Automatyzacja: przyszłość data science i uczenia maszynowego?

Uczenie maszynowe było jednym z największych postępów w historii informatyki i jest obecnie postrzegane jako zdolne do odgrywania ważnej roli w dziedzinie big data i analityki. Analityka Big Data to ogromne wyzwanie z perspektywy przedsiębiorstwa. Na przykład czynności, takie jak zrozumienie dużej liczby różnych formatów danych, analiza przygotowania danych i filtrowanie zbędnych danych, mogą wymagać dużej ilości zasobów. Rekrutacja specjalistów data science to kosztowna propozycja, a nie środek do celu dla każdej firmy. Eksperci uważają, że uczenie maszynowe może zautomatyzować wiele zadań związanych z analityką – zarówno rutynowych, jak i złożonych. Zautomatyzowane uczenie maszynowe może uwolnić znaczne zasoby, które można wykorzystać do bardziej złożonej i innowacyjnej pracy. Uczenie maszynowe wydaje się cały czas zmierzać w tym kierunku.

Automatyzacja w kontekście informatyki

W IT automatyzacja to połączenie różnych systemów i oprogramowania, umożliwiające im wykonywanie określonych zadań bez ingerencji człowieka. W IT zautomatyzowane systemy mogą wykonywać zarówno proste, jak i złożone zadania. Przykładem prostego zadania może być integracja formularzy z plikami PDF i wysyłanie dokumentów do właściwego odbiorcy, natomiast tworzenie kopii zapasowych poza siedzibą firmy może być przykładem złożonego zadania.

Aby prawidłowo wykonywać swoją pracę, musisz zaprogramować lub dać jasne instrukcje zautomatyzowanemu systemowi. Za każdym razem, gdy zautomatyzowany system jest potrzebny do zmodyfikowania zakresu jego pracy, program lub zestaw instrukcji musi zostać przez kogoś zaktualizowany. Chociaż zautomatyzowany system jest skuteczny w swojej pracy, błędy mogą wystąpić z różnych powodów. W przypadku wystąpienia błędów należy zidentyfikować i naprawić podstawową przyczynę. Oczywiście, aby wykonać swoją pracę, zautomatyzowany system jest całkowicie zależny od ludzi. Im bardziej złożony charakter pracy, tym większe prawdopodobieństwo błędów i problemów.

Typowym przykładem automatyzacji w branży IT jest automatyzacja testowania internetowych interfejsów użytkownika. Przypadki testowe są wprowadzane do skryptu automatyzacji, a interfejs użytkownika jest odpowiednio testowany. (Aby uzyskać więcej informacji na temat praktycznego zastosowania uczenia maszynowego, zobacz Machine Learning i Hadoop w wykrywaniu oszustw nowej generacji).

Argumentem przemawiającym za automatyzacją jest to, że wykonuje ona rutynowe i powtarzalne zadania oraz uwalnia pracowników do wykonywania bardziej złożonych i kreatywnych zadań. Jednak argumentuje się również, że automatyzacja wykluczyła dużą liczbę zadań lub ról, które wcześniej pełnili ludzie. Teraz, gdy uczenie maszynowe wkracza do różnych branż, automatyzacja może nadać nowy wymiar.

Przyszłość zautomatyzowanego uczenia maszynowego?

Istotą uczenia maszynowego jest zdolność systemu do ciągłego uczenia się na podstawie danych i ewolucji bez interwencji człowieka. Uczenie maszynowe może działać jak ludzki mózg. Na przykład wyszukiwarki rekomendacji w witrynach handlu elektronicznego mogą oceniać unikalne preferencje i upodobania użytkowników oraz dostarczać rekomendacje dotyczące najodpowiedniejszych produktów i usług do wyboru. Biorąc pod uwagę tę możliwość, uczenie maszynowe jest postrzegane jako idealne do automatyzacji złożonych zadań związanych z big data i analizą. Pokonał główne ograniczenia tradycyjnych zautomatyzowanych systemów, które nie pozwalają na regularną interwencję człowieka. Istnieje wiele studiów przypadku, które demonstrują zdolność uczenia maszynowego do wykonywania złożonych zadań analizy danych, które zostaną omówione w dalszej części tego artykułu.

Jak już wspomniano, analityka big data to wyzwanie dla firm, które można częściowo delegować do systemów uczenia maszynowego. Z perspektywy biznesowej może to przynieść wiele korzyści, takich jak uwolnienie zasobów analizy danych do bardziej kreatywnych i krytycznych zadań, większe obciążenie pracą, skrócenie czasu wykonywania zadań i opłacalność.

Studium przypadku

W 2015 roku naukowcy z MIT rozpoczęli prace nad narzędziem do nauki o danych, które może tworzyć modele danych predykcyjnych z dużych ilości surowych danych przy użyciu techniki zwanej algorytmami głębokiej syntezy cech. Naukowcy twierdzą, że algorytm może łączyć najlepsze cechy uczenia maszynowego. Według naukowców przetestowali go na trzech różnych zestawach danych i rozszerzają testy, aby objąć ich więcej. W artykule, który ma zostać zaprezentowany na Międzynarodowej Konferencji Nauki o Danych i Analityki, naukowcy James Max Kanter i Kalyan Veeramachaneni powiedzieli: „Korzystając z automatycznego procesu dostrajania, optymalizujemy całą ścieżkę bez udziału człowieka, umożliwiając jej uogólnianie na różne zestawy danych”.

Przyjrzyjmy się złożoności zadania: algorytm ma tak zwaną zdolność autodopasowania, za pomocą której można uzyskać lub wyodrębnić spostrzeżenia lub wartości z surowych danych (takich jak wiek lub płeć), po czym dane predykcyjne modele mogą być tworzone. Algorytm wykorzystuje złożone funkcje matematyczne i teorię prawdopodobieństwa zwaną kopułą Gaussa. Dlatego łatwo jest zrozumieć poziom złożoności, z jakim może sobie poradzić algorytm. Ta technika zdobyła również nagrody w konkursach.

Uczenie maszynowe może zastąpić pracę domową

Na całym świecie mówi się, że uczenie maszynowe może zastąpić wiele zawodów, ponieważ wykonuje zadania z wydajnością ludzkiego mózgu. W rzeczywistości istnieją pewne obawy, że uczenie maszynowe zastąpi naukowców zajmujących się danymi i wydaje się, że istnieją podstawy do takich obaw.

Dla przeciętnego użytkownika, który nie ma umiejętności analizy danych, ale ma różne potrzeby analityczne w codziennym życiu, nie jest możliwe korzystanie z komputerów, które mogą analizować ogromne ilości danych i dostarczać dane analityczne. Jednak techniki przetwarzania języka naturalnego (NLP) mogą przezwyciężyć to ograniczenie, ucząc komputery akceptowania i przetwarzania naturalnego języka ludzkiego. W ten sposób przeciętny użytkownik nie potrzebuje wyrafinowanych funkcji analitycznych ani umiejętności.

IBM wierzy, że zapotrzebowanie na naukowców zajmujących się danymi można zminimalizować lub wyeliminować dzięki jej produktowi, platformie Watson Natural Language Analytics Platform. Według Marca Atschullera, wiceprezesa ds. analityki i analityki biznesowej w firmie Watson: „Dzięki systemowi kognitywnemu, takiemu jak Watson, po prostu zadajesz pytanie – a jeśli nie masz pytania, po prostu przesyłasz swoje dane, a Watson może je przeglądać i wywnioskuj, co możesz chcieć wiedzieć. ”

Wniosek

Automatyzacja to kolejny logiczny krok w uczeniu maszynowym, którego efekty już odczuwamy w naszym codziennym życiu – witryny e-commerce, sugestie znajomych z Facebooka, sugestie sieci LinkedIn i rankingi wyszukiwania Airbnb. Biorąc pod uwagę podane przykłady, nie ma wątpliwości, że można to przypisać jakości produktu wytwarzanego przez zautomatyzowane systemy uczenia maszynowego. Pomimo wszystkich swoich zalet i korzyści, pomysł uczenia maszynowego powodującego ogromne bezrobocie wydaje się trochę przesadą. Maszyny od dziesięcioleci zastępują ludzi w wielu aspektach naszego życia, ale ludzie ewoluowali i dostosowywali się, aby pozostać ważnymi w branży. Zgodnie z poglądem uczenie maszynowe, pomimo wszystkich jego zakłóceń, jest tylko kolejną falą, do której ludzie się przystosują.


Czas publikacji: 03.08.2021