Co to jest nadzorowane uczenie maszynowe?
W uczeniu nadzorowanym trenujesz maszynę przy użyciu danych, które są dobrze „oznaczone ”. Oznacza to, że niektóre dane są już oznaczone poprawną odpowiedzią. Można to porównać do uczenia się, które odbywa się w obecności opiekuna lub nauczyciela.
Algorytm uczenia nadzorowanego uczy się na podstawie oznaczonych danych szkoleniowych, pomaga przewidywać wyniki dla nieprzewidzianych danych. Pomyślne budowanie, skalowanie i wdrażanie dokładnego nadzorowanego uczenia maszynowego Model nauki o danych wymaga czasu i technicznej wiedzy zespołu wysoko wykwalifikowanych analityków danych. Co więcej, naukowiec zajmujący się danymi musi przebudować modele, aby upewnić się, że podane spostrzeżenia pozostaną prawdziwe do czasu zmiany danych.
W tym samouczku dowiesz się
- Co to jest nadzorowane uczenie maszynowe?
- Co to jest uczenie się bez nadzoru?
- Dlaczego uczenie nadzorowane?
- Dlaczego uczenie się bez nadzoru?
- Jak działa uczenie nadzorowane?
- Jak działa uczenie bez nadzoru?
- Rodzaje nadzorowanych technik uczenia maszynowego
- Rodzaje nienadzorowanych technik uczenia maszynowego
- Uczenie się nadzorowane i nienadzorowane
Co to jest uczenie się bez nadzoru?
Uczenie się nienadzorowane to technika uczenia maszynowego, w której nie ma potrzeby nadzorowania modelu. Zamiast tego musisz pozwolić modelowi na samodzielną pracę, aby odkryć informacje. Zajmuje się głównie danymi bez etykiety.
Algorytmy uczenia się bez nadzoru umożliwiają wykonywanie bardziej złożonych zadań przetwarzania w porównaniu z uczeniem nadzorowanym. Chociaż uczenie się bez nadzoru może być bardziej nieprzewidywalne w porównaniu z innymi naturalnymi metodami uczenia głębokiego i uczenia ze wzmocnieniem.
Dlaczego uczenie nadzorowane?
- Uczenie nadzorowane umożliwia zbieranie danych lub tworzenie danych wyjściowych z poprzedniego doświadczenia.
- Pomaga zoptymalizować kryteria wydajności za pomocą doświadczenia
- Nadzorowane uczenie maszynowe pomaga rozwiązywać różne typy problemów obliczeniowych w świecie rzeczywistym.
Dlaczego uczenie się bez nadzoru?
Oto główne powody korzystania z uczenia się bez nadzoru:
- Uczenie maszynowe bez nadzoru znajduje w danych wszelkiego rodzaju nieznane wzorce.
- Metody nienadzorowane pomagają znaleźć funkcje, które mogą być przydatne przy kategoryzacji.
- Odbywa się to w czasie rzeczywistym, więc wszystkie dane wejściowe należy przeanalizować i oznaczyć w obecności uczniów.
- Łatwiej jest uzyskać dane bez etykiety z komputera niż dane oznaczone etykietami, które wymagają ręcznej interwencji.
Jak działa uczenie nadzorowane?
Na przykład chcesz wyszkolić maszynę, aby pomogła Ci przewidzieć, ile czasu zajmie Ci podróż do domu z miejsca pracy. Tutaj zaczynasz od utworzenia zestawu oznaczonych danych. Dane te obejmują
- Warunki pogodowe
- Pora dnia
- Wakacje
Wszystkie te szczegóły są Twoimi danymi wejściowymi. Wynik to czas potrzebny na powrót do domu w tym konkretnym dniu.
Instynktownie wiesz, że jeśli na dworze pada deszcz, jazda do domu zajmie Ci więcej czasu. Ale maszyna potrzebuje danych i statystyk.
Zobaczmy teraz, jak możesz opracować nadzorowany model uczenia się z tego przykładu, który pomoże użytkownikowi określić czas dojazdów do pracy. Pierwszą rzeczą, którą musisz utworzyć, jest zestaw danych szkoleniowych. Ten zestaw treningowy będzie zawierał całkowity czas dojazdów do pracy i odpowiednie czynniki, takie jak pogoda, czas itp. Na podstawie tego zestawu treningowego Twoja maszyna może zobaczyć, że istnieje bezpośredni związek między ilością deszczu a czasem, jaki zajmie Ci dotarcie do domu.
Sprawdza więc, że im więcej pada, tym dłużej będziesz jechał, aby wrócić do domu. Może również dostrzec związek między momentem wyjścia z pracy a czasem, gdy będziesz w drodze.
Im bliżej 18:00, tym więcej czasu zajmuje Ci powrót do domu. Twój komputer może znaleźć niektóre powiązania z danymi oznaczonymi etykietami.
To jest początek Twojego modelu danych. Zaczyna wpływać na to, jak deszcz wpływa na sposób, w jaki ludzie jeżdżą. Zaczyna również zauważać, że więcej osób podróżuje o określonej porze dnia.
Jak działa uczenie bez nadzoru?
Weźmy przykład dziecka i jego psa rodzinnego.
Zna i identyfikuje tego psa. Kilka tygodni później przyjaciel rodziny przyprowadza psa i próbuje bawić się z dzieckiem.
Dziecko nie widziało wcześniej tego psa. Ale rozpoznaje wiele cech (2 uszy, oczy, chodzenie na 4 nogach) jest jak jej pies. Identyfikuje nowe zwierzę jak psa. Jest to uczenie się bez nadzoru, w którym nie uczysz się, ale uczysz się na podstawie danych (w tym przypadku danych o psie). Gdyby było to uczenie nadzorowane, przyjaciel rodziny powiedziałby dziecku, że to pies.
Rodzaje nadzorowanych technik uczenia maszynowego
Regresja:
Technika regresji przewiduje pojedynczą wartość wyjściową na podstawie danych uczących.
Przykład: Możesz użyć regresji, aby przewidzieć cenę domu na podstawie danych szkoleniowych. Zmiennymi wejściowymi będą lokalizacja, wielkość domu itp.
Klasyfikacja:
Klasyfikacja oznacza grupowanie wyników wewnątrz klasy. Jeśli algorytm próbuje podzielić dane wejściowe na dwie odrębne klasy, nazywa się to klasyfikacją binarną. Wybieranie między więcej niż dwiema klasami nazywa się klasyfikacją wieloklasową.
Przykład : ustalenie, czy ktoś będzie odstępował od pożyczki.
Mocne strony : Wyniki zawsze mają probabilistyczną interpretację, a algorytm można regulować, aby uniknąć nadmiernego dopasowania.
Słabe strony : Regresja logistyczna może działać gorzej niż wtedy, gdy istnieje wiele lub nieliniowych granic decyzyjnych. Ta metoda nie jest elastyczna, więc nie obejmuje bardziej złożonych relacji.
Rodzaje nienadzorowanych technik uczenia maszynowego
Nienadzorowane problemy z uczeniem się pogrupowane są dalej w klastry i problemy asocjacyjne.
Grupowanie
Klastrowanie jest ważną koncepcją, jeśli chodzi o uczenie się bez nadzoru. Zajmuje się głównie wyszukiwaniem struktury lub wzoru w zbiorze danych nieskategoryzowanych. Algorytmy klastrowania będą przetwarzać Twoje dane i znajdować naturalne klastry (grupy), jeśli istnieją w danych. Możesz także zmodyfikować liczbę klastrów, które mają identyfikować algorytmy. Pozwala dostosować szczegółowość tych grup.
Stowarzyszenie
Reguły asocjacyjne umożliwiają tworzenie powiązań między obiektami danych w dużych bazach danych. Ta nienadzorowana technika polega na odkrywaniu ekscytujących relacji między zmiennymi w dużych bazach danych. Na przykład osoby, które kupują nowy dom, najprawdopodobniej kupią nowe meble.
Inne przykłady:
- Podgrupa pacjentów z rakiem pogrupowana według pomiarów ekspresji genów
- Grupy kupujących na podstawie historii przeglądania i zakupów
- Grupa filmów według oceny nadanej przez widzów
Uczenie się nadzorowane i nienadzorowane
Parametry | Nadzorowana technika uczenia maszynowego | Technika uczenia maszynowego bez nadzoru |
Proces | W nadzorowanym modelu uczenia się zostaną podane zmienne wejściowe i wyjściowe. | W modelu uczenia się bez nadzoru podane będą tylko dane wejściowe |
Dane wejściowe | Algorytmy są uczone przy użyciu oznaczonych danych. | Algorytmy są używane do danych, które nie są oznaczone |
Zastosowane algorytmy | Maszyna wektorów nośnych, sieć neuronowa, regresja liniowa i logistyczna, losowy las i drzewa klasyfikacyjne. | Algorytmy nienadzorowane można podzielić na różne kategorie: takie jak algorytmy klastrowe, K-średnie, hierarchiczne grupowanie itp. |
Złożoność obliczeniowa | Uczenie nadzorowane jest prostszą metodą. | Uczenie się bez nadzoru jest obliczeniowo złożone |
Wykorzystanie danych | Model uczenia nadzorowanego wykorzystuje dane szkoleniowe, aby nauczyć się powiązania między danymi wejściowymi a wyjściami. | Uczenie się nienadzorowane nie wykorzystuje danych wyjściowych. |
Dokładność wyników | Bardzo dokładna i godna zaufania metoda. | Mniej dokładna i wiarygodna metoda. |
Nauka w czasie rzeczywistym | Metoda uczenia się odbywa się offline. | Metoda uczenia się odbywa się w czasie rzeczywistym. |
Liczba klas | Znana jest liczba zajęć. | Liczba zajęć nie jest znana. |
Główna wada | Klasyfikacja dużych zbiorów danych może być prawdziwym wyzwaniem w nadzorowanym uczeniu się. | Nie można uzyskać dokładnych informacji dotyczących sortowania danych, a dane wyjściowe jako dane używane w uczeniu się bez nadzoru są oznaczone i nieznane. |
Podsumowanie
- W uczeniu nadzorowanym trenujesz maszynę przy użyciu danych, które są dobrze „oznaczone”.
- Uczenie się nienadzorowane to technika uczenia maszynowego, w której nie ma potrzeby nadzorowania modelu.
- Uczenie nadzorowane umożliwia zbieranie danych lub tworzenie danych wyjściowych z poprzedniego doświadczenia.
- Uczenie maszynowe bez nadzoru pomaga znaleźć wszelkiego rodzaju nieznane wzorce w danych.
- Na przykład, będziesz w stanie określić czas potrzebny do powrotu na podstawie warunków pogodowych, pory dnia i wakacji.
- Na przykład Dziecko może zidentyfikować inne psy na podstawie wcześniejszego nadzorowanego uczenia się.
- Regresja i klasyfikacja to dwa rodzaje nadzorowanych technik uczenia maszynowego.
- Klastrowanie i skojarzenie to dwa rodzaje uczenia się nienadzorowanego.
- W nadzorowanym modelu uczenia się, zmienne wejściowe i wyjściowe będą podane, podczas gdy w modelu uczenia nienadzorowanego podane będą tylko dane wejściowe