50 najpopularniejszych pytań do rozmów kwalifikacyjnych w dziedzinie uczenia maszynowego i amp; Odpowiedzi

ściągnij PDF

1) Co to jest uczenie maszynowe?

Uczenie maszynowe to dziedzina informatyki, która zajmuje się programowaniem systemów w celu automatycznego uczenia się i doskonalenia wraz z doświadczeniem. Na przykład: Roboty są zaprogramowane tak, aby mogły wykonywać zadanie na podstawie danych zebranych z czujników. Automatycznie uczy się programów na podstawie danych.

2) Wspomnij o różnicy między eksploracją danych a uczeniem maszynowym?

Uczenie maszynowe wiąże się z badaniem, projektowaniem i rozwijaniem algorytmów, które dają komputerom zdolność uczenia się bez konieczności bezpośredniego programowania. Podczas gdy eksplorację danych można zdefiniować jako proces, w którym nieustrukturyzowane dane próbują wydobyć wiedzę lub nieznane interesujące wzorce. Podczas tego procesu wykorzystywane są algorytmy uczące się.

3) Co to jest „nadmierne dopasowanie” w uczeniu maszynowym?

W uczeniu maszynowym, gdy model statystyczny opisuje przypadkowy błąd lub szum zamiast podstawowej relacji, występuje „nadmierne dopasowanie”. Gdy model jest nadmiernie złożony, zwykle obserwuje się nadmierne dopasowanie z powodu zbyt wielu parametrów w odniesieniu do liczby typów danych uczących. Model wykazuje słabe osiągi, które zostały przesadzone.

4) Dlaczego dochodzi do przeuczenia?

Istnieje możliwość nadmiernego dopasowania, ponieważ kryteria stosowane do trenowania modelu nie są takie same, jak kryteria stosowane do oceny skuteczności modelu.

5) Jak uniknąć nadmiernego dopasowania?

Używając dużej ilości danych, można uniknąć przeuczenia, nadmierne dopasowanie występuje stosunkowo, gdy masz mały zestaw danych i próbujesz się z niego uczyć. Ale jeśli masz małą bazę danych i jesteś zmuszony przedstawić model oparty na tym. W takiej sytuacji możesz użyć techniki znanej jako walidacja krzyżowa . W tej metodzie zestaw danych dzieli się na dwie sekcje, zestawy danych testowych i szkoleniowych, zestaw danych testowych będzie testował tylko model, podczas gdy w zestawie danych uczących punkty danych pojawią się z modelem.

W tej technice model otrzymuje zwykle zestaw danych znanych danych, na których jest uruchamiane uczenie (zbiór danych uczących), oraz zestaw danych nieznanych danych, na podstawie których model jest testowany. Ideą walidacji krzyżowej jest zdefiniowanie zbioru danych w celu „przetestowania” modelu w fazie uczenia.

6) Co to jest indukcyjne uczenie maszynowe?

Indukcyjne uczenie maszynowe obejmuje proces uczenia się na przykładach, w którym system z zestawu obserwowanych instancji próbuje wywołać ogólną regułę.

7) Jakie jest pięć popularnych algorytmów uczenia maszynowego?

Drzewa decyzyjne
Sieci neuronowe (propagacja wsteczna)
Sieci probabilistyczne
Najbliższy sąsiad
Maszyny wektorów nośnych

8) Jakie są różne techniki algorytmów w uczeniu maszynowym?

Istnieją różne typy technik w uczeniu maszynowym

Nadzorowana nauka
Uczenie się bez nadzoru
Nauka częściowo nadzorowana
Uczenie się ze wzmocnieniem
Transdukcja
Nauka uczenia się

9) Jakie są trzy etapy budowania hipotez lub modelu w uczeniu maszynowym?

Budowa modelu
Testowanie modeli
Stosowanie modelu

10) Jakie jest standardowe podejście do nadzorowanego uczenia się?

Standardowe podejście do nadzorowanego uczenia się polega na podzieleniu zestawu przykładów na zestaw szkoleniowy i test.

11) Co to jest „Zbiór treningowy” i „Zbiór testowy”?

W różnych obszarach informatyki, takich jak uczenie maszynowe, zestaw danych jest używany do odkrywania potencjalnie predykcyjnej relacji znanej jako „zbiór szkoleniowy”. Zestaw szkoleniowy jest przykładem podawanym uczącemu się, natomiast zestaw testowy służy do testowania dokładności hipotez generowanych przez ucznia i jest zbiorem przykładów ukrytych przed uczącym się. Zbiór uczący różni się od zbioru testowego.

12) Wymień różne podejścia do uczenia maszynowego?

Istnieją różne podejścia w uczeniu maszynowym

Koncepcja Vs Klasyfikacja uczenia się
Symboliczne i statystyczne uczenie się
Indukcyjne i analityczne uczenie się

13) Czym nie jest uczenie maszynowe?

Sztuczna inteligencja
Wnioskowanie oparte na regułach

14) Wyjaśnij, jaka jest funkcja „uczenia się bez nadzoru”?

Znajdź grupy danych
Znajdź niskowymiarowe reprezentacje danych
Znajdź interesujące kierunki w danych
Ciekawe współrzędne i korelacje
Znajdź nowe obserwacje / czyszczenie bazy danych

15) Wyjaśnij, jaka jest funkcja „nadzorowanego uczenia się”?

Klasyfikacje
Rozpoznawanie mowy
Regresja
Przewiduj szeregi czasowe
Opisz ciągi

16) Co to jest uczenie maszynowe niezależne od algorytmów?

Uczenie maszynowe, w którym podstawy matematyczne są niezależne od określonego klasyfikatora lub algorytmu uczenia się, nazywane jest uczeniem maszynowym niezależnym od algorytmu?

17) Jaka jest różnica między sztucznym uczeniem się a uczeniem maszynowym?

Projektowanie i opracowywanie algorytmów zgodnie z zachowaniami opartymi na danych empirycznych nosi nazwę Machine Learning. Chociaż sztuczna inteligencja oprócz uczenia maszynowego obejmuje również inne aspekty, takie jak reprezentacja wiedzy, przetwarzanie języka naturalnego, planowanie, robotyka itp.

18) Co to jest klasyfikator w uczeniu maszynowym?

Klasyfikator w uczeniu maszynowym to system, który wprowadza wektor dyskretnych lub ciągłych wartości funkcji i wyprowadza pojedynczą wartość dyskretną, klasę.

19) Jakie są zalety Naive Bayes?

W Naïve Bayes klasyfikator zbiegnie się szybciej niż modele dyskryminacyjne, takie jak regresja logistyczna, więc potrzebujesz mniej danych szkoleniowych. Główną zaletą jest to, że nie może nauczyć się interakcji między funkcjami.

20) W jakich obszarach stosowane jest rozpoznawanie wzorców?

Rozpoznawanie wzorców może być używane w programie

Wizja komputerowa
Rozpoznawanie mowy
Eksploracja danych
Statystyka
Nieformalne pobieranie
Bioinformatyka

21) Co to jest programowanie genetyczne?

Programowanie genetyczne jest jedną z dwóch technik stosowanych w uczeniu maszynowym. Model opiera się na testowaniu i wyborze najlepszego wyboru spośród zestawu wyników.

22) Co to jest programowanie w logice indukcyjnej w uczeniu maszynowym?

Programowanie w logice indukcyjnej (ILP) to poddziedzina uczenia maszynowego, która wykorzystuje programowanie logiczne reprezentujące wiedzę podstawową i przykłady.

23) Co to jest wybór modelu w uczeniu maszynowym?

Proces selekcji modeli spośród różnych modeli matematycznych, które są używane do opisu tego samego zbioru danych, jest znany jako Wybór modelu. Wybór modelu jest stosowany w dziedzinach statystyki, uczenia maszynowego i eksploracji danych.

24) Jakie są dwie metody wykorzystywane do kalibracji w uczeniu nadzorowanym?

Dwie metody stosowane do przewidywania dobrych prawdopodobieństw w uczeniu nadzorowanym to

Kalibracja Platt
Regresja izotoniczna

Te metody są przeznaczone do klasyfikacji binarnej i nie jest to trywialne.

25) Która metoda jest często stosowana, aby zapobiec nadmiernemu dopasowaniu?

Gdy dostępne są wystarczające dane, stosowana jest regresja izotoniczna, aby zapobiec problemowi nadmiernego dopasowania.

26) Jaka jest różnica między heurystyką dla uczenia się reguł a heurystykami dla drzew decyzyjnych?

Różnica polega na tym, że heurystyki drzew decyzyjnych oceniają średnią jakość szeregu rozłącznych zbiorów, podczas gdy uczący się reguł oceniają tylko jakość zbioru instancji objętych regułą kandydata.

27) Co to jest Perceptron w uczeniu maszynowym?

W uczeniu maszynowym Perceptron jest algorytmem nadzorowanej klasyfikacji wejścia na jedno z kilku możliwych wyjść niebinarnych.

28) Wyjaśnij dwa składniki programu logiki Bayesa?

Program logiki bayesowskiej składa się z dwóch komponentów. Pierwszy składnik jest logiczny; składa się z zestawu klauzul bayesowskich, które odzwierciedlają jakościową strukturę domeny. Drugi składnik ma charakter ilościowy, koduje ilościowe informacje o domenie.

29) Co to są sieci bayesowskie (BN)?

Sieć Bayesa służy do reprezentowania graficznego modelu zależności prawdopodobieństwa między zbiorem zmiennych.

30) Dlaczego algorytm uczenia się oparty na instancjach jest czasami nazywany algorytmem leniwego uczenia się?

Algorytm uczenia się oparty na instancjach jest również nazywany algorytmem leniwego uczenia się, ponieważ opóźnia proces indukcji lub uogólnienia do czasu wykonania klasyfikacji.

31) Jakie są dwie metody klasyfikacji, które obsługuje SVM (Support Vector Machine)?

Łączenie klasyfikatorów binarnych
Modyfikacja pliku binarnego w celu uwzględnienia uczenia się wieloklasowego

32) Co to jest nauka zespołowa?

Aby rozwiązać konkretny program obliczeniowy, strategicznie generuje się i łączy wiele modeli, takich jak klasyfikatory lub eksperci. Ten proces jest nazywany uczeniem się zespołowym.

33) Dlaczego stosuje się uczenie zespołowe?

Uczenie zespołowe służy do ulepszania klasyfikacji, przewidywania, przybliżania funkcji itp. Modelu.

34) Kiedy korzystać z uczenia się zespołowego?

Uczenie zespołowe jest używane podczas tworzenia klasyfikatorów komponentów, które są dokładniejsze i niezależne od siebie.

35) Jakie są dwa paradygmaty metod zespołowych?

Są to dwa paradygmaty metod zespołowych

Sekwencyjne metody zespołowe
Metody zespołowe równoległe

36) Jaka jest ogólna zasada metody zespołowej, a czym jest gromadzenie i wzmacnianie w metodzie zespołowej?

Ogólna zasada metody zespołowej polega na łączeniu przewidywań kilku modeli zbudowanych za pomocą danego algorytmu uczenia się w celu zwiększenia odporności pojedynczego modelu. Pakowanie jest połączoną metodą ulepszania niestabilnych szacunków lub schematów klasyfikacji. Podczas gdy metody wzmacniające są stosowane sekwencyjnie, aby zmniejszyć odchylenie połączonego modelu. Wzmocnienie i zapakowanie mogą zmniejszyć liczbę błędów poprzez skrócenie okresu wariancji.

37) Co to jest dekompozycja odchylenia i wariancji błędu klasyfikacji w metodzie zespołowej?

Oczekiwany błąd algorytmu uczącego się można rozłożyć na odchylenie i wariancję. Termin odchylenia określa, jak dokładnie średni klasyfikator generowany przez algorytm uczący się pasuje do funkcji docelowej. Termin wariancji określa, jak bardzo zmienia się przewidywanie algorytmu uczącego się dla różnych zestawów uczących.

38) Co to jest zbiór algorytmów uczenia przyrostowego?

Metoda uczenia przyrostowego to zdolność algorytmu do uczenia się na podstawie nowych danych, które mogą być dostępne po wygenerowaniu klasyfikatora z już dostępnego zbioru danych.

39) Do czego służą PCA, KPCA i ICA?

PCA (Analiza głównych komponentów), KPCA (analiza głównych komponentów oparta na jądrze) i ICA (niezależna analiza komponentów) to ważne techniki wyodrębniania cech stosowane do redukcji wymiarowości.

40) Co to jest redukcja wymiarów w uczeniu maszynowym?

W uczeniu maszynowym i statystyce redukcja wymiarów jest procesem zmniejszania liczby rozważanych zmiennych losowych i można go podzielić na wybór funkcji i wyodrębnianie funkcji.

41) Co to są maszyny wektorów nośnych?

Maszyny wektorów nośnych to nadzorowane algorytmy uczące się używane do klasyfikacji i analizy regresji.

42) Jakie są komponenty technik ewaluacji relacyjnej?

Ważnymi składnikami relacyjnych technik ewaluacji są

Pozyskiwanie danych
Akwizycja prawdy o gruncie
Technika walidacji krzyżowej
Typ zapytania
Metryka punktacji
Test istotności

43) Jakie są różne metody sekwencyjnego nadzorowanego uczenia się?

Istnieją różne metody rozwiązywania problemów z sekwencyjnym uczeniem nadzorowanym

Metody okien przesuwnych
Powtarzające się okna przesuwne
Ukryte modele Markowa
Modele maksymalnej entropii Markowa
Warunkowe pola losowe
Grafowe sieci transformatorowe

44) W jakich obszarach robotyki i przetwarzania informacji pojawia się problem z prognozowaniem sekwencyjnym?

Obszary robotyki i przetwarzania informacji, w których pojawia się problem z prognozowaniem sekwencyjnym, to obszary

Nauka naśladowania
Strukturyzowane przewidywanie
Uczenie się ze wzmocnieniem w oparciu o model

45) Co to jest zbiorcze uczenie się statystyki?

Statystyczne techniki uczenia się umożliwiają uczenie się funkcji lub predyktora na podstawie zestawu obserwowanych danych, które mogą tworzyć prognozy dotyczące niewidocznych lub przyszłych danych. Techniki te zapewniają gwarancję działania wyuczonego predyktora na przyszłych niewidocznych danych w oparciu o statystyczne założenie dotyczące procesu generowania danych.

46) Co to jest nauka PAC?

Uczenie się metodą PAC (prawdopodobnie w przybliżeniu poprawne) to struktura uczenia się, która została wprowadzona w celu analizy algorytmów uczenia się i ich statystycznej wydajności.

47) Jakie są różne kategorie, które możesz sklasyfikować w procesie uczenia się sekwencji?