40 najpopularniejszych pytań i odpowiedzi do wywiadów ElasticSearch

Anonim

Oto pytania na rozmowę kwalifikacyjną w wyszukiwarce Elastic dla świeższych i doświadczonych kandydatów.

1) Co to jest Elasticsearch?

Elasticsearch to baza danych NoSQL. Opiera się na wyszukiwarce Lucene i jest zbudowany z wykorzystaniem RESTful APIS. Oferuje proste wdrożenie, maksymalną niezawodność i łatwe zarządzanie. Zapewnia również zaawansowane zapytania do przeprowadzania szczegółowej analizy i centralnie przechowuje wszystkie dane. Pomaga w szybkim wyszukiwaniu dokumentów.

2) Jakie są ważne cechy Elasticsearch?

Oto ważne cechy Elasticsearch:

  • Serwer wyszukiwania typu open source napisany przy użyciu języka Java.
  • Służy do indeksowania wszelkiego rodzaju heterogenicznych danych
  • Posiada interfejs sieciowy REST API z wyjściem JSON
  • Wyszukiwanie pełnotekstowe
  • Wyszukiwanie w czasie zbliżonym do rzeczywistego (NRT)
  • Magazyn dokumentów JSON podzielony na fragmenty, replikowany z możliwością wyszukiwania.
  • Rozproszony magazyn dokumentów bez schematów, oparty na REST i JSON
  • Obsługa wielu języków i geolokalizacji

3) Co to jest klaster?

Klaster to zbiór węzłów, które razem przechowują dane i zapewniają połączone możliwości indeksowania i wyszukiwania.

4) Wyjaśnij indeks

Węzeł jest elastycznym wystąpieniem wyszukiwania. Jest tworzony, gdy rozpoczyna się wystąpienie elastyczne wyszukiwanie.

5) Co to jest dokument w Elastic Search?

W wyszukiwaniu elastycznym dokument jest podstawową jednostką informacji, którą można indeksować. Jest wyrażana w parze JSON (klucz: wartość). '{"user": "nullcon"}'. Każdy dokument jest powiązany z typem i unikalnym identyfikatorem.

6) Zdefiniuj odłamek terminu

Każdy indeks można podzielić na kilka fragmentów, aby móc dystrybuować dane. Fragment jest atomową częścią indeksu, który można rozprowadzić po klastrze, jeśli chcesz dodać więcej węzłów.

7) Jakie są ważne zalety Elastic Search?

Oto ważne zalety Elasticsearch:

  • Przechowuj dane bez schematu, a także tworzy schemat dla swoich danych.
  • Manipuluj rekordem danych po rekordzie za pomocą interfejsów API z wieloma dokumentami
  • Przeprowadź filtrowanie i odpytywanie danych w celu uzyskania szczegółowych informacji
  • Oparty na Apache Lucene i zapewnia RESTful API
  • Zapewnia poziomą skalowalność, niezawodność i możliwość obsługi wielu dzierżawców przy indeksowaniu w czasie rzeczywistym.
  • Pomaga skalować w pionie i poziomie

8) Co to jest stos ELK?

ELK Stack to zbiór trzech produktów open source - Elasticsearch, Logstash i Kibana. Wszystkie są opracowywane, zarządzane i utrzymywane przez firmę Elastic.

  • E oznacza ElasticSearch : służy do przechowywania dzienników.
  • L oznacza LogStash: służy zarówno do wysyłki, jak i przetwarzania i przechowywania dzienników.
  • K oznacza Kibana: jest to narzędzie do wizualizacji (interfejs sieciowy), które jest hostowane przez Nginx lub Apache.

9) Wyjaśnij architekturę stosu ELK

ELK Stack został zaprojektowany, aby umożliwić użytkownikom pobieranie danych z dowolnego źródła, w dowolnym formacie oraz wyszukiwanie, analizowanie i wizualizowanie tych danych w czasie rzeczywistym.

  • Dzienniki: identyfikowane są dzienniki serwera, które należy przeanalizować
  • Logstash: Zbieraj dzienniki i dane o zdarzeniach. Nawet analizuje i przekształca dane.
  • ElasticSearch: Przekształcone dane z Logstash są przechowywane, wyszukiwane i indeksowane.
  • Kibana: Kibana używa Elasticsearch DB do przeglądania, wizualizacji i udostępniania

10) Jaki jest powód używania stosu ELK?

Oto powody, dla których warto używać stosu ELK:

  • ELK działa najlepiej, gdy dzienniki z różnych aplikacji przedsiębiorstwa zbiegają się w jedną instancję ELK
  • Zapewnia niesamowity wgląd w to pojedyncze wystąpienie, a także eliminuje potrzebę logowania się do stu różnych źródeł danych dziennika.
  • Szybka instalacja na miejscu
  • Łatwe do rozmieszczania wagi w pionie i poziomie
  • Elastic oferuje wiele klientów językowych, w tym Ruby. Pyton. PHP, Perl, .NET, Java i JavaScript i nie tylko
  • Dostępność bibliotek dla różnych języków programowania i skryptów

11) Wyjaśnij Tokenizer w ElasticSearch

Pola podziału tokenizera, które wartości dokumentu są umieszczane w strumieniu. Indeksy odwrócone są tworzone i aktualizowane przy użyciu tych wartości. Następnie ten strumień wartości jest przechowywany w dokumencie.

12) Co to jest replika w ElasticSearch?

Każdy fragment w ElasticSearch ma 2 kopie, które nazywamy replikami. Pomagają w zapewnieniu wysokiej dostępności i odporności na awarie.

13) Jakie są główne operacje, które można wykonać na dokumencie?

Oto ważne operacje wykonywane na dokumentach:

  • Indeksowanie dokumentu
  • Pobieranie dokumentów
  • Aktualizacja dokumentów
  • Usuwanie dokumentów

14) Co to jest klaster w Elasticsearch?

Klaster to zbiór pojedynczych lub wielu węzłów, który przechowuje całe dane i oferuje sfederowane indeksowanie i możliwości wyszukiwania we wszystkich węzłach.

15) Jak usunąć indeks w wyszukiwaniu elastycznym?

Aby usunąć indeks w Elasticsearch, musisz napisać polecenie:

 DELETE /index name. 

Na przykład DELETE / website.

16) Wyjaśnij metodę dodawania mapowania w indeksie

Elasticsearch umożliwia tworzenie mapowań na podstawie danych dostarczonych przez użytkownika w treści żądania. Jego funkcja zbiorcza może służyć do dodawania więcej niż jednego obiektu JSON do indeksu.

Na przykład POST website / _bulk.

17) Jakie są różne sposoby wyszukiwania w Elasticsearch?

Oto sposób wyszukiwania w Elasticsearch:

Wyszukiwanie z wieloma indeksami, wyszukiwanie w wielu typach: można wyszukiwać interfejsy API, które można zastosować do wszystkich wielu indeksów, korzystając z systemu obsługi wielu indeksów.

W wyszukiwaniu elastycznym możemy tworzyć określone tagi we wszystkich indeksach we wszystkich indeksach i we wszystkich typach.

  • Wyszukiwanie URI: żądanie wyszukiwania jest wykonywane przy użyciu identyfikatora URI przez podanie żądanych parametrów.
  • Wyszukiwanie treści żądania: żądanie wyszukiwania musi zostać wykonane przez łącze DSL wyszukiwania. Zawiera zapytanie DSL w treści.

18) Jaka jest najnowsza wersja Elasticsearch?

Ostatnia wersja Elastic Search w styczniu 2020 r., Która jest najnowszą i stabilną wersją Elasticsearch.

19) Co to jest mapowanie?

Mapowanie to proces, który pomaga zdefiniować sposób odwzorowania dokumentu w wyszukiwarce. Jego cechy, które można przeszukiwać, obejmują pola, które są tokenizowane, a także przeszukiwane.

20) Gdzie jest przechowywane Elastic Search?

Możesz przechowywać Elasticsearch to dokument rozproszony, czyli sklep z różnymi typami katalogów. Możesz również pobrać złożone struktury danych, które można serializować jako dokumenty JSON.

21) Co to jest Apache Lucene?

Apache Lucene to biblioteka oprogramowania typu open source do odzyskiwania informacji. Został pierwotnie napisany w języku Java.

22) Oto ważne narzędzie do zarządzania konfiguracją obsługiwane przez Elasticsearch:

  • Puppet - puppet-flexiblesearch
  • Szef kuchni - książka kucharska-elastyczne wyszukiwanie
  • Ansible - wyszukiwanie ansiblowo-elastyczne

23) Co to jest NRT w Elasticsearch?

NRT to pełna forma platformy (Near Real-Time Search). Jest to platforma wyszukiwania działająca niemal w czasie rzeczywistym. Oznacza to niewielkie opóźnienie (przeważnie jedną sekundę) od momentu zaindeksowania dokumentu do momentu, gdy stanie się on bardzo łatwy do przeszukiwania.

24) Gdzie konfigurujesz ustawienia dla X-Pack?

Możesz skonfigurować ustawienia dla X-Pack. Posiada funkcje w plikach konfiguracyjnych flexiblesearch, logstash i kibana.yml (stos ELK).

25) Co to jest cat API w Elasticsearch?

Te polecenia akceptują parametr ciągu zapytania. Pomaga to zobaczyć wszystkie informacje i nagłówki oraz informacje, które podają, a także polecenie / _cat, które umożliwia wyświetlenie wszystkich dostępnych poleceń.

26) Jakie są różne polecenia dostępne w Elasticsearch cat API?

Polecenia używane z cat API to:

  • Aliasy kotów, przydział kotów, liczba kotów, dane pól kota
  • Zdrowie kota, indeksy kotów, mistrz kotów, oczekujące zadania, wtyczki dla kotów, odzyskiwanie kota
  • repozytoria kotów, migawki kotów, szablony kotów

27) Co to jest węzeł Ingest?

Węzeł przetwarzania jest używany do wstępnego przetwarzania dokumentów przed faktycznym indeksowaniem dokumentów. Pomaga przechwytywać żądania zbiorcze i indeksować. Stosuje również transformacje, a następnie przekazuje dokumenty z powrotem do zbiorczego interfejsu API i indeksu.

28) Jakie są różne sposoby korzystania z poleceń X-Pack?

Oto polecenia X-Pack, które pomagają skonfigurować zabezpieczenia:

  • Certgen
  • migrować
  • syskeygen
  • certutil
  • saml-metadata
  • hasła konfiguracji
  • użytkowników

29) Co to są interfejsy API pojedynczego dokumentu w Elasticsearch?

  • Pobierz API
  • Index API
  • Usuń API
  • Zaktualizuj API

30) Wyjaśnij Explore API w Elasticsearch

Graph explore API umożliwia wyodrębnianie i podsumowywanie informacji dotyczących dokumentów.

31) Jak utworzyć indeks w Elasticsearch?

Na przykład:

PUT / klient? Ładny

GET / _cat / indices? V

32) Co to są agregacje?

Struktura agregacji pomaga w dostarczaniu zagregowanych danych na podstawie zapytania wyszukiwania. Opiera się na prostych blokach konstrukcyjnych zwanych agregacjami. Można go składać w celu tworzenia złożonych podsumowań danych.

33) Czy Elasticsearch ma schemat?

Mapowania ElasticSearch, których można użyć do wymuszenia schematu w dokumentach.

34) Co to jest zapytanie DSL w Elasticsearch?

Elasticsearch oferuje pełne zapytanie DSL (język specyficzny dla domeny) w oparciu o JSON do definiowania zapytań.

35) Co to jest węzeł danych Elasticsearch?

Węzły danych przechowują fragmenty, które obsługują indeksowane dokumenty. Pomagają one w wykonywaniu operacji CRUD związanych z danymi, agregacji wyszukiwania itp. Musisz jednak ustawić node.data = true, aby węzeł był węzłem danych.

36) Co to jest dokument w ElasticSearch?

Dokument jest bardzo podobny do wiersza w relacyjnych bazach danych. Każdy dokument w indeksie ma inną strukturę, ale ma ten sam typ danych dla odpowiednich pól.

  • MySQL => Bazy danych => Tabele => Kolumny / Wiersze
  • ElasticSearch => Indeksy => Typy => Dokumenty z właściwościami

37) Wyjaśnij typ w ElasticSearch

Typ to logiczna partycja indeksu, której semantyka zależy od użytkownika.

38) Jaki jest język zapytań w Elasticsearch?

Język zapytań Apache Lucene, znany również jako Query DSL, jest używany przez Elasticsearch.

39) Co to jest dynamiczne mapowanie w Elasticsearch?

Dynamiczne mapowanie pomaga użytkownikowi indeksować dokumenty bez niepożądanych konfiguracji nazwy pola. Zamiast tego zostanie dodany automatycznie przez Elasticsearch z pewnymi niestandardowymi regułami.

40) Co to jest wyszukiwanie rozmyte Elasticsearch?

Wyszukiwanie rozmyte to proces, w którym należy zidentyfikować lokalizacje dokumentów na stronach internetowych. To przypomina argument wyszukiwania. Działa również wtedy, gdy argument nie jest istotny dla korespondenta wyszukującego określone informacje.