50 najpopularniejszych pytań do wywiadów Teradata & Odpowiedzi

Anonim

ściągnij PDF

1) Jak definiujesz Teradata? Podaj niektóre z głównych cech tego samego.

Teradata to w zasadzie RDMS, który służy do sterowania urządzeniami Datamart, Datawarehouse, OLAP, OLTP, a także DSS firmy. Poniżej przedstawiono niektóre z głównych cech Teradata.

  • Może działać na pojedynczych węzłach, jak również na wielu węzłach.
  • Równoległość jest wbudowana w system.
  • Bardzo kompatybilny ze standardami ANSI.
  • Zwykle działa w taki sam sposób, jak serwer.
  • Jest to system otwarty, który zasadniczo działa dla UNIX MR-RAS, Suse Linux ETC, WIN2K itp.

2) Jakie są nowo opracowane funkcje Teradata?

Niektóre z nowo opracowanych funkcji Teradata to: -

  • Zautomatyzowana analiza czasowa
  • Rozszerzenie możliwości kompresji co pozwala na elastyczną kompresję danych około 20 razy więcej danych niż w poprzedniej wersji.
  • Innowacje związane z klientem, takie jak punkt widzenia tetradata.

3) Podkreśl kilka ważnych składników Teradata.

Niektóre z ważnych składników Teradata to: -

  • Bynet
  • Procesor modułu dostępu (AMP)
  • Silnik analizujący (PE)
  • Dysk wirtualny (vDisk)
  • Wirtualny system pamięci masowej (VSS)

4) Wspomnij o procedurze, za pomocą której możemy uruchamiać zadania Teradata w środowisku UNIX.

Wszystko, co musisz zrobić, to wykonać wykonanie w systemie UNIX w sposób opisany poniżej.

$ Sh> BTEQ <[ścieżka skryptu]> [ścieżka pliku dziennika]

lub

$ Sh> BTEQ <[ścieżka skryptu] TEE [ścieżka pliku dziennika]

5) W Teradata, jak generujemy sekwencję?

W Teradata generujemy sekwencję przy użyciu kolumny tożsamości

6) W jaki sposób w czasie wyświetlania jest generowana sekwencja przez Teradata?

Wszystko, co musisz zrobić, to użyć CSUM.

7) Na stół nakładane jest pewne obciążenie i to również co godzinę. Ruch w godzinach porannych jest stosunkowo niewielki, a nocny bardzo duży. W tej sytuacji, które narzędzie jest najbardziej zalecane i jak ma być ładowane?

Najbardziej sugestywnym narzędziem musi być Tpump. Wykorzystując zmniejszanie lub zwiększanie rozmiaru pakietu, ruch można łatwo obsłużyć.

8) Jeśli skrypt szybkiego ładowania nie powiedzie się i zostaną udostępnione tylko tabele błędów, to jak zrestartujesz komputer?

W tym przypadku istnieją zasadniczo dwa sposoby ponownego uruchomienia.

  • Uruchamianie starego pliku - upewnij się, że nie usunąłeś całkowicie tabel błędów. Zamiast tego spróbuj naprawić błędy obecne w skrypcie lub pliku, a następnie wykonaj ponownie.
  • Uruchamianie nowego pliku - w tym procesie skrypt jest wykonywany po prostu przy użyciu instrukcji end loading i begin. Pomoże to w usunięciu blokady, która została nałożona na docelową tabelę, a także może usunąć dany rekord z tabeli szybkiego dziennika. Gdy to zrobisz, możesz ponownie uruchomić cały skrypt.

9) Wspomnij o kilku narzędziach ETL wchodzących w skład Teradata.

Niektóre z narzędzi ETL, które są powszechnie używane w Teradata, to DataStage, Informatica, SSIS itp.

10) Podkreśl kilka zalet, jakie mają narzędzia ETL w porównaniu z TD.

Niektóre z zalet narzędzi ETL w porównaniu z TD to: -

  • Można obsługiwać wiele heterogenicznych miejsc docelowych, a także źródeł.
  • Proces debugowania jest znacznie łatwiejszy z pomocą narzędzi ETL dzięki pełnoprawnemu wsparciu GUI.
  • Komponenty narzędzi ETL można łatwo ponownie wykorzystać, w wyniku czego w przypadku aktualizacji na serwerze głównym wszystkie odpowiednie aplikacje podłączone do serwera są aktualizowane automatycznie.
  • Odchylanie i obracanie można łatwo wykonać za pomocą narzędzi ETL.

11) Jakie jest znaczenie buforowania w Teradata?

Buforowanie jest uważane za dodatkową zaletę korzystania z Teradata, ponieważ działa przede wszystkim ze źródłem, które pozostaje w tej samej kolejności, tj. Nie zmienia się często. Czasami pamięć podręczna jest zwykle współdzielona między aplikacjami.

12) Jak możemy sprawdzić wersję Teradata, której obecnie używamy?

Po prostu wydaj polecenie. POKAŻ WERSJĘ.

13) Podaj uzasadniony powód, dla którego Multi-load obsługuje NUSI zamiast USI.

Tak się składa, że ​​wiersz tabeli podrzędnej indeksu znajduje się na tym samym wzmacniaczu w taki sam sposób, jak wiersz danych w NUSI. W ten sposób każdy wzmacniacz działa oddzielnie i równolegle.

14) Jak jest restartowany system klienta MLOAD po wykonaniu?

Skrypt należy przesłać ręcznie, aby można go było łatwo załadować dane z ostatniego punktu kontrolnego.

15) Jak jest restartowany MLOAD Teradata Server po wykonaniu?

Proces przebiega w zasadzie od ostatniego znanego punktu kontrolnego, a po wykonaniu danych po wykonaniu skryptu MLOAD następuje restart serwera.

16) Co oznacza węzeł?

Węzeł jest zasadniczo określany jako zbiór komponentów sprzętu i oprogramowania. Zwykle serwer jest nazywany węzłem.

17) Powiedzmy, że istnieje plik składający się ze 100 rekordów, z których musimy pominąć pierwszy i ostatnie 20 rekordów. Jaki będzie fragment kodu?

Aby wykonać to zadanie, musimy użyć narzędzia BTEQ Utility. Pomiń 20, a także Powtórz 60 zostaną użyte w skrypcie.

18) Wyjaśnij PDE.

PDE w zasadzie oznacza równoległe rozszerzenie danych. Zasadniczo PDE jest warstwą interfejsu oprogramowania znajdującego się nad systemem operacyjnym i daje bazie danych szansę działania w środowisku równoległym.

19) Co to jest TPD?

TPD w zasadzie oznacza Trusted Parallel Database i działa w zasadzie pod PDE. Tak się składa, że ​​Teradata jest bazą danych, która działa głównie w środowisku PDE. To jest powód, dla którego Teradata jest zwykle określana jako baza danych Trusted Parallel lub Pure Parallel.

20) Co oznacza Channel Driver?

Sterownik kanału to oprogramowanie, które działa jako medium komunikacji między PE i wszystkimi aplikacjami działającymi na kanałach dołączonych do klientów.

21) Co oznacza Teradata Gateway?

Podobnie jak sterownik kanału, Teradata Gateway działa jako medium komunikacyjne między Parse Engine a aplikacjami dołączonymi do klientów sieciowych. Do każdego węzła przypisana jest tylko jedna brama.

22) Co oznacza dysk wirtualny?

Dysk wirtualny to w zasadzie kompilacja całej tablicy cylindrów, które są dyskami fizycznymi. Czasami jest nazywany macierzą dyskową.

23) Wyjaśnij znaczenie Amp?

Amp w zasadzie oznacza Access Module Processor i jest procesorem działającym wirtualnie i jest zasadniczo używany do zarządzania pojedynczą częścią bazy danych. Ta konkretna część bazy danych nie może być współużytkowana przez żaden inny Amp. Dlatego ta forma architektury jest powszechnie określana jako architektura bez współdzielenia.

24) Co zawiera Amp i jakie są wszystkie operacje, które wykonuje?

Amp zasadniczo składa się z podsystemu menedżera baz danych i jest w stanie wykonywać wymienione poniżej operacje.

  • Wykonywanie DML
  • Wykonywanie DDL
  • Wdrażanie agregacji i połączeń.
  • Zwalnianie i zakładanie blokad itp.

25) Co oznacza mechanizm parsowania?

PE okazuje się być miłym Vproc. Jego podstawową funkcją jest przyjmowanie żądań SQL i dostarczanie odpowiedzi w języku SQL. Składa się z szerokiej gamy komponentów oprogramowania, które są używane do dzielenia SQL na różne kroki, a następnie wysyłania tych kroków do stron AMP.

26) Co masz na myśli przez parsowanie?

Parsowanie jest procesem związanym z analizą symboli łańcucha, które są albo w języku komputerowym, albo w języku naturalnym.

27) Jakie są funkcje parsera?

Parser: -

  • Sprawdza błędy semantyki
  • Sprawdza błędy składniowe
  • Sprawdza istnienie obiektu

28) Co oznacza dyspozytor?

Dyspozytor pobiera całą kolekcję żądań, a następnie przechowuje je w kolejce. Ta sama kolejka jest utrzymywana przez cały proces w celu dostarczenia wielu zestawów odpowiedzi.

29) Ile sesji MAX jest w stanie obsłużyć w określonym czasie?

WF może obsłużyć łącznie 120 sesji w określonym momencie.

30) Wyjaśnij BYNET.

BYNET zasadniczo służy jako medium komunikacji między komponentami. Jest przede wszystkim odpowiedzialny za wysyłanie wiadomości, a także za wykonywanie operacji scalania i sortowania.

31) Co rozumie się przez klikę?

Zasadniczo wiadomo, że klika jest zbiorem węzłów, które są współdzielone między zwykłymi dyskami. Obecność Clique jest niezwykle ważna, ponieważ pomaga w unikaniu awarii węzłów.

32) Co się dzieje, gdy węzeł ulega awarii?

Ilekroć występuje spadek wydajności węzła, wszystkie odpowiadające mu Vproc natychmiast migrują do nowego węzła z węzła awarii, aby odzyskać wszystkie dane ze wspólnych dysków.

33) Wymień wszystkie formy ZAMEK, które są dostępne w Teradata.

Zasadniczo istnieją cztery typy ZAMKÓW, które wchodzą w zakres Teradata. To są: -

  • Przeczytaj Lock
  • Blokada dostępu
  • Ekskluzywny zamek
  • Napisz Lock

34) Jaki jest konkretny wyznaczony poziom, na którym LOCK może być zastosowany w Teradata?

  • Poziom tabeli - wszystkie wiersze, które są obecne w tabeli, z pewnością zostaną zablokowane.
  • Blokada poziomu bazy danych - wszystkie obiekty obecne w bazie danych zostaną zablokowane.
  • Blokada poziomu skrótu wierszy - zablokowane zostaną tylko te wiersze, które odpowiadają danemu wierszowi.

35) Jaki jest wynik aktywnie zaangażowanych stron AMP w Indeksie Głównym?

Tylko jedna strona AMP jest aktywnie zaangażowana w indeks podstawowy.

36) Jakie jest znaczenie polecenia UPSERT w Teradata?

UPSERT w zasadzie oznacza Update Else Insert. Ta opcja jest dostępna tylko w Teradata.

37) Podkreśl zalety PPI (Partition Primary Index).

PPI jest zasadniczo używany do celów przechowywania danych w oparciu o zakres lub kategorię. Jeśli chodzi o zapytania o zakres, nie ma potrzeby korzystania z pełnego skanowania tabeli, ponieważ od razu przenosi się ono na kolejną partycję, pomijając w ten sposób wszystkie inne partycje.

38) Podaj rozmiary SMALLINT, BYTEINT i INTEGER.

SMALLINT - 2 bajty - 16 bitów -> -32768 do 32767

BYTEINT - 1 bajt - 8 bitów -> -128 do 127

INTEGER - 4 bajty - 32 bity -> -2 147 483 648 do 2 147 483 647

39) Co oznacza plan najmniejszych kosztów?

Plan najmniejszych kosztów zasadniczo realizuje się w krótszym czasie na najkrótszej ścieżce.

40) Podkreśl punkty różnic między bazą danych a użytkownikiem w Teradata.

  • Baza danych jest w zasadzie pasywna, podczas gdy użytkownik jest aktywny.
  • Baza danych przede wszystkim przechowuje wszystkie obiekty bazy danych, podczas gdy użytkownik może przechowywać dowolny obiekt, niezależnie od tego, czy jest to makro, tabela, widok itp.
  • Baza danych nie ma hasła, podczas gdy użytkownik musi wprowadzić hasło.

41) Podkreśl różnice między kluczem podstawowym a indeksem podstawowym.

  • Indeks podstawowy jest dość obowiązkowy, podczas gdy klucz podstawowy jest opcjonalny.
  • Indeks podstawowy ma limit 64 tabel / kolumn, podczas gdy klucz podstawowy nie ma żadnego limitu.
  • Indeks podstawowy zezwala na duplikaty i wartości null, podczas gdy klucz podstawowy nie.
  • Indeks podstawowy jest mechanizmem fizycznym, podczas gdy klucz podstawowy jest mechanizmem czysto logicznym.

42) Wyjaśnij, jak wykorzystywane jest miejsce na szpulę.

Przestrzeń bufora w Teradata jest zasadniczo używana do uruchamiania zapytań. Z całkowitej przestrzeni dostępnej w Teradata 20% miejsca jest zasadniczo przydzielane na przestrzeń buforowania.

43) Podkreśl potrzebę dostrojenia wydajności.

Dostrajanie wydajności w Teradata jest zasadniczo wykonywane w celu zidentyfikowania wszystkich wąskich gardeł, a następnie ich rozwiązania.

44) Skomentuj, czy wąskie gardło jest błędem, czy nie.

Technicznie wąskie gardło nie jest formą błędu, ale z pewnością powoduje pewne opóźnienie w systemie.

45) Jak można zidentyfikować wąskie gardła?

Zasadniczo istnieją cztery sposoby identyfikacji wąskiego gardła. To są: -

  • Teradata Visual Explain
  • Wyjaśnij modyfikator żądania
  • Teradata Manager
  • Monitor wydajności

46) Co oznacza plan o najwyższym koszcie?

Zgodnie z planem najwyższych kosztów, czas potrzebny na wykonanie procesu jest dłuższy i zajmuje najdłuższą dostępną ścieżkę.

47) Podświetl wszystkie tryby, które są obecne w Poziomie pewności.

Niski, Nie, Wysoki i Dołącz to cztery tryby, które są obecne w poziomie ufności.

48) Nazwij pięć faz wchodzących w skład narzędzia MultiLoad.

Faza wstępna, faza DML, faza gromadzenia danych, faza aplikacji i faza końcowa.

49) Podkreśl ograniczenia narzędzia TPUMP.

Poniżej przedstawiono ograniczenia narzędzia TPUMP: -

  • Nie możemy użyć instrukcji SELECT.
  • Pliki danych nie mogą być łączone.
  • Operatory agregujące i wykładnicze nie są obsługiwane.
  • Funkcje arytmetyczne nie mogą być obsługiwane.

50) W jaki sposób w BTEQ są ustawiane parametry trybu sesji?

.set transakcja sesyjna BTET -> tryb transakcji Teradata

.set transakcja sesji ANSI -> tryb ANSI

Te polecenia będą działać tylko wtedy, gdy zostaną wprowadzone przed zalogowaniem się do sesji.