Oto pytania do rozmowy kwalifikacyjnej dotyczące modelowania danych, przeznaczone zarówno dla nowszych, jak i doświadczonych kandydatów.
1) Co to jest modelowanie danych?
Modelowanie danych to proces tworzenia modelu danych do przechowywania w bazie danych. Jest to koncepcyjna reprezentacja obiektów danych, powiązań między różnymi obiektami danych i reguł.
2) Wyjaśnij różne typy modeli danych
Istnieją głównie trzy różne typy modeli danych:
Koncepcyjne: koncepcyjny model danych definiuje, co powinien zawierać system. Ten model jest zwykle tworzony przez interesariuszy biznesowych i architektów danych. Celem jest uporządkowanie, zakres i zdefiniowanie koncepcji i reguł biznesowych.
Logiczne: definiuje sposób implementacji systemu niezależnie od DBMS. Ten model jest zwykle tworzony przez architektów danych i analityków biznesowych. Celem jest opracowanie technicznej mapy reguł i struktur danych.
Fizyczne: ten model danych opisuje, w jaki sposób system zostanie wdrożony przy użyciu określonego systemu DBMS. Ten model jest zwykle tworzony przez DBA i programistów. Celem jest faktyczna implementacja bazy danych.
3) Wyjaśnij fakt i tabelę faktów
Fakt ten przedstawia dane ilościowe. Na przykład należna kwota netto. Tabela faktów zawiera dane liczbowe, a także klucze obce z tabel wymiarowych.
4) Wymień różne schematy projektowe w modelowaniu danych
Istnieją dwa różne typy schematów modelowania danych: 1) Schemat gwiezdny i 2) Schemat płatka śniegu
5) Kiedy należy rozważyć denormalizację?
Denormalizacja jest używana, gdy podczas pobierania danych występuje duże zaangażowanie tabeli. Służy do budowy hurtowni danych.
6) Wyjaśnij wymiar i atrybut
Wymiary przedstawiają dane jakościowe. Na przykład produkt, klasa, plan itp. Tabela wymiarów ma atrybuty tekstowe lub opisowe. Na przykład kategoria produktu i nazwa produktu to dwa atrybuty tabeli wymiarów produktów.
7) Co jest mniej faktem?
Fakt mniej faktów to tabela bez pomiaru faktów. Zawiera tylko klucze wymiarów.
8) Co to jest analiza w pamięci?
Analiza w pamięci to proces buforowania bazy danych w pamięci RAM.
9) Jaka jest różnica między OLTP i OLAP?
OLTP | OLAP |
OLTP to internetowy system transakcyjny. | OLAP to internetowy proces analizy i pobierania danych. |
Charakteryzuje się dużą liczbą krótkich transakcji internetowych. | Charakteryzuje się dużą ilością danych. |
OLTP używa tradycyjnego DBMS. | OLAP korzysta z hurtowni danych. |
Tabele w bazie danych OLTP są znormalizowane. | Tabele w OLAP nie są znormalizowane. |
Jego czas odpowiedzi jest w milisekundach. | Jego czas odpowiedzi wynosi od sekund do minut. |
OLTP jest przeznaczony do operacji biznesowych w czasie rzeczywistym. | OLAP jest przeznaczony do analizy miar biznesowych według kategorii i atrybutów. |
10) Co to jest stół?
Zbiór wierszy i kolumn nazywany jest tabelą. Każda kolumna ma typ danych. Tabela zawiera powiązane dane w formacie tabelarycznym.
11) Co to jest kolumna?
Kolumna lub pole to pionowy układ danych zawierających powiązane informacje.
12) Zdefiniuj rzadkość danych
Rzadkość danych to termin używany do określenia ilości danych dotyczących encji / wymiaru modelu.
13) Co to jest złożony klucz podstawowy?
Złożony klucz podstawowy odnosi się do przypadku, gdy więcej niż jedna kolumna tabeli jest używana jako część klucza podstawowego.
14) Co to jest klucz podstawowy?
Klucz podstawowy to kolumna lub grupa kolumn, które nierówno identyfikują każdy wiersz w tabeli. Wartość klucza podstawowego nie może być pusta. Każda tabela musi zawierać jeden klucz podstawowy.
15) Wyjaśnij klucz obcy
Klucz obcy to grupa atrybutów używana do łączenia tabeli nadrzędnej i podrzędnej. Wartość kolumny klucza obcego, która jest dostępna w tabeli podrzędnej, jest odniesiona do wartości klucza podstawowego w tabeli nadrzędnej.
16) Co to są metadane?
Metadane opisują dane o danych. Pokazuje, jakie dane są faktycznie przechowywane w systemie bazodanowym.
17) Co to jest hurtownia danych?
Składnica danych to skondensowana wersja hurtowni danych przeznaczona do użytku przez określony dział, jednostkę lub zbiór użytkowników w organizacji. Np. Marketing, sprzedaż, HR lub finanse.
18) Co to jest OLTP?
Przetwarzanie transakcji online, w skrócie OLTP, obsługuje aplikacje zorientowane na transakcje w architekturze trójwarstwowej. OLTP administruje bieżącymi transakcjami firmy lub organizacji.
19) Jakie są przykłady systemu OLTP?
Przykładem systemu OLTP są:
- Wysyłanie wiadomości tekstowej
- Dodaj książkę do koszyka
- Rezerwacja biletów lotniczych online
- Bankowość internetowa
- Wprowadzanie zamówień
20) Co to jest ograniczenie czeku?
Ograniczenie sprawdzające służy do weryfikacji zakresu wartości w kolumnie.
21) Wymień rodzaje normalizacji?
Typy normalizacji to: 1) pierwsza postać normalna, 2) druga postać normalna, 3) trzecia postać normalna, 4) czwarta postać boyce-codd i 5) piąta postać normalna.
22) Co to jest inżynieria danych naprzód?
Inżynieria naprzód to termin techniczny używany do opisu procesu automatycznego tłumaczenia modelu logicznego na fizyczne narzędzie.
23) Co to jest PDAP?
Jest to kostka danych, która przechowuje dane jako podsumowanie. Pomaga użytkownikowi w szybkiej analizie danych. Dane w PDAP są przechowywane w sposób umożliwiający łatwe raportowanie.
24) Wyjaśnij projekt bazy danych schematu płatków śniegu
Schemat płatka śniegu to układ tabeli wymiarów i tabeli faktów. Ogólnie rzecz biorąc, obie tabele są dalej dzielone na więcej tabel wymiarów.
25) Wyjaśnij usługę analizy
Usługa analizy zapewnia połączony widok danych używanych w eksploracji danych lub OLAP.
26) Co to jest algorytm grupowania sekwencji?
Algorytm grupowania sekwencji zbiera ścieżki, które są podobne lub powiązane ze sobą oraz sekwencje danych zawierających zdarzenia.
27) Co to są dane dyskretne i ciągłe?
Dane dyskretne to dane ograniczone lub zdefiniowane. Np. Płeć, numery telefonów. Dane ciągłe to dane, które zmieniają się w sposób ciągły i uporządkowany. Np. Wiek.
28) Co to jest algorytm szeregów czasowych?
Algorytm szeregów czasowych to metoda przewidywania ciągłych wartości danych w tabeli. Np. Wydajność jeden pracownik może przewidzieć zysk lub wpływ.
29) Co to jest Business Intelligence?
BI (Business Intelligence) to zestaw procesów, architektur i technologii, które przekształcają surowe dane w znaczące informacje, które napędzają dochodowe działania biznesowe. Jest to pakiet oprogramowania i usług służących do przekształcania danych w przydatne informacje i wiedzę.
30) Co to jest indeks mapowany bitowo?
Indeksy bitmapowe to specjalny typ indeksu bazy danych, który używa bitmap (tablic bitowych) do odpowiadania na zapytania poprzez wykonywanie operacji bitowych.
31) Wyjaśnij szczegółowo hurtownie danych
Hurtownia danych to proces gromadzenia danych z różnych źródeł i zarządzania nimi. Dostarcza znaczących informacji o przedsiębiorstwie. Hurtownie danych są zwykle używane do łączenia i analizowania danych z heterogenicznych źródeł. Stanowi rdzeń systemu BI, który służy do analizy danych i raportowania.
32) Co to jest wymiar śmieci?
Wymiar śmieci łączy dwie lub więcej powiązanych liczności w jeden wymiar. Zwykle są to wartości logiczne lub wartości flag.
33) Wyjaśnij schemat danych
Schemat danych to schematyczne przedstawienie, które ilustruje relacje i struktury danych.
34) Wyjaśnij częstotliwość gromadzenia danych
Częstotliwość zbierania danych to szybkość zbierania danych. Przechodzi również przez różne etapy. Etapy te to: 1) wydobywanie z różnych źródeł, 3) przekształcanie, 4) oczyszczanie i 5) przechowywanie.
35) Co to jest liczność bazy danych?
Liczność to liczbowy atrybut relacji między dwoma bytami lub zestawami jednostek.
36) Jakie są rodzaje relacji kardynalnych?
Istnieją różne typy kluczowych relacji kardynalnych:
- Relacje jeden do jednego
- Relacje jeden do wielu
- Relacje wiele do jednego
- Relacje wiele do wielu
37) Zdefiniuj krytyczny czynnik sukcesu i wymień jego cztery typy
Krytyczny czynnik sukcesu to korzystny wynik wszelkich działań potrzebnych organizacji do osiągnięcia celu.
Cztery rodzaje krytycznych czynników sukcesu to:
- Przemysłowe CSF
- Strategiczne CSF
- Środowiskowe CSF
- Czasowe CSF
38) Co to jest eksploracja danych?
Eksploracja danych to wielodyscyplinarna umiejętność wykorzystująca uczenie maszynowe, statystyki, sztuczną inteligencję i technologię baz danych. Chodzi o odkrywanie nieoczekiwanych / wcześniej nieznanych relacji między danymi.
39) Jaka jest różnica między schematem Star a schematem Snowflake?
Schemat gwiazdy | Schemat płatka śniegu |
Hierarchie wymiarów są przechowywane w tabeli wymiarów. | Hierarchie są podzielone na oddzielne tabele. |
Zawiera tabelę faktów otoczoną tabelami wymiarów. | Jedna tabela faktów otoczona tabelą wymiarów, która z kolei jest otoczona tabelą wymiarów |
W schemacie gwiaździstym tylko jedno sprzężenie tworzy relację między tabelą faktów a dowolnymi tabelami wymiarów. | Schemat płatka śniegu wymaga wielu sprzężeń, aby pobrać dane. |
Ma prosty projekt bazy danych | Ma złożony projekt bazy danych |
Zdenormalizowana struktura danych i zapytania również działają szybciej. | Znormalizowana struktura danych. |
Wysoki poziom nadmiarowości danych | Nadmiarowość danych na bardzo niskim poziomie |
Oferuje bardziej wydajne zapytania przy użyciu optymalizacji zapytania gwiaździstego. Stoły można łączyć w wielu wymiarach. | Schemat płatka śniegu jest reprezentowany przez scentralizowaną tabelę faktów, która jest mało prawdopodobna w połączeniu z wieloma wymiarami. |
40) Co to jest identyfikacja relacji?
Identyfikowanie relacji między podmiotami w systemie DBMS służy do identyfikowania relacji między dwoma podmiotami: 1) podmiotem silnym i 2) podmiotem słabym.
41) Co to jest relacja samorekurencyjna?
Relacja rekurencyjna to samodzielna kolumna w tabeli połączona z kluczem podstawowym tej samej tabeli.
42) Wyjaśnij relacyjne modelowanie danych
Modelowanie danych relacyjnych to reprezentacja obiektów w relacyjnej bazie danych, która jest zwykle znormalizowana.
43) Co to jest analiza modelowania predykcyjnego?
Proces walidacji lub testowania modelu, który służyłby do przewidywania testów i walidacji wyników. Może być używany do uczenia maszynowego, sztucznej inteligencji, a także do statystyk.
44) Jaka jest różnica między logicznym modelem danych a fizycznym modelem danych?
Logiczny model danych | Fizyczny model danych |
Logiczny model danych może zaprojektować wymagania biznesowe w sposób logiczny. | Fizyczny model danych zawiera informacje o źródle docelowej bazy danych i jego właściwościach. |
Odpowiada za faktyczną implementację danych, które są przechowywane w bazie danych. | Fizyczny model danych pomaga utworzyć nowy model bazy danych na podstawie istniejącego i zastosować ograniczenie integralności referencyjnej. |
Zawiera encję, atrybuty klucza podstawowego, klucze inwersji, klucz alternatywny, regułę, relację biznesową, definicję itp. | Fizyczny model danych zawiera tabelę, ograniczenia klucza, klucz unikalny, kolumny, klucz obcy, indeksy, wartości domyślne itp. |
45) Jakie są rodzaje ograniczeń?
Innym rodzajem ograniczenia mogą być unikalne, wartości null, klucze obce, klucz złożony lub ograniczenie sprawdzające itp.
46) Co to jest narzędzie do modelowania danych?
Narzędzie do modelowania danych to oprogramowanie, które pomaga w konstruowaniu przepływu danych i relacji między danymi. Przykładami takich narzędzi są Borland Together, Altova Database Spy, casewise, Case Studio 2 itp.
47) Co to jest hierarchiczny DBMS?
W hierarchicznej bazie danych dane modelu są zorganizowane w strukturę drzewa. Dane są przechowywane w formacie hierarchicznym. Dane są przedstawiane za pomocą relacji rodzic-dziecko. W hierarchicznym DBMS rodzic może mieć wiele dzieci, dzieci mają tylko jednego rodzica.
48) Jakie są wady hierarchicznego modelu danych?
Wady hierarchicznego modelu danych to:
- Nie jest elastyczny, ponieważ dostosowanie się do zmieniających się potrzeb biznesu wymaga czasu.
- Struktura stawia problem w komunikacji międzyresortowej, wertykalnej, a także międzyresortowej.
- Hierarchiczny model danych może stwarzać problemy związane z brakiem jedności.
49) Wyjaśnij oparte na procesach podejście do modelowania danych
Podejście oparte na procesach stosowane w modelowaniu danych jest zgodne z metodą krok po kroku w odniesieniu do relacji między modelem relacji jednostka a procesem organizacyjnym.
50) Jakie są zalety korzystania z modelowania danych?
Zalety stosowania modelowania danych w hurtowni danych to:
- Pomaga w zarządzaniu danymi biznesowymi, normalizując je i definiując ich atrybuty.
- Modelowanie danych integruje dane z różnych systemów w celu zmniejszenia nadmiarowości danych.
- Umożliwia tworzenie wydajnych projektów baz danych.
- Modelowanie danych pomaga działowi organizacji funkcjonować jako zespół.
- Ułatwia dostęp do danych z łatwością.
51) Jakie są wady korzystania z modelowania danych?
Wady korzystania z modelowania danych to:
- Ma mniejszą niezależność strukturalną
- Może to skomplikować system.
52) Co to jest indeks?
Indeks jest używany dla kolumny lub grupy kolumn w celu szybkiego pobierania danych.
53) Jakie są cechy logicznego modelu danych?
Charakterystyka logicznego modelu danych to:
- Opisuje potrzeby w zakresie danych dla pojedynczego projektu, ale można je zintegrować z innymi logicznymi modelami danych w oparciu o zakres projektu.
- Zaprojektowany i opracowany niezależnie od DBMS.
- Atrybuty danych będą miały typy danych z dokładną dokładnością i długością.
- Procesy normalizacji do modelu, który jest generalnie stosowany typowo do 3NF.
54) Jakie są cechy fizycznego modelu danych?
Charakterystyka fizycznego modelu danych to:
- Fizyczny model danych opisuje zapotrzebowanie na dane dla pojedynczego projektu lub aplikacji. Może być zintegrowany z innymi fizycznymi modelami danych w oparciu o zakres projektu.
- Model danych zawiera relacje między tabelami, które odnoszą się do liczności i wartości zerowej relacji.
- Opracowany dla określonej wersji DBMS, lokalizacji, przechowywania danych lub technologii do wykorzystania w projekcie.
- Kolumny powinny mieć dokładne typy danych, przypisane długości i wartości domyślne.
- Zdefiniowane są klucze podstawowe i obce, widoki, indeksy, profile dostępu, uprawnienia itp.
55) Jakie są dwa rodzaje technik modelowania danych?
Dwa typy technik modelowania danych to: 1) model relacji między jednostkami (ER) i 2) UML (Unified Modeling Language).
56) Co to jest UML?
UML (Unified Modeling Language) to język programowania ogólnego przeznaczenia, służący do tworzenia baz danych i modelowania w dziedzinie inżynierii oprogramowania. Głównym celem jest zapewnienie uogólnionego sposobu wizualizacji projektu systemu.
57) Wyjaśnij obiektowy model bazy danych
Zorientowany obiektowo model bazy danych to zbiór obiektów. Obiekty te mogą mieć powiązane funkcje, a także metody.
58) Co to jest model sieciowy?
Jest to model zbudowany na modelu hierarchicznym. Umożliwia łączenie rekordów przez więcej niż jedną relację, co oznacza, że ma wiele rekordów. Możliwe jest skonstruowanie zestawu rekordów nadrzędnych i podrzędnych. Każdy rekord może należeć do wielu zestawów, które umożliwiają wykonywanie złożonych relacji między tabelami.
59) Co to jest haszowanie?
Haszowanie to technika używana do przeszukiwania wszystkich wartości indeksu i pobierania żądanych danych. Pomaga obliczyć bezpośrednią lokalizację danych, które są zapisywane na dysku bez korzystania ze struktury indeksu.
60) Co to są klucze biznesowe lub naturalne?
klucze biznesowe lub klucze naturalne to pole, które jednoznacznie identyfikuje jednostkę. Na przykład identyfikator klienta, numer pracownika, adres e-mail itp.
61) Co to jest klucz złożony?
Gdy do reprezentowania klucza używane jest więcej niż jedno pole, nazywa się to kluczem złożonym.
62) Jaka jest pierwsza postać normalna?
Pierwsza postać normalna lub 1NF jest właściwością relacji dostępną w systemie zarządzania relacyjnymi bazami danych. Każda relacja nazywana jest pierwszą formą normalną, jeśli dziedzina każdego atrybutu zawiera wartości, które są niepodzielne. Zawiera jedną wartość z tej domeny.
63) Jaka jest różnica między kluczem podstawowym a obcym?
Klucz podstawowy | Klucz obcy |
Klucz podstawowy pomaga jednoznacznie zidentyfikować rekord w tabeli. | Klucz obcy to pole w tabeli, które jest kluczem podstawowym innej tabeli. |
Klucz podstawowy nigdy nie akceptuje wartości null. | Klucz obcy może akceptować wiele wartości null. |
Klucz podstawowy to indeks klastrowy, a dane w tabeli DBMS są fizycznie uporządkowane w kolejności indeksu klastrowego. | Klucz obcy nie może automatycznie utworzyć indeksu, klastrowego ani nieklastrowego. Możesz jednak ręcznie utworzyć indeks na kluczu obcym. |
Możesz mieć pojedynczy klucz podstawowy w tabeli. | W tabeli możesz mieć wiele kluczy obcych. |
64) Jakie są wymagania drugiej formy normalnej?
Wymagania drugiej formy normalnej są następujące:
- Powinien być w pierwszej normalnej formie.
- Nie zawiera atrybutu innego niż pierwszy, który jest funkcjonalnie zależny od dowolnego podzbioru klucza kandydującego relacji tabeli.
65) Jakie są zasady dotyczące trzeciej formy normalnej?
Reguły dotyczące trzeciej formy normalnej to:
- Powinien być w drugiej normalnej postaci
- Nie ma przechodnich zależności funkcjonalnych.
66) Jakie znaczenie ma używanie kluczy?
- Klucze pomagają zidentyfikować dowolny wiersz danych w tabeli. W rzeczywistej aplikacji tabela może zawierać tysiące rekordów.
- Klucze zapewniają, że możesz jednoznacznie zidentyfikować rekord tabeli pomimo tych wyzwań.
- Umożliwia ustanowienie relacji między tabelami i zidentyfikowanie relacji między nimi
- Pomóż ci wymusić tożsamość i integralność w związku.
67) Co to jest klucz zastępczy?
Sztuczny klucz, który ma na celu unikalną identyfikację każdego rekordu, nazywany jest kluczem zastępczym. Tego rodzaju klucze są unikalne, ponieważ są tworzone, gdy nie masz naturalnego klucza podstawowego. Nie nadają one znaczenia danym w tabeli. Klucz zastępczy jest zwykle liczbą całkowitą.
68) Wyjaśnij szczegółowo inny klucz
Klucz alternatywny to kolumna lub grupa kolumn w tabeli, która jednoznacznie identyfikuje każdy wiersz w tej tabeli. Tabela może mieć wiele opcji dla klucza podstawowego, ale tylko jeden może być ustawiony jako klucz podstawowy. Wszystkie klucze, które nie są kluczami podstawowymi, nazywane są kluczami alternatywnymi.
69) Jaka jest czwarta forma normalna w DBMS?
Czwarta postać normalna to poziom normalizacji bazy danych, na którym nie może istnieć nietrywialna zależność inna niż klucz kandydujący.
70) Co to jest system zarządzania bazą danych?
System zarządzania bazą danych lub DBMS to oprogramowanie do przechowywania i wyszukiwania danych użytkownika. Składa się z grupy programów, które manipulują bazą danych.
71) Jaka jest reguła piątej postaci normalnej?
Tabela w 5 p postaci normalnej tylko wtedy, gdy znajduje się w 4 p normalnej postaci, i nie mogą być rozłożone w dowolnej liczbie mniejszych tabelach bez utraty danych.
72) Co to jest normalizacja?
Normalizacja to technika projektowania baz danych, która organizuje tabele w sposób zmniejszający nadmiarowość i zależność danych. Dzieli większe tabele na mniejsze i łączy je za pomocą relacji.
73) Wyjaśnij cechy systemu zarządzania bazą danych
- Zapewnia bezpieczeństwo i usuwa nadmiarowość
- Samoopisujący charakter systemu bazodanowego
- Izolacja między programami i abstrakcja danych
- Obsługa wielu widoków danych.
- Udostępnianie danych i przetwarzanie transakcji przez wielu użytkowników
- DBMS umożliwia jednostkom i relacjom między nimi tworzenie tabel.
- Jest zgodny z koncepcją ACID (atomowość, spójność, izolacja i trwałość).
- DBMS obsługuje środowisko wielu użytkowników, które umożliwia użytkownikom równoległy dostęp do danych i manipulowanie nimi.
74) Wypisz popularne oprogramowanie DBMS
Popularne oprogramowanie DBMS to:
- MySQL
- Microsoft Access
- Wyrocznia
- PostgreSQL
- dbase
- FoxPro
- SQLite
- IBM DB2
- Microsoft SQL Server.
75) Wyjaśnij koncepcję RDBMS
System zarządzania relacyjnymi bazami danych to oprogramowanie służące do przechowywania danych w postaci tabel. W tego rodzaju systemie dane są zarządzane i przechowywane w wierszach i kolumnach, zwanych krotkami i atrybutami. RDBMS to potężny system zarządzania danymi, który jest szeroko stosowany na całym świecie.
76) Jakie są zalety modelu danych?
Zalety modelu danych to:
- Głównym celem projektowania modelu danych jest zapewnienie dokładnej reprezentacji obiektów danych oferowanych przez zespół funkcjonalny.
- Model danych powinien być wystarczająco szczegółowy, aby można go było wykorzystać do zbudowania fizycznej bazy danych.
- Informacje zawarte w modelu danych mogą służyć do definiowania relacji między tabelami, kluczami podstawowymi i obcymi oraz procedurami składowanymi.
- Model danych pomaga firmom komunikować się w ramach organizacji i między nimi.
- Model danych pomaga w dokumentowaniu mapowań danych w procesie ETL
- Pomóż rozpoznać prawidłowe źródła danych do wypełnienia modelu
77) Jakie są wady modelu danych?
Wady modelu danych to:
- Aby opracować model danych, należy znać fizyczne właściwości przechowywanych danych.
- Jest to system nawigacyjny, który umożliwia tworzenie i zarządzanie złożonymi aplikacjami. Wymaga więc znajomości prawdy biograficznej.
- Jeszcze mniejsze zmiany w konstrukcji wymagają modyfikacji w całej aplikacji.
- W DBMS nie ma zestawu języków do manipulacji danymi.
78) Wyjaśnij różne typy tabel faktów
Istnieją trzy typy tabel faktów:
- Dodatek: jest to miara dodawana do dowolnego wymiaru.
- Nieaddytywna: jest to miara, której nie można dodać do żadnego wymiaru.
- Półdodatki: jest to miara, którą można dodać do kilku wymiarów.
79) Co to jest tabela zbiorcza?
Tabela zbiorcza zawiera zagregowane dane, które można obliczyć przy użyciu takich funkcji, jak: 1) Średnia 2) MAKS, 3) Liczba, 4) SUMA, 5) SUMA i 6) MIN.
80) Co to jest wymiar potwierdzony?
Wymiar dostosowany to wymiar zaprojektowany w taki sposób, aby można go było używać w wielu tabelach faktów w różnych obszarach hurtowni danych.
81) Wymień typy hierarchii w modelowaniu danych
Istnieją dwa typy hierarchii: 1) Hierarchie oparte na poziomach i 2) Hierarchie nadrzędny-podrzędny.
82) Jaka jest różnica między zbiorczą bazą danych a hurtownią danych?
Data mart | Hurtownia danych |
Data mart koncentruje się na jednym obszarze biznesowym. | Hurtownia danych skupia się na wielu obszarach biznesowych. |
Służy do podejmowania taktycznych decyzji dotyczących rozwoju biznesu. | Pomaga właścicielom firm w podjęciu strategicznej decyzji |
Data mart jest zgodna z modelem oddolnym | Hurtownia danych działa w modelu odgórnym |
Źródło danych pochodzi z jednego źródła danych | Źródło danych pochodzi z więcej niż jednego heterogenicznego źródła danych. |
83) Co to jest XMLA?
XMLA to analiza XML, która jest uważana za standard w dostępie do danych w przetwarzaniu analitycznym online (OLAP).
84) Wyjaśnij wymiar śmieci
Wymiar śmieci pomaga przechowywać dane. Jest używany, gdy dane nie są odpowiednie do przechowywania w schemacie.
85) Wyjaśnij łańcuchową replikację danych
Sytuacja, w której węzeł drugorzędny wybiera cel przy użyciu czasu ping lub gdy najbliższy węzeł jest drugorzędnym, nazywa się to łańcuchową replikacją danych.
86) Wyjaśnij wirtualne hurtownie danych
Wirtualna hurtownia danych zapewnia zbiorczy widok kompletnych danych. Wirtualna hurtownia danych nie zawiera danych historycznych. Jest uważany za logiczny model danych posiadający metadane.
87) Wyjaśnij migawkę hurtowni danych
Migawka to pełna wizualizacja danych w momencie rozpoczęcia procesu wyodrębniania danych.
88) Co to jest ekstrakt dwukierunkowy?
Zdolność systemu do wyodrębniania, czyszczenia i przesyłania danych w dwóch kierunkach nazywana jest ekstrakcją kierunkową.