Co to jest schemat wielowymiarowy?
Schemat wielowymiarowy jest specjalnie zaprojektowany do modelowania systemów hurtowni danych. Schematy zostały zaprojektowane z myślą o unikalnych potrzebach bardzo dużych baz danych zaprojektowanych do celów analitycznych (OLAP).
Typy schematów hurtowni danych:
Poniżej przedstawiono 3 główne typy wielowymiarowych schematów, z których każdy ma swoje unikalne zalety.
- Schemat gwiazdy
- Schemat płatka śniegu
- Schemat galaktyki
W tym samouczku dowiesz się więcej o:
- Co to jest schemat gwiezdny?
- Co to jest schemat płatka śniegu?
- Schemat gwiazdy kontra schemat płatka śniegu: kluczowe różnice
- Co to jest schemat Galaxy?
- Co to jest schemat gromady gwiazd?
Co to jest schemat gwiezdny?
Schemat gwiazdy w hurtowni danych, w której środek gwiazdy może mieć jedną tabelę faktów i kilka powiązanych tabel wymiarów. Jest znany jako schemat gwiazdy, ponieważ jego struktura przypomina gwiazdę. Model danych Star Schema to najprostszy typ schematu Data Warehouse. Znany jest również jako schemat łączenia gwiazd i jest zoptymalizowany do przeszukiwania dużych zestawów danych.
W poniższym przykładzie schematu gwiaździstego tabela faktów znajduje się pośrodku, która zawiera klucze do każdej tabeli wymiarów, takich jak ID_Delnera, ID modelu, ID_Daty, ID_produktu, ID_oddziału i inne atrybuty, takie jak sprzedane jednostki i przychód.
Charakterystyka schematu gwiezdnego:
- Każdy wymiar w schemacie gwiazdy jest reprezentowany za pomocą jedynej jednowymiarowej tabeli.
- Tabela wymiarów powinna zawierać zestaw atrybutów.
- Tabela wymiarów jest łączona z tabelą faktów za pomocą klucza obcego
- Tabele wymiarów nie są ze sobą połączone
- Tabela faktów zawierałaby klucz i miarę
- Schemat gwiazdy jest łatwy do zrozumienia i zapewnia optymalne wykorzystanie dysku.
- Tabele wymiarów nie są znormalizowane. Na przykład na powyższym rysunku Country_ID nie ma tabeli wyszukiwania krajów, jak miałby projekt OLTP.
- Schemat jest szeroko obsługiwany przez narzędzia BI
Co to jest schemat płatka śniegu?
Schemat płatka śniegu w hurtowni danych to logiczne rozmieszczenie tabel w wielowymiarowej bazie danych w taki sposób, że diagram ER przypomina kształt płatka śniegu. Schemat płatka śniegu jest rozszerzeniem schematu gwiaździstego i dodaje dodatkowe wymiary. Tabele wymiarów są znormalizowane, co powoduje podział danych na dodatkowe tabele.
W poniższym przykładzie schematu płatka śniegu kraj jest dalej znormalizowany do indywidualnej tabeli.
Charakterystyka schematu płatka śniegu:
- Główną zaletą schematu płatka śniegu jest to, że zajmuje mniej miejsca na dysku.
- Do schematu dodawany jest łatwiejszy do zaimplementowania wymiar
- Z powodu wielu tabel wydajność zapytań jest zmniejszona
- Głównym wyzwaniem, z którym będziesz musiał się zmierzyć podczas korzystania ze schematu płatka śniegu, jest to, że musisz wykonać więcej czynności konserwacyjnych z powodu większej liczby tabel przeglądowych.
Schemat gwiazdy kontra schemat płatka śniegu: kluczowe różnice
Poniżej przedstawiono kluczową różnicę między schematem gwiazdy a schematem płatka śniegu:
Schemat gwiazdy | Schemat płatka śniegu |
---|---|
Hierarchie wymiarów są przechowywane w tabeli wymiarów. | Hierarchie są podzielone na oddzielne tabele. |
Zawiera tabelę faktów otoczoną tabelami wymiarów. | Jedna tabela faktów otoczona tabelą wymiarów, które z kolei są otoczone tabelą wymiarów |
W schemacie gwiaździstym tylko jedno sprzężenie tworzy relację między tabelą faktów a dowolnymi tabelami wymiarów. | Schemat płatka śniegu wymaga wielu sprzężeń, aby pobrać dane. |
Prosty projekt DB. | Bardzo złożony projekt DB. |
Denormalizowana struktura danych i zapytania również działają szybciej. | Znormalizowana struktura danych. |
Wysoki poziom nadmiarowości danych | Nadmiarowość danych na bardzo niskim poziomie |
Tabela pojedynczego wymiaru zawiera dane zagregowane. | Dane podzielone na różne tabele wymiarów. |
Przetwarzanie kostek jest szybsze. | Przetwarzanie kostki może być powolne z powodu złożonego sprzężenia. |
Oferuje bardziej wydajne zapytania przy użyciu optymalizacji zapytań w gwiazdę. Stoły można łączyć w wielu wymiarach. | Schemat płatka śniegu jest reprezentowany przez scentralizowaną tabelę faktów, która jest mało prawdopodobna w połączeniu z wieloma wymiarami. |
Co to jest schemat galaktyki?
Galaxy Schemat zawiera dwa tabelę faktów, że tabele wymiarów akcji między nimi. Jest również nazywany schematem konstelacji faktów. Schemat jest postrzegany jako zbiór gwiazd, stąd nazwa Galaxy Schema.
Jak widać na powyższym przykładzie, istnieją dwie tabele faktów
- Dochód
- Produkt.
W Galaxy współużytkowane wymiary nazywane są wymiarami zgodnymi.
Charakterystyka schematu galaktyki:
- Wymiary w tym schemacie są podzielone na osobne wymiary na podstawie różnych poziomów hierarchii.
- Na przykład, jeśli geografia ma cztery poziomy hierarchii, takie jak region, kraj, stan i miasto, wówczas schemat Galaxy powinien mieć cztery wymiary.
- Co więcej, możliwe jest zbudowanie tego typu schematu poprzez podzielenie schematu jednogwiazdkowego na więcej schematów gwiazdy.
- Wymiary są duże w tym schemacie, który jest potrzebny do zbudowania w oparciu o poziomy hierarchii.
- Ten schemat jest pomocny przy agregowaniu tabel faktów w celu lepszego zrozumienia.
Co to jest schemat gromady gwiazd?
Schemat płatka śniegu zawiera w pełni rozwinięte hierarchie. Może to jednak zwiększyć złożoność schematu i wymaga dodatkowych połączeń. Z drugiej strony schemat gwiazdy zawiera całkowicie zwinięte hierarchie, co może prowadzić do nadmiarowości. Tak więc najlepszym rozwiązaniem może być równowaga między tymi dwoma schematami, którą jest projekt schematu gwiezdnej gromady.
Nakładające się wymiary można znaleźć jako rozwidlenia w hierarchiach. Rozwidlenie ma miejsce, gdy jednostka działa jako rodzic w dwóch różnych hierarchiach wymiarowych. Rozwidlenia są następnie identyfikowane jako klasyfikacja z relacjami jeden do wielu.
Podsumowanie:
- Schemat wielowymiarowy jest specjalnie zaprojektowany do modelowania systemów hurtowni danych
- Schemat gwiazdy jest najprostszym typem schematu hurtowni danych. Jest znany jako schemat gwiazdy, ponieważ jego struktura przypomina gwiazdę.
- Schemat płatka śniegu jest rozszerzeniem schematu gwiaździstego i dodaje dodatkowe wymiary. Nazywa się płatkiem śniegu, ponieważ jego schemat przypomina płatek śniegu.
- W schemacie gwiaździstym tylko jedno sprzężenie definiuje relację między tabelą faktów a dowolnymi tabelami wymiarów.
- Schemat gwiazdy zawiera tabelę faktów otoczoną tabelami wymiarów.
- Schemat płatka śniegu jest otoczony tabelą wymiarów, która z kolei jest otoczona tabelą wymiarów
- Schemat płatka śniegu wymaga wielu sprzężeń, aby pobrać dane.
- Schemat Galaxy zawiera dwie tabele faktów, które współużytkują tabele wymiarów. Jest również nazywany schematem konstelacji faktów.
- Schemat klastra gwiazdowego zawiera atrybuty schematu gwiazdy i płatka śniegu.