Co to jest OLAP?
Online Analytical Processing (OLAP) to kategoria oprogramowania, która pozwala użytkownikom analizować informacje z wielu systemów baz danych w tym samym czasie. Jest to technologia, która umożliwia analitykom wyodrębnianie i przeglądanie danych biznesowych z różnych punktów widzenia.
Analitycy często muszą grupować, agregować i łączyć dane. Te operacje w relacyjnych bazach danych wymagają dużej ilości zasobów. Dzięki OLAP dane można wstępnie obliczyć i wstępnie zagregować, co przyspiesza analizę.
Bazy danych OLAP są podzielone na jedną lub więcej kostek. Kostki są zaprojektowane w taki sposób, aby tworzenie i przeglądanie raportów stało się łatwe. OLAP oznacza przetwarzanie analityczne online.
W tym samouczku nauczysz się:
- Kostka OLAP
- Podstawowe operacje analityczne OLAP
- Rodzaje systemów OLAP
- ROLAP
- MOLAP
- Hybrydowy OLAP
- Zalety OLAP
- Wady OLAP
Kostka OLAP:
Podstawą koncepcji OLAP jest kostka OLAP. Kostka OLAP to struktura danych zoptymalizowana pod kątem bardzo szybkiej analizy danych.
Kostka OLAP składa się z liczbowych faktów zwanych miarami, które są podzielone na kategorie według wymiarów. Kostka OLAP jest również nazywana hipersześcianem .
Zwykle operacje na danych i analizy są wykonywane przy użyciu prostego arkusza kalkulacyjnego, w którym wartości danych są uporządkowane w formacie wierszy i kolumn. Jest to idealne rozwiązanie w przypadku danych dwuwymiarowych. Jednak OLAP zawiera dane wielowymiarowe, przy czym dane są zwykle uzyskiwane z innego i niepowiązanego źródła. Korzystanie z arkusza kalkulacyjnego nie jest optymalną opcją. Kostka może przechowywać i analizować wielowymiarowe dane w logiczny i uporządkowany sposób.
Jak to działa?
Hurtownia danych wyodrębnia informacje z wielu źródeł danych i formatów, takich jak pliki tekstowe, arkusze Excela, pliki multimedialne itp.
Wyodrębnione dane są czyszczone i przekształcane. Dane są ładowane do serwera OLAP (lub kostki OLAP), gdzie informacje są wstępnie obliczane z wyprzedzeniem do dalszej analizy.
Podstawowe operacje analityczne OLAP
Cztery typy operacji analitycznych w OLAP to:
- Roll-up
- Drążyć
- Pokrój i pokrój w kostkę
- Pivot (obróć)
1) Roll-up:
Konsolidacja jest również nazywana „konsolidacją” lub „agregacją”. Operację zwijania można wykonać na 2 sposoby
- Zmniejszanie wymiarów
- Wspinanie się w górę hierarchii pojęć. Hierarchia pojęć to system grupowania rzeczy na podstawie ich kolejności lub poziomu.
Rozważ poniższy diagram
- W tym przykładzie miasta New jersey i Lost Angles i zawinęły się do kraju USA
- Wyniki sprzedaży w New Jersey i Los Angeles wynoszą odpowiednio 440 i 1560. Po roll-upie stają się 2000
- W tym procesie agregacji dane to hierarchia lokalizacji przesuwa się w górę z miasta do kraju.
- W procesie zwijania należy usunąć co najmniej jeden lub więcej wymiarów. W tym przykładzie wymiar Quater został usunięty.
2) Drążenie w dół
W przypadku drążenia dane są podzielone na mniejsze części. Jest to przeciwieństwo procesu zbiorczego. Można to zrobić za pomocą
- Przechodzenie w dół hierarchii pojęć
- Zwiększenie wymiaru
Rozważ powyższy schemat
- Kwartał I kwartał jest drążony do miesięcy stycznia, lutego i marca. Odpowiadająca im sprzedaż to także rejestry.
- W tym przykładzie dodawane są miesiące wymiaru.
3) Kawałek:
Tutaj wybierany jest jeden wymiar i tworzony jest nowy pod-kostka.
Poniższy diagram wyjaśnia, w jaki sposób wykonywana jest operacja wycinka:
- Czas wymiarowania jest dzielony z Q1 jako filtrem.
- W sumie tworzony jest nowy sześcian.
Kostka do gry:
Ta operacja jest podobna do plastra. Różnica w kostkach polega na tym, że wybierasz 2 lub więcej wymiarów, które skutkują utworzeniem kostki podrzędnej.
4) Pivot
W Pivocie możesz obracać osie danych, aby zapewnić zastępczą prezentację danych.
W poniższym przykładzie przestawienie jest oparte na typach elementów.
Rodzaje systemów OLAP
Struktura hierarchiczna OLAP
Typ OLAP | Wyjaśnienie |
Relacyjny OLAP (ROLAP): | ROLAP to rozszerzony RDBMS wraz z wielowymiarowym mapowaniem danych do wykonywania standardowej operacji relacyjnej. |
Wielowymiarowy OLAP (MOLAP) | MOLAP Implementuje operacje na danych wielowymiarowych. |
Hybrydowe przetwarzanie analityczne online (HOLAP) | W podejściu HOLAP zagregowane sumy są przechowywane w wielowymiarowej bazie danych, podczas gdy szczegółowe dane są przechowywane w relacyjnej bazie danych. Zapewnia to zarówno wydajność danych modelu ROLAP, jak i wydajność modelu MOLAP. |
Pulpit OLAP (DOLAP) | W Desktop OLAP użytkownik pobiera część danych z bazy danych lokalnie lub na swój komputer i analizuje je. DOLAP jest stosunkowo tańszy we wdrożeniu, ponieważ oferuje bardzo niewiele funkcji w porównaniu z innymi systemami OLAP. |
Internetowy OLAP (WOLAP) | Web OLAP czyli system OLAP dostępny przez przeglądarkę internetową. WOLAP to trójwarstwowa architektura. Składa się z trzech komponentów: klienta, oprogramowania pośredniego i serwera bazy danych. |
Mobilny OLAP: | Mobilny OLAP pomaga użytkownikom uzyskać dostęp do danych OLAP i analizować je za pomocą urządzeń mobilnych |
Przestrzenny OLAP: | SOLAP jest tworzony w celu ułatwienia zarządzania danymi przestrzennymi i nieprzestrzennymi w systemie informacji geograficznej (GIS) |
ROLAP
ROLAP działa z danymi istniejącymi w relacyjnej bazie danych. Fakty i tabele wymiarów są przechowywane jako tabele relacyjne. Umożliwia również wielowymiarową analizę danych i jest najszybciej rozwijającym się OLAP-em.
Zalety modelu ROLAP:
- Wysoka wydajność danych. Oferuje wysoką wydajność danych, ponieważ wydajność zapytań i język dostępu są zoptymalizowane szczególnie pod kątem wielowymiarowej analizy danych.
- Skalowalność. Ten typ systemu OLAP zapewnia skalowalność do zarządzania dużymi ilościami danych, nawet gdy ilość danych stale rośnie.
Wady modelu ROLAP:
- Zapotrzebowanie na większe zasoby: ROLAP wymaga dużego wykorzystania siły roboczej, oprogramowania i zasobów sprzętowych.
- Łącznie ograniczenia danych. Narzędzia ROLAP używają języka SQL do wszystkich obliczeń danych zagregowanych. Jednak nie ma ustalonych limitów dotyczących obsługi obliczeń.
- Niska wydajność zapytań. Wydajność zapytań w tym modelu jest wolna w porównaniu z MOLAP
MOLAP
MOLAP wykorzystuje wielowymiarowe silniki pamięci masowej oparte na tablicach do wyświetlania wielowymiarowych widoków danych. Zasadniczo używają kostki OLAP.
Dowiedz się więcej o OLAP tutaj
Hybrydowy OLAP
Hybrydowy OLAP to mieszanka ROLAP i MOLAP. Oferuje szybkie obliczenia MOLAP i wyższą skalowalność ROLAP. HOLAP korzysta z dwóch baz danych.
- Zagregowane lub obliczone dane są przechowywane w wielowymiarowej kostce OLAP
- Szczegółowe informacje są przechowywane w relacyjnej bazie danych.
Zalety hybrydowego OLAP:
- Ten rodzaj OLAP pomaga zaoszczędzić miejsce na dysku, a także pozostaje kompaktowy, co pomaga uniknąć problemów związanych z szybkością i wygodą dostępu.
- Hybrid HOLAP wykorzystuje technologię kostki, która umożliwia szybsze działanie dla wszystkich typów danych.
- ROLAP są natychmiast aktualizowane, a użytkownicy HOLAP mają dostęp do tych natychmiast aktualizowanych danych w czasie rzeczywistym. MOLAP zapewnia czyszczenie i konwersję danych, poprawiając w ten sposób ich trafność. To daje to, co najlepsze z obu światów.
Wady hybrydowego OLAP:
- Większy poziom złożoności : Główną wadą systemów HOLAP jest to, że obsługuje zarówno narzędzia i aplikacje ROLAP, jak i MOLAP. Dlatego jest to bardzo skomplikowane.
- Potencjalne pokrywanie się : są większe szanse na pokrywanie się, zwłaszcza w zakresie ich funkcjonalności.
Zalety OLAP
- OLAP to platforma dla wszystkich rodzajów działalności obejmująca planowanie, budżetowanie, raportowanie i analizę.
- Informacje i obliczenia są spójne w kostce OLAP. To jest kluczowa korzyść.
- Szybko twórz i analizuj scenariusze „Co by było, gdyby”
- Z łatwością przeszukuj bazę danych OLAP pod kątem ogólnych lub szczegółowych terminów.
- OLAP zapewnia bloki konstrukcyjne dla narzędzi do modelowania biznesowego, narzędzi do eksploracji danych, narzędzi do raportowania wydajności.
- Umożliwia użytkownikom tworzenie danych z kostek i kostek według różnych wymiarów, miar i filtrów.
- Jest dobry do analizy szeregów czasowych.
- Znajdowanie niektórych klastrów i wartości odstających jest łatwe dzięki OLAP.
- Jest to potężny system wizualizacji procesu analitycznego online, który zapewnia szybsze czasy odpowiedzi
Wady OLAP
- OLAP wymaga uporządkowania danych w schemacie gwiazdy lub płatka śniegu. Te schematy są skomplikowane we wdrażaniu i zarządzaniu
- Nie można mieć dużej liczby wymiarów w pojedynczej kostce OLAP
- Nie można uzyskać dostępu do danych transakcyjnych za pomocą systemu OLAP.
- Każda modyfikacja kostki OLAP wymaga pełnej aktualizacji kostki. To czasochłonny proces
Podsumowanie:
- OLAP to technologia, która umożliwia analitykom wyodrębnianie i przeglądanie danych biznesowych z różnych punktów widzenia.
- Podstawą koncepcji OLAP jest kostka OLAP.
- Różne aplikacje biznesowe i inne operacje na danych wymagają użycia kostki OLAP.
- Istnieje pięć podstawowych typów operacji analitycznych w OLAP 1) Podsumowanie 2) Drążenie w dół 3) Wycinek 4) Kości i 5) Obrót
- Trzy typy powszechnie używanych systemów OLAP to MOLAP, ROLAP i Hybrid OLAP.
- Komputerowy OLAP, Internetowy OLAP i Mobilny OLAP to inne typy systemów OLAP.