Co to jest OLAP? Cube, Operations & Typy w hurtowni danych

Spisie treści:

Anonim

Co to jest OLAP?

Online Analytical Processing (OLAP) to kategoria oprogramowania, która pozwala użytkownikom analizować informacje z wielu systemów baz danych w tym samym czasie. Jest to technologia, która umożliwia analitykom wyodrębnianie i przeglądanie danych biznesowych z różnych punktów widzenia.

Analitycy często muszą grupować, agregować i łączyć dane. Te operacje w relacyjnych bazach danych wymagają dużej ilości zasobów. Dzięki OLAP dane można wstępnie obliczyć i wstępnie zagregować, co przyspiesza analizę.

Bazy danych OLAP są podzielone na jedną lub więcej kostek. Kostki są zaprojektowane w taki sposób, aby tworzenie i przeglądanie raportów stało się łatwe. OLAP oznacza przetwarzanie analityczne online.

W tym samouczku nauczysz się:

  • Kostka OLAP
  • Podstawowe operacje analityczne OLAP
  • Rodzaje systemów OLAP
  • ROLAP
  • MOLAP
  • Hybrydowy OLAP
  • Zalety OLAP
  • Wady OLAP

Kostka OLAP:

Podstawą koncepcji OLAP jest kostka OLAP. Kostka OLAP to struktura danych zoptymalizowana pod kątem bardzo szybkiej analizy danych.

Kostka OLAP składa się z liczbowych faktów zwanych miarami, które są podzielone na kategorie według wymiarów. Kostka OLAP jest również nazywana hipersześcianem .

Zwykle operacje na danych i analizy są wykonywane przy użyciu prostego arkusza kalkulacyjnego, w którym wartości danych są uporządkowane w formacie wierszy i kolumn. Jest to idealne rozwiązanie w przypadku danych dwuwymiarowych. Jednak OLAP zawiera dane wielowymiarowe, przy czym dane są zwykle uzyskiwane z innego i niepowiązanego źródła. Korzystanie z arkusza kalkulacyjnego nie jest optymalną opcją. Kostka może przechowywać i analizować wielowymiarowe dane w logiczny i uporządkowany sposób.

Jak to działa?

Hurtownia danych wyodrębnia informacje z wielu źródeł danych i formatów, takich jak pliki tekstowe, arkusze Excela, pliki multimedialne itp.

Wyodrębnione dane są czyszczone i przekształcane. Dane są ładowane do serwera OLAP (lub kostki OLAP), gdzie informacje są wstępnie obliczane z wyprzedzeniem do dalszej analizy.

Podstawowe operacje analityczne OLAP

Cztery typy operacji analitycznych w OLAP to:

  1. Roll-up
  2. Drążyć
  3. Pokrój i pokrój w kostkę
  4. Pivot (obróć)

1) Roll-up:

Konsolidacja jest również nazywana „konsolidacją” lub „agregacją”. Operację zwijania można wykonać na 2 sposoby

  1. Zmniejszanie wymiarów
  2. Wspinanie się w górę hierarchii pojęć. Hierarchia pojęć to system grupowania rzeczy na podstawie ich kolejności lub poziomu.

Rozważ poniższy diagram

  • W tym przykładzie miasta New jersey i Lost Angles i zawinęły się do kraju USA
  • Wyniki sprzedaży w New Jersey i Los Angeles wynoszą odpowiednio 440 i 1560. Po roll-upie stają się 2000
  • W tym procesie agregacji dane to hierarchia lokalizacji przesuwa się w górę z miasta do kraju.
  • W procesie zwijania należy usunąć co najmniej jeden lub więcej wymiarów. W tym przykładzie wymiar Quater został usunięty.

2) Drążenie w dół

W przypadku drążenia dane są podzielone na mniejsze części. Jest to przeciwieństwo procesu zbiorczego. Można to zrobić za pomocą

  • Przechodzenie w dół hierarchii pojęć
  • Zwiększenie wymiaru

Rozważ powyższy schemat

  • Kwartał I kwartał jest drążony do miesięcy stycznia, lutego i marca. Odpowiadająca im sprzedaż to także rejestry.
  • W tym przykładzie dodawane są miesiące wymiaru.

3) Kawałek:

Tutaj wybierany jest jeden wymiar i tworzony jest nowy pod-kostka.

Poniższy diagram wyjaśnia, w jaki sposób wykonywana jest operacja wycinka:

  • Czas wymiarowania jest dzielony z Q1 jako filtrem.
  • W sumie tworzony jest nowy sześcian.

Kostka do gry:

Ta operacja jest podobna do plastra. Różnica w kostkach polega na tym, że wybierasz 2 lub więcej wymiarów, które skutkują utworzeniem kostki podrzędnej.

4) Pivot

W Pivocie możesz obracać osie danych, aby zapewnić zastępczą prezentację danych.

W poniższym przykładzie przestawienie jest oparte na typach elementów.

Rodzaje systemów OLAP

Struktura hierarchiczna OLAP

Typ OLAP Wyjaśnienie
Relacyjny OLAP (ROLAP): ROLAP to rozszerzony RDBMS wraz z wielowymiarowym mapowaniem danych do wykonywania standardowej operacji relacyjnej.
Wielowymiarowy OLAP (MOLAP) MOLAP Implementuje operacje na danych wielowymiarowych.
Hybrydowe przetwarzanie analityczne online (HOLAP) W podejściu HOLAP zagregowane sumy są przechowywane w wielowymiarowej bazie danych, podczas gdy szczegółowe dane są przechowywane w relacyjnej bazie danych. Zapewnia to zarówno wydajność danych modelu ROLAP, jak i wydajność modelu MOLAP.
Pulpit OLAP (DOLAP) W Desktop OLAP użytkownik pobiera część danych z bazy danych lokalnie lub na swój komputer i analizuje je. DOLAP jest stosunkowo tańszy we wdrożeniu, ponieważ oferuje bardzo niewiele funkcji w porównaniu z innymi systemami OLAP.
Internetowy OLAP (WOLAP) Web OLAP czyli system OLAP dostępny przez przeglądarkę internetową. WOLAP to trójwarstwowa architektura. Składa się z trzech komponentów: klienta, oprogramowania pośredniego i serwera bazy danych.
Mobilny OLAP: Mobilny OLAP pomaga użytkownikom uzyskać dostęp do danych OLAP i analizować je za pomocą urządzeń mobilnych
Przestrzenny OLAP: SOLAP jest tworzony w celu ułatwienia zarządzania danymi przestrzennymi i nieprzestrzennymi w systemie informacji geograficznej (GIS)

ROLAP

ROLAP działa z danymi istniejącymi w relacyjnej bazie danych. Fakty i tabele wymiarów są przechowywane jako tabele relacyjne. Umożliwia również wielowymiarową analizę danych i jest najszybciej rozwijającym się OLAP-em.

Zalety modelu ROLAP:

  • Wysoka wydajność danych. Oferuje wysoką wydajność danych, ponieważ wydajność zapytań i język dostępu są zoptymalizowane szczególnie pod kątem wielowymiarowej analizy danych.
  • Skalowalność. Ten typ systemu OLAP zapewnia skalowalność do zarządzania dużymi ilościami danych, nawet gdy ilość danych stale rośnie.

Wady modelu ROLAP:

  • Zapotrzebowanie na większe zasoby: ROLAP wymaga dużego wykorzystania siły roboczej, oprogramowania i zasobów sprzętowych.
  • Łącznie ograniczenia danych. Narzędzia ROLAP używają języka SQL do wszystkich obliczeń danych zagregowanych. Jednak nie ma ustalonych limitów dotyczących obsługi obliczeń.
  • Niska wydajność zapytań. Wydajność zapytań w tym modelu jest wolna w porównaniu z MOLAP

MOLAP

MOLAP wykorzystuje wielowymiarowe silniki pamięci masowej oparte na tablicach do wyświetlania wielowymiarowych widoków danych. Zasadniczo używają kostki OLAP.

Dowiedz się więcej o OLAP tutaj

Hybrydowy OLAP

Hybrydowy OLAP to mieszanka ROLAP i MOLAP. Oferuje szybkie obliczenia MOLAP i wyższą skalowalność ROLAP. HOLAP korzysta z dwóch baz danych.

  1. Zagregowane lub obliczone dane są przechowywane w wielowymiarowej kostce OLAP
  2. Szczegółowe informacje są przechowywane w relacyjnej bazie danych.

Zalety hybrydowego OLAP:

  • Ten rodzaj OLAP pomaga zaoszczędzić miejsce na dysku, a także pozostaje kompaktowy, co pomaga uniknąć problemów związanych z szybkością i wygodą dostępu.
  • Hybrid HOLAP wykorzystuje technologię kostki, która umożliwia szybsze działanie dla wszystkich typów danych.
  • ROLAP są natychmiast aktualizowane, a użytkownicy HOLAP mają dostęp do tych natychmiast aktualizowanych danych w czasie rzeczywistym. MOLAP zapewnia czyszczenie i konwersję danych, poprawiając w ten sposób ich trafność. To daje to, co najlepsze z obu światów.

Wady hybrydowego OLAP:

  • Większy poziom złożoności : Główną wadą systemów HOLAP jest to, że obsługuje zarówno narzędzia i aplikacje ROLAP, jak i MOLAP. Dlatego jest to bardzo skomplikowane.
  • Potencjalne pokrywanie się : są większe szanse na pokrywanie się, zwłaszcza w zakresie ich funkcjonalności.

Zalety OLAP

  • OLAP to platforma dla wszystkich rodzajów działalności obejmująca planowanie, budżetowanie, raportowanie i analizę.
  • Informacje i obliczenia są spójne w kostce OLAP. To jest kluczowa korzyść.
  • Szybko twórz i analizuj scenariusze „Co by było, gdyby”
  • Z łatwością przeszukuj bazę danych OLAP pod kątem ogólnych lub szczegółowych terminów.
  • OLAP zapewnia bloki konstrukcyjne dla narzędzi do modelowania biznesowego, narzędzi do eksploracji danych, narzędzi do raportowania wydajności.
  • Umożliwia użytkownikom tworzenie danych z kostek i kostek według różnych wymiarów, miar i filtrów.
  • Jest dobry do analizy szeregów czasowych.
  • Znajdowanie niektórych klastrów i wartości odstających jest łatwe dzięki OLAP.
  • Jest to potężny system wizualizacji procesu analitycznego online, który zapewnia szybsze czasy odpowiedzi

Wady OLAP

  • OLAP wymaga uporządkowania danych w schemacie gwiazdy lub płatka śniegu. Te schematy są skomplikowane we wdrażaniu i zarządzaniu
  • Nie można mieć dużej liczby wymiarów w pojedynczej kostce OLAP
  • Nie można uzyskać dostępu do danych transakcyjnych za pomocą systemu OLAP.
  • Każda modyfikacja kostki OLAP wymaga pełnej aktualizacji kostki. To czasochłonny proces

Podsumowanie:

  • OLAP to technologia, która umożliwia analitykom wyodrębnianie i przeglądanie danych biznesowych z różnych punktów widzenia.
  • Podstawą koncepcji OLAP jest kostka OLAP.
  • Różne aplikacje biznesowe i inne operacje na danych wymagają użycia kostki OLAP.
  • Istnieje pięć podstawowych typów operacji analitycznych w OLAP 1) Podsumowanie 2) Drążenie w dół 3) Wycinek 4) Kości i 5) Obrót
  • Trzy typy powszechnie używanych systemów OLAP to MOLAP, ROLAP i Hybrid OLAP.
  • Komputerowy OLAP, Internetowy OLAP i Mobilny OLAP to inne typy systemów OLAP.