Co to są usługi SAP Data?
Usługi danych SAP to narzędzie ETL, które zapewnia pojedyncze rozwiązanie na poziomie przedsiębiorstwa do integracji danych, transformacji, jakości danych, profilowania danych i przetwarzania danych tekstowych z heterogenicznego źródła do docelowej bazy danych lub hurtowni danych.
Możemy tworzyć aplikacje (job), w których mapowanie i transformację danych można wykonać za pomocą Projektanta. (Najnowsza wersja SAP BODS to 4.2).
Funkcje usług danych
- Zapewnia wysokowydajne transformacje równoległe.
- Posiada wszechstronne narzędzia administracyjne i narzędzie do raportowania.
- Obsługuje wielu użytkowników.
- SAP BODS jest bardzo elastyczny dzięki aplikacji opartej na usługach internetowych.
- Umożliwia język skryptowy z bogatym zestawem funkcji.
- Usługi danych można zintegrować z serwerem replikacji SAP LT (SLT), korzystając z
Technologia oparta na wyzwalaczach. SLT dodaje funkcje delta do każdej tabeli źródłowej SAP lub innej niż SAP
Co pozwala na wykorzystanie przechwytywania danych do zmiany i przesyłania danych delta
tabela źródłowa.
- Walidacja danych z dashboardami i audytem procesów.
- Narzędzie administracyjne z funkcjami planowania i monitorowania / pulpitami nawigacyjnymi.
- Debugowanie oraz wbudowane profilowanie i przeglądanie danych.
- SAP BODS obsługuje szerokie źródło i cel.
- Dowolne aplikacje (np. SAP).
- Dowolne bazy danych z ładowaniem zbiorczym i przechwytywaniem danych zmian
- Pliki: stała szerokość, rozdzielane przecinkami, COBOL, XML, Excel.
Składnik usług danych
Usługi SAP DATA mają poniższy składnik -
- Projektant - jest to narzędzie programistyczne, za pomocą którego możemy tworzyć, testować i wykonywać zadanie wypełniające hurtownię danych.
Pozwala programistom tworzyć obiekty i konfigurować je przez wybranie ikony na diagramie przepływu źródło-cel.
Może służyć do tworzenia aplikacji poprzez określenie przepływów pracy i przepływów danych.
Aby otworzyć projektanta usług danych, przejdź do Menu Start -> Wszystkie programy -> Usługi danych SAP (tutaj 4.2) -> Projektant usług danych.
- Serwer zadań - jest to aplikacja, która uruchamia silnik przetwarzania usług danych i służy jako interfejs do silnika i pakietu usług danych.
- Silnik - silnik usługi danych wykonuje indywidualne zadania, które są zdefiniowane w aplikacji.
- Repozytorium - repozytorium to baza danych przechowująca obiekty predefiniowane przez projektanta i obiekty zdefiniowane przez użytkownika (metadane źródłowe i docelowe, reguły transformacji).
Repozytorium są dwojakiego rodzaju -
- Repozytorium lokalne (używane przez projektanta i serwer zadań).
- Centralne repozytorium (używane do udostępniania obiektów i kontroli wersji)
- Dostęp Server- serwer dostępu przekazuje wiadomości między aplikacjami WWW, serwer usługi danych i pracy silników.
- Administrator - Administrator sieci zapewnia zarządzanie zasobami usług danych przez przeglądarkę, szczegóły są jak poniżej -
- Konfigurowanie, uruchamianie i zatrzymywanie usług czasu rzeczywistego.
- Planowanie, monitorowanie i wykonywanie zadań wsadowych.
- Konfigurowanie użycia serwera zadań, serwera dostępu i repozytorium.
- Zarządzanie użytkownikami.
- Publikowanie zadań wsadowych i usług w czasie rzeczywistym za pośrednictwem usług internetowych
- Konfigurowanie i zarządzanie adapterami.
Architektura usług danych -
Architektura usług danych ma następujący składnik:
- Centralne repozytorium - służy do konfiguracji repozytoriów do serwerów zadań, zarządzania bezpieczeństwem, kontroli wersji i udostępniania obiektów
- Projektant - używany do tworzenia projektów, zadań, przepływu pracy, przepływu danych i uruchamiania.
- Lokalne repozytorium (tutaj możesz tworzyć zmiany i rozpoczynać zadania, Workflow, Dataflow).
- Serwer i silnik zadań - zarządza zadaniami.
- Serwer dostępu - służy do wykonywania zadań w czasie rzeczywistym utworzonych przez programistów w repozytoriach.
Na poniższym obrazku pokazano usługi danych i ich związek między komponentami.
Architektura SAP BODS
Szczegóły okna projektanta: Najpierw przyjrzymy się pierwszemu komponentowi usługi danych SAP - projektantowi
Szczegóły każdej sekcji projektanta usług danych są następujące:
- Pasek narzędzi (używany do otwierania, zapisywania, cofania, sprawdzania poprawności, wykonywania itp.).
- Obszar projektu (zawiera bieżący projekt, który obejmuje zadanie, przepływ pracy i przepływ danych. W usługach danych wszystkie elementy są obiektami.
- Przestrzeń robocza (obszar okna aplikacji, w którym definiujemy, wyświetlamy i modyfikujemy obiekty).
- Lokalna biblioteka obiektów (zawiera lokalne obiekty repozytorium, takie jak transformacje, zadanie, przepływ pracy, przepływ danych itp.).
- Paleta narzędzi (przyciski na palecie narzędzi umożliwiają dodawanie nowych obiektów do obszaru roboczego).
Hierarchia obiektów
Poniższy diagram przedstawia relacje hierarchiczne dla kluczowych typów obiektów w usługach danych.
>
Uwaga:
Przepływy pracy i warunkowe * są opcjonalne
Szczegóły obiektów używanych w usługach SAP Data są następujące -
Obiekty | Opis |
Projekt | Projekt jest obiektem najwyższego poziomu w oknie Projektanta. Projekty umożliwiają organizowanie innych obiektów tworzonych w usługach danych. W danym momencie otwarty jest tylko jeden projekt (gdzie „otwarty” oznacza „widoczny w obszarze projektu”). |
Praca | „Praca” to najmniejsza jednostka pracy, którą można niezależnie zaplanować. |
Skrypty | Podzbiór wierszy w procedurze. |
Przepływ pracy | „Przepływ pracy” to włączenie kilku przepływów danych w spójny przepływ pracy dla całego zadania. Przepływ pracy jest opcjonalny. Przepływ pracy to procedura.
|
Przepływ danych | „Przepływ danych” to proces, w którym dane źródłowe są przekształcane w dane docelowe. Przepływ danych to obiekt wielokrotnego użytku. Jest zawsze wywoływany z przepływu pracy lub pracy.
|
Magazyn danych | Kanał logiczny łączący usługi danych ze źródłową i docelową bazą danych Datastore.
|
Cel | Tabela lub plik, w którym usługi danych ładują dane ze źródła. |
Przykład usług danych przez ładowanie danych z tabeli źródłowej SAP
Wszystko w usługach danych jest obiektem. Musimy oddzielić magazyn danych dla każdej źródłowej i docelowej bazy danych.
Kroki ładowania danych z tabeli źródłowej SAP - SAP BODS ma wiele kroków, w których musimy utworzyć składnicę danych dla źródła i celu oraz zmapować do nich.
- Utwórz magazyn danych między źródłem a BODS
- Zaimportuj metadane (Struktury) do BODS.
- Skonfiguruj serwer importu
- Zaimportuj metadane do systemu HANA.
- Utwórz magazyn danych między BODS a HANA.
- Utwórz projekt.
- Utwórz zadanie (wsadowo / w czasie rzeczywistym)
- Utwórz przepływ pracy
- Utwórz przepływ danych
- Dodaj obiekt w Dataflow
- Wykonaj zadanie
- Sprawdź podgląd danych w HANA
Krok 1) Utwórz magazyn danych między źródłem SAP a BODS
- Aby załadować dane z SAP Source do SAP HANA za pośrednictwem SAP BODS, potrzebujemy magazynu danych. Więc najpierw tworzymy magazyn danych, jak pokazano poniżej -
Projekt -> Nowy -> Magazyn danych
- Pojawi się wyskakujące okienko Utwórz nową składnicę danych, wprowadź szczegóły jak poniżej -
- Wpisz nazwę magazynu danych „ds_ecc”.
- Wybierz nazwę typu magazynu danych jako „Aplikacje SAP”.
- Wprowadź nazwę serwera bazy danych
- Nazwa użytkownika i hasło.
- Kliknij przycisk „Zastosuj”.
- Kliknij przycisk „OK”.
- Magazyn danych zostanie utworzony i wyświetli utworzony magazyn danych, jak poniżej:
- Przejdź do lokalnej biblioteki obiektów
- Wybierz zakładkę DataStore.
- Zostanie wyświetlony magazyn danych „ds_ecc”.
Krok 2) Importuj metadane (strukturę) do serwera BODS.
Stworzyliśmy magazyn danych dla ECC do BODS; teraz importujemy metadane z ECC do BODS. Aby zaimportować, wykonaj poniższe czynności -
- Wybierz Datastore „ds_ecc” i kliknij prawym przyciskiem myszy.
- Wybierz opcję Importuj według nazwy.
Zostanie wyświetlone wyskakujące okienko Import według nazwy. Wprowadź szczegóły jak poniżej -
- Wybierz Typ jako tabelę.
- Wpisz nazwę tabeli, którą chcemy zaimportować. Tutaj importujemy tabelę KNA1.
- Kliknij przycisk „Importuj”. Tabela KNA1 pojawi się pod węzłem tabeli źródła danych „ds_ecc”.
Metadane tabeli zostaną zaimportowane do datastore ds_ecc, jak poniżej -
Krok 3) Skonfiguruj serwer importu
Do tej pory zaimportowaliśmy tabelę do danych przechowywanych „ds_ecc” utworzonych dla ECC do połączenia SAP BODS. Aby zaimportować dane do SAP HANA, musimy skonfigurować serwer importu,
- Aby to zrobić, przejdź do Szybki podgląd-> Konfiguruj serwer importu, jak poniżej -
- Pojawi się wyskakujące okienko Select System, Select SAP HANA (HDB here) System jak poniżej-
- Kliknij przycisk „Dalej”. Pojawi się kolejne wyskakujące okienko z danymi uwierzytelniającymi do usługi danych, wprowadź następujące dane
- Adres serwera SAP BODS (tutaj BODS: 6400)
- Wprowadź nazwę repozytorium SAP BODS (nazwa repozytorium HANAUSER)
- Wprowadź źródło danych ODBC (ZTDS_DS).
- Wprowadź domyślny port dla serwera SAP BODS (8080).
Kliknij przycisk „Zakończ”.
Krok 4) Zaimportuj metadane do systemu HANA
1. Do tej pory mamy skonfigurowany serwer importu, teraz będziemy importować metadane z serwera SAP BODS.
- Kliknij opcję Importuj w Szybkim podglądzie.
- Zostanie wyświetlone wyskakujące okienko opcji importu. Wybierz opcję „Selektywny import metadanych”.
Kliknij przycisk „Dalej”.
2. Wyświetli się wyskakujące okienko „Selektywny import metadanych”, w którym wybieramy system docelowy.
- Wybierz system SAP HANA (tutaj HDB).
Kliknij przycisk „Dalej”.
Krok 5) Utwórz magazyn danych między BODS i HANA
Jak wiemy, w BODS musimy stworzyć oddzielny magazyn danych dla źródła i celu. Stworzyliśmy już magazyn danych dla źródła, teraz musimy stworzyć magazyn danych dla celu (między BODS a HANA). Dlatego tworzymy nową składnicę danych o nazwie „DS_BODS_HANA”.
- Przejdź do Project -> New -> Datastore.
- Pojawi się ekran Utwórz nowy Datastore, jak poniżej.
- Wpisz nazwę Datastore (DS_BODS_HANA).
- Wpisz typ Datastore jako Baza danych.
- Wpisz typ bazy danych jako SAP HANA.
- Wybierz wersję bazy danych.
- Wprowadź nazwę serwera bazy danych SAP HANA.
- Wprowadź nazwę portu dla bazy danych SAP HANA.
- Wprowadź nazwę użytkownika i hasło.
- Zaznacz opcję „Włącz automatyczny transfer danych”.
Kliknij przycisk „Zastosuj”, a następnie przycisk „OK”.
Magazyn danych „DS_BODS_HANA” zostanie wyświetlony na karcie magazynu danych w lokalnej bibliotece obiektów jako
Poniżej-
- Teraz importujemy tabelę do magazynu danych „DS_BODS_HANA”.
- Wybierz magazyn danych „DS_BODS_HANA” i kliknij prawym przyciskiem myszy.
- Wybierz Importuj według nazwy.
- Pojawi się wyskakujące okienko Importuj według nazwy, jak poniżej:
- Wybierz Typ jako tabelę.
- Wpisz nazwę jako KNA1.
- Właściciel będzie wyświetlany jako Hanauser.
- Kliknij przycisk Importuj.
Tabela zostanie zaimportowana do magazynu danych „DS_BOD_HANA”, aby wyświetlić dane w tabeli, wykonaj poniższe czynności -
- Kliknij tabelę „KNA1” w magazynie danych „DS_BODS_HANA”.
- Dane zostaną wyświetlone w formacie TABULARNYM.
Krok 6) Zdefiniuj projekt: Grupuj projekt i organizuj powiązane obiekty. Projekt może zawierać dowolną liczbę zadań, przepływu pracy i przepływu danych.
- Przejdź do menu Projekt projektanta.
- Wybierz nową opcję.
- Wybierz opcję Projekt.
Pojawi się POP-UP do tworzenia nowego projektu, jak poniżej. Wprowadź nazwę projektu i kliknij przycisk Utwórz. Stworzy folder projektu w naszym przypadku BODS_DHK.
Krok 7) Zdefiniuj zadanie: Zadanie to obiekt wielokrotnego użytku. Zawiera przepływy pracy i przepływ danych. Zadania można wykonywać ręcznie lub zgodnie z harmonogramem. Aby wykonać proces BODS, musimy zdefiniować zadanie.
Zlecenie tworzymy jako JOB_Customer.
- Wybierz projekt (BODS_DHK) utworzony w kroku 1, kliknij prawym przyciskiem myszy i wybierz „Nowe zadanie wsadowe”.
- Zmień nazwę na „JOB_Customer”.
Krok 8) Zdefiniuj przepływ pracy:
- Wybierz zadanie „JOB_Customer” w obszarze projektu,
- Kliknij przycisk procesu roboczego na palecie narzędzi. Kliknij czarny obszar roboczy. W obszarze roboczym pojawi się ikona przepływu pracy.
- Zmień nazwę przepływu pracy na „WF_Customer”.
Kliknij nazwę przepływu pracy, w obszarze roboczym pojawi się pusty widok przepływu pracy.
Krok 9) Zdefiniuj przepływ danych:
- Kliknij opcję Przepływ pracy „WF_Customer”.
- Kliknij przycisk Dataflow na palecie narzędzi. Kliknij czarny obszar roboczy. W obszarze roboczym pojawi się ikona Dataflow.
- Zmień nazwę przepływu danych na „DF_Customer”.
- Przepływ danych pojawia się również w obszarze projektu po lewej stronie pod nazwą zadania.
Krok 10) Dodaj obiekt w Dataflow:
Wewnątrz przepływu danych możemy dostarczyć instrukcje, aby przekształcić dane źródłowe do żądanej postaci dla tabeli docelowej.
Zobaczymy poniżej obiekt -
- Obiekt dla źródła.
- Obiekt dla tabeli docelowej.
- Obiekt do przekształcenia zapytania. (Przekształcenie zapytania odwzorowuje kolumny ze źródła na cel).
Kliknij przepływ danych DF_Customer. Pojawi się pusty obszar roboczy, jak poniżej -
- Określ obiekt ze źródła - przejdź do magazynu danych „ds_ecc” i wybierz tabelę KNA1, a następnie przeciągnij i upuść do pustego ekranu przepływu danych, jak na poniższym ekranie-
- Określ obiekt dla celu - wybierz składnicę danych „DS_BODS_HANA” z repozytorium i wybierz tabelę KNA1.
- Przeciągnij i upuść do obszaru roboczego i wybierz opcję „Ustaw cel”. Będą dwie tabele dla źródła i celu. Tutaj zdefiniujemy tabelę jako źródło i cel.
- Query Transformation - jest to narzędzie służące do pobierania danych na podstawie schematu wejściowego dla warunków specyficznych dla użytkownika oraz do transportu danych ze źródła do celu.
- Wybierz ikonę Query Transform z palety narzędzi, a następnie przeciągnij i upuść ją między obiektem źródłowym a docelowym w obszarze roboczym, jak poniżej -
- Połącz obiekt zapytania ze źródłem.
- Połącz obiekt zapytania z tabelą docelową.
- Kliknij dwukrotnie ikonę zapytania. W ten sposób mapujemy kolumnę ze schematu wejściowego na schemat wyjściowy.
Po kliknięciu ikony Zapytanie pojawi się kolejne okno mapowania, w którym wykonujemy następujące kroki -
- Wybrano tabelę źródłową KNA1.
- Wybierz wszystkie kolumny z tabeli źródłowej i kliknij prawym przyciskiem myszy i wybierz mapę do wyprowadzenia.
- Docelowe dane wyjściowe wybrane jako zapytanie, a kolumna zostanie zmapowana.
5. Zapisz i potwierdź projekt.
1. Kliknij ikonę sprawdzania poprawności.
2. Pojawi się wyskakujące okienko z informacją o powodzeniu weryfikacji.
Krok 11) Wykonaj zadanie - Aby wykonać zadanie, postępuj zgodnie z poniższą ścieżką-
- Wybierz ikonę obszaru projektu, aby otworzyć projekt i wybierz utworzony projekt.
- Wybierz zadanie i kliknij prawym przyciskiem myszy.
- Wybierz opcję Wykonaj, aby wykonać zadanie.
- Po wykonaniu zadania zostanie wyświetlone okno dziennika zadań, w którym zostaną wyświetlone wszystkie komunikaty dotyczące zadania.
- Ostatnią wiadomością będzie zadanie <> zakończone pomyślnie.
Krok 12) - Zweryfikuj / Sprawdź dane w bazie danych SAP HANA.
- Zaloguj się do bazy danych SAP HANA za pośrednictwem SAP HANA Studio i wybierz schemat HANAUSER.
- Wybierz tabelę KNA1 w węźle tabeli.
- Kliknij prawym przyciskiem myszy tabelę KNA1 i wybierz opcję Otwórz podgląd danych.
- Tabela (KNA1) Dane załadowane przez procesy BODS jak powyżej zostaną wyświetlone na ekranie podglądu danych.