Szkolenie dostępne na zamówienie
Techniczne aspekty budowania wydajnych procesów ładowania hurtowni danych z wykorzystaniem Pentaho Data Integration
Podczas szkolenia "Techniczne aspekty budowania wydajnych procesów ładowania hurtowni danych z wykorzystaniem Pentaho Data Integration" nauczysz się jak opracowywać procesy ETL.
Czas trwania szkolenia:3 dni (24h)
Poziom zaawansowania:
Kod kursu:PENTAHO/ETL
Techniczne aspekty budowania wydajnych procesów ładowania hurtowni danych z wykorzystaniem Pentaho Data Integration
Cele szkolenia
- Zdobycie przekrojowej wiedzy dotyczącej projektowania, implementowania, monitorowania, uruchamiania, strojenia procesów ETL
- Poznanie założeń hurtowni danych tj najpopularniejsze schematy relacyjnych hurtowni danych
- Zdobycie umiejętności wybierania właściwego zestawu narzędzi i technik dla swoich projektów
- Skupienie na stosie produktowym wybudowanym wokół Pentaho Business Intelligence a w szczególności na Pentaho Data Integration (PDI), poza ogólnym wprowadzeniem do pojęć teoretycznych
Dla kogo?
- Szkolenie jest adresowane do programistów, architektów oraz administratorów aplikacji, którzy chcą tworzyć lub utrzymywać procesy ekstrakcji, transformacji i ładowania danych (ETL) z wykorzystaniem Pentaho Data Integration (PDI)
- Szkolenie jest także kierowane do osób, które chcą uzupełnić swoją wiedzę o pojęcia związane z hurtowaniami danych (DWH) oraz ich realizacją z wykorzystaniem oprogramowania Pentaho Business Intelligence Suite
- Program jest ciągle uaktualniany ze względu na szybki rozwój rozwiązań, których dotyczy szkolenie
Zalety
- Program obejmuje zarówno ogólne wprowadzenie w tematykę ETL i DWH, jak i całościowe przedstawienie stosu produktowego Pentaho Data Integration
- Szkolenie jest unikalne, gdyż tematyka poruszana w jego trakcie nie jest wyczerpująco ujęta w dostępnej literaturze, a wiedza na ten temat jest mocno rozproszona
- Praktyka przed teorią - wszystkie szkolenia technologiczne prowadzone są w formie warsztatowej. Konieczna teoria jest wyjaśniana na przykładzie praktycznych zadań
- Konkretne umiejętności - w ramach każdego szkolenia rozwijamy praktyczne umiejętności związane z daną technologią i tematyką
- Nauka z praktykami - wszyscy trenerzy na co dzień pracują w projektach, gwarantuje to dostęp do eksperckiej wiedzy i praktycznego know-how
Wymagania
- Podstawowa znajomość baz danych
- Podstawowa umiejętność programowania w języku Java
W cenie otrzymasz:
- Materiały szkoleniowe
- Certyfikat ukończenia szkolenia
- W przypadku szkolenia w trybie stacjonarnym zapewnimy Ci również lunch oraz sprzęt niezbędny do nauki
Program
Wstęp
- Wprowadzenie do hurtowni danych
- Platforma Pentaho BI Suite
ETL
- Ekstrakcja danych
- Transformacja, oczyszczenie i uzupełnianie danych
- Ładowanie
- Wyznaczniki i ocena jakości danych
- Staging
- Hurtownie czasu rzeczywistego
- Kwestie wydajnościowe w kontekście procesów ETL
- Przegląd narzędzi ETL dostępnych na rynku
Pentaho Data Integration
- Architektura
Praca ze Spoon
- Instalacja, uruchomienie, Look & Feel (perspektywy, zakładki etc.)
- Zmienne
- Hopy
- Praca z repozytorium i plikami XML
- Współdzielenie obiektów tj. połączenia z bazami danych, partycje, klastry
Praca ze Spoon i z transformacjami
- Czytanie i zapisywanie danych z różnych źródeł danych
- Walidacja danych
- Uzupełnianie danych
- Transformacja danych
- Optymalizacja
- Wykorzystanie własnego kodu w transformatach
- Utlilities
- Monitorowanie wydajności i analiza logów
- Wersjonowanie i praca grupowa
Praca ze Spoon i z zadaniami
- Zadania (kjb) a transformaty (ktr)
- Tworzenie złożonych zadań
- Wykorzystanie własnego kodu w zadaniach
- Przepływ pracy
- Praca z plikami
- Monitorowanie wydajności i analiza logów
- Wersjonowanie i praca grupowa
Praca z Kitchen i Pan
- Uruchamianie zadań i transformat z plików i z repozytorium
- Scheduling
- Obsługa błędów
- Przekierowanie wejścia/wyjścia
Praca z Cartle
- Zdalne uruchomienie transformat i zadań