Szkolenie dostępne na zamówienie

Techniczne aspekty budowania wydajnych procesów ładowania hurtowni danych z wykorzystaniem Pentaho Data Integration

Podczas szkolenia "Techniczne aspekty budowania wydajnych procesów ładowania hurtowni danych z wykorzystaniem Pentaho Data Integration" nauczysz się jak opracowywać procesy ETL.

Czas trwania szkolenia:3 dni (24h)

Poziom zaawansowania:

Kod kursu:PENTAHO/ETL

pentaho

Szkolenie na zamówienie

  • Dostosowany program
  • Indywidualna wycena
  • Dowolny termin
Zapytanie o szkolenie

Techniczne aspekty budowania wydajnych procesów ładowania hurtowni danych z wykorzystaniem Pentaho Data Integration

Cele szkolenia

  • Zdobycie przekrojowej wiedzy dotyczącej projektowania, implementowania, monitorowania, uruchamiania, strojenia procesów ETL

  • Poznanie założeń hurtowni danych tj najpopularniejsze schematy relacyjnych hurtowni danych

  • Zdobycie umiejętności wybierania właściwego zestawu narzędzi i technik dla swoich projektów

  • Skupienie na stosie produktowym wybudowanym wokół Pentaho Business Intelligence a w szczególności na Pentaho Data Integration (PDI), poza ogólnym wprowadzeniem do pojęć teoretycznych


Dla kogo?

  • Szkolenie jest adresowane do programistów, architektów oraz administratorów aplikacji, którzy chcą tworzyć lub utrzymywać procesy ekstrakcji, transformacji i ładowania danych (ETL) z wykorzystaniem Pentaho Data Integration (PDI)

  • Szkolenie jest także kierowane do osób, które chcą uzupełnić swoją wiedzę o pojęcia związane z hurtowaniami danych (DWH) oraz ich realizacją z wykorzystaniem oprogramowania Pentaho Business Intelligence Suite

  • Program jest ciągle uaktualniany ze względu na szybki rozwój rozwiązań, których dotyczy szkolenie


Zalety

  • Program obejmuje zarówno ogólne wprowadzenie w tematykę ETL i DWH, jak i całościowe przedstawienie stosu produktowego Pentaho Data Integration

  • Szkolenie jest unikalne, gdyż tematyka poruszana w jego trakcie nie jest wyczerpująco ujęta w dostępnej literaturze, a wiedza na ten temat jest mocno rozproszona

  • Praktyka przed teorią - wszystkie szkolenia technologiczne prowadzone są w formie warsztatowej. Konieczna teoria jest wyjaśniana na przykładzie praktycznych zadań

  • Konkretne umiejętności - w ramach każdego szkolenia rozwijamy praktyczne umiejętności związane z daną technologią i tematyką

  • Nauka z praktykami - wszyscy trenerzy na co dzień pracują w projektach, gwarantuje to dostęp do eksperckiej wiedzy i praktycznego know-how


Wymagania

  • Podstawowa znajomość baz danych

  • Podstawowa umiejętność programowania w języku Java


W cenie otrzymasz:

  • Materiały szkoleniowe

  • Certyfikat ukończenia szkolenia

  • W przypadku szkolenia w trybie stacjonarnym zapewnimy Ci również lunch oraz sprzęt niezbędny do nauki

Program

Pobierz program w PDF

Wstęp

  • Wprowadzenie do hurtowni danych

  • Platforma Pentaho BI Suite

ETL

  • Ekstrakcja danych

  • Transformacja, oczyszczenie i uzupełnianie danych

  • Ładowanie

  • Wyznaczniki i ocena jakości danych

  • Staging

  • Hurtownie czasu rzeczywistego

  • Kwestie wydajnościowe w kontekście procesów ETL

  • Przegląd narzędzi ETL dostępnych na rynku

Pentaho Data Integration

  • Architektura

Praca ze Spoon

  • Instalacja, uruchomienie, Look & Feel (perspektywy, zakładki etc.)

  • Zmienne

  • Hopy

  • Praca z repozytorium i plikami XML

  • Współdzielenie obiektów tj. połączenia z bazami danych, partycje, klastry

Praca ze Spoon i z transformacjami

  • Czytanie i zapisywanie danych z różnych źródeł danych

  • Walidacja danych

  • Uzupełnianie danych

  • Transformacja danych

  • Optymalizacja

  • Wykorzystanie własnego kodu w transformatach

  • Utlilities

  • Monitorowanie wydajności i analiza logów

  • Wersjonowanie i praca grupowa

Praca ze Spoon i z zadaniami

  • Zadania (kjb) a transformaty (ktr)

  • Tworzenie złożonych zadań

  • Wykorzystanie własnego kodu w zadaniach

  • Przepływ pracy

  • Praca z plikami

  • Monitorowanie wydajności i analiza logów

  • Wersjonowanie i praca grupowa

Praca z Kitchen i Pan

  • Uruchamianie zadań i transformat z plików i z repozytorium

  • Scheduling

  • Obsługa błędów

  • Przekierowanie wejścia/wyjścia

Praca z Cartle

  • Zdalne uruchomienie transformat i zadań

Pentaho Data Integration Marketplace i Pentaho Data Integration Plug-Ins