Szkolenie: Zaawansowane przetwarzanie strumieni danych w Apache Flink
Szkolenie z Apache Flink to praktyczny kurs Big Data, który uczy zaawansowanego przetwarzania strumieni danych, analizy w czasie rzeczywistym, projektowania rozwiązań streamingowych oraz wykorzystania Java, Python i SQL w środowiskach produkcyjnych
- Trenerzy praktycy
- Kameralne grupy
Czas trwania szkolenia:3 dni (24h)
Kod kursu:BIGDATA/FLINK
Zaawansowane przetwarzanie strumieni danych w Apache Flink
Cele szkolenia
Szkolenie przygotowuje do samodzielnego projektowania i wdrażania rozwiązań do przetwarzania strumieni danych z użyciem Apache Flink w środowiskach Big Data
Szkolenie uczy wykorzystywania zaawansowanych mechanizmów analizy, obsługi czasu, okien, wyzwalaczy oraz zarządzania stanem w aplikacjach streamingowych
Szkolenie rozwija umiejętność implementacji rozwiązań z użyciem DataStream API, Table API oraz SQL, umożliwiając integrację różnych źródeł i typów danych
Dla kogo?
Analityków danych i programistów posiadających doświadczenie w pracy z Big Data oraz znajomość podstaw przetwarzania strumieniowego
Specjalistów IT realizujących projekty analityczne, którzy chcą rozwinąć kompetencje w zakresie zaawansowanego streamingu i integracji danych
Osób odpowiedzialnych za wdrażanie i utrzymanie rozwiązań do analizy danych w czasie rzeczywistym w dużych organizacjach
Efekty kształcenia
Uczestnik projektuje i wdraża aplikacje do przetwarzania strumieni danych w Apache Flink
Uczestnik analizuje i implementuje zaawansowane operacje na strumieniach, oknach i zdarzeniach
Uczestnik wykorzystuje DataStream API, Table API oraz SQL do realizacji złożonych zadań analitycznych
Uczestnik integruje różne źródła danych i zarządza stanem aplikacji streamingowych
Uczestnik rozpoznaje i stosuje wzorce Complex Event Processing w analizie danych
Uczestnik optymalizuje i monitoruje wydajność aplikacji strumieniowych
Wymagania
Dobra znajomość: języka SQL, relacyjnego modelu danych
Podstawowa znajomość języka Java i opcjonalnie (jako uzupełnienie) Python
Znajomość zagadnień Big Data, platformy Hadoop oraz powiązanych z nią narzędzi - rekomendujemy wcześniejszy udział w szkoleniu: Big Data i platforma Hadoop - wprowadzenie
Znajomość mechanizmów związanych z przetwarzaniem strumieni danych (okien, wyzwalaczy, nieuporządkowania zdarzeń, punktów kontrolnych, typów gwarancji itp.) - rekomendujemy wcześniejszy udział w szkoleniu Przetwarzanie strumieni danych w środowiskach Big Data
W cenie otrzymasz:
Materiały szkoleniowe
Certyfikat ukończenia szkolenia
W przypadku szkolenia w trybie stacjonarnym zapewnimy Ci również lunch oraz sprzęt niezbędny do nauki
Program szkolenia
Wprowadzenie do systemów przetwarzania strumieni danych (SP)
Wprowadzenie do świata systemów SP
Podstawy SP
Obsługa czasu w SP
Dualizm strumieni i tabel, SQL
Punkty kontrolne i punkty zachowania
Complex Event Processing (CEP)
Flink - wprowadzenie
Flink - historia, cechy, architektura
Podstawy implementacji aplikacji
Typy źródeł i tryby przetwarzania
Warsztat
DataStream API - podstawy
Typy danych
Typy strumieni
Postać programu
Podstawy przetwarzania strumieni danych
Transformacje
Złożone interfejsy operatorów
Warsztat
DataStream API - elementy zaawansowane - część 1
Wprowadzenie - okna, obsługa czasu
Etykiety czasowe i ich przypisywanie do zdarzeń
Okna i operacje z nimi związane
Łączenie strumieni
Warsztat
DataStream API - elementy zaawansowane - część 2
Wyzwalacze - wprowadzenie
Wyzwalacze wbudowane
Obsługa zdarzeń nieuporządkowanych
Obsługa zdarzeń spóźnionych
Zaawansowana obsługa okien
Warsztat
DataStream API - obsługa stanu przetwarzania
Wprowadzenie
Punkty kontrolne - wprowadzenie
Własne operatory i ich stan
Warsztat
SQL i Table API - podstawy
Wprowadzenie
Struktura programu
Narzędzia do prototypowania
Katalogi, bazy danych, tabele i ich typy
Semantyka Table API
Obsługa znaczników czasu i watermark
Table API - przegląd metod
Integracja SQL i Table API
Warsztat
Complex Event Processing (CEP)
Wprowadzenie
CEP w DataStream API
SQL API - wyrażenie MATCH_RECOGNIZE
Warsztat
Przetwarzanie danych wsadowych
Strumienie skończone i nieskończone
Statyczne zbiory danych
Warsztat
Wybrane opinie
Przeczytaj pozytywne opinie pochodzące z ankiet satysfakcji z naszych szkoleń wypełnianych wyłącznie przez ich uczestników po realizacji usługi
