Trwają zapisy do grupy

Szkolenie: Przetwarzanie strumieni danych w Apache Spark

Szkolenie z przetwarzania strumieni danych w Apache Spark uczy analizy i przetwarzania danych w czasie rzeczywistym, omawia architekturę Spark Structured Streaming, prezentuje praktyczne zastosowania, optymalizację oraz integrację z narzędziami Big Data

  • Trenerzy praktycy
  • Kameralne grupy

Czas trwania szkolenia:1 dzień (8h)

Poziom zaawansowania:

Kod kursu:BIGDATA/SPARK/STREAMS

big-dataapache-sparkstream-processingspark-streaming

Dostępne terminy szkolenia

  • Termin
  • Trener
  • Cena
  • Zapis
  • Lokalizacja

Termin:

11 maja
Trwają zapisy na szkolenie

Trener:

Krzysztof Jankiewicz

Cena:

1300 PLN netto
Ikona podpowiedziDowiedz się więcej o cenach szkoleń - zapraszamy do kontaktu
+23% VAT

Lokalizacja:

Zdalne
Zdalne
Ikona podpowiedziZapytaj o inne lokalizacje - w tym celu skorzystaj z chatu

Termin:

26 czerwca
Trwają zapisy na szkolenieDostępne w BUR

Trener:

Trener-Sages

Cena:

1300 PLN netto
Ikona podpowiedziDowiedz się więcej o cenach szkoleń - zapraszamy do kontaktu
+23% VAT

Lokalizacja:

Zdalne
Zdalne
Ikona podpowiedziZapytaj o inne lokalizacje - w tym celu skorzystaj z chatu

Termin:

2 listopada
Trwają zapisy na szkolenie

Trener:

Krzysztof Jankiewicz

Cena:

1300 PLN netto
Ikona podpowiedziDowiedz się więcej o cenach szkoleń - zapraszamy do kontaktu
+23% VAT

Lokalizacja:

Zdalne
Zdalne
Ikona podpowiedziZapytaj o inne lokalizacje - w tym celu skorzystaj z chatu

Forma szkolenia

Interesuje Cię szkolenie stacjonarne?

Powiadom o kolejnych terminach

Interesuje Cię szkolenie w innym terminie?

Przetwarzanie strumieni danych w Apache Spark

Cele szkolenia

  • Szkolenie przygotowuje do samodzielnego projektowania i implementowania procesów przetwarzania strumieni danych z wykorzystaniem Apache Spark

  • Szkolenie uczy rozpoznawania i stosowania mechanizmów obsługi danych strumieniowych, w tym okien czasowych, znaczników czasowych oraz obsługi zdarzeń opóźnionych

  • Szkolenie pokazuje, jak analizować możliwości i ograniczenia platformy Spark w kontekście przetwarzania strumieniowego oraz jak wdrażać rozwiązania odporne na awarie


Dla kogo?

  • Programistów i inżynierów danych rozpoczynających pracę z przetwarzaniem strumieniowym w środowisku Big Data

  • Specjalistów IT posiadających podstawową znajomość Apache Spark i języka Python lub Scala, chcących rozwinąć umiejętności w zakresie analizy danych w czasie rzeczywistym

  • Osób odpowiedzialnych za wdrażanie i utrzymanie rozwiązań analitycznych opartych o przetwarzanie strumieni danych


Efekty kształcenia

  • Uczestnik projektuje procesy przetwarzania strumieni danych w Apache Spark

  • Uczestnik analizuje i wdraża mechanizmy obsługi okien czasowych i znaczników czasowych

  • Uczestnik konfiguruje źródła, transformacje i ujścia danych strumieniowych

  • Uczestnik rozpoznaje i rozwiązuje problemy związane z danymi opóźnionymi i spóźnionymi

  • Uczestnik monitoruje i optymalizuje wydajność przetwarzania strumieniowego

  • Uczestnik wdraża rozwiązania odporne na awarie w środowisku Spark


Wymagania


W cenie otrzymasz:

  • Materiały szkoleniowe

  • Certyfikat ukończenia szkolenia

  • W przypadku szkolenia w trybie stacjonarnym zapewnimy Ci również lunch oraz sprzęt niezbędny do nauki

Program szkolenia

Pobierz program w PDF

Wprowadzenie do przetwarzania strumieni danych

  • Cele

  • Przetwarzanie wsadowe, mikrowsadowe i strumieniowe

  • Przetwarzanie stanowe i bezstanowe

  • Znacznik czasowe

  • Okna

  • Typy dostępnych operacji

  • Porządek danych, dane opóźnione, dane spóźnione

  • Obsługa awarii

  • Complex Event Processing

  • API wysokopoziomowe

Spark Structured Streaming

  • Wprowadzenie

  • Podstawy - struktura i logika programu

  • Typy obsługi tabel wynikowych

  • Obsługa znaczników czasowych

  • Wykorzystanie okien i ich typy

  • Szczegóły API (źródła, transformacje, ujścia, uruchamianie)

  • Obsługa zdarzeń opóźnionych

  • Konfiguracja i wykorzystanie punktów kontrolnych

Autorem szkolenia jest Krzysztof Jankiewicz

Konsultant IT i wykładowca akademicki. Specjalista w zakresie ogólnie rozumianego przetwarzania danych. Począwszy od relacyjnych systemów baz danych, poprzez architekturę, utrzymanie i wykorzystywanie hurtowni danych, bazy danych NoSQL, systemy danych przestrzennych, po narzędzia i platformy Big Data. Od samego początku pracy zawodowej stara się jako konsultant znajdować czas na kontakty przemysłem, gdzie swoją wiedzę może konfrontować i rozwijać w oparciu o rzeczywiste przypadki. Począwszy od…

Wybrane opinie

Przeczytaj pozytywne opinie pochodzące z ankiet satysfakcji z naszych szkoleń wypełnianych wyłącznie przez ich uczestników po realizacji usługi

4.8
Ikona podpowiedziŚrednia ocen Sages w serwisie Google Ocena pochodzi ze średniej ocen Sages w serwisie Google i nie jest weryfikowana

18.09.2024

Uczestnik szkoleniaPrzetwarzanie strumieni danych w Apache Spark

Aleksandra Płuciennik

Ogromna ilość materiału, bardzo skumulowana wiedza, duże tempo

Więcej opinii