Trwają zapisy do grupy

Szkolenie: Projektowanie platformy Big Data z użyciem narzędzi z rodziny Apache

Szkolenie obejmujące podstawy projektowania i tworzenia platform Big Data przy pomocy narzędzi Apache (Kafka, Spark, NiFi, Druid, Airflow)

Trenerzy praktycy
Kameralne grupy

Czas trwania szkolenia:3 dni (24h)

Poziom zaawansowania:

Kod kursu:BIGDATA/APACHE

javascalabig-dataspark

Dostępne terminy szkolenia

Termin:

14 lipca

Trener:

Krzysztof Jankiewicz

Cena:

2805 PLN netto +23% VAT

Zapisz się

Lokalizacja:

Zdalne

Termin:

13 października

Trener:

Trener Sages

Cena:

2805 PLN netto +23% VAT

Zapisz się

Lokalizacja:

Zdalne

Forma szkolenia

Interesuje Cię szkolenie stacjonarne?

Zapytaj o szkolenie

Powiadom o kolejnych terminach

Interesuje Cię szkolenie w innym terminie?

Projektowanie platformy Big Data z użyciem narzędzi z rodziny Apache

Cele szkolenia

Praktyczna umiejętność projektowania platformy do przetwarzania dużej ilości danych
Zdobycie wiedzy na temat powszechnie używanych narzędzi typu open-source w Big Data

Dla kogo?

Programiści chcący poznać podstawy Big Data
Osoby które chciałby rozszerzyć swoją więdzę na temat narzędzi Big Data

Zalety

Warsztatowy charakter zajęć
Użycie wielu różnych narzędzi niezbędnych w codziennej pracy z Big Data
Ćwiczenia praktyczne odbywają się w środowisku chmury obliczeniowej (Google Cloud Platform)
Praktyka przed teorią - wszystkie szkolenia technologiczne prowadzone są w formie warsztatowej. Konieczna teoria jest uzupełniana praktycznymi zadaniami
Konkretne umiejętności - w ramach każdego szkolenia rozwijamy praktyczne umiejętności związane z daną technologią i tematyką

Wymagania

Praktyczna wiedza z programowania obiektowego w języku Java
Silnie rekomendowane jest posiadanie wiedzy i umiejętności z zagadnień ujętych w ramach szkolenia Big Data i platforma Hadoop - wprowadzenie

W cenie otrzymasz:

Materiały szkoleniowe
Certyfikat ukończenia szkolenia
W przypadku szkolenia w trybie stacjonarnym zapewnimy Ci również lunch oraz sprzęt niezbędny do nauki

Wprowadzenie do świata Big Data

Przedstawienie domeny
Problemy Big Data - wydajność, skalowalność, dostępność
Przegląd typów przetwarzania Big Data
Omówienie narzędzi wykorzystywanych w ramach kursu

Programowanie w Scala

Zalety programowania funkcyjnego
Różnice w stosunku do języka Java
Elementy języka wykorzystywane w kontekście Big Data
Ćwiczenia praktyczne (case class, companion object, pattern matching, implicit)

Apache Spark

Architektura i konfiguracja
RDD vs Spark SQL
Transformacje i akcje
Tworzenie aplikacji w środowisku IDE
Uruchamianie zadań
Koncepcje partycjonowania i przesyłania (shuffling) danych
Catalyst i mechanizmy optymalizacji
Integracja z Apache Hadoop

Apache Spark Structured Streaming

Podstawy i zastosowanie Spark Structured Streaming
Model przetwarzania
Projektowanie aplikacji przetwarzającej strumienie danych
Znaczniki czasowe i operatory okna
Obsługa zdarzeń nieuporządkowanych

Apache NiFi

Automatyzacja pobierania danych z różnych źródeł
Architektura
Przykładowe zastosowania
Integracja danych między MySQL i GCS
Przykłady transformacji danych
Partycjonowanie danych przy zapisie

Apache Kafka

Architektura
Porównanie z podobnymi narzędziami
Pub/Sub vs Producer/Consumer
Tworzenie i konfiguracja producenta oraz konsumenta
Tematy i partycjonowanie
Konsumenci i grupy konsumentów
Replikacje i retencja
ZooKeeper

Apache Druid

Opis i architektura
Struktura danych
Zarządzanie komponentami
Indeksacja danych
Druid i platformy Big Data oparte na Apache Hadoop
Przetwarzanie real-time i batch

Apache Airflow

Automatyzacja przetwarzania
Tworzenie data pipeline
Python vs Bash
Definiowanie Acyklicznych Grafów Skierowanych Przetwarzania (DAG)
Architektura

Szkolenie poprowadzi jego autor Krzysztof Jankiewicz

Konsultant IT i wykładowca akademicki. Specjalista w zakresie ogólnie rozumianego przetwarzania danych. Począwszy od relacyjnych systemów baz danych, poprzez architekturę, utrzymanie i wykorzystywanie hurtowni danych, bazy danych NoSQL, systemy danych przestrzennych, po narzędzia i platformy Big Data. Od samego początku pracy zawodowej stara się jako konsultant znajdować czas na kontakty przemysłem, gdzie swoją wiedzę może konfrontować i rozwijać w oparciu o rzeczywiste przypadki. Począwszy od…

Autorem szkolenia jest Krzysztof Jankiewicz

Szkolenie poprowadzi jego autor Krzysztof Jankiewicz

Autorem szkolenia jest Krzysztof Jankiewicz

Szkolenie poprowadzi jego autor Krzysztof Jankiewicz

Wybrane opinie

Przeczytaj pozytywne opinie pochodzące z ankiet satysfakcji z naszych szkoleń wypełnianych wyłącznie przez ich uczestników po realizacji usługi

4.8

20.03.2025

Uczestnik szkolenia “Projektowanie modeli domen z wykorzystaniem Domain-Driven Design i Event Storming”

Wojciech Pyszko

Nawiązywało do przypadków bliskich naszemu biznesowi

Więcej opinii

Podobne szkolenia

Zaawansowane przetwarzanie strumieni danych w Apache Flink

Liczba dni: 3

3100 PLN

Szkolenie obejmuje praktyczne wykorzystanie platformy Apache Flink do zaawansowanego przetwarzania strumieni danych w środowiskach Big Data z wykorzystaniem języków Java, Scala i SQL, a także platformy Google Cloud Platform (GCP).

gcpsqlbig-datajava

Przetwarzanie strumieni danych w Apache Spark

Liczba dni: 1

1300 PLN

Szkolenie "Przetwarzanie strumieni danych w Apache Spark" pozwala nie tylko poznać mechanizmy przetwarzania strumieni danych w Apache Spark, ale także usystematyzować i uporządkować wiedzę na temat przetwarzania strumieni oraz szczegółowo przyjrzeć się możliwościom i ograniczeniom, z jakimi mamy do czynienia w ramach tej platformy.

sparkscalapython

Apache Spark z wykorzystaniem języka Python

Liczba dni: 2

2565 PLN

Praktyczne przetwarzanie Big Data przy pomocy Apache Spark w języku Python

spark-sqlsparkmlib

Kategorie szkoleń

Terminarz - szkolenia otwarte

Szkolenia zamknięte dla Firm

E-learning

Stacja IT - warsztaty dla programistów

Kodołamacz - kursy AI, bootcampy

AI Programming - Nowy kurs PRO by Kodołamacz

Upskilling, reskilling i optymalizacja w IT

AI i analityka danych

Testowanie

Zarządzanie

DevOps / CloudOps

Programowanie

AI & Data Driven Business

UX Design

Data Science

Big Data

Wizualna analityka danych

Vouchery

Dofinansowania

Promocje

Dokumenty

FAQ

Chatboty

Rozwiązania AI

Cyfrowa dostępność

Usługi DevOps

Chatboty

USOS

SSOP

Omega-PSIR

UNIplaner

Rektorat

Portal Pracowniczy

Wszystkie rozwiązania

Co nas wyróżnia

Referencje

Opinie ze szkoleń

Zespół

Kariera

Wszystkie wpisy

Case studies

Aktualności

Artykuły

Kategorie szkoleń

Terminarz - szkolenia otwarte

Szkolenia zamknięte dla Firm

E-learning

Stacja IT - warsztaty dla programistów

Kodołamacz - kursy AI, bootcampy

AI Programming - Nowy kurs PRO by Kodołamacz

Upskilling, reskilling i optymalizacja w IT

AI i analityka danych

Testowanie

Zarządzanie

DevOps / CloudOps

Programowanie

AI & Data Driven Business

UX Design

Data Science

Big Data

Wizualna analityka danych

Vouchery

Dofinansowania

Promocje

Dokumenty

FAQ

Chatboty

Rozwiązania AI

Cyfrowa dostępność

Usługi DevOps

Chatboty

USOS

SSOP

Omega-PSIR

UNIplaner

Rektorat

Portal Pracowniczy

Wszystkie rozwiązania

Co nas wyróżnia