Apache Spark z wykorzystaniem języka Python

2550 PLN+23% VAT (3136 PLN brutto / 1 os.)

Czas trwania szkolenia:2 dni (16h)

Kod kursu:BIGDATA/PYSPARK

Poziom zaawansowania:

mlibsparkspark-sqlspark-streaming

Dostępne terminy

Termin:

14 maj

Trener:

Krzysztof Jankiewicz

Cena:

2550 PLN netto+23% VAT

Zapisz się

Lokalizacja:

Zdalne

Termin:

26 sierpień

Trener:

Krzysztof Jankiewicz

Cena:

2550 PLN netto+23% VAT

Zapisz się

Lokalizacja:

Zdalne

Termin:

23 wrzesień

Trener:

Krzysztof Jankiewicz

Cena:

2550 PLN netto+23% VAT

Zapisz się

Lokalizacja:

Zdalne

Termin:

18 listopad

Trener:

Krzysztof Jankiewicz

Cena:

2550 PLN netto+23% VAT

Zapisz się

Lokalizacja:

Zdalne

Interesuje Cię szkolenie stacjonarne lub nie odpowiada Ci żaden z dostępnych terminów?

Zapytaj o szkolenie

O szkoleniu Apache Spark z wykorzystaniem języka Python

W cenie otrzymasz:

Materiały szkoleniowe
Certyfikat ukończenia szkolenia
W przypadku szkolenia w trybie stacjonarnym zapewnimy Ci również lunch oraz sprzęt niezbędny do nauki

Dla kogo?

Analitycy i programiści zaznajomieni z językiem Python, chcący poznać jedno z najpopularniejszych narzędzi do przetwarzania danych

Wymagania

Podstawowa znajomość języka Python i SQL

Zalety

Kompleksowe wprowadzenie do pracy z Apache Spark
Praktyka przed teorią - wszystkie szkolenia technologiczne prowadzone są w formie warsztatowej. Konieczna teoria jest wyjaśniana na przykładzie praktycznych zadań
Konkretne umiejętności - w ramach każdego szkolenia rozwijamy praktyczne umiejętności związane z daną technologią i tematyką
Nauka z praktykami - wszyscy trenerzy na co dzień pracują w projektach, gwarantuje to dostęp do eksperckiej wiedzy i praktycznego know-how

Cele szkolenia

Zapoznanie z API Apache Spark oferowanym przez bibliotekę pyspark
Poznanie metod przetwarzania dużych wolumenów danych

Program

Wprowadzenie do Apache Spark

Historia
Moduły
Architektura
Struktura programu
spark-submit
Najważniejsze ustawienia
Miejsce w ekosystemie Big Data

Spark Core

RDD
Akumulatory
Zmienne rozgłoszeniowe
Partycjonowanie
Zależności wąskie i szerokie

Spark SQL

DataFrame
Wydajność
Źródła danych
Schemat danych
Składnia Spark SQL
Agregacja danych
Funkcje analityczne
UDF
Testy jednostkowe

Spark UI

Spark ML

Wektory
Transformery
Estymatory
Potoki
Algorytmy uczenia maszynowego

Spark Streaming i Structured Streaming

DStream
Streaming DataFrame
Transformacje strumieni danych
Operacje oknowe
Watermarking
Źródła danych

Szkolenie poprowadzi Krzysztof Jankiewicz

Konsultant IT i wykładowca akademicki. Specjalista w zakresie ogólnie rozumianego przetwarzania danych. Począwszy od relacyjnych systemów baz danych, poprzez architekturę, utrzymanie i wykorzystywanie hurtowni danych, bazy danych NoSQL, systemy danych przestrzennych, po narzędzia i platformy Big Data. Od samego początku pracy zawodowej stara się jako konsultant znajdować czas na kontakty przemysłem, gdzie swoją wiedzę może konfrontować i rozwijać w oparciu o rzeczywiste przypadki. Począwszy od…

Więcej o mnie »

Autorem szkolenia jest Patryk Pilarski

Data scientist. Dobrze czuje się w pracy z danymi w każdym rozmiarze – od dużych po małe. Na ścieżce kariery poszukuje interesujących wyzwań oraz możliwości pracy z ciekawymi technologiami, w związku z czym pracował w licznych projektach łączących w sobie wyzwania z zakresu analizy i inżynierii danych. Chętnie zgłębia nowe technologie oraz języki programowania. Stara się również przekazywać pozyskaną wiedzę i umiejętności wcielając się w rolę trenera.

Więcej o mnie »

Szkolenie poprowadzi Krzysztof Jankiewicz

Więcej o mnie »

Autorem szkolenia jest Patryk Pilarski

Więcej o mnie »

Szkolenie poprowadzi Krzysztof Jankiewicz

Więcej o mnie »

Podobne szkolenia

Przetwarzanie strumieni danych w środowiskach Big Data

Liczba dni: 3

3350 PLN

Przetwarzanie strumieni danych (stream data processing) z roku na rok zyskuje na znaczeniu w szczególności w przypadku rozwiązań Big Data. Jest wymagane w wielu uznanych architekturach, oferuje możliwości, które nie sposób osiągnąć przy tradycyjnym/wsadowym przetwarzaniu danych. Kurs wprowadza uczestników w świat mechanizmów przetwarzania strumieni danych oraz najważniejszych narzędzi Big Data, które taki typ przetwarzania udostępniają. Zakres szkolenia obejmuje: podstawy platformy Kafka jako brokera wiadomości, Spark Streaming, Spark Structured Streaming, Kafka Streaming, a także wprowadzenie platformy Flink. Innymi słowy, szkolenie zawiera wprowadzenie do przetwarzania strumieni danych w środowiskach Big Data oraz przegląd najważniejszych rozwiązań począwszy od najprostszych, aż po najbardziej skomplikowane.

scalaspark

Apache Spark z wykorzystaniem języka Scala

Liczba dni: 3

3350 PLN

Praktyczne wykorzystanie platformy Apache Spark w kontekście przetwarzania Big Data

scalaspark

Projektowanie platformy Big Data z użyciem narzędzi z rodziny Apache

Liczba dni: 3

3350 PLN

Szkolenie obejmujące podstawy projektowania i tworzenia platform Big Data przy pomocy narzędzi Apache (Kafka, Spark, NiFi, Druid, Airflow)

javascalabig-dataspark

Kategorie szkoleń

Terminarz - szkolenia otwarte

Szkolenia zamknięte dla Firm

E-learning

Stacja IT - warsztaty dla programistów

Upskilling, reskilling i optymalizacja w IT

Data Science i Big Data w zarządzaniu

Data Science

Big Data

Wizualna analityka danych

Vouchery

Dofinansowania

Promocje

Dokumenty

FAQ

Chatboty

Rozwiązania AI

Cyfrowa dostępność

Chatboty

USOS

SSOP

Omega-PSIR

UNIplaner

Rektorat

Portal Pracowniczy

Wszystkie rozwiązania

Co nas wyróżnia

Referencje

Zespół

Kariera

Wszystkie wpisy

Case studies

Aktualności

Artykuły

Apache Spark z wykorzystaniem języka Python

Dostępne terminy

Termin:

Trener:

Cena:

Lokalizacja:

Termin:

Trener:

Cena:

Lokalizacja:

Termin:

Trener:

Cena:

Lokalizacja:

Termin:

Trener:

Cena:

Lokalizacja:

Interesuje Cię szkolenie stacjonarne lub nie odpowiada Ci żaden z dostępnych terminów?

O szkoleniu Apache Spark z wykorzystaniem języka Python

W cenie otrzymasz:

Dla kogo?

Wymagania

Zalety

Cele szkolenia

Program

Wprowadzenie do Apache Spark

Spark Core

Spark SQL

Spark UI

Spark ML

Spark Streaming i Structured Streaming

Autorem szkolenia jest Patryk Pilarski

Podobne szkolenia

Przetwarzanie strumieni danych w środowiskach Big Data

Apache Spark z wykorzystaniem języka Scala

Projektowanie platformy Big Data z użyciem narzędzi z rodziny Apache