Trwają zapisy do grupy

Szkolenie: Apache Spark z wykorzystaniem języka Python

Praktyczne przetwarzanie Big Data przy pomocy Apache Spark w języku Python

Trenerzy praktycy
Kameralne grupy

Czas trwania szkolenia:2 dni (16h)

Poziom zaawansowania:

Kod kursu:BIGDATA/PYSPARK

mlibsparkspark-sql

Dostępne terminy szkolenia

Termin:

15 września

Trener:

Krzysztof Jankiewicz

Cena:

2565 PLN netto +23% VAT

Zapisz się

Lokalizacja:

Zdalne

Termin:

3 listopada

Trener:

Krzysztof Jankiewicz

Cena:

2565 PLN netto +23% VAT

Zapisz się

Lokalizacja:

Zdalne

Forma szkolenia

Interesuje Cię szkolenie stacjonarne?

Zapytaj o szkolenie

Powiadom o kolejnych terminach

Interesuje Cię szkolenie w innym terminie?

Apache Spark z wykorzystaniem języka Python

Cele szkolenia

Zapoznanie z API Apache Spark oferowanym przez bibliotekę pyspark
Poznanie metod przetwarzania dużych wolumenów danych

Dla kogo?

Analitycy i programiści zaznajomieni z językiem Python, chcący poznać jedno z najpopularniejszych narzędzi do przetwarzania danych

Zalety

Kompleksowe wprowadzenie do pracy z Apache Spark
Praktyka przed teorią - wszystkie szkolenia technologiczne prowadzone są w formie warsztatowej. Konieczna teoria jest wyjaśniana na przykładzie praktycznych zadań
Konkretne umiejętności - w ramach każdego szkolenia rozwijamy praktyczne umiejętności związane z daną technologią i tematyką
Nauka z praktykami - wszyscy trenerzy na co dzień pracują w projektach, gwarantuje to dostęp do eksperckiej wiedzy i praktycznego know-how

Wymagania

Podstawowa znajomość języka Python i SQL

W cenie otrzymasz:

Materiały szkoleniowe
Certyfikat ukończenia szkolenia
W przypadku szkolenia w trybie stacjonarnym zapewnimy Ci również lunch oraz sprzęt niezbędny do nauki

Wprowadzenie do Apache Spark

Historia
Moduły
Architektura
Struktura programu
spark-submit
Najważniejsze ustawienia
Miejsce w ekosystemie Big Data

Spark Core (RDD API)

Wprowadzenie
Cechy
Typy
Akcje
Transformacje

Spark SQL (DataFrame API)

DataFrame
Wydajność
Źródła danych
Schemat danych
Składnia Spark SQL
Agregacja danych
Funkcje analityczne
UDF
Testy jednostkowe

SQL API

Tabele zewnętrzne jako źródła danych
Tworzenie tabel zarządzalnych
Korzystanie z SQL
Usługa Thrift JDBC/ODBC Server
Dostęp za pomocą JDBC

Spark WebUI

Zakładki podstawowe: Jobs, Stages, Storage, Environment, Executors
Zakładki dodatkowe (kontekstowe): SQL/DataFrame

Spark ML

Wektory
Transformery
Estymatory
Potoki
Algorytmy uczenia maszynowego (do wyboru)

Szkolenie poprowadzi jego autor Krzysztof Jankiewicz

Konsultant IT i wykładowca akademicki. Specjalista w zakresie ogólnie rozumianego przetwarzania danych. Począwszy od relacyjnych systemów baz danych, poprzez architekturę, utrzymanie i wykorzystywanie hurtowni danych, bazy danych NoSQL, systemy danych przestrzennych, po narzędzia i platformy Big Data. Od samego początku pracy zawodowej stara się jako konsultant znajdować czas na kontakty przemysłem, gdzie swoją wiedzę może konfrontować i rozwijać w oparciu o rzeczywiste przypadki. Począwszy od…

Autorem szkolenia jest Krzysztof Jankiewicz

Szkolenie poprowadzi jego autor Krzysztof Jankiewicz

Autorem szkolenia jest Krzysztof Jankiewicz

Szkolenie poprowadzi jego autor Krzysztof Jankiewicz

Wybrane opinie

Przeczytaj pozytywne opinie pochodzące z ankiet satysfakcji z naszych szkoleń wypełnianych wyłącznie przez ich uczestników po realizacji usługi

4.8

25.09.2024

Uczestnik szkolenia “Apache Spark z wykorzystaniem języka Python”

Michał Kowalczyk, Eurocash

Szkolenie składało się z dwóch elementów: praktyczny (pisanie kodu) i teoretyczny. Aspekt teoretyczny stanowił trudno osiągalny zasób zrozumienia dlaczego, tak jest. Daje to możliwość lepszego rozumienia i w przyszłości optymalizacji własnego kodu. Jeśli chodzi o aspekt praktyczny, był on wystarczający przy 16h ograniczeniu. Pomimo codziennej pracy z pysparkiem, szkolenie było ciekawe i miałem wrażenie, że jest rzeczywiście od podstaw do poziomu średniozaawansowanego.

17.12.2024

Uczestnik szkolenia “Apache Spark z wykorzystaniem języka Python”

Kinga Wadowska

trener bardzo przygotowany do tematu, fajne materiały, dobra proporcja teorii do praktyki :) plus coś co bardzo lubię, dobry humor.

25.09.2024

Uczestnik szkolenia “Apache Spark z wykorzystaniem języka Python”

Michał Kowalczyk, Eurocash

25.09.2024

Uczestnik szkolenia “Apache Spark z wykorzystaniem języka Python”

Michał Kowalczyk, Eurocash

Więcej opinii

Podobne szkolenia

Przetwarzanie strumieni danych w Apache Spark

Liczba dni: 1

1300 PLN

Szkolenie "Przetwarzanie strumieni danych w Apache Spark" pozwala nie tylko poznać mechanizmy przetwarzania strumieni danych w Apache Spark, ale także usystematyzować i uporządkować wiedzę na temat przetwarzania strumieni oraz szczegółowo przyjrzeć się możliwościom i ograniczeniom, z jakimi mamy do czynienia w ramach tej platformy.

sparkscalapython

Projektowanie platformy Big Data z użyciem narzędzi z rodziny Apache

Liczba dni: 3

2805 PLN

Szkolenie obejmujące podstawy projektowania i tworzenia platform Big Data przy pomocy narzędzi Apache (Kafka, Spark, NiFi, Druid, Airflow)

kafkaspark-sqlgcpspark

Przetwarzanie strumieni danych w środowiskach Big Data

Liczba dni: 3

3100 PLN

Przetwarzanie strumieni danych (stream data processing) z roku na rok zyskuje na znaczeniu w szczególności w przypadku rozwiązań Big Data. Jest wymagane w wielu uznanych architekturach, oferuje możliwości, które nie sposób osiągnąć przy tradycyjnym/wsadowym przetwarzaniu danych. Kurs wprowadza uczestników w świat mechanizmów przetwarzania strumieni danych oraz najważniejszych narzędzi Big Data, które taki typ przetwarzania udostępniają. Zakres szkolenia obejmuje: podstawy platformy Kafka jako brokera wiadomości, Spark Streaming, Spark Structured Streaming, Kafka Streaming, a także wprowadzenie platformy Flink. Innymi słowy, szkolenie zawiera wprowadzenie do przetwarzania strumieni danych w środowiskach Big Data oraz przegląd najważniejszych rozwiązań począwszy od najprostszych, aż po najbardziej skomplikowane.

sparkscala

Kategorie szkoleń

Terminarz - szkolenia otwarte

Szkolenia zamknięte dla Firm

E-learning

Stacja IT - warsztaty dla programistów

Kodołamacz - kursy AI, bootcampy

AI Programming - Nowy kurs PRO by Kodołamacz

Upskilling, reskilling i optymalizacja w IT

AI i analityka danych

Testowanie

Zarządzanie

DevOps / CloudOps

Programowanie

AI & Data Driven Business

UX Design

Data Science

Big Data

Wizualna analityka danych

Vouchery

Dofinansowania

Promocje

Dokumenty

FAQ

Chatboty

Rozwiązania AI

Cyfrowa dostępność

Usługi DevOps

Chatboty

USOS

SSOP

Omega-PSIR

UNIplaner

Rektorat

Portal Pracowniczy

Wszystkie rozwiązania

Co nas wyróżnia

Referencje

Opinie ze szkoleń

Zespół

Kariera

Wszystkie wpisy

Case studies

Aktualności

Artykuły

Kategorie szkoleń

Terminarz - szkolenia otwarte

Szkolenia zamknięte dla Firm

E-learning

Stacja IT - warsztaty dla programistów

Kodołamacz - kursy AI, bootcampy

AI Programming - Nowy kurs PRO by Kodołamacz

Upskilling, reskilling i optymalizacja w IT

AI i analityka danych

Testowanie

Zarządzanie

DevOps / CloudOps

Programowanie

AI & Data Driven Business

UX Design

Data Science

Big Data

Wizualna analityka danych

Vouchery

Dofinansowania

Promocje

Dokumenty

FAQ

Chatboty

Rozwiązania AI

Cyfrowa dostępność

Usługi DevOps

Chatboty

USOS

SSOP

Omega-PSIR

UNIplaner

Rektorat

Portal Pracowniczy

Wszystkie rozwiązania

Co nas wyróżnia