Apache Spark z wykorzystaniem języka Python

LICZBA DNI: 2 (16h)

KOD KURSU: BIGDATA/PYSPARK

POZIOM SZKOLENIA:

# spark

# spark-sql

# spark-streaming

# mlib

Najbliższy termin:

19 sierpnia 2021

PROWADZI:

Patryk Pilarski

1950 PLN netto + 23% VAT

  • stacjonarne
  • zdalne

STACJONARNE

W CENIE

  • 2 dni pracy z trenerem
  • Materiały szkoleniowe
  • Lunch
  • Certyfikat ukończenia szkolenia

ZDALNE

W CENIE

  • 2 dni pracy z trenerem na żywo online
  • Materiały szkoleniowe
  • Certyfikat ukończenia szkolenia

Czy wiesz, że możesz uzyskać nawet do 100% DOFINANSOWANIA na szkolenie? Napisz do nas »

Weź udział w szkoleniu

Termin

Lokalizacja

Trener

Cena / os

19

sierpnia

Warszawa,

Zdalne,

1950 PLN netto
+ 23% VAT

4

listopada

Zdalne,

Warszawa,

1950 PLN netto
+ 23% VAT

9

grudnia

Zdalne,

1950 PLN netto
+ 23% VAT

Termin

19

sierpnia

Lokalizacja

Warszawa,

Zdalne,

Trener

Cena / os

1950 PLNnetto
+ 23% VAT

Termin

4

listopada

Lokalizacja

Zdalne,

Warszawa,

Trener

Cena / os

1950 PLNnetto
+ 23% VAT

Termin

9

grudnia

Lokalizacja

Zdalne,

Trener

Cena / os

1950 PLNnetto
+ 23% VAT

Powiadom
o kolejnych terminach

O szkoleniu

DLA KOGO?

Analitycy i programiści zaznajomieni z językiem Python, chcący poznać jedno z najpopularniejszych narzędzi do przetwarzania danych

WYMAGANIA

Podstawowa znajomość języka Python i SQL

ZALETY

Kompleksowe wprowadzenie do pracy z Apache Spark

Kameralne grupy - szkolenia technologiczne prowadzimy w grupach liczących do 8 osób. Pozwala to na indywidualne podejście oraz aktywizację każdego uczestnika

Praktyka przed teorią - wszystkie szkolenia technologiczne prowadzone są w formie warsztatowej. Konieczna teoria jest wyjaśniana na przykładzie praktycznych zadań

Konkretne umiejętności - w ramach każdego szkolenia rozwijamy praktyczne umiejętności związane z daną technologią i tematyką

Nauka z praktykami - wszyscy trenerzy na co dzień pracują w projektach, gwarantuje to dostęp do eksperckiej wiedzy i praktycznego know-how

Cele szkolenia

Zapoznanie z API Apache Spark oferowanym przez bibliotekę pyspark

Poznanie metod przetwarzania dużych wolumenów danych

Program

  • Historia
  • Moduły
  • Architektura
  • Struktura programu
  • spark-submit
  • Najważniejsze ustawienia
  • Miejsce w ekosystemie Big Data
  • RDD
    • Wprowadzenie
    • Cechy
    • Typy
    • Akcje
    • Transformacje
  • Akumulatory
  • Zmienne rozgłoszeniowe
  • Partycjonowanie
  • Zależności wąskie i szerokie
  • DataFrame
  • Wydajność
  • Źródła danych
  • Schemat danych
  • Składnia Spark SQL
  • Agregacja danych
  • Funkcje analityczne
  • UDF
  • Testy jednostkowe
  • Wektory
  • Transformery
  • Estymatory
  • Potoki
  • Algorytmy uczenia maszynowego
    • Klasyfikacja
    • Regresja
  • DStream
  • Streaming DataFrame
  • Transformacje strumieni danych
  • Operacje oknowe
  • Watermarking
  • Źródła danych

Autor szkolenia:

Patryk Pilarski

Data scientist. Dobrze czuje się w pracy z danymi w każdym rozmiarze – od dużych po małe. Na ścieżce kariery poszukuje interesujących wyzwań oraz możliwości pracy z ciekawymi technologiami, w związku z czym pracował w licznych projektach łączących w sobie wyzwania z zakresu analizy i inżynierii danych. Chętnie zgłębia nowe technologie oraz języki programowania. Stara się również przekazywać pozyskaną wiedzę i umiejętności wcielając się w rolę trenera.

Najbliższe szkolenie poprowadzi:

Patryk Pilarski

Data scientist. Dobrze czuje się w pracy z danymi w każdym rozmiarze – od dużych po małe. Na ścieżce kariery poszukuje interesujących wyzwań oraz możliwości pracy z ciekawymi technologiami, w związku z czym pracował w licznych projektach łączących w sobie wyzwania z zakresu analizy i inżynierii danych. Chętnie zgłębia nowe technologie oraz języki programowania. Stara się również przekazywać pozyskaną wiedzę i umiejętności wcielając się w rolę trenera.

POLITYKA COOKIES:

Korzystamy z plików cookies, by móc jak najlepiej dostosować stronę do Twoich potrzeb oraz wyświetlać Ci przydatne i adekwatnych dla Ciebie reklamy w serwisie i poza nim. Możesz kontrolować ustawienia ciasteczek w swoich ustawieniach swojej przeglądarki. Odwiedzając tę stronę, wyrażasz zgodę na wykorzystywanie przez nas plików cookies.