Analiza danych z użyciem Apache Spark

LICZBA DNI: 2 (16h)

KOD KURSU: SPARK/ANA

POZIOM SZKOLENIA:

# mining

# information-retrieval

Najbliższy termin:

4 listopada 2021

1950 PLN netto + 23% VAT

Jeszcze 8 miejsc w tej cenie.

  • stacjonarne
  • zdalne

STACJONARNE

W CENIE

  • 2 dni pracy z trenerem
  • Materiały szkoleniowe
  • Lunch
  • Certyfikat ukończenia szkolenia

ZDALNE

W CENIE

  • 2 dni pracy z trenerem na żywo online
  • Materiały szkoleniowe
  • Certyfikat ukończenia szkolenia

Czy wiesz, że możesz uzyskać nawet do 100% DOFINANSOWANIA na szkolenie? Napisz do nas »

Oferta dla firm

Dostosuj zakres, czas i miejsce szkolenia do potrzeb Twojego zespołu. Uzyskaj indywidualną wycenę szkolenia dla grupy.

Weź udział w szkoleniu

Termin

Lokalizacja

Cena / os

4

listopada

Warszawa,

Zdalne,

1950 PLN netto
+ 23% VAT

9

grudnia

Warszawa,

Zdalne,

1950 PLN netto
+ 23% VAT

Termin

4

listopada

Lokalizacja

Warszawa,

Zdalne,

Cena / os

1950 PLNnetto
+ 23% VAT

Termin

9

grudnia

Lokalizacja

Warszawa,

Zdalne,

Cena / os

1950 PLNnetto
+ 23% VAT

Powiadom
o kolejnych terminach

O szkoleniu

DLA KOGO?

Osoby pracujące z danymi chcące pozyskać umiejętności pozwalające na analizę dużych zbiorów danych przy użyciu Apache Spark

WYMAGANIA

Podstawowa znajomość Pythona oraz SQLa

ZALETY

Wprowadzenie do świata analizy danych Big Data

Koncentracja na użytkowaniu Sparka nie przytłoczy mnogością szczegółów technicznych

Duży nacisk na część warsztatową i pisanie kodu pozwoli na szybkie wykorzystanie zdobytych umiejętności w praktyce

Wykorzystanie głównie Spark SQL pozwoli na intuicyjną pracę z dużymi zbiorami danych

Kameralne grupy - szkolenia technologiczne prowadzimy w grupach liczących do 8 osób. Pozwala to na indywidualne podejście oraz aktywizację każdego uczestnika

Praktyka przed teorią - wszystkie szkolenia technologiczne prowadzone są w formie warsztatowej. Konieczna teoria jest wyjaśniana na przykładzie praktycznych zadań

Konkretne umiejętności - w ramach każdego szkolenia rozwijamy praktyczne umiejętności związane z daną technologią i tematyką

Nauka z praktykami - wszyscy trenerzy na co dzień pracują w projektach, gwarantuje to dostęp do eksperckiej wiedzy i praktycznego know-how

Cele szkolenia

Zdobycie praktycznych umiejętności i wiedzy pozwalających na wykonywanie analiz dużych zbiorów danych z wykorzystaniem Apache Spark

Zapoznanie z problemami przetwarzania, czyszczenia oraz eksploracyjnej analizy danych, a także zagadnieniami pokrewnymi, jak chociażby wykorzystaniem algorytmów uczenia maszynowego na przygotowanym zbiorze

Program

  • Architektura
  • Moduły
  • Miejsce w ekosystemie Big Data
  • Jupyter
  • Przegląd możliwości i udogodnień
  • Spark Context i Spark Session
  • RDD
  • Akcje i transformacje
  • DataFrame
  • Źródła danych
  • Składnia Spark SQL
  • Statystyki zmiennych
  • Grupowanie i agregacja danych
  • Funkcje analityczne i okienne
  • Podstawy wizualizacji
  • Typy wykresów
  • Wizualizacja dużych zbiorów danych
  • Wektory gęste i rzadkie
  • Przekształcanie zbioru do postaci wektorowej
  • Przegląd dostępnych transformacji zmiennych
  • Przegląd dostępnych algorytmów uczenia maszynowego
    • Modele klasyfikacyjne
    • Modele regresyjne
    • Algorytmy klastrowania
  • Przetwarzanie potokowe (pipeline)

Autor szkolenia:

Patryk Pilarski

Data Scientist, Data Engineer - pół człowiek pół dane. Dobrze czuje się w pracy z danymi w każdym rozmiarze – od dużych po małe. Na ścieżce kariery poszukuje interesujących wyzwań oraz możliwości pracy z ciekawymi technologiami, w związku z czym pracował w licznych projektach łączących w sobie wyzwania z zakresu analizy i inżynierii danych - zarówno dla dużych jak i małych firm. Chętnie zgłębia nowe technologie oraz języki programowania. Stara się również przekazywać pozyskaną wiedzę i umiejętności wcielając się w rolę trenera.

POLITYKA COOKIES:

Korzystamy z plików cookies, by móc jak najlepiej dostosować stronę do Twoich potrzeb oraz wyświetlać Ci przydatne i adekwatnych dla Ciebie reklamy w serwisie i poza nim. Możesz kontrolować ustawienia ciasteczek w swoich ustawieniach swojej przeglądarki. Odwiedzając tę stronę, wyrażasz zgodę na wykorzystywanie przez nas plików cookies.