Projektowanie platformy Big Data z użyciem narzędzi z rodziny Apache

LICZBA DNI: 5 (40h)

KOD KURSU: BIGDATA/APACHE/JAVA

# oop

# java

# scala

# gcp

# spark-sql

# spark-streaming

# big-data

# map-reduce

# yarn

# spark

# hive

# kafka

Szkolenie na zamówienie

Szkolenie dostosowane do potrzeb Twojego zespołu. Dostępne wyłącznie na zamówienie.

  • Dostosowany program
  • Indywidualna wycena
  • Dowolny termin

O szkoleniu

DLA KOGO?

Programiści chcący poznać podstawy Big Data

WYMAGANIA

Praktyczna wiedza z programowania obiektowego w języku Java

ZALETY

Warsztatowy charakter zajęć

Użycie wielu różnych narzędzi niezbędnych w codziennej pracy z Big Data

Ćwiczenia praktyczne odbywają się w środowisku chmury obliczeniowej (Google Cloud Platform)

Cele szkolenia

Praktyczna umiejętność projektowania platformy do przetwarzania dużej ilości danych

Zdobycie wiedzy na temat powszechnie używanych narzędzi typu open-source w Big Data

Program

  • Zalety programowania funkcyjnego
  • Różnice w stosunku do języka Java
  • Elementy języka wykorzystywane w kontekście Big Data
  • Ćwiczenia praktyczne (case class, companion object, pattern matching, implicit)
  • Przetwarzanie real-time
  • Zastosowanie Spark Streaming
  • Projektowanie joba przetwarzającego dane strumieniowo
  • Checkpointing
  • Exactly-once delivery possibilities
  • Wstęp do architektury
  • Opis poszczególnych komponentów (HDFS, Yarn, MapReduce)
  • Porównanie MapReduce oraz Spark jobs

POLITYKA COOKIES:

Korzystamy z plików cookies, by móc jak najlepiej dostosować stronę do Twoich potrzeb oraz wyświetlać Ci przydatne i adekwatnych dla Ciebie reklamy w serwisie i poza nim. Możesz kontrolować ustawienia ciasteczek w swoich ustawieniach swojej przeglądarki. Odwiedzając tę stronę, wyrażasz zgodę na wykorzystywanie przez nas plików cookies.