Big Data i platforma Hadoop - wprowadzenie

2950 PLN+23% VAT (3628 PLN brutto / 1 os.)

Czas trwania szkolenia:3 dni (24h)

Kod kursu:BIGDATA/BASE

Poziom zaawansowania:

hadoop

hdfs

yarn

hive

pig

hbase

mapreduce

Dostępne terminy

  • Termin
  • Lokalizacja
  • Trener
  • Cena
Brak dostępnych terminów

O szkoleniu Big Data i platforma Hadoop - wprowadzenie

W cenie otrzymasz:

  • Materiały szkoleniowe
  • Certyfikat ukończenia szkolenia
  • W przypadku szkolenia w trybie stacjonarnym zapewnimy Ci również lunch oraz sprzęt niezbędny do nauki

Dla kogo?

  • Analitycy i programiści, którzy chcą rozpocząć przygodę z analizą dużych zbiorów danych

Wymagania

  • Podstawy SQL oraz hurtowni danych
  • Podstawowa umiejętność programowania, najlepiej w: Java, Python lub Scala

Zalety

  • Praktyczne wprowadzenie do tematyki Big Data
  • Warsztatowy charakter zajęć, umożliwiający przyswojenie wiedzy, niezbędnej do przeprowadzania analizy dużych ilości danych
  • Praktyka przed teorią - wszystkie szkolenia technologiczne prowadzone są w formie warsztatowej. Konieczna teoria jest wyjaśniana na przykładzie praktycznych zadań
  • Konkretne umiejętności - w ramach każdego szkolenia rozwijamy praktyczne umiejętności związane z daną technologią i tematyką
  • Nauka z praktykami - wszyscy trenerzy na co dzień pracują w projektach, gwarantuje to dostęp do eksperckiej wiedzy i praktycznego know-how

Cele szkolenia

  • Wprowadzenie do koncepcji Big Data
  • Zapoznanie z platformą Hadoop oraz dostępnymi narzędziami

Program

Wprowadzenie do Big Data

  • Czym jest Big Data?
  • Typy przetwarzania w Big Data
  • Dystrybucje Big Data
  • Rozwiązania w chmurze

Apache Hadoop

  • Wprowadzenie do platformy Hadoop
  • MapReduce
  • HDFS
  • YARN

Apache Pig

  • Wprowadzenie
  • Architektura
  • PigLatin w szczegółach
  • Uruchamianie zadań
  • Różne źródła danych
  • Funkcje wbudowane
  • Biblioteki, makra
  • Funkcje użytkownika (UDF)
  • Warsztaty Pig

Apache Hive

  • Czym jest Hive
  • Model danych w Hive
  • Formaty przechowywania danych
  • HiveSQL
  • Uruchamianie zadań
  • Różne źródła danych
  • Korzystanie w konsoli
  • Interfejsy użytkownika
  • Funkcje wbudowane
  • Funkcje użytkownika (UDF)
  • Wykorzystanie Apache Tez i optymalizacja zadań
  • Warsztaty Hive

Wprowadzenie do baz danych NoSQL

  • Historia
  • Podstawowe cechy
  • Przyczyny sukcesu
  • Problem spójności
  • Przegląd modeli NoSQL
  • Powiązane technologie

HBase

  • Wprowadzenie
  • Case Study
  • Organizacja danych
  • Widoki danych: koncepcyjny i fizyczny
  • Architektura
  • Jak to wszystko działa?
  • Interfejsy
  • Warsztaty HBase
  • Warsztaty HBase z zewnętrznych narzędzi: Pig i Hive

Podobne szkolenia