Big Data i platforma Hadoop - wprowadzenie
Czas trwania szkolenia:3 dni (24h)
Kod kursu:BIGDATA/BASE
Poziom zaawansowania:
O szkoleniu Big Data i platforma Hadoop - wprowadzenie
W cenie otrzymasz:
- Materiały szkoleniowe
- Certyfikat ukończenia szkolenia
- W przypadku szkolenia w trybie stacjonarnym zapewnimy Ci również lunch oraz sprzęt niezbędny do nauki
Wymagania
- Podstawy SQL oraz hurtowni danych
- Podstawowa umiejętność programowania, najlepiej w: Java, Python lub Scala
Zalety
- Praktyczne wprowadzenie do tematyki Big Data
- Warsztatowy charakter zajęć, umożliwiający przyswojenie wiedzy, niezbędnej do przeprowadzania analizy dużych ilości danych
- Praktyka przed teorią - wszystkie szkolenia technologiczne prowadzone są w formie warsztatowej. Konieczna teoria jest wyjaśniana na przykładzie praktycznych zadań
- Konkretne umiejętności - w ramach każdego szkolenia rozwijamy praktyczne umiejętności związane z daną technologią i tematyką
- Nauka z praktykami - wszyscy trenerzy na co dzień pracują w projektach, gwarantuje to dostęp do eksperckiej wiedzy i praktycznego know-how
Cele szkolenia
- Wprowadzenie do koncepcji Big Data
- Zapoznanie z platformą Hadoop oraz dostępnymi narzędziami
Program
Wprowadzenie do Big Data
- Czym jest Big Data?
- Typy przetwarzania w Big Data
- Dystrybucje Big Data
- Rozwiązania w chmurze
Apache Hadoop
- Wprowadzenie do platformy Hadoop
- MapReduce
- HDFS
- YARN
Apache Pig
- Wprowadzenie
- Architektura
- PigLatin w szczegółach
- Uruchamianie zadań
- Różne źródła danych
- Funkcje wbudowane
- Biblioteki, makra
- Funkcje użytkownika (UDF)
- Warsztaty Pig
Apache Hive
- Czym jest Hive
- Model danych w Hive
- Formaty przechowywania danych
- HiveSQL
- Uruchamianie zadań
- Różne źródła danych
- Korzystanie w konsoli
- Interfejsy użytkownika
- Funkcje wbudowane
- Funkcje użytkownika (UDF)
- Wykorzystanie Apache Tez i optymalizacja zadań
- Warsztaty Hive
Wprowadzenie do baz danych NoSQL
- Historia
- Podstawowe cechy
- Przyczyny sukcesu
- Problem spójności
- Przegląd modeli NoSQL
- Powiązane technologie
HBase
- Wprowadzenie
- Case Study
- Organizacja danych
- Widoki danych: koncepcyjny i fizyczny
- Architektura
- Jak to wszystko działa?
- Interfejsy
- Warsztaty HBase
- Warsztaty HBase z zewnętrznych narzędzi: Pig i Hive