Szkolenie: Big Data i platforma Hadoop - wprowadzenie
Szkolenie Big Data i platforma Hadoop to praktyczny kurs, który wprowadza w analizę dużych zbiorów danych z wykorzystaniem Hadoop, HDFS, YARN, MapReduce i Hive, ucząc efektywnego przetwarzania, przechowywania i analizy danych w środowiskach rozproszonych
- Trenerzy praktycy
- Kameralne grupy
Czas trwania szkolenia:2 dni (16h)
Kod kursu:BIGDATA/BASE
Big Data i platforma Hadoop - wprowadzenie
Cele szkolenia
Szkolenie przygotowuje do samodzielnego analizowania i przetwarzania dużych zbiorów danych z użyciem platformy Hadoop oraz narzędzi ekosystemu Big Data
Szkolenie uczy projektowania i wdrażania rozwiązań opartych o rozproszone systemy przechowywania i przetwarzania danych
Szkolenie pokazuje, jak wykorzystywać narzędzia takie jak HDFS, MapReduce, YARN i Hive do realizacji praktycznych zadań analitycznych
Dla kogo?
Analitycy danych i programiści rozpoczynający pracę z dużymi zbiorami danych i technologiami Big Data
Specjaliści IT posiadający podstawową znajomość SQL oraz umiejętność programowania w językach takich jak Java lub Python
Osoby odpowiedzialne za wdrażanie rozwiązań analitycznych w organizacjach, które chcą poznać podstawy Hadoop
Efekty kształcenia
Uczestnik rozróżnia kluczowe komponenty platformy Hadoop i ich zastosowania
Uczestnik analizuje i przetwarza duże zbiory danych z wykorzystaniem narzędzi Hadoop
Uczestnik projektuje zadania MapReduce oraz wykorzystuje HDFS do przechowywania danych
Uczestnik obsługuje narzędzia Apache Hive do analizy danych i budowy zapytań
Uczestnik optymalizuje procesy przetwarzania danych w środowisku rozproszonym
Uczestnik integruje różne źródła danych w ramach ekosystemu Hadoop
Wymagania
Podstawy SQL oraz hurtowni danych
Podstawowa umiejętność programowania, najlepiej w: Java, Python
W cenie otrzymasz:
Materiały szkoleniowe
Certyfikat ukończenia szkolenia
W przypadku szkolenia w trybie stacjonarnym zapewnimy Ci również lunch oraz sprzęt niezbędny do nauki
Program szkolenia
Wprowadzenie do Big Data
Czym jest Big Data?
Typy przetwarzania w Big Data
Apache Hadoop
Wprowadzenie do platformy Hadoop
MapReduce
HDFS
YARN
Apache Hive
Czym jest Hive
Model danych w Hive
Formaty przechowywania danych
HiveSQL
Uruchamianie zadań
Różne źródła danych
Korzystanie w konsoli
Interfejsy użytkownika
Funkcje wbudowane
Funkcje użytkownika (UDF)
Wykorzystanie Apache Tez i optymalizacja zadań
Warsztaty Hive
Wybrane opinie
Przeczytaj pozytywne opinie pochodzące z ankiet satysfakcji z naszych szkoleń wypełnianych wyłącznie przez ich uczestników po realizacji usługi
