Szkolenie: Apache Druid - analiza danych w czasie rzeczywistym
Szkolenie Apache Druid – analiza danych w czasie rzeczywistym to praktyczne szkolenie, które wprowadza uczestników w świat Big Data i technologii analitycznych klasy enterprise. Uczestnicy poznają, jak projektować i wdrażać rozwiązania oparte na Apache Druid – nowoczesnej, wydajnej bazie analitycznej typu open-source, wykorzystywanej do obsługi zapytań ad-hoc, analizy strumieniowej oraz przetwarzania dużych wolumenów danych w czasie rzeczywistym. Szkolenie koncentruje się na architekturze Druid, pozyskiwaniu danych wsadowych i strumieni danych, optymalizacji zapytań SQL i natywnych, a także praktycznym wykorzystaniu narzędzia w analizie danych biznesowych i technicznych.
- Trenerzy praktycy
- Kameralne grupy
Czas trwania szkolenia:1 dzień (8h)
Kod kursu:BIGDATA/DRUID
Apache Druid - analiza danych w czasie rzeczywistym
Cele szkolenia
Szkolenie przygotowuje do samodzielnego projektowania i wdrażania skalowalnych rozwiązań analitycznych Big Data w czasie rzeczywistym z wykorzystaniem Apache Druid
Szkolenie uczy pozyskiwania, transformowania i integrowania danych wsadowych oraz strumieniowych z użyciem Apache Kafka, preagregacji i Apache DataSketches
Szkolenie pokazuje optymalizację zapytań SQL i natywnych oraz konfigurację silników zapytań Apache Druid dla wysokiej wydajności analizy OLAP
Szkolenie omawia architekturę Apache Druid, role usług serwerów master, query i data servers oraz zarządzanie cyklem życia segmentów
Szkolenie rozwija umiejętność analizy danych OLAP z użyciem GUI, REST API i JDBC oraz integracji Apache Druid z Apache Kafka i HDFS
Szkolenie prezentuje praktyczne wykorzystanie approximate algorithms i DataSketches do interaktywnej analizy dużych zbiorów danych
Dla kogo?
Programiści backend i inżynierowie danych z doświadczeniem w SQL i podstawach Big Data zainteresowani analizą w czasie rzeczywistym
Analitycy danych oraz inżynierowie ETL odpowiedzialni za przetwarzanie strumieni i hurtownie danych
Architekci rozwiązań i DevOps planujący wdrożenia skalowalnych systemów analitycznych
Osoby znające Apache Kafka lub Hadoop chcące rozwinąć umiejętności praktycznej pracy z Apache Druid
Efekty kształcenia
Uczestnik projektuje i konfiguruje architekturę Apache Druid dla analiz danych w czasie rzeczywistym oraz środowisk Big Data
Uczestnik pozyskuje i przekształca dane wsadowe i strumieniowe oraz stosuje preagregację i SQL-based ingestion
Uczestnik optymalizuje zapytania SQL i natywne oraz dobiera odpowiedni silnik zapytań Apache Druid do analizy OLAP
Uczestnik wdraża integracje Apache Druid z Apache Kafka, HDFS oraz systemami HTTP i REST API
Uczestnik analizuje wyniki OLAP z użyciem GUI, JDBC, REST API i narzędzi zewnętrznych do analizy danych
Uczestnik wykorzystuje Apache DataSketches i algorytmy przybliżone do efektywnej agregacji oraz analizy dużych zbiorów danych
Wymagania
Niezbędna jest znajomość podstawowych pojęć z zakresu Big Data
Silnie rekomendowane jest posiadanie wiedzy i umiejętności z zagadnień ujętych w ramach szkolenia Big Data i platforma Hadoop - wprowadzenie
Niezbędna znajomość podstaw Hurtowni Danych i ich projektowania
Niezbędna znajomość modelu relacyjnego i poleceń SQL
Rekomendowana znajomość wyrażeń regularnych
Znajomość Apache Kafka
W cenie otrzymasz:
Materiały szkoleniowe
Certyfikat ukończenia szkolenia
W przypadku szkolenia w trybie stacjonarnym zapewnimy Ci również lunch oraz sprzęt niezbędny do nauki
Program szkolenia
Wprowadzenie do Apache Druid
Cel narzędzia
Podstawowe cechy
Charakterystyka modelu danych
Algorytmy przybliżone i Apache DataSketches
Typy zapytań
Podstawowe pojęcia
Usługi
Źródła danych (datasources)
Segmenty
Składnice metadanych oraz segmentów
Zookeeper
Architektura
Usługi serwerów master
Usługi serwerów zapytań
Usługi serwerów danych
Procedura pozyskiwania danych
Format i model danych
Logiczna struktura danych
Miary, wymiary, wymiar czasu
Fizyczna organizacja danych
Projekcje (projections)
Pozyskiwanie danych
Wsadowe - natywne i SQL-based ingestion
Strumieniowe
Preagregacja
Cykl życia segmentów
Scalanie segmentów danych
Obsługa danych bez wymiaru czasu
Proste transformacje
Interfejsy i zapytania
GUI
REST API
JDBC
SQL
Funkcje i operatory
Zapytania natywne i ich cechy
Silniki zapytań - natywny, MSQ, Dart
Wybrane opinie
Przeczytaj pozytywne opinie pochodzące z ankiet satysfakcji z naszych szkoleń wypełnianych wyłącznie przez ich uczestników po realizacji usługi

