Techniczne aspekty eksploracji danych zgromadzonych w hurtowni danych z wykorzystaniem Pentaho Data Mining
Czas trwania szkolenia:4 dni (32h)
Kod kursu:WEKA
Poziom zaawansowania:
O szkoleniu Techniczne aspekty eksploracji danych zgromadzonych w hurtowni danych z wykorzystaniem Pentaho Data Mining
W cenie otrzymasz:
- Materiały szkoleniowe
- Certyfikat ukończenia szkolenia
- W przypadku szkolenia w trybie stacjonarnym zapewnimy Ci również lunch oraz sprzęt niezbędny do nauki
Dla kogo?
- Szkolenie jest adresowane do programistów, architektów oraz administratorów aplikacji, którzy chcą tworzyć lub utrzymywać procesy eksploracji danych z wykorzystaniem Pentaho Data Mining (WEKA)
- Szkolenie jest także kierowane do osób, które chcą uzupełnić swoją wiedzę o pojęcia związane z hurtowniami danych (DWH) oraz ich realizacją z wykorzystaniem oprogramowania Pentaho Business Intelligence Suite
Wymagania
- Podstawowa znajomość baz danych, podstawowa umiejętność programowania w języku Java
Zalety
- Program obejmuje zarówno ogólne wprowadzenie w tematykę DM i DWH, jak i całościowe przedstawienie stosu produktowego Pentaho Data Mining
- Szkolenie jest unikalne, gdyż tematyka poruszana w jego trakcie nie jest wyczerpująco ujęta w dostępnej literaturze, a wiedza na ten temat jest mocno rozproszona
- Program jest ciągle uaktualniany ze względu na szybki rozwój rozwiązań, kt órych dotyczy szkolenie
- Praktyka przed teorią - wszystkie szkolenia technologiczne prowadzone są w formie warsztatowej. Konieczna teoria jest wyjaśniana na przykładzie praktycznych zadań
- Konkretne umiejętności - w ramach każdego szkolenia rozwijamy praktyczne umiejętności związane z daną technologią i tematyką
- Nauka z praktykami - wszyscy trenerzy na co dzień pracują w projektach, gwarantuje to dostęp do eksperckiej wiedzy i praktycznego know-how
Cele szkolenia
- Zdobycie przekrojowej wiedzy dotyczącej projektowania, implementowania, monitorowania, uruchamiania, strojenia procesów DM
- Odświeżenie wiedzy na temat podstawowych pojęć statystycznych
- Poznanie najpopularniejszych algorytmów DM w szczegółach
- Poznanie założenia hurtowni danych
- Wybór właściwego zestawu narzędzi i technik dla własnych projektów
- Skupienie na stosie produktowym wybudowanym wokół Pentaho Business Intelligence a w szczególności na Pentaho Data Mining (WEKA)
Program
Wstęp
- Wprowadzenie do hurtowni danych
- Platforma Pentaho BI Suite
Eksploracja danych
- Sztuczna inteligencja, uczenie maszynowe, eksploracja danych etc
- Podstawy algorytmów eksploracji danych
- Przegląd narzędzi eksploracji danych dostępnych na rynku
Pentaho Data Mining (WEKA)
- Architektura
- Weka GUI Chooser
- Praca z Explorer’em
Preprocessing i praca z danymi
- Format danych ARFF
- Przygotowanie danych do analizy
- Odpowiedni dobór atrybutów np.: korelacja atrybutów a wyniki eksploracji danych etc
- Filtrowanie i rodzaje filtrów w WEKA np.: filtrowanie, dyskretyzacja, normalizacja etc
- Wizualizacja
- Przetwarzanie dużych zbiorów danych, ograniczenia JVM 32bit
- Przetwarzanie strumieni oraz uczenie przyrostowe
Klasyfikacja
- Definicja problemu klasyfikacji
- Odpowiedni zbiór danych uczących i testujących a wyniki klasyfikacji
- Rodzaje algorytmów klasyfikacji dostępnych w WEKA
- Najpopularniejsze algorytmy klasyfikacji w szczegółach
- Walidacja krzyżowa, nadmierne dopasowanie
- Interpretacja wyników klasyfikacji
Grupowanie
- Definicja problemu grupowania
- Odpowiedni zbiór danych uczących i testujących a wyniki grupowania
- Rodzaje algorytmów grupowania dostępnych w WEKA
- Najpopularniejsze algorytmy grupowania w szczegółach
- Interpretacja wyników grupowania
Odkrywanie reguł asocjacyjnych
- Definicja problemu odkrywania wzorców i reguł asocjacyjnych
- Odpowiedni zbiór danych uczących i testujących a odkryte reguły
- Rodzaje algorytmów odkrywania reguł asocjacyjnych dostępnych w WEKA
- Najpopularniejsze algorytmy odkrywania reguł asocjacyjnych w szczegółach
- Interpretacja odkrytych reguł
Ograniczanie i transformacja przestrzeni atrybutów
- Definicja problemu selekcji, ograniczenia, transformacji atrybutów
- Odpowiedni zbiór danych uczących i testujących a wybrane atrybuty
- Rodzaje algorytmów ograniczania i transformacji przestrzeni atrybutów w WEKA
- Najpopularniejsze algorytmy ograniczania i transformacji przestrzeni atrybutów w szczegółach
- Interpretacja wyników
Pozostałe algorytmy i techniki eksploracji danych dostępne w WEKA
Rozbudowa możliwości WEKA
- Pentaho Data Mining Plug-Ins
- Własne algorytmy DM w WEKA
Wykorzystanie możliwości w połączeniu z innymi produktami Pentaho
- Knowledge Flow Plugin oraz Pentaho Data Integration