Techniczne aspekty eksploracji danych zgromadzonych w hurtowni danych z wykorzystaniem Pentaho Data Mining

Czas trwania szkolenia:4 dni (32h)

Kod kursu:WEKA

Poziom zaawansowania:
pentaho

Szkolenie na zamówienie

  • Dostosowany program
  • Indywidualna wycena
  • Dowolny termin
Zapytanie o szkolenie

O szkoleniu Techniczne aspekty eksploracji danych zgromadzonych w hurtowni danych z wykorzystaniem Pentaho Data Mining

W cenie otrzymasz:

  • Materiały szkoleniowe
  • Certyfikat ukończenia szkolenia
  • W przypadku szkolenia w trybie stacjonarnym zapewnimy Ci również lunch oraz sprzęt niezbędny do nauki

Dla kogo?

  • Szkolenie jest adresowane do programistów, architektów oraz administratorów aplikacji, którzy chcą tworzyć lub utrzymywać procesy eksploracji danych z wykorzystaniem Pentaho Data Mining (WEKA)
  • Szkolenie jest także kierowane do osób, które chcą uzupełnić swoją wiedzę o pojęcia związane z hurtowniami danych (DWH) oraz ich realizacją z wykorzystaniem oprogramowania Pentaho Business Intelligence Suite

Wymagania

  • Podstawowa znajomość baz danych, podstawowa umiejętność programowania w języku Java

Zalety

  • Program obejmuje zarówno ogólne wprowadzenie w tematykę DM i DWH, jak i całościowe przedstawienie stosu produktowego Pentaho Data Mining
  • Szkolenie jest unikalne, gdyż tematyka poruszana w jego trakcie nie jest wyczerpująco ujęta w dostępnej literaturze, a wiedza na ten temat jest mocno rozproszona
  • Program jest ciągle uaktualniany ze względu na szybki rozwój rozwiązań, których dotyczy szkolenie
  • Praktyka przed teorią - wszystkie szkolenia technologiczne prowadzone są w formie warsztatowej. Konieczna teoria jest wyjaśniana na przykładzie praktycznych zadań
  • Konkretne umiejętności - w ramach każdego szkolenia rozwijamy praktyczne umiejętności związane z daną technologią i tematyką
  • Nauka z praktykami - wszyscy trenerzy na co dzień pracują w projektach, gwarantuje to dostęp do eksperckiej wiedzy i praktycznego know-how

Cele szkolenia

  • Zdobycie przekrojowej wiedzy dotyczącej projektowania, implementowania, monitorowania, uruchamiania, strojenia procesów DM
  • Odświeżenie wiedzy na temat podstawowych pojęć statystycznych
  • Poznanie najpopularniejszych algorytmów DM w szczegółach
  • Poznanie założenia hurtowni danych
  • Wybór właściwego zestawu narzędzi i technik dla własnych projektów
  • Skupienie na stosie produktowym wybudowanym wokół Pentaho Business Intelligence a w szczególności na Pentaho Data Mining (WEKA)

Program

Wstęp

  • Wprowadzenie do hurtowni danych
  • Platforma Pentaho BI Suite

Eksploracja danych

  • Sztuczna inteligencja, uczenie maszynowe, eksploracja danych etc
  • Podstawy algorytmów eksploracji danych
  • Przegląd narzędzi eksploracji danych dostępnych na rynku

Pentaho Data Mining (WEKA)

  • Architektura
  • Weka GUI Chooser
  • Praca z Explorer’em

Preprocessing i praca z danymi

  • Format danych ARFF
  • Przygotowanie danych do analizy
  • Odpowiedni dobór atrybutów np.: korelacja atrybutów a wyniki eksploracji danych etc
  • Filtrowanie i rodzaje filtrów w WEKA np.: filtrowanie, dyskretyzacja, normalizacja etc
  • Wizualizacja
  • Przetwarzanie dużych zbiorów danych, ograniczenia JVM 32bit
  • Przetwarzanie strumieni oraz uczenie przyrostowe

Klasyfikacja

  • Definicja problemu klasyfikacji
  • Odpowiedni zbiór danych uczących i testujących a wyniki klasyfikacji
  • Rodzaje algorytmów klasyfikacji dostępnych w WEKA
  • Najpopularniejsze algorytmy klasyfikacji w szczegółach
  • Walidacja krzyżowa, nadmierne dopasowanie
  • Interpretacja wyników klasyfikacji

Grupowanie

  • Definicja problemu grupowania
  • Odpowiedni zbiór danych uczących i testujących a wyniki grupowania
  • Rodzaje algorytmów grupowania dostępnych w WEKA
  • Najpopularniejsze algorytmy grupowania w szczegółach
  • Interpretacja wyników grupowania

Odkrywanie reguł asocjacyjnych

  • Definicja problemu odkrywania wzorców i reguł asocjacyjnych
  • Odpowiedni zbiór danych uczących i testujących a odkryte reguły
  • Rodzaje algorytmów odkrywania reguł asocjacyjnych dostępnych w WEKA
  • Najpopularniejsze algorytmy odkrywania reguł asocjacyjnych w szczegółach
  • Interpretacja odkrytych reguł

Ograniczanie i transformacja przestrzeni atrybutów

  • Definicja problemu selekcji, ograniczenia, transformacji atrybutów
  • Odpowiedni zbiór danych uczących i testujących a wybrane atrybuty
  • Rodzaje algorytmów ograniczania i transformacji przestrzeni atrybutów w WEKA
  • Najpopularniejsze algorytmy ograniczania i transformacji przestrzeni atrybutów w szczegółach
  • Interpretacja wyników

Pozostałe algorytmy i techniki eksploracji danych dostępne w WEKA

Rozbudowa możliwości WEKA

  • Pentaho Data Mining Plug-Ins
  • Własne algorytmy DM w WEKA

Wykorzystanie możliwości w połączeniu z innymi produktami Pentaho

  • Knowledge Flow Plugin oraz Pentaho Data Integration

Podobne szkolenia