Uczenie maszynowe z wykorzystaniem Python
LICZBA DNI: 3 (24h)
KOD KURSU: ML/MID/PY
Weź udział w szkoleniu
Termin
Lokalizacja
Cena / os
1
marca
Warszawa,
Zdalne,
Termin
1
marca
Lokalizacja
Warszawa,
Zdalne,
Cena / os
Powiadom
o kolejnych terminach
O szkoleniu
DLA KOGO?
Początkujący data scientists, analitycy danych, statystycy, programiści oraz specjaliści ds. baz danych zainteresowani poszerzeniem własnych kompetencji w zakresie uczenia maszynowego
Każdy, kto zna podstawy uczenia maszynowego na poziomie programu szkolenia Wprowadzenie do uczenia maszynowego z wykorzystaniem Python
WYMAGANIA
Od uczestników szkolenia wymagana jest podstawowa znajomość języka Python oraz znajomość podstaw uczenia maszynowego na poziomie szkolenia Wprowadzenie do uczenia maszynowego z wykorzystaniem Python
ZALETY
Warsztatowy charakter zajęć
Dokładne omówienie algorytmów i ich własności
Duża dawka praktycznej wiedzy i umiejętności, przydatnych w realnych projektach
Cele szkolenia
Pogłębienie wiedzy z zakresu uczenia maszynowego
Zapoznanie z użytecznymi funkcjonalnościami biblioteki scikit-learn związanymi z omawianymi algorytmami
Rozwijanie praktycznych umiejętności pracy z danymi dobrze odzwierciedlającymi problemy spotykane w rzeczywistości
Program
Model regresji liniowej - aspekty ponadpodstawowe
- Normalizacja rozkładu zmiennych objaśniających
- Transformacje zmiennej celu
- Problem współliniowości atrybutów
Algorytmy klasyfikacji
- Naiwny klasyfikator Bayesa
- Maszyna wektorów nośnych (SVM)
- Wersja liniowa oraz kernel trick
- Schematy zastosowania w klasyfikacji wieloklasowej
- Metoda najbliższych sąsiadów (KNN)
- Sposoby mierzenia podobieństwa między obserwacjami
Metody łączenia algorytmów klasyfikacji i regresji - ensembling
- Komitety proste
- Lasy losowe
- Bagging
- Boosting
Specjalistyczna ewaluacja klasyfikatorów
- Precyzja, czułość, specyficznosć
- Miara F1
- Krzywa ROC i wskaźnik AUC
- Dobór miar adekwatnych do problemów biznesowych
Ocena ważności i algorytmy selekcji cech
- Ocena ważności cech w algorytmach liniowych i drzewiastych
- Selekcje współbieżna z uczeniem
- Selekcja na podstawie ważności cech
- Selekcja krokowa
- Filtrowanie zmiennych
Analiza Składowych Głównych (PCA)
- Zmniejszanie wymiarowości danych
- Zastosowanie w procesie predykcyjnym (regresji lub klasyfikacji)
- Zastosowanie w analizie zależności w danych
- Zastosowanie w wizualizacji
Sieci neuronowe
- Proces uczenia sieci neuronowych
- Wykorzystanie sieci neuronowych jako algorytmy predykcyjne
Przygotowywanie danych do modelowania - feature engineering
- Obserwacje odstające (outliers)
- Obsługa braków danych (missing values)
- Obsługa zmiennych kategorycznych
- Dyskretyzacja zmiennych ciągłych
Podsumowanie
- Porównanie metod
- Przykład budowy modelu od A do Z
