Szkolenie: Python - statystyka, modelowanie i wizualizacja
Szkolenie praktyczne z statystyki, modelowania i wizualizacji danych w Pythonie, uczące probabilistyki, testowania hipotez, budowy i diagnostyki regresji (liniowej i logistycznej) oraz tworzenia analiz i wizualizacji z użyciem numpy, pandas, scipy, statsmodels, matplotlib i seaborn
- Trenerzy praktycy
- Kameralne grupy
Czas trwania szkolenia:3 dni (24h)
Kod kursu:PYTHON/STATYSTYKA
Python - statystyka, modelowanie i wizualizacja
Cele szkolenia
Szkolenie przygotowuje do samodzielnego stosowania metod statystycznych w analizie danych i formułowania wniosków na podstawie inferencji statystycznej
Szkolenie uczy budowy, interpretacji i diagnostyki modeli regresji liniowej i logistycznej oraz oceny ich jakości za pomocą odpowiednich metryk
Szkolenie pokazuje, jak przeprowadzać poprawne testy hipotez, interpretować p‑value i przedziały ufności oraz dobierać testy adekwatne do danych
Szkolenie rozwija umiejętność weryfikacji założeń modelu (współliniowość, homoskedastyczność, normalność reszt, punkty wpływowe) i stosowania korekcji
Szkolenie omawia praktyczne wykorzystanie bibliotek numpy, pandas, scipy, statsmodels, matplotlib i seaborn w zadaniach analitycznych i ML
Dla kogo?
Analitycy danych i specjaliści BI z podstawową znajomością Pythona i narzędzi numpy/pandas, chcący pogłębić umiejętności statystyczne
Data Scientist i ML Engineer poszukujący praktycznych technik inferencji statystycznej, regresji i diagnostyki modeli
Inżynierowie danych oraz programiści Python pracujący z danymi, którzy potrzebują solidnych podstaw statystycznych i wizualizacji
Osoby z wykształceniem technicznym lub ekonomicznym znające podstawy algebry liniowej i chcące stosować statystykę w projektach
Studenci i absolwenci kierunków analitycznych szukający praktycznych umiejętności w analizie, modelowaniu i komunikacji wyników
Efekty kształcenia
Uczestnik analizuje dane i dobiera odpowiednie metody statystyczne
Uczestnik buduje oraz interpretuje modele regresji liniowej i logistycznej
Uczestnik przeprowadza testy hipotez i interpretuje p‑value oraz przedziały ufności
Uczestnik diagnozuje naruszenia założeń modeli i stosuje metody korekcyjne
Uczestnik tworzy czytelne wizualizacje wyników z matplotlib i seaborn
Uczestnik ocenia jakość modeli przy użyciu metryk i technik walidacji
Wymagania
Podstawowa znajomość języka Python
Podstawowa Umiejętność pracy z danymi w bibliotekach numpy i pandas
Znajomość podstaw algebry liniowej oraz elementarnych pojęć matematycznych
Podstawowa orientacja w analizie danych
W cenie otrzymasz:
Materiały szkoleniowe
Certyfikat ukończenia szkolenia
W przypadku szkolenia w trybie stacjonarnym zapewnimy Ci również lunch oraz sprzęt niezbędny do nauki
Program szkolenia
Prawdopodobieństwo i twierdzenie Bayesa
Zdarzenia losowe, prawdopodobieństwo warunkowe, niezależność, naiwny klasyfikator bayesowski
Rozkłady zmiennych losowych
Rozkłady dyskretne i ciągłe, rozkład normalny, wykładniczy, dwumianowy, Poissona, t-Studenta, chi-kwadrat, dystrybuanta
Charakterystyki rozkładów i zależności między zmiennymi
Wartość oczekiwana, wariancja, skośność, kwantyle, korelacja Pearsona i Spearmana, wpływ obserwacji odstających
Testowanie hipotez statystycznych
Istotność statystyczna, p-value, testy normalności, test chi-kwadrat, test t-Studenta, test dla proporcji, ANOVA
Regresja liniowa
Metoda najmniejszych kwadratów, interpretacja parametrów, diagnostyka modelu, weryfikacja założeń, metryki jakości
Regresja logistyczna
Funkcja logistyczna, interpretacja współczynników, ocena klasyfikacji, próg decyzyjny, modele wieloklasowe
Wybrane opinie
Przeczytaj pozytywne opinie pochodzące z ankiet satysfakcji z naszych szkoleń wypełnianych wyłącznie przez ich uczestników po realizacji usługi
