Analiza i wizualizacja danych w Pythonie z wykorzystaniem biblioteki Pandas
Czas trwania szkolenia:3 dni (24h)
Kod kursu:PYTHON/PANDAS
Poziom zaawansowania:
O szkoleniu Analiza i wizualizacja danych w Pythonie z wykorzystaniem biblioteki Pandas
W cenie otrzymasz:
- Materiały szkoleniowe
- Certyfikat ukończenia szkolenia
- W przypadku szkolenia w trybie stacjonarnym zapewnimy Ci również lunch oraz sprzęt niezbędny do nauki
Dla kogo?
- Analityków danych
- Programistów
- Data scientist
- Naukowców i inżynierów
Wymagania
- Znajomość podstawowej składni Pythona
- Mile widziana znajomość dowolnego języka programowania
Zalety
- Warsztat będzie prowadzony w oparciu o najnowszą wersję biblioteki Pandas oraz Matplotlib
- Podczas szkolenia uczestnicy poznają od podstaw funkcjonalności bibliotek Pandas i Matplotlib
- Warsztaty obejmują pracę na case study
- Szkolenie Analiza i wizualizacja danych w Pythonie z wykorzystaniem biblioteki Pandas wzbogacone jest o komplet materiałów, obejmujących zarówno teorię, jaki i zadania praktyczne
Cele szkolenia
- Nauka wykorzystania bibliotek Pandas oraz Matplotlib w analizie danych
- Przegląd bibliotek i środowiska SciPy
Program
Biblioteki używane w analizie numerycznej i Data Science
- SciPy: wprowadzenie do ekosystemu narzędzi
- Jupyter: instalacja, uruchamianie, korzystanie, LaTeX, zaawansowane opcje
- Markdown: krótkie wprowadzenie do składni i możliwości
Pandas i obróbka danych
- Konfiguracja biblioteki oraz wyświetlania
- Import i export danych: obsługiwane formaty, serializacja, łączenie, wyciąganie danych ze stron www
- Typy danych: Series, DataFrame, SparseArray, Interval, Categorical
- Indeksy: numeryczne, alfabetyczne, szeregi czasowe
- Daty i szeregi czasowe: frequency, Timestamp, strefy czasowe, Timedelta, DateOffset, Date Ranges
- Series: tworzenie, atrybuty, indeksy, slice, wypełnianie, podmiana, usuwanie, arytmetyka, sampling, tasowanie
- DataFrame podstawy: tworzenie, indeksy, kolumny, slice, wybieranie wartości, locate, at, sampling, tasowanie
- DataFrame zaawansowane: statystyki, grupowanie, agregacje, join, wykresy
- Architektura i plany rozwoju Pandas
- Techniki pracy z danymi większymi niż ilość RAMu
- Triki zwiększające wydajność
Matplotlib i wizualizacja
- Rodzaje wykresów i podstawianie danych
- Stylowanie wykresów
- Wykresy i podwykresy
- Export do różnych formatów
- Alternatywy do Matplotlib (Bokeh, Seaborn, Plot.ly)
- Integracja Matplotlib z Pandas
Case studies
- Case studies
- Pobieranie danych z różnych źródeł
- Oczyszczanie informacji
- Selekcja istotnych informacji
- Wykorzystanie metod NumPy, Pandas i Matplotlib
- Przygotowanie do analizy
- Wizualizacja danych
- (*) Liczba case studies zależna jest od pozostałego czasu