Analiza i wizualizacja danych w Pythonie z wykorzystaniem biblioteki Pandas
Szkolenie wprowadzi uczestników w analizę i wizualizację danych z wykorzystaniem jednych z najpopularniejszych bibliotek w języku Python, czyli Pandas i Matplotlib.
2750 PLN+23% VAT (3382 PLN brutto / 1 os.)Czas trwania szkolenia:3 dni (24h)
Kod kursu:PYTHON/PANDAS
Analiza i wizualizacja danych w Pythonie z wykorzystaniem biblioteki Pandas
Cele szkolenia
Nauka wykorzystania bibliotek Pandas oraz Matplotlib w analizie danych
Przegląd bibliotek i środowiska SciPy
Dla kogo?
Analityków danych
Programistów
Data scientist
Naukowców i inżynierów
Zalety
Warsztat będzie prowadzony w oparciu o najnowszą wersję biblioteki Pandas oraz Matplotlib
Podczas szkolenia uczestnicy poznają od podstaw funkcjonalności bibliotek Pandas i Matplotlib
Warsztaty obejmują pracę na case study
Szkolenie Analiza i wizualizacja danych w Pythonie z wykorzystaniem biblioteki Pandas wzbogacone jest o komplet materiałów, obejmujących zarówno teorię, jaki i zadania praktyczne
Wymagania
Znajomość podstawowej składni Pythona
Mile widziana znajomość dowolnego języka programowania
W cenie otrzymasz:
Materiały szkoleniowe
Certyfikat ukończenia szkolenia
W przypadku szkolenia w trybie stacjonarnym zapewnimy Ci również lunch oraz sprzęt niezbędny do nauki
Program
Biblioteki używane w analizie numerycznej i Data Science
SciPy: wprowadzenie do ekosystemu narzędzi
Jupyter: instalacja, uruchamianie, korzystanie, LaTeX, zaawansowane opcje
Markdown: krótkie wprowadzenie do składni i możliwości
Pandas i obróbka danych
Konfiguracja biblioteki oraz wyświetlania
Import i export danych: obsługiwane formaty, serializacja, łączenie, wyciąganie danych ze stron www
Typy danych: Series, DataFrame, SparseArray, Interval, Categorical
Indeksy: numeryczne, alfabetyczne, szeregi czasowe
Daty i szeregi czasowe: frequency, Timestamp, strefy czasowe, Timedelta, DateOffset, Date Ranges
Series: tworzenie, atrybuty, indeksy, slice, wypełnianie, podmiana, usuwanie, arytmetyka, sampling, tasowanie
DataFrame podstawy: tworzenie, indeksy, kolumny, slice, wybieranie wartości, locate, at, sampling, tasowanie
DataFrame zaawansowane: statystyki, grupowanie, agregacje, join, wykresy
Architektura i plany rozwoju Pandas
Techniki pracy z danymi większymi niż ilość RAMu
Triki zwiększające wydajność
Matplotlib i wizualizacja
Rodzaje wykresów i podstawianie danych
Stylowanie wykresów
Wykresy i podwykresy
Export do różnych formatów
Alternatywy do Matplotlib (Bokeh, Seaborn, Plot.ly)
Integracja Matplotlib z Pandas
Case studies
Case studies
Pobieranie danych z różnych źródeł
Oczyszczanie informacji
Selekcja istotnych informacji
Wykorzystanie metod NumPy, Pandas i Matplotlib
Przygotowanie do analizy
Wizualizacja danych