Szkolenie: Python Pandas - analiza i wizualizacja danych
Szkolenie Python Pandas - analiza i wizualizacja danych to praktyczny kurs, który uczy efektywnej analizy, przetwarzania i wizualizacji danych z wykorzystaniem bibliotek Pandas i Matplotlib, przygotowując do pracy z danymi w środowisku Python oraz wdrażania nowoczesnych rozwiązań data science
- Trenerzy praktycy
- Kameralne grupy
Czas trwania szkolenia:3 dni (24h)
Kod kursu:PYTHON/PANDAS
Python Pandas - analiza i wizualizacja danych
Cele szkolenia
Szkolenie przygotowuje do samodzielnej analizy i przetwarzania danych z wykorzystaniem bibliotek Pandas i Matplotlib w języku Python
Szkolenie uczy efektywnego importowania, oczyszczania, transformowania i wizualizowania danych pochodzących z różnych źródeł
Szkolenie rozwija umiejętność stosowania narzędzi ekosystemu SciPy do rozwiązywania praktycznych problemów analitycznych
Szkolenie pokazuje, jak projektować i realizować procesy analizy danych, od pozyskania po prezentację wyników
Dla kogo?
Analityków danych i specjalistów ds. raportowania z podstawową znajomością Pythona, chcących rozwijać umiejętności analizy danych
Programistów i inżynierów oprogramowania realizujących zadania związane z przetwarzaniem i wizualizacją danych
Naukowców i pracowników badawczych wykorzystujących narzędzia data science w codziennej pracy
Osób rozpoczynających pracę w obszarze data science, które chcą poznać praktyczne zastosowania narzędzi Python
Efekty kształcenia
Uczestnik analizuje i przetwarza dane z użyciem bibliotek Pandas i Matplotlib
Uczestnik importuje i eksportuje dane z różnych formatów plików i baz danych
Uczestnik wizualizuje dane, tworząc czytelne wykresy i raporty
Uczestnik oczyszcza, transformuje i normalizuje zbiory danych
Uczestnik stosuje techniki grupowania, agregacji i analizy statystycznej
Uczestnik porównuje narzędzia i wybiera optymalne rozwiązania do analizy danych
Wymagania
Znajomość podstawowej składni Pythona
Mile widziana znajomość dowolnego języka programowania
W cenie otrzymasz:
Materiały szkoleniowe
Certyfikat ukończenia szkolenia
W przypadku szkolenia w trybie stacjonarnym zapewnimy Ci również lunch oraz sprzęt niezbędny do nauki
Program szkolenia
Wstęp
Pandas i jego miejsce w ekosystemie SciPy
Zmiany w Pandas 3.0
Architektura Pandas
Opcje konfiguracyjne
Podstawowe typy w Pandas: Series, DataFrame, Interval, Categorical, Index
Indeksy: numeryczne, znakowe, czasowe (timeseries)
Wczytywanie i eksport danych
CSV, JSON, XML, HTML, SQL
Feather, Parquet, Pickle
Excel, Word, PDF
Konfiguracja formatów, parsowanie dat, zmiana user-agent
Praca z Series
Tworzenie, konwersja, typy danych, atrybuty
Indeksowanie, selekcja, próbkowanie, wybieranie, wycinanie
Praca z wartościami pustymi
Podmiana danych, zmiany stuktury, sortowanie
Arytmetyka, operacje zwektoryzowane, broadcasting
Statystyka, grupowania, normalizacja danych
Mapowanie: map vs apply
Praca z DataFrame
Tworzenie, konwersja, atrybuty, typy danych
Praca z kolumnami, indeksem, indeksem wielowymiarowym (multi-index)
Selekcja, próbkowanie, wybieranie (at, iat), wycinanie (loc, iloc), zapytania (query)
Kategoryzacja danych, oczyszczanie i normalizacja, wyrażenia regularne
Praca z datami: formatowanie dat i czasu, strefy czasowe, konwersja, przesunięcia czasu
Praca z szeregami czasowymi: frequency, Timestamp, date range, czas biznesowy
Zmiany struktury, podmiana danych, wypełnianie wartości pustych, sortowanie
Statystyka, grupowanie danych, operacje rolling i resample, agregacje
Mapowanie: map vs apply
Łączenie danych: merge vs join vs concat
Wizualizacja danych
Zasady współpracy Pandas i Matplotlib
Rodzaje wykresów i podstawianie danych
Wykresy: liniowy, słupkowy, pudełkowy, gęstości, inne
Stylowanie wykresów, kolorystyka
Zmiana tytułu wykresu oraz nazw osi, zmiany etykiet osi (obrót, formatowanie, częstość)
Umiejscowienie legendy, siatka, strzałki, labelki, komentarze
Wykresy, podwykresy, wiele wykresów na jednym diagramie
Export do różnych formatów
Case studies
Case studies
Pobieranie danych z różnych źródeł
Oczyszczanie informacji
Selekcja istotnych informacji
Wykorzystanie metod NumPy, Pandas i Matplotlib
Przygotowanie do analizy
Wizualizacja danych
Podsumowanie
Pandas vs Polars vs DuckDB vs Dask
Alternatywy do Matplotlib (Bokeh, Seaborn)
Techniki pracy z danymi większymi niż ilość RAMu
Triki zwiększające wydajność
Plan rozwuju na przyszłość
Wybrane opinie
Przeczytaj pozytywne opinie pochodzące z ankiet satysfakcji z naszych szkoleń wypełnianych wyłącznie przez ich uczestników po realizacji usługi


