Analiza i wizualizacja danych w Pythonie z wykorzystaniem biblioteki Pandas

2950 PLN+23% VAT (3628 PLN brutto / 1 os.)

Czas trwania szkolenia:3 dni (24h)

Kod kursu:PYTHON/PANDAS

Poziom zaawansowania:
machine-learningpythondata-sciencenumerical-analysis

Dostępne terminy

  • Termin
  • Trener
  • Cena
  • Zapis
  • Lokalizacja

Termin:

26 luty
Trwają zapisy na szkolenie

Trener:

Matt Harasymczuk

Cena:

2950 PLN netto+23% VAT

Lokalizacja:

Zdalne
Zdalne

Termin:

24 czerwiec
Trwają zapisy na szkolenie

Trener:

Matt Harasymczuk

Cena:

2950 PLN netto+23% VAT

Lokalizacja:

Zdalne
Zdalne

Termin:

26 sierpień
Trwają zapisy na szkolenie

Trener:

Matt Harasymczuk

Cena:

2950 PLN netto+23% VAT

Lokalizacja:

Zdalne
Zdalne

Termin:

7 październik
Trwają zapisy na szkolenie

Trener:

Matt Harasymczuk

Cena:

2950 PLN netto+23% VAT

Lokalizacja:

Zdalne
Zdalne

Interesuje Cię szkolenie stacjonarne lub nie odpowiada Ci żaden z dostępnych terminów?

Ikona pytaniaZapytaj o szkolenie

O szkoleniu Analiza i wizualizacja danych w Pythonie z wykorzystaniem biblioteki Pandas

W cenie otrzymasz:

  • Materiały szkoleniowe
  • Certyfikat ukończenia szkolenia
  • W przypadku szkolenia w trybie stacjonarnym zapewnimy Ci również lunch oraz sprzęt niezbędny do nauki

Dla kogo?

  • Analityków danych
  • Programistów
  • Data scientist
  • Naukowców i inżynierów

Wymagania

  • Znajomość podstawowej składni Pythona
  • Mile widziana znajomość dowolnego języka programowania

Zalety

  • Warsztat będzie prowadzony w oparciu o najnowszą wersję biblioteki Pandas oraz Matplotlib
  • Podczas szkolenia uczestnicy poznają od podstaw funkcjonalności bibliotek Pandas i Matplotlib
  • Warsztaty obejmują pracę na case study
  • Szkolenie Analiza i wizualizacja danych w Pythonie z wykorzystaniem biblioteki Pandas wzbogacone jest o komplet materiałów, obejmujących zarówno teorię, jaki i zadania praktyczne

Cele szkolenia

  • Nauka wykorzystania bibliotek Pandas oraz Matplotlib w analizie danych
  • Przegląd bibliotek i środowiska SciPy

Program

Biblioteki używane w analizie numerycznej i Data Science

  • SciPy: wprowadzenie do ekosystemu narzędzi
  • Jupyter: instalacja, uruchamianie, korzystanie, LaTeX, zaawansowane opcje
  • Markdown: krótkie wprowadzenie do składni i możliwości

Pandas i obróbka danych

  • Konfiguracja biblioteki oraz wyświetlania
  • Import i export danych: obsługiwane formaty, serializacja, łączenie, wyciąganie danych ze stron www
  • Typy danych: Series, DataFrame, SparseArray, Interval, Categorical
  • Indeksy: numeryczne, alfabetyczne, szeregi czasowe
  • Daty i szeregi czasowe: frequency, Timestamp, strefy czasowe, Timedelta, DateOffset, Date Ranges
  • Series: tworzenie, atrybuty, indeksy, slice, wypełnianie, podmiana, usuwanie, arytmetyka, sampling, tasowanie
  • DataFrame podstawy: tworzenie, indeksy, kolumny, slice, wybieranie wartości, locate, at, sampling, tasowanie
  • DataFrame zaawansowane: statystyki, grupowanie, agregacje, join, wykresy
  • Architektura i plany rozwoju Pandas
  • Techniki pracy z danymi większymi niż ilość RAMu
  • Triki zwiększające wydajność

Matplotlib i wizualizacja

  • Rodzaje wykresów i podstawianie danych
  • Stylowanie wykresów
  • Wykresy i podwykresy
  • Export do różnych formatów
  • Alternatywy do Matplotlib (Bokeh, Seaborn, Plot.ly)
  • Integracja Matplotlib z Pandas

Case studies

  • Case studies
  • Pobieranie danych z różnych źródeł
  • Oczyszczanie informacji
  • Selekcja istotnych informacji
  • Wykorzystanie metod NumPy, Pandas i Matplotlib
  • Przygotowanie do analizy
  • Wizualizacja danych

To szkolenie jest częścią ścieżki

Podobne szkolenia