Analiza numeryczna w Python
Czas trwania szkolenia:3 dni (24h)
Kod kursu:PYTHON/NUM
Poziom zaawansowania:
Szkolenie na zamówienie
Szkolenie dostosowane do potrzeb Twojego zespołu. Dostępne wyłącznie na zamówienie.
- Dostosowany program
- Indywidualna wycena
- Dowolny termin
O szkoleniu Analiza numeryczna w Python
W cenie otrzymasz:
- Materiały szkoleniowe
- Certyfikat ukończenia szkolenia
- W przypadku szkolenia w trybie stacjonarnym zapewnimy Ci również lunch oraz sprzęt niezbędny do nauki
Wymagania
- Znajomość dowolnego języka programowania może znacząco ułatwić przyswajanie materiału
Zalety
- Trener programuje od 2004 roku, a w Python od 2009
- Materiały ze szkolenia mają ponad 1700 stron
- Materiały są dostępne online jako strona internetowa i aktualizowane niemalże codziennie
- Ponad 350 zadań do samodzielnego wykonania
- Wszystkie zadania mają testy i rozwiązany kod źródłowy
- Dostęp do materiałów również po szkoleniu
- Praktyka przed teorią - wszystkie szkolenia technologiczne prowadzone są w formie warsztatowej. Konieczna teoria jest wyjaśniana na przykładzie praktycznych zadań
- Konkretne umiejętności - w ramach każdego szkolenia rozwijamy praktyczne umiejętności związane z daną technologią i tematyką
- Nauka z praktykami - wszyscy trenerzy na co dzień pracują w projektach, gwarantuje to dostęp do eksperckiej wiedzy i praktycznego know-how
Cele szkolenia
- Nauka wykorzystania biblioteki NumPy i Pandas oraz Matplotlib w analizie numerycznej danych
- Przegląd bibliotek i środowiska SciPy
Program
Biblioteki używane w analizie numerycznej i Data Science
- SciPy: wprowadzenie do ekosystemu narzędzi
- Jupyter: instalacja, uruchamianie, korzystanie, LaTeX, zaawansowane opcje
- Markdown: krótkie wprowadzenie do składni i możliwości
Zagadnienia wydajnościowe
- Micro-benchmarking
- Złożoność obliczeniowa i pamięciowa
- Pamięć: Architektura RAM, kopiowanie i referencje
- Techniki pracy z danymi większymi niż ilość RAMu
- Generatory i Iteratory
- Triki zwiększające wydajność
- Skalowalność: X-Array, Dask
NumPy i analiza numeryczna
- Typy wbudowane i stałe: array, poly1d, nan, inf
- Import i export danych, serializacja, łączenie, obsługiwane formaty, pliki binarne i tekstowe
- Definiowanie tablic: tworzenie, generowanie, opis typu
- Pseudolosowość: Problematyka, ziarno, sampling, tasowanie
- Atrybuty tablic: typy danych, kształt, wielkość, rozmiar danych, osie
- Wybieranie i iteracja: indeksacja, wycinanie, fancy indexing
- Operacje na danych: operacje zwektoryzowane, funkcje uniwersalne, zmiana wymiarów, spłaszczanie
- Manipulacja danymi: zaokrąglanie, przycinanie, wstawianie, wypełnianie, transpozycja, sortowanie
- Arytmetyka: operacje arytmetyczne i macierzowe, wyznaczniki
- Statystyka: ekstrema, wariancja, odchylenie standardowe, średnie, mody, kowariancje, korelacje
- Logika: operatory, wybieranie, maski, where
- Trygonometria: funkcje, konwersje, stałe
- Wielomiany: współczynniki, miejsca zerowe, pierwiastki, dopasowanie wielomianów, arytmetyka, pochodne, całki
Pandas i obróbka danych
- Konfiguracja biblioteki oraz wyświetlania
- Import i export danych: obsługiwane formaty, serializacja, łączenie, wyciąganie danych ze stron www
- Typy danych: Series, DataFrame, SparseArray, Interval, Categorical
- Indeksy: numeryczne, alfabetyczne, szeregi czasowe
- Daty i szeregi czasowe: frequency, Timestamp, strefy czasowe, Timedelta, DateOffset, Date Ranges
- Series: tworzenie, atrybuty, indeksy, slice, wypełnianie, podmiana, usuwanie, arytmetyka, sampling, tasowanie
- DataFrame podstawy: tworzenie, indeksy, kolumny, slice, wybieranie wartości, locate, at, sampling, tasowanie
- DataFrame zaawansowane: statystyki, grupowanie, agregacje, join, wykresy
- Architektura i plany rozwoju Pandas
Matplotlib i wizualizacja
- Rodzaje wykresów i podstawianie danych
- Stylowanie wykresów
- Wykresy i podwykresy
- Export do różnych formatów
- Alternatywy do Matplotlib (Bokeh, Seaborn, Plot.ly)
- Integracja Matplotlib z Pandas
- Złożoność obliczeniowa, notacja wielkiego O
- Techniki pracy z danymi większymi niż ilość RAMu
- Triki zwiększające wydajność
Case studies
- Cztery case studies: COVID-19, dane sportowe, dane finansowe i sensory IoT
- Pobieranie danych z różnych źródeł
- Oczyszczanie informacji
- Selekcja istotnych informacji
- Wykorzystanie metod NumPy, Pandas i Matplotlib
- Przygotowanie do analizy
- Wizualizacja danych
- (*) Liczba case studies zależna jest od pozostałego czasu