Analiza numeryczna w Python

LICZBA DNI: 3 (24h)

KOD KURSU: PYTHON/NUM

POZIOM SZKOLENIA:

# python

# data science

# machine learning

# numerical analysis

Szkolenie na zamówienie

Szkolenie dostosowane do potrzeb Twojego zespołu. Dostępne WYŁĄCZNIE na zamówienie.

  • Dostosowany program
  • Indywidualna wycena
  • Dowolny termin

Interesuje Cię ta tematyka i szukasz szkolenia tylko dla siebie?

O szkoleniu

DLA KOGO?

Analityków danych

Programistów

Data scientist

Naukowców i inżynierów

WYMAGANIA

Umiejętność programowania w dowolnym języku

Opcjonalny dzień wprowadzenia do Python

ZALETY

Trener programuje od 2004 roku, a w Python od 2009

Materiały ze szkolenia mają ponad 1700 stron

Materiały są dostępne online jako strona internetowa i aktualizowane niemalże codziennie

Ponad 350 zadań do samodzielnego wykonania

Wszystkie zadania mają testy i rozwiązany kod źródłowy

Dostęp do materiałów również po szkoleniu

Kameralne grupy - szkolenia technologiczne prowadzimy w grupach liczących do 8 osób. Pozwala to na indywidualne podejście oraz aktywizację każdego uczestnika

Praktyka przed teorią - wszystkie szkolenia technologiczne prowadzone są w formie warsztatowej. Konieczna teoria jest wyjaśniana na przykładzie praktycznych zadań

Konkretne umiejętności - w ramach każdego szkolenia rozwijamy praktyczne umiejętności związane z daną technologią i tematyką

Nauka z praktykami - wszyscy trenerzy na co dzień pracują w projektach, gwarantuje to dostęp do eksperckiej wiedzy i praktycznego know-how

Cele szkolenia

Nauka wykorzystania biblioteki NumPy i Pandas oraz Matplotlib w analizie numerycznej danych

Przegląd bibliotek i środowiska SciPy

Program

  • SciPy: wprowadzenie do ekosystemu narzędzi
  • Jupyter: instalacja, uruchamianie, korzystanie, LaTeX, zaawansowane opcje
  • Markdown: krótkie wprowadzenie do składni i możliwości
  • Micro-benchmarking
  • Złożoność obliczeniowa i pamięciowa
  • Pamięć: Architektura RAM, kopiowanie i referencje
  • Techniki pracy z danymi większymi niż ilość RAMu
  • Generatory i Iteratory
  • Triki zwiększające wydajność
  • Skalowalność: X-Array, Dask
  • Typy wbudowane i stałe: array, poly1d, nan, inf
  • Import i export danych, serializacja, łączenie, obsługiwane formaty, pliki binarne i tekstowe
  • Definiowanie tablic: tworzenie, generowanie, opis typu
  • Pseudolosowość: Problematyka, ziarno, sampling, tasowanie
  • Atrybuty tablic: typy danych, kształt, wielkość, rozmiar danych, osie
  • Wybieranie i iteracja: indeksacja, wycinanie, fancy indexing
  • Operacje na danych: operacje zwektoryzowane, funkcje uniwersalne, zmiana wymiarów, spłaszczanie
  • Manipulacja danymi: zaokrąglanie, przycinanie, wstawianie, wypełnianie, transpozycja, sortowanie
  • Arytmetyka: operacje arytmetyczne i macierzowe, wyznaczniki
  • Statystyka: ekstrema, wariancja, odchylenie standardowe, średnie, mody, kowariancje, korelacje
  • Logika: operatory, wybieranie, maski, where
  • Trygonometria: funkcje, konwersje, stałe
  • Wielomiany: współczynniki, miejsca zerowe, pierwiastki, dopasowanie wielomianów, arytmetyka, pochodne, całki
  • Konfiguracja biblioteki oraz wyświetlania
  • Import i export danych: obsługiwane formaty, serializacja, łączenie, wyciąganie danych ze stron www
  • Typy danych: Series, DataFrame, SparseArray, Interval, Categorical
  • Indeksy: numeryczne, alfabetyczne, szeregi czasowe
  • Daty i szeregi czasowe: frequency, Timestamp, strefy czasowe, Timedelta, DateOffset, Date Ranges
  • Series: tworzenie, atrybuty, indeksy, slice, wypełnianie, podmiana, usuwanie, arytmetyka, sampling, tasowanie
  • DataFrame podstawy: tworzenie, indeksy, kolumny, slice, wybieranie wartości, locate, at, sampling, tasowanie
  • DataFrame zaawansowane: statystyki, grupowanie, agregacje, join, wykresy
  • Architektura i plany rozwoju Pandas
  • Rodzaje wykresów i podstawianie danych
  • Stylowanie wykresów
  • Wykresy i podwykresy
  • Export do różnych formatów
  • Alternatywy do Matplotlib (Bokeh, Seaborn, Plot.ly)
  • Integracja Matplotlib z Pandas
  • Złożoność obliczeniowa, notacja wielkiego O
  • Techniki pracy z danymi większymi niż ilość RAMu
  • Triki zwiększające wydajność
  • Cztery case studies: COVID-19, dane sportowe, dane finansowe i sensory IoT
  • Pobieranie danych z różnych źródeł
  • Oczyszczanie informacji
  • Selekcja istotnych informacji
  • Wykorzystanie metod NumPy, Pandas i Matplotlib
  • Przygotowanie do analizy
  • Wizualizacja danych
  • (*) Liczba case studies zależna jest od pozostałego czasu

Autor szkolenia:

Matt Harasymczuk

Mateusz Matt Harasymczuk jest głównym inżynierem technologii kosmicznych i oprogramowania w Astro Tech and Bioastronautics Research gdzie tworzy HabitatOS - system operacyjny dla przyszłych baz na Księżycu i Marsie. Wcześniej pracował w Europejskiej Agencji Kosmicznej, w Allegro oraz w Centralnym Ośrodku Informatyki jako główny specjalista ds. architektury procesów. Studiował lotnictwo i kosmonautykę w Lotniczej Akademii Wojskowej oraz informatykę na Politechnice Poznańskiej. Otrzymał Medal Kopernika za stworzenie podstaw dla lotów kosmicznych w Polsce i budowę pierwszego w Europie habitatu. Prywatnie PADI DiveMaster, pilot, zwycięzca Global Space Balloon Challenge w 2019 i ojciec. Autor sześciu książek dotyczących inżynierii oprogramowania oraz astronautyki. W jego 500+ szkoleniach łącznie brało udział ponad 6 tysięcy osób.

POLITYKA COOKIES:

Korzystamy z plików cookies, by móc jak najlepiej dostosować stronę do Twoich potrzeb oraz wyświetlać Ci przydatne i adekwatnych dla Ciebie reklamy w serwisie i poza nim. Możesz kontrolować ustawienia ciasteczek w swoich ustawieniach swojej przeglądarki. Odwiedzając tę stronę, wyrażasz zgodę na wykorzystywanie przez nas plików cookies.