Warsztat analityka danych w R

LICZBA DNI: 3 (24h)

KOD KURSU: R/BP

POZIOM SZKOLENIA:

# analysis

Szkolenie na zamówienie

Szkolenie dostosowane do potrzeb Twojego zespołu. Dostępne WYŁĄCZNIE na zamówienie.

  • Dostosowany program
  • Indywidualna wycena
  • Dowolny termin

Interesuje Cię ta tematyka i szukasz szkolenia tylko dla siebie?

O szkoleniu

DLA KOGO?

Szkolenie przeznaczone jest przede wszystkim dla analityków danych, którzy mają już pewne doświadczenie i chcą dowiedzieć się „jak to zrobić w R”

Jednak podejście od podstaw umożliwia także wstępne zapoznanie się ze specyfiką tej dziedziny wiedzy osobom, które dopiero stawiają swoje pierwsze kroki

WYMAGANIA

Szkolenie wymaga podstawowej umiejętności programowania w dowolnym języku lub podstaw programowania w języku R

ZALETY

Cele szkolenia

Zapoznanie z językiem R, a także szeroką gamą pakietów, które towarzyszą temu środowisku i pozwalają w wygodny i szybki sposób dokonać analizy danych

Szkolenie pozwoli na łączenie wielu narzędzi, co z kolei umożliwia wykonywanie bardziej skomplikowanych analiz z użyciem większego wachlarza technik

Program

  • Charakterystyka języka R
  • Porównanie z innymi językami
  • Dlaczego R?
  • Instalacja R
  • Instalacja RStudio
  • Kontrola wersji z Git
    • Instalacja
    • Podstawowe operacje
  • Podstawowe okno pracy
  • Historia komend
  • Konsola R
  • Kod źródłowy
  • Korzystanie z plików pomocy
  • Obliczenia zwektoryzowane
  • Funkcje z rodziny apply
  • Ramki danych
  • Typ czynnikowy
  • Wczytywanie i czyszczenie danych
  • Przekształcanie danych przy użyciu bazowego R
    • Wybór poszczególnych kolumn
    • Wybór wierszy spełniających zadany warunek
    • Grupowanie danych
    • Liczenie podstawowych statystyk
    • Sortowanie
  • Przekształcanie danych przy użyciu pakietu dplyr
    • Wybór poszczególnych kolumn
    • Wybór wierszy spełniających zadany warunek
    • Grupowanie danych
    • Liczenie podstawowych statystyk
    • Sortowanie
  • Grafika niskopoziomowa
    • Barwy, punkty, odcinki, wielokąty
    • Zapisywanie wykresów w formatach grafiki rastrowej (np. JPG) i wektorowej (np. PDF)
  • Grafika wysokopoziomowa
    • Wykres słupkowy, kołowy
    • Wykres skrzynkowy, histogram
    • Wykres rozproszenia
  • Pakiet ggplot2
  • Gęstość, dystrybuanta, odwrotna dystrybuanta, losowanie z podanego rozkładu - przydatne funkcje w R
  • Podstawowe testy statystyczne
  • Regresja liniowa
  • Regresja logistyczna
  • Analiza skupień
  • Drzewa decyzyjne

Autor szkolenia:

Maciej Bartoszuk

Ukończył z wyróżnieniem informatykę na wydziale Matematyki i Nauk Informacyjnych Politechniki Warszawskiej, gdzie aktualnie pracuje w zakładzie Sztucznej Inteligencji i Metod Obliczeniowych. Tam też od 2013 roku prowadzi zajęcia dydaktyczne z programowania w R, Pythonie, C/C++, C#. Uczestnik studiów doktoranckich w Instytucie Podstaw Informatyki Polskiej Akademii Nauk w latach 2013-2015. W 2018 roku obronił doktorat z wyróżnieniem na swoim rodzimym wydziale: 'System do oceny podobieństwa kodów źródłowych w językach funkcyjnych oparty na metodach uczenia maszynowego i agregacji danych', który obejmuje zarówno algorytmy przetwarzania kodów źródłowych programów, jak i data science. Współautor książki 'Przetwarzanie i analiza danych w języku Python' wydanej przez PWN. Ponadto trener na bootcampach Data Science, gdzie uczy programować w języku Python pod kątem analizy danych.

POLITYKA COOKIES:

Korzystamy z plików cookies, by móc jak najlepiej dostosować stronę do Twoich potrzeb oraz wyświetlać Ci przydatne i adekwatnych dla Ciebie reklamy w serwisie i poza nim. Możesz kontrolować ustawienia ciasteczek w swoich ustawieniach swojej przeglądarki. Odwiedzając tę stronę, wyrażasz zgodę na wykorzystywanie przez nas plików cookies.