Warsztat analityka danych w R
LICZBA DNI: 3 (24h)
KOD KURSU: R/BP
O szkoleniu
DLA KOGO?
Szkolenie przeznaczone jest przede wszystkim dla analityków danych, którzy mają już pewne doświadczenie i chcą dowiedzieć się „jak to zrobić w R”
Jednak podejście od podstaw umożliwia także wstępne zapoznanie się ze specyfiką tej dziedziny wiedzy osobom, które dopiero stawiają swoje pierwsze kroki
WYMAGANIA
Szkolenie wymaga podstawowej umiejętności programowania w dowolnym języku lub podstaw programowania w języku R
Cele szkolenia
Zapoznanie z językiem R, a także szeroką gamą pakietów, które towarzyszą temu środowisku i pozwalają w wygodny i szybki sposób dokonać analizy danych
Szkolenie pozwoli na łączenie wielu narzędzi, co z kolei umożliwia wykonywanie bardziej skomplikowanych analiz z użyciem większego wachlarza technik
Program
Wstęp
- Charakterystyka języka R
- Porównanie z innymi językami
- Dlaczego R?
Instalacja podstawowego środowiska
- Instalacja R
- Instalacja RStudio
- Kontrola wersji z Git
- Instalacja
- Podstawowe operacje
RStudio
- Podstawowe okno pracy
- Historia komend
- Konsola R
- Kod źródłowy
- Korzystanie z plików pomocy
Typy danych i możliwości języka R niedostępne w innych językach
- Obliczenia zwektoryzowane
- Funkcje z rodziny apply
- Ramki danych
- Typ czynnikowy
Inżynieria danych
- Wczytywanie i czyszczenie danych
- Przekształcanie danych przy użyciu bazowego R
- Wybór poszczególnych kolumn
- Wybór wierszy spełniających zadany warunek
- Grupowanie danych
- Liczenie podstawowych statystyk
- Sortowanie
- Przekształcanie danych przy użyciu pakietu dplyr
- Wybór poszczególnych kolumn
- Wybór wierszy spełniających zadany warunek
- Grupowanie danych
- Liczenie podstawowych statystyk
- Sortowanie
Wizualizacja
- Grafika niskopoziomowa
- Barwy, punkty, odcinki, wielokąty
- Zapisywanie wykresów w formatach grafiki rastrowej (np. JPG) i wektorowej (np. PDF)
- Grafika wysokopoziomowa
- Wykres słupkowy, kołowy
- Wykres skrzynkowy, histogram
- Wykres rozproszenia
- Pakiet ggplot2
Statystyka i uczenie maszynowe
- Gęstość, dystrybuanta, odwrotna dystrybuanta, losowanie z podanego rozkładu - przydatne funkcje w R
- Podstawowe testy statystyczne
- Regresja liniowa
- Regresja logistyczna
- Analiza skupień
- Drzewa decyzyjne
