Analiza danych w języku R
LICZBA DNI: 2 (16h)
KOD KURSU: R/ANA
O szkoleniu
DLA KOGO?
Szkolenie jest adresowane w szczególności do analityków danych, którzy zajmują się przetwarzaniem danych w MS Excel lub w innym narzędziu i chcieliby zdobyć umiejętności analizy danych za pomocą języka R
Jednak prezentowane elementy wprowadzenia do środowiska R umożliwiają także zdobycie podstawowej wiedzy z zakresu analizy danych również osobom, które nie miały wcześniej z tym styczności
WYMAGANIA
Brak
ZALETY
Uczestnik szkolenia zdobędzie niezbędne umiejętności z zakresu przetwarzania i analizy danych w języku R, co pozwoli na efektywną pracę z danymi
Cele szkolenia
Zapoznanie ze środowiskiem R oraz narzędziem RStudio
Poznanie podstawowych typów danych oraz operacji wykonywanych na nich
Poznanie pakietów, które umożliwiają w szybki i prosty sposób przekształcać i analizować dane
Zdobycie umiejętności prezentacji danych za pomocą wykresów
Program
Wprowadzenie do środowiska R
- Instalacja i konfiguracja R oraz RStudio
- Podstawy organizacji pracy
- Korzystanie z dokumentacji R i funkcji pomocy
- Instalacja i wczytywanie pakietów
Działania na wektorach, operacje zwektoryzowane
- Tworzenie wektorów liczbowych i tekstowych
- Operacje arytmetyczne na wektorach (dodawanie, odejmowanie, mnożenie, dzielenie)
- Sumowanie, wyznaczanie minimum, maximum całych wektorów
- Łączenie wektorów, przeszukiwanie, wybieranie elementów
Praca z ramkami danych
- Wczytywanie danych
- Czyszczenie danych i określanie typów zmiennych
- Przekształcanie danych przy użyciu bazowego R
- Wybieranie określonych kolumn - subset()
- Zmiana nazw kolumn - colnames()
- Wybieranie unikalnych wierszy - !duplicated()
- Filtrowanie wierszy - subset()
- Sortowanie - order()
- Dodawanie nowych zmiennych - transform()
- Grupowanie danych - by()
- Obliczanie podstawowych statystyk - aggregate(), tapply()
- Przekształcanie danych przy użyciu pakietu dplyr
- Wybieranie określonych kolumn - select()
- Zmiana nazw kolumn - rename()
- Wybieranie unikalnych wierszy - distinct()
- Filtrowanie wierszy - filter(), slice()
- Sortowanie - arrange(), desc()
- Tworzenie nowych zmiennych - mutate()
- Grupowanie danych - group_by()
- Obliczanie podstawowych statystyk - summarize()
- Przetwarzanie daty i czasu za pomocą pakietu lubridate
Wizualizacja danych
- Wykres słupkowy, kołowy
- Histogram
- Wykres pudełkowy
- Wykres rozproszenia
- Zapisywanie wykresów w formatach jpg, pdf
