Szkolenie: Nowoczesne przetwarzanie danych w R
Szkolenie nowoczesne przetwarzanie danych w R uczy praktycznego wykorzystania pakietów dplyr i purrr do analizy, czyszczenia i transformacji danych, inżynierii cech oraz pracy z bazami danych, przygotowując do efektywnego tworzenia czytelnego kodu analitycznego
- Trenerzy praktycy
- Kameralne grupy
Czas trwania szkolenia:3 dni (24h)
Kod kursu:R/DPLYR
Nowoczesne przetwarzanie danych w R
Cele szkolenia
Szkolenie przygotowuje do samodzielnego przetwarzania i analizy danych w języku R z wykorzystaniem nowoczesnych narzędzi
Szkolenie uczy stosowania pakietów dplyr i purrr do efektywnej transformacji, selekcji oraz czyszczenia danych
Szkolenie rozwija umiejętność implementacji strategii split-apply-combine oraz pracy z bazami danych w środowisku R
Szkolenie pokazuje, jak wykorzystywać zaawansowane funkcje do rozwiązywania nietypowych problemów analitycznych
Dla kogo?
Analitycy danych, statystycy i programiści R realizujący zadania związane z analizą i przygotowaniem danych
Osoby posiadające podstawową znajomość języka R, chcące rozwinąć umiejętności w zakresie nowoczesnego przetwarzania danych
Pracownicy naukowi i badacze wykorzystujący R do eksploracji i modelowania danych
Efekty kształcenia
Uczestnik analizuje i przetwarza dane z użyciem pakietów dplyr i purrr
Uczestnik projektuje przejrzysty i elastyczny kod analityczny w R
Uczestnik wdraża strategie split-apply-combine w praktycznych zadaniach
Uczestnik integruje pracę z danymi lokalnymi i bazami danych
Uczestnik selekcjonuje i transformuje cechy na potrzeby modelowania
Uczestnik wykorzystuje narzędzia do czyszczenia i przygotowania danych
Wymagania
Podstawowa wiedza w zakresie programowania w R
W szczególności przydatna będzie znajomość podstawowej składni języka (instrukcja warunkowa if, pętla for, umiejętność tworzenia własnych prostych funkcji), znajomość podstawowych struktur danych (wektor, lista, ramka danych) oraz umiejętność dokonywania podstawowych operacji na danych jak wyznaczenie wartości średniej z wektora
W cenie otrzymasz:
Materiały szkoleniowe
Certyfikat ukończenia szkolenia
W przypadku szkolenia w trybie stacjonarnym zapewnimy Ci również lunch oraz sprzęt niezbędny do nauki
Program szkolenia
Szybki wstęp do tematyki przetwarzania danych
Obiekt tibble jako narzędzie wygodnej pracy z danymi w konsoli R
Wprowadzenie do mechaniki przetwarzania danych z pakietem dplyr
Zapoznanie z podstawowymi funkcjonalnościami pakietu dplyr
Manipulowanie zmiennymi
Manipulowanie obserwacjami
Analizowanie danych
Podnoszenie komfortu pracy z pakietem dplyr
Zwinne metody selekcji kolumn
Tworzenie i modyfikowanie zmiennych
Wybieranie i porządkowanie obserwacji
Dodatkowe funkcjonalności pakietu dplyr
Masowe przetwarzanie zmiennych
Równoczesne przetwarzanie wszystkich zmiennych
Równoczesne przetwarzanie wybranych zmiennych
Równoczesne warunkowe przetwarzanie zmiennych
Funkcje okienkowe z pakietem dplyr
Zapoznanie z podstawową konstrukcją programistyczną
Przegląd różnych możliwości zastosowania
Łączenie zbiorów danych
Proste łączenie wierszy lub kolumn
Łącznie z wykorzystaniem kolumn kluczy
Szybkie wprowadzenie do pakietu purrr
Transformowanie zbiorów danych z wykorzystaniem pakietu purrr
Warunkowa selekcja kolumn
Złożone transformacje kolumn z użyciem map()
Warunkowe funkcje map()
Użyteczne rozszerzenia funkcji map()
Kumulowanie wyników pośrednich
Strategia split-apply-combine
Wprowadzenie do strategii z wykorzystaniem R base
Prosta implementacja strategii z wykorzystaniem pakietu dplyr
Zaawansowane wykorzystanie strategii w oparciu o pakiet purrr
Funkcje wspierające pracę z wynikami cząstkowymi
Zaawansowane aspekty pracy z pakietem dplyr
Elastyczne przetwarzanie danych z funkcją do()
Uzupełnienie wiedzy na temat łączenia zbiorów danych
Zaawansowane aspekty składni pakietu dplyr
Współpraca pakietu dplyr z bazą danych
Wykorzystanie pakietu dbplyr do łączenia z bazą danych
Funkcje wspierające pracę z bazami danych w pakiecie dplyr
Szybki przegląd rozwiązań komplementarnych i alternatywnych
Czyszczenie danych z pakietem tidyr
Zmiana struktury danych z pakietem reshape
Pakiet data.table jako alternatywa dla dplyr
Wybrane opinie
Przeczytaj pozytywne opinie pochodzące z ankiet satysfakcji z naszych szkoleń wypełnianych wyłącznie przez ich uczestników po realizacji usługi
