Szkolenie dostępne na zamówienie

Szkolenie: Nowoczesne przetwarzanie danych w R

Szkolenie nowoczesne przetwarzanie danych w R uczy praktycznego wykorzystania pakietów dplyr i purrr do analizy, czyszczenia i transformacji danych, inżynierii cech oraz pracy z bazami danych, przygotowując do efektywnego tworzenia czytelnego kodu analitycznego

  • Trenerzy praktycy
  • Kameralne grupy

Czas trwania szkolenia:3 dni (24h)

Poziom zaawansowania:

Kod kursu:R/DPLYR

data-sciencejezyk-rprzetwarzanie-danychanaliza-danych-r

Szkolenie na zamówienie

  • Dostosowany program
  • Indywidualna wycena
  • Dowolny termin
Zapytanie o szkolenie

Nowoczesne przetwarzanie danych w R

Cele szkolenia

  • Szkolenie przygotowuje do samodzielnego przetwarzania i analizy danych w języku R z wykorzystaniem nowoczesnych narzędzi

  • Szkolenie uczy stosowania pakietów dplyr i purrr do efektywnej transformacji, selekcji oraz czyszczenia danych

  • Szkolenie rozwija umiejętność implementacji strategii split-apply-combine oraz pracy z bazami danych w środowisku R

  • Szkolenie pokazuje, jak wykorzystywać zaawansowane funkcje do rozwiązywania nietypowych problemów analitycznych


Dla kogo?

  • Analitycy danych, statystycy i programiści R realizujący zadania związane z analizą i przygotowaniem danych

  • Osoby posiadające podstawową znajomość języka R, chcące rozwinąć umiejętności w zakresie nowoczesnego przetwarzania danych

  • Pracownicy naukowi i badacze wykorzystujący R do eksploracji i modelowania danych


Efekty kształcenia

  • Uczestnik analizuje i przetwarza dane z użyciem pakietów dplyr i purrr

  • Uczestnik projektuje przejrzysty i elastyczny kod analityczny w R

  • Uczestnik wdraża strategie split-apply-combine w praktycznych zadaniach

  • Uczestnik integruje pracę z danymi lokalnymi i bazami danych

  • Uczestnik selekcjonuje i transformuje cechy na potrzeby modelowania

  • Uczestnik wykorzystuje narzędzia do czyszczenia i przygotowania danych


Wymagania

  • Podstawowa wiedza w zakresie programowania w R

  • W szczególności przydatna będzie znajomość podstawowej składni języka (instrukcja warunkowa if, pętla for, umiejętność tworzenia własnych prostych funkcji), znajomość podstawowych struktur danych (wektor, lista, ramka danych) oraz umiejętność dokonywania podstawowych operacji na danych jak wyznaczenie wartości średniej z wektora


W cenie otrzymasz:

  • Materiały szkoleniowe

  • Certyfikat ukończenia szkolenia

  • W przypadku szkolenia w trybie stacjonarnym zapewnimy Ci również lunch oraz sprzęt niezbędny do nauki

Program szkolenia

Pobierz program w PDF

Szybki wstęp do tematyki przetwarzania danych

Obiekt tibble jako narzędzie wygodnej pracy z danymi w konsoli R

Wprowadzenie do mechaniki przetwarzania danych z pakietem dplyr

Zapoznanie z podstawowymi funkcjonalnościami pakietu dplyr

  • Manipulowanie zmiennymi

  • Manipulowanie obserwacjami

  • Analizowanie danych

Podnoszenie komfortu pracy z pakietem dplyr

  • Zwinne metody selekcji kolumn

  • Tworzenie i modyfikowanie zmiennych

  • Wybieranie i porządkowanie obserwacji

  • Dodatkowe funkcjonalności pakietu dplyr

Masowe przetwarzanie zmiennych

  • Równoczesne przetwarzanie wszystkich zmiennych

  • Równoczesne przetwarzanie wybranych zmiennych

  • Równoczesne warunkowe przetwarzanie zmiennych

Funkcje okienkowe z pakietem dplyr

  • Zapoznanie z podstawową konstrukcją programistyczną

  • Przegląd różnych możliwości zastosowania

Łączenie zbiorów danych

  • Proste łączenie wierszy lub kolumn

  • Łącznie z wykorzystaniem kolumn kluczy

Szybkie wprowadzenie do pakietu purrr

Transformowanie zbiorów danych z wykorzystaniem pakietu purrr

  • Warunkowa selekcja kolumn

  • Złożone transformacje kolumn z użyciem map()

  • Warunkowe funkcje map()

  • Użyteczne rozszerzenia funkcji map()

  • Kumulowanie wyników pośrednich

Strategia split-apply-combine

  • Wprowadzenie do strategii z wykorzystaniem R base

  • Prosta implementacja strategii z wykorzystaniem pakietu dplyr

  • Zaawansowane wykorzystanie strategii w oparciu o pakiet purrr

  • Funkcje wspierające pracę z wynikami cząstkowymi

Zaawansowane aspekty pracy z pakietem dplyr

  • Elastyczne przetwarzanie danych z funkcją do()

  • Uzupełnienie wiedzy na temat łączenia zbiorów danych

  • Zaawansowane aspekty składni pakietu dplyr

Współpraca pakietu dplyr z bazą danych

  • Wykorzystanie pakietu dbplyr do łączenia z bazą danych

  • Funkcje wspierające pracę z bazami danych w pakiecie dplyr

Szybki przegląd rozwiązań komplementarnych i alternatywnych

  • Czyszczenie danych z pakietem tidyr

  • Zmiana struktury danych z pakietem reshape

  • Pakiet data.table jako alternatywa dla dplyr

Autorem szkolenia jest Paweł Jamer

Menedżer zespołów zaawansowanej analityki (data science, artificial intelligence, machine learning), trener data science i computer science oraz wykładowca. W swojej prawie 15 letniej karierze zawodowej realizował projekty z obszaru zaawansowanej analityki dla branży finansowej, HoReCa, energetycznej oraz IT. Miał również okazję uczestniczyć w projektach naukowych dotyczących NLP, computer vision oraz modelowania rynków finansowych. Jako osoba wiecznie głodna wiedzy, studiował dotychczas matematykę,…

Wybrane opinie

Przeczytaj pozytywne opinie pochodzące z ankiet satysfakcji z naszych szkoleń wypełnianych wyłącznie przez ich uczestników po realizacji usługi

4.8
Ikona podpowiedziŚrednia ocen Sages w serwisie Google Ocena pochodzi ze średniej ocen Sages w serwisie Google i nie jest weryfikowana

30.01.2026

Uczestnik szkoleniaJira - organizacja i zarządzanie projektami

Adam NAJMOWICZ

Praktyczna wiedza w praktyce i swietna komunikacja z trenerem

Więcej opinii