Szkolenie: Analiza danych tekstowych i języka naturalnego
Szkolenie z analizy danych tekstowych i języka naturalnego uczy praktycznego wykorzystania Pythona do przetwarzania, eksploracji i klasyfikacji tekstu, w tym pracy z Large Language Models oraz nowoczesnych technik NLP
- Trenerzy praktycy
- Kameralne grupy
Czas trwania szkolenia:3 dni (24h)
Kod kursu:ANA/TXT
Analiza danych tekstowych i języka naturalnego
Cele szkolenia
Szkolenie przygotowuje do samodzielnego pozyskiwania, przetwarzania i analizowania danych tekstowych z wykorzystaniem języka Python
Szkolenie uczy stosowania metod czyszczenia, eksploracji i klasyfikacji tekstu w kontekście budowy modeli uczenia maszynowego
Szkolenie omawia zagadnienia związane z wykorzystaniem Large Language Models do analizy i przetwarzania języka naturalnego
Dla kogo?
Programiści i analitycy danych z podstawową znajomością Pythona, chcący rozwijać kompetencje w analizie tekstu
Specjaliści IT oraz osoby pracujące z dużymi zbiorami danych tekstowych, zainteresowane automatyzacją analizy
Pracownicy firm technologicznych i badawczych wdrażający rozwiązania oparte na przetwarzaniu języka naturalnego
Efekty kształcenia
Uczestnik analizuje i przetwarza dane tekstowe przy użyciu narzędzi programistycznych
Uczestnik projektuje procesy czyszczenia i eksploracji tekstu
Uczestnik wdraża klasyczne i nowoczesne algorytmy klasyfikacji tekstu
Uczestnik wykorzystuje modele językowe do rozwiązywania zadań NLP
Uczestnik przygotowuje dane tekstowe do uczenia maszynowego
Uczestnik ocenia skuteczność zastosowanych metod analizy tekstu
Wymagania
Podstawowa znajomość języka Python
W cenie otrzymasz:
Materiały szkoleniowe
Certyfikat ukończenia szkolenia
W przypadku szkolenia w trybie stacjonarnym zapewnimy Ci również lunch oraz sprzęt niezbędny do nauki
Program szkolenia
Pozyskiwanie tekstu
Web scraping
Large Language Models
Wprowadzenie do LLM na przykładzie modeli GPT
OpenAI API
Przykładowe use case'y
Algorytmy klasyfikacyjne
Wprowadzenie do klasyfikacji
Podstawowe algorytmy klasyfikacyjne
Ewaluacja wyników klasyfikacji
Preprocessing tekstu
Tokenizacja
Eliminacja interpunkcji i znaków specjalnych
Usuwanie stopwords
Stemming i lematyzacja
Wektoryzacja i embeddingi
Document-term matrix
TF-IDF
Embedding semantyczny
Klasyfikacja tekstu
Przygotowanie danych tekstowych
Użycie algorytmów klasyfikacji na danych tekstowych
Wybrane opinie
Przeczytaj pozytywne opinie pochodzące z ankiet satysfakcji z naszych szkoleń wypełnianych wyłącznie przez ich uczestników po realizacji usługi
