Analiza danych tekstowych i języka naturalnego

LICZBA DNI: 3 (24h)

KOD KURSU: ANA/TXT

POZIOM SZKOLENIA:

# text-mining

# information-retrieval

# machine-learning

Najbliższy termin:

8 września 2021

PROWADZI:

Patryk Pilarski

2680 PLN netto + 23% VAT

  • stacjonarne
  • zdalne

STACJONARNE

W CENIE

  • 3 dni pracy z trenerem
  • Materiały szkoleniowe
  • Lunch
  • Certyfikat ukończenia szkolenia

ZDALNE

W CENIE

  • 3 dni pracy z trenerem na żywo online
  • Materiały szkoleniowe
  • Certyfikat ukończenia szkolenia

Czy wiesz, że możesz uzyskać nawet do 100% DOFINANSOWANIA na szkolenie? Napisz do nas »

Oferta dla firm

Dostosuj zakres, czas i miejsce szkolenia do potrzeb Twojego zespołu. Uzyskaj indywidualną wycenę szkolenia dla grupy.

Weź udział w szkoleniu

Termin

Lokalizacja

Trener

Cena / os

8

września

Wrocław,

Łódź,

Warszawa,

Zdalne,

2680 PLN netto
+ 23% VAT

20

października

Kraków,

Warszawa,

Zdalne,

2680 PLN netto
+ 23% VAT

8

grudnia

Warszawa,

Zdalne,

2680 PLN netto
+ 23% VAT

Termin

8

września

Lokalizacja

Wrocław,

Łódź,

Warszawa,

Zdalne,

Trener

Cena / os

2680 PLNnetto
+ 23% VAT

Termin

20

października

Lokalizacja

Kraków,

Warszawa,

Zdalne,

Trener

Cena / os

2680 PLNnetto
+ 23% VAT

Termin

8

grudnia

Lokalizacja

Warszawa,

Zdalne,

Trener

Cena / os

2680 PLNnetto
+ 23% VAT

Powiadom
o kolejnych terminach

O szkoleniu

DLA KOGO?

Programiści, pragnący zastosować w swoich systemach metody odkrywania wiedzy z danych tekstowych

Analitycy, którzy chcą rozbudować swój warsztat analityczny o narzędzie analizy danych tekstowych

Osoby zainteresowane zastosowaniem narzędzi statystycznych, metod uczenia maszynowego w pracy z danymi tekstowymi

WYMAGANIA

Podstawowa znajomość języka Python

ZALETY

Obszerne wprowadzenie do świata analizy danych tekstowych

Zapoznanie z najważniejszymi narzędziami i technikami

Kameralne grupy - szkolenia technologiczne prowadzimy w grupach liczących do 8 osób. Pozwala to na indywidualne podejście oraz aktywizację każdego uczestnika

Praktyka przed teorią - wszystkie szkolenia technologiczne prowadzone są w formie warsztatowej. Konieczna teoria jest wyjaśniana na przykładzie praktycznych zadań

Konkretne umiejętności - w ramach każdego szkolenia rozwijamy praktyczne umiejętności związane z daną technologią i tematyką

Nauka z praktykami - wszyscy trenerzy na co dzień pracują w projektach, gwarantuje to dostęp do eksperckiej wiedzy i praktycznego know-how

Cele szkolenia

Zdobycie praktycznych umiejętności i wiedzy pozwalających na wykonywanie analiz języka naturalnego z wykorzystaniem języka Python

Zapoznanie z problemami przetwarzania, czyszczenia oraz eksploracji danych tekstowych, a także z wykorzystaniem przygotowanych danych między innymi do budowania modeli uczenia maszynowego

Program

  • Źródła i zastosowania danych tekstowych
  • Definicje pojęć
    • Text Mining
    • Natural Language Processing
    • Information Retrieval
  • Języki programowania stosowane do analizy danych tekstowych
  • Regex
  • Pandas
  • Scikit-learn
  • NLTK
  • SpaCy
  • Wczytywanie danych
    • txt
    • csv
    • json
    • docx
    • pdf
  • Czytanie danych z API (np. Twitter)
  • Web scraping
  • Tokenizacja
  • Usuwanie zbędnych znaków
  • Rozwijanie skrótów
  • Usuwanie nieistotnych słów
  • Poprawianie literówek
  • Stemming/lematyzacja
  • Wykres długości słów
  • Wykres częstości słów
  • Word cloud
  • Document-term matrix
    • Bag of Words
    • TF-IDF
  • word2vec
  • fasttext
  • doc2vec
  • Kolokacje
  • TextRank
  • Miary podobieństwa słów
    • Odległość Hamminga
    • Odległość Levenshteina
  • Miary podobieństwa dokumentów
    • Miara Cosinusowa
    • Miara Jaccarda
  • Klasteryzacja dokumentów
    • K-means
    • Affinity Propagation
    • Hierarchical Agglomerative Clustering
  • Klasyfikacja dokumentów
    • Naiwny Bayes
    • SVM
  • Universal tagset
  • Penn TreeBank tagset
  • Podejście słownikowe
  • Podejście oparte na metodach uczenia maszynowego
  • Parsowanie płytkie
  • Parsowanie zależnościowe

Autor szkolenia:

Patryk Pilarski

Data Scientist, Data Engineer - pół człowiek pół dane. Dobrze czuje się w pracy z danymi w każdym rozmiarze – od dużych po małe. Na ścieżce kariery poszukuje interesujących wyzwań oraz możliwości pracy z ciekawymi technologiami, w związku z czym pracował w licznych projektach łączących w sobie wyzwania z zakresu analizy i inżynierii danych - zarówno dla dużych jak i małych firm. Chętnie zgłębia nowe technologie oraz języki programowania. Stara się również przekazywać pozyskaną wiedzę i umiejętności wcielając się w rolę trenera.

Najbliższe szkolenie poprowadzi:

Patryk Pilarski

Data Scientist, Data Engineer - pół człowiek pół dane. Dobrze czuje się w pracy z danymi w każdym rozmiarze – od dużych po małe. Na ścieżce kariery poszukuje interesujących wyzwań oraz możliwości pracy z ciekawymi technologiami, w związku z czym pracował w licznych projektach łączących w sobie wyzwania z zakresu analizy i inżynierii danych - zarówno dla dużych jak i małych firm. Chętnie zgłębia nowe technologie oraz języki programowania. Stara się również przekazywać pozyskaną wiedzę i umiejętności wcielając się w rolę trenera.

POLITYKA COOKIES:

Korzystamy z plików cookies, by móc jak najlepiej dostosować stronę do Twoich potrzeb oraz wyświetlać Ci przydatne i adekwatnych dla Ciebie reklamy w serwisie i poza nim. Możesz kontrolować ustawienia ciasteczek w swoich ustawieniach swojej przeglądarki. Odwiedzając tę stronę, wyrażasz zgodę na wykorzystywanie przez nas plików cookies.