Natural Language Processing

Kód kurzu: MLNLP

Kurz je zaměřen na analýzu a zpracování textů. Předpokládá se znalost principů strojového učení, ale ty nejdůležitější koncepty budou stručně zopakovány. Specifikem zpracování textů je způsob předzpracování dat a jejich vektorizace. Tomu bude věnována první část. Vše bude prakticky vyzkoušeno na úloze, jejíž cílem je klasifikace textových dokumentů. Dále se účastníci dozvědí, co jsou to jazykové modely a jak je použít pro detekci jazyka dokumentu nebo generování textů.

3 990 Kč

4 828 Kč s DPH

Nejbližší termín od 09.09.2022

Výběr termínů

Odborní
certifikovaní lektoři

Mezinárodně
uznávané certifikace

Široká nabídka technických
a soft skills kurzů

Skvělý zákaznický
servis

Přizpůsobení kurzů
přesně na míru

Termíny kurzu

Počáteční datum: 09.09.2022

Místo konání: Praha

Forma: Prezenční

Délka kurzu: 1 den

Jazyk: cz

Cena bez DPH: 3 990 Kč

Registrovat

Počáteční datum: 09.11.2022

Forma: Virtuální

Délka kurzu: 1 den

Jazyk: en

Cena bez DPH: 3 990 Kč

Registrovat

Počáteční datum: 09.11.2022

Místo konání: Praha

Forma: Prezenční

Délka kurzu: 1 den

Jazyk: en

Cena bez DPH: 3 990 Kč

Registrovat

Počáteční datum: Individuální

Forma: Individuální

Délka kurzu: 1 den

Jazyk: cz

Cena bez DPH: 3 990 Kč

Registrovat

Počáteční
datum
Místo
konání
Forma Délka
kurzu
Jazyk Cena bez DPH
09.09.2022 Praha Prezenční 1 den cz 3 990 Kč Registrovat
09.11.2022 Virtuální 1 den en 3 990 Kč Registrovat
09.11.2022 Praha Prezenční 1 den en 3 990 Kč Registrovat
Individuální Individuální 1 den cz 3 990 Kč Registrovat
G Garantovaný kurz

Nenašli jste vhodný termín?

Napište nám o vypsání alternativního termínu na míru.

Kontakt

Struktura kurzu

  • Úvod do zpracování přirozeného jazyka
  • Vybrané kapitoly z komputační ligvistiky (korpusy, tokenizace, morfologická, syntaktická a sémantická analýza, entropie, mutual information, perplexita)
  • Vektorizace textových dokumentů (bag of words, one-hot encoding, TF-IDF)
  • Word embedding (word2vec)
  • Praktická úloha na klasifikaci textů
  • Word embedding (vytvoření word2vec modelů a experimenty s vektorovými reprezentacemi slov)
  • Úvod do jazykových modelů (n-gramové modely, vyhlazování, modely založené na neuronových sítích)
  • Praktická úloha na jazykové modelování (implementace jazykových modelů a jejich využití pro detekci jazyka textu)
  • Úprava algoritmu pro generování textů

Předpokládané znalosti

  • Základní znalost programování v Pythonu
  • Středoškolské znalosti lineární algebry, matematické analýzy a teorie pravděpodobnosti. Bude předpokládáno základní porozumění pojmům jako vektor, matice, vektorový prostor, pravděpodobnost, podmíněná pravděpodobnost, nezávislost náhodných jevů a znalost násobení matic a derivace funkcí.
  • Znalosti strojového učení na úrovni kurzu Úvod do strojového učení.

Potřebujete poradit nebo upravit kurz na míru?

Daniel Šťastný

Daniel Šťastný

produktová podpora

Navazující kurzy

Machine Learning BootCamp cz/sk en

Dodavatel: EDU Trainings

Oblast: Strojové učení

Cena od:

17 990 Kč bez DPH

Garantovaný

Introduction to machine learning cz/sk en

Dodavatel: EDU Trainings

Oblast: Strojové učení

Cena od:

7 990 Kč bez DPH

Convolutional neural networks and image processing cz/sk en

Dodavatel: EDU Trainings

Oblast: Strojové učení

Cena od:

3 990 Kč bez DPH

Time Series Analysis cz/sk en

Dodavatel: EDU Trainings

Oblast: Strojové učení

Cena od:

3 990 Kč bez DPH

Machine Learning with R cz/sk

Dodavatel: EDU Trainings

Oblast: Strojové učení

Cena od:

12 300 Kč bez DPH

Data Manipulation and Visualization with R cz/sk

Dodavatel: EDU Trainings

Oblast: Strojové učení

Cena od:

12 300 Kč bez DPH

Data modelling in Power BI cz/sk en

Dodavatel: EDU Trainings

Oblast: Strojové učení

Cena od:

9 840 Kč bez DPH

Interpretable machine learning (R/Python) cz/sk

Dodavatel: EDU Trainings

Oblast: Strojové učení

Cena od:

9 840 Kč bez DPH

Platební brána ComGate Logo MasterCard Logo Visa