Struktura kurzu
Matematika a statistika (17 %)
Statistické metody:
-
aplikace t-testů, chí-kvadrát testů, analýzy rozptylu (ANOVA), testování hypotéz, regresních metrík, Giniho indexu, entropie, p-hodnoty, ROC křivky a plochy pod křivkou (ROC/AUC), Akaikeho informačního kritéria / Bayesovského informačního kritéria (AIC/BIC) a konfuzní matice.
Pravděpodobnost a modelování:
-
vysvětlení rozdělení, šikmosti, špičatosti (kurtózy), heteroskedasticity, hustoty pravděpodobnosti (PDF), pravděpodobnostní hmotnostní funkce (PMF), distribuční funkce (CDF), chybějících hodnot, převzorkování (oversampling) a stratifikace.
Lineární algebra a kalkulus:
-
porozumění hodnosti matice (rank), vlastním číslům (eigenvalues), maticovým operacím, metrikám vzdálenosti, parciálním derivacím, řetězovému pravidlu a logaritmům.
Časové modely:
Modelování, analýza a výsledky (24 %)
Metody EDA:
-
využívání technik exploratorní analýzy dat (EDA), jako je univariační a multivariační analýza, grafy, vizualizace a identifikace příznaků (feature identification).
Problémy s daty:
Obohacování dat:
Iterace modelu:
Komunikace výsledků:
Strojové učení (24 %)
Základní koncepty:
-
aplikace ztrátových funkcí, kompromisu bias-variance, regularizace, křížové validace, ansámblových modelů, ladění hyperparametrů a prevence úniku dat (data leakage).
Učení s učitelem:
-
aplikace lineární regrese, logistické regrese, k-nejbližších sousedů (KNN), naivního Bayese a asociačních pravidel.
Stromové modely:
Hluboké učení:
-
vysvětlení umělých neuronových sítí (ANN), dropout, batch normalizace, backpropagation a frameworků pro hluboké učení.
Učení bez učitele:
Provoz a procesy (22 %)
Podnikové funkce:
Typy dat:
Příjem dat (data ingestion):
Příprava dat (data wrangling):
Životní cyklus datové vědy:
DevOps a MLOps:
Prostředí nasazení:
Specializované aplikace datové vědy (13 %)
Optimalizace:
Koncepty NLP:
-
vysvětlení technik zpracování přirozeného jazyka (NLP), jako je tokenizace, embeddingy, TF-IDF (term frequency–inverse document frequency), modelování témat a aplikace NLP.
Počítačové vidění:
Další aplikace:
-
vysvětlení grafové analýzy, posilovaného učení (reinforcement learning), detekce podvodů, detekce anomálií, zpracování signálu a dalších oblastí.