CompTIA DataAI Exam DY0-001

Kód kurzu: DY0001

CompTIA DataAI (dříve DataX) je prestižní certifikace určená pro vysoce zkušené odborníky, kteří chtějí potvrdit své kompetence v rychle se rozvíjející oblasti datové vědy. DataAI vás vybaví dovednostmi, díky nimž můžete přesně a s jistotou prokázat svou odbornost při práci se složitými datovými soubory, při implementaci řešení založených na datech a při podpoře růstu podnikání prostřednictvím hluboké interpretace dat.

Odborní
certifikovaní lektoři

Mezinárodně
uznávané certifikace

Široká nabídka technických
a soft skills kurzů

Skvělý zákaznický
servis

Přizpůsobení kurzů
přesně na míru

Termíny kurzu

Počáteční datum: Na vyžádání

Forma: Zkouška + Retake

Délka kurzu: 2h 45min

Jazyk: en

Cena bez DPH: 10 625 Kč

Registrovat

Počáteční datum: Na vyžádání

Forma: Zkouška

Délka kurzu: 2h 45min

Jazyk: en

Cena bez DPH: 9 725 Kč

Registrovat

Počáteční
datum
Místo
konání
Forma Délka
kurzu
Jazyk Cena bez DPH
Na vyžádání Zkouška + Retake 2h 45min en 10 625 Kč Registrovat
Na vyžádání Zkouška 2h 45min en 9 725 Kč Registrovat
G Garantovaný kurz

Nenašli jste vhodný termín?

Napište nám o vypsání alternativního termínu na míru.

Kontakt

Popis kurzu

Co se naučíte:

  • Aplikovat matematické a statistické metody vhodným způsobem, včetně zpracování a čištění dat, statistického modelování a konceptů lineární algebry a kalkulu.

  • Využívat vhodné analytické a modelovací metody k podloženému doporučení modelů pro modelování, analýzu a dosažení požadovaných výsledků.

  • Implementovat modely strojového učení a rozumět konceptům hlubokého učení s cílem rozvíjet schopnosti v oblasti datové vědy.

  • Efektivně zavádět procesy a postupy datové vědy na podporu organizačních cílů.

  • Prokazovat porozumění trendům v odvětví a specializovaným aplikacím datové vědy v různých oblastech.

Cílová skupina

Certifikace CompTIA DataAI je ideální pro odborníky, kteří chtějí potvrdit své expertní dovednosti v oblasti datové vědy a analýzy bez ohledu na používané nástroje či platformy konkrétních výrobců. Je určena datovým analytikům, specialistům na business intelligence a všem, kteří se podílejí na rozhodování založeném na datech napříč různými odvětvími.

Struktura kurzu

Matematika a statistika (17 %)

Statistické metody:

  • aplikace t-testů, chí-kvadrát testů, analýzy rozptylu (ANOVA), testování hypotéz, regresních metrík, Giniho indexu, entropie, p-hodnoty, ROC křivky a plochy pod křivkou (ROC/AUC), Akaikeho informačního kritéria / Bayesovského informačního kritéria (AIC/BIC) a konfuzní matice.

Pravděpodobnost a modelování:

  • vysvětlení rozdělení, šikmosti, špičatosti (kurtózy), heteroskedasticity, hustoty pravděpodobnosti (PDF), pravděpodobnostní hmotnostní funkce (PMF), distribuční funkce (CDF), chybějících hodnot, převzorkování (oversampling) a stratifikace.

Lineární algebra a kalkulus:

  • porozumění hodnosti matice (rank), vlastním číslům (eigenvalues), maticovým operacím, metrikám vzdálenosti, parciálním derivacím, řetězovému pravidlu a logaritmům.

Časové modely:

  • porovnávání časových řad, analýzy přežití a kauzální inference.


Modelování, analýza a výsledky (24 %)

Metody EDA:

  • využívání technik exploratorní analýzy dat (EDA), jako je univariační a multivariační analýza, grafy, vizualizace a identifikace příznaků (feature identification).

Problémy s daty:

  • analýza řídkých dat, nelinearity, sezónnosti, granularity a odlehlých hodnot.

Obohacování dat:

  • aplikace feature engineeringu, škálování, geokódování a transformace dat.

Iterace modelu:

  • návrh, hodnocení, výběr a validace modelu.

Komunikace výsledků:

  • tvorba vizualizací, výběr relevantních dat, vyhýbání se zavádějícím grafům a zajištění přístupnosti.


Strojové učení (24 %)

Základní koncepty:

  • aplikace ztrátových funkcí, kompromisu bias-variance, regularizace, křížové validace, ansámblových modelů, ladění hyperparametrů a prevence úniku dat (data leakage).

Učení s učitelem:

  • aplikace lineární regrese, logistické regrese, k-nejbližších sousedů (KNN), naivního Bayese a asociačních pravidel.

Stromové modely:

  • aplikace rozhodovacích stromů, náhodného lesa (random forest), boostingu a bootstrap agregace (bagging).

Hluboké učení:

  • vysvětlení umělých neuronových sítí (ANN), dropout, batch normalizace, backpropagation a frameworků pro hluboké učení.

Učení bez učitele:

  • vysvětlení shlukování (clustering), redukce dimenzionality a singulárního rozkladu (SVD).


Provoz a procesy (22 %)

Podnikové funkce:

  • vysvětlení compliance (souladu s předpisy), klíčových ukazatelů výkonnosti (KPI) a sběru požadavků.

Typy dat:

  • vysvětlení generovaných, syntetických a veřejných dat.

Příjem dat (data ingestion):

  • porozumění datovým pipeline, streamování, dávkovému zpracování a datové linii (data lineage).

Příprava dat (data wrangling):

  • implementace čištění, slučování, imputace a označování referenčních dat (ground truth).

Životní cyklus datové vědy:

  • aplikace workflow modelů, verzování, principů čistého kódu a jednotkových testů.

DevOps a MLOps:

  • vysvětlení kontinuální integrace / kontinuálního nasazování (CI/CD), nasazení modelů, orchestraci kontejnerů a monitorování výkonu.

Prostředí nasazení:

  • porovnání kontejnerizace, cloudového, hybridního, edge a on-premises nasazení.


Specializované aplikace datové vědy (13 %)

Optimalizace:

  • porovnání optimalizace s omezeními a bez omezení.

Koncepty NLP:

  • vysvětlení technik zpracování přirozeného jazyka (NLP), jako je tokenizace, embeddingy, TF-IDF (term frequency–inverse document frequency), modelování témat a aplikace NLP.

Počítačové vidění:

  • vysvětlení optického rozpoznávání znaků (OCR), detekce objektů, sledování objektů a augmentace dat.

Další aplikace:

  • vysvětlení grafové analýzy, posilovaného učení (reinforcement learning), detekce podvodů, detekce anomálií, zpracování signálu a dalších oblastí.

Certifikace

  • Verze zkoušky: V1
  • Kód série zkoušky: DY0-001
  • Datum uvedení: 25. července 2024
  • Počet otázek: maximálně 90 otázek
  • Typy otázek: výběr z možností (multiple-choice) a praktické úlohy (performance-based)
  • Délka trvání: 165 minut
  • Hodnocení: pouze prospěl/neprospěl (bez bodového skóre)
  • Jazyk: angličtina a japonština
  • Doporučená praxe: 5 a více let v oblasti datové vědy nebo na podobné pozici
  • Ukončení platnosti: obvykle tři roky od uvedení (odhad 2027)
Platební brána ComGate Logo MasterCard Logo Visa