INMNPDOD Dolování dat

Obchodně podnikatelská fakulta v Karviné
zima 2023
Rozsah
2/1/0. 5 kr. Ukončení: zk.
Vyučující
Ing. Jan Górecki, Ph.D. (přednášející)
Garance
Ing. Jan Górecki, Ph.D.
Katedra informatiky a matematiky – Obchodně podnikatelská fakulta v Karviné
Kontaktní osoba: Ing. Jan Górecki, Ph.D.
Rozvrh
St 8:05–9:40 A318
  • Rozvrh seminárních/paralelních skupin:
INMNPDOD/01: St 9:45–10:30 A318, J. Górecki
Předpoklady
FAKULTA(OPF) && TYP_STUDIA(N) && FORMA(P)
Omezení zápisu do předmětu
Předmět je určen pouze studentům mateřských oborů.

Předmět si smí zapsat nejvýše 15 stud.
Momentální stav registrace a zápisu: zapsáno: 7/15, pouze zareg.: 0/15
Mateřské obory/plány
Osnova
  • 1. Proces dolování dat
    Dolování dat, úlohy dolování dat, metodiky pro dolování dat.
    2. Statistika v kontextu dolování dat
    Kontingenční tabulky, regresní analýza, diskriminační analýza, shluková analýza.
    3. Strojové učení
    Základní pojmy, principy strojového učení, typy strojového učení, formy strojového učení, trénovací data, atributy, chybová funkce.
    4. Metody dolování dat
    Rozhodovací stromy, Rozhodovací pravidla, Neuronové sítě, Genetické algoritmy, bayesovské metody, metody založené na analogii.
    5. Evaluace modelů
    Kritéria, deskriptivní úlohy, klasifikační úlohy, vizualizace modelů, vizualizace klasifikací, porovnávání modelů, volba nejvhodnějšího algoritmu, kombinování modelů.
    6. Předzpracování dat
    Příprava dat, strukturovaná data, více vzájemně propojených tabulek, odvozené atributy, příliš mnoho objektů, příliš mnoho atributů, numerické atributy, kategoriální atributy, chybějící hodnoty.
Literatura
    povinná literatura
  • BERKA, P. a J. GÓRECKI. Dolování dat. Skripta SU OPF, Karviná, 2017. info
  • BERKA, P. Dobývání znalostí z databází. Academia, Praha, 2003. ISBN 80-200-1062-9. info
    doporučená literatura
  • FRIEDMAN, J., T. HASTIE a R. TIBSHIRANI., 2013. The Elements of Statistical Learning: Data Mining, Inference, and Prediction. 2nd Edition. Springer. ISBN 978-0387848570.
  • MURPHY, K. P. Machine learning: A probabilistic perspective. London, England: The MIT Press, 2012. ISBN 978-0-262-01802-9. info
Informace učitele
Požadavky na studenta: docházka na semináře, seminární práce.
Hodnotící metody: docházka na semináře min. 60 % (10 % hodnocení), zpracování seminární práce (30 % hodnocení), zkouška (60 % hodnocení).
Další komentáře
Studijní materiály
Předmět je dovoleno ukončit i mimo zkouškové období.
Předmět je zařazen také v obdobích zima 2018, zima 2019, zima 2020, zima 2021, zima 2022, zima 2024.