INMNPDTS Datové sklady

Obchodně podnikatelská fakulta v Karviné
zima 2018
Rozsah
2/1/0. 4 kr. Ukončení: zk.
Vyučující
Mgr. Milena Janáková, Ph.D. (přednášející)
doc. RNDr. František Koliba, CSc. (přednášející)
Mgr. Milena Janáková, Ph.D. (cvičící)
doc. RNDr. František Koliba, CSc. (cvičící)
Garance
doc. RNDr. František Koliba, CSc.
Katedra informatiky a matematiky – Obchodně podnikatelská fakulta v Karviné
Kontaktní osoba: doc. Mgr. Petr Suchánek, Ph.D.
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
Cíle předmětu
Cílem předmětu je podat přehled pokročilejších databázových technologií, jako jsou datové sklady, analýzy OLAP a dolování údajů. Jde především o management, plánování, návrh, zavedení a řízení konkrétního projektu databáze nebo datového skladu.
Osnova
  • 1. Úvod do problematiky datových skladů.
    2. Přechod od relačních databází k multidimenzionálním.
    3. Nástroje pro administraci a práci s analytickými službami.
    4. Datové sklady.
    5. Metody budování datového skladu.
    6. Příprava údajů - etapa ETL.
    7. Analýza OLAP.
    8. OLAP.
    9. OLAP nad údaji z DB Oracle.
    10. Administrace přístupu k databázím OLAP.
    11. Data mining.
    12. Model procesu data miningu.
    13. Výběr algoritmu a modelu.
    14.
    1. Úvod do problematiky datových skladů.
    Přechod od transakčních databází k analytickým. Systémy OLTP, MIS, DSS, AIS, OLAP. Kvalita údajů pro analýzu. Relační databáze.
    2. Přechod od relačních databází k multidimenzionálním.
    Relační DB model multidimenzionální datový model porovnání.
    3. Nástroje pro administraci a práci s analytickými službami.
    SQL Server Service manager, Microsoft Management konsole, SQL Server Enterprise Manager, Analysis Manager, SQL Server Query Analyzer..
    4. Datové sklady.
    Zpracování podkladů z operačního prostředí, skladování údajů, datový sklad, návrh, koncepce, software, datové trhy.
    5. Metody budování datového skladu.
    Metoda velkého třesku, přírůstková metoda, provoz datového skladu.
    6. Příprava údajů - etapa ETL.
    Extrakce, transformace a zavedení, přenos, chyby a problémy etapy ETL, testování etapy ETL..
    7. Analýza OLAP.
    Teoretický úvod, fakta a dimenze, schémata tabulek dimenzí, úložiště multidimenzionálních údajů.
    8. OLAP.
    Vytvoření jednoduché krychle pomocí průvodce. Krychle OLAP v jazyce SQL.
    9. OLAP nad údaji z DB Oracle.
    MS SQL Server Analysis versus DB Oracle, vytvoření krychle nad údaji z DB Oracle..
    10. Administrace přístupu k databázím OLAP.
    Role pro přístup k analytickým databázím, role pro přístup k jednotlivým krychlím analytické databáze.
    11. Data mining .
    Teoretický úvod,, rozdělení pravděpodobností a testování hypotéz, statistické metody využívané data miningovými modely, neuronové sítě.
    12. Model procesu data miningu.
    Konceptuální model, logický model, fyzický model.
    13. Výběr algoritmu a modelu.
    Vícerozměrné shlukové diagramy. Nevyvážené rozhodovací stromy. Fáze učení. Analýza a predikce nových případů. Zpracování vyhodnocení a ověření modelu.
Literatura
    povinná literatura
  • LACO, L. Datové sklady analýza OLAP a dolování dat 2003. Computer Press, Brno. ISBN 80-7226-969-0. info
  • KIMBAL, R., ROSS, M. The Data Warehouse Toolkit: The Definitive Guide to Dimensional Modeling. Indianapolis, John Wiley & Sons, 2013. ISBN -13: 978-11185308. info
  • INMON, W. H. Building the Data Warehouse. Indianapolis, Wiley Publishing, 2005. ISBN -13: 978-07645994. info
  • BERKA Petr. Dobývání znalostí z databází. Praha, 2003. ISBN 80-200-1062-9. info
    doporučená literatura
  • LIEBOWITZ, J. Big Data and Business Analytics. NW, CRC Press, 2013. ISBN -13: 978-14665657. info
  • KRISHNAN, K. Big Data and Business Analytics. NW, CRC Press, 2013. ISBN 0124058914. info
  • Šarmanová, J. Informační systémy a datové sklady. VŠB - Technická univerzita Ostrava, 2007. ISBN 978-80-248-1500-8. URL info
  • HUMPHRIES, M.,HAWKINS,M.W.,Dy M.C. Data warehousing, Návrh a implementace. Brno, Computer Presss, 2002. ISBN 80-72-2656-0. info
  • Olivia Parr Rud. Data Mining. Computer Press, Praha, 2001. ISBN 80-7226-577-6. info
Výukové metody
Demonstrace dovedností
Seminární výuka
Metody hodnocení
Známkou
Informace učitele
https://elearning.opf.slu.cz/course/view.php?id=1072
Průběžný test, seminární práce, kombinovaná zkouška, min 50% účast na seminářích
Jiná zátěž: vyhledávání a zpracování zdrojů na internetu.

AktivityNáročnost [h]
Ostatní studijní zátěž39
Přednáška26
Seminář13
Zkouška40
Celkem118
Další komentáře
Předmět je dovoleno ukončit i mimo zkouškové období.
Předmět je zařazen také v obdobích zima 2014, zima 2015, zima 2016, zima 2017, zima 2019.