INFPDTS Datové sklady

Obchodně podnikatelská fakulta v Karviné
zima 2010
Rozsah
2/1/0. 4 kr. Ukončení: zk.
Vyučující
doc. RNDr. František Koliba, CSc. (přednášející)
Mgr. Milena Janáková, Ph.D. (cvičící)
Garance
doc. RNDr. František Koliba, CSc.
Katedra informatiky a matematiky – Obchodně podnikatelská fakulta v Karviné
Omezení zápisu do předmětu
Předmět je nabízen i studentům mimo mateřské obory.
Mateřské obory/plány
Cíle předmětu
Cílem předmětu je podat přehled pokročilejších databázových technologií, jako jsou datové sklady, analýzy OLAP a dolování údajů. Jde především o management, plánování, návrh, zavedení a řízení konkrétního projektu databáze nebo datového skladu.
Osnova
  • 1. Úvod do problematiky datových skladů.
    2. Přechod od relačních databází k multidimenzionálním.
    3. Nástroje pro administraci a práci s analytickými službami.
    4. Datové sklady.
    5. Metody budování datového skladu.
    6. Příprava údajů - etapa ETL.
    7. Analýza OLAP.
    8. OLAP.
    9. OLAP nad údaji z DB Oracle.
    10. Administrace přístupu k databázím OLAP.
    11. Data mining.
    12. Model procesu data miningu.
    13. Výběr algoritmu a modelu.
    14.
    1. Úvod do problematiky datových skladů.
    Přechod od transakčních databází k analytickým. Systémy OLTP, MIS, DSS, AIS, OLAP. Kvalita údajů pro analýzu. Relační databáze.
    2. Přechod od relačních databází k multidimenzionálním.
    Relační DB model multidimenzionální datový model porovnání.
    3. Nástroje pro administraci a práci s analytickými službami.
    SQL Server Service manager, Microsoft Management konsole, SQL Server Enterprise Manager, Analysis Manager, SQL Server Query Analyzer..
    4. Datové sklady.
    Zpracování podkladů z operačního prostředí, skladování údajů, datový sklad, návrh, koncepce, software, datové trhy.
    5. Metody budování datového skladu.
    Metoda velkého třesku, přírůstková metoda, provoz datového skladu.
    6. Příprava údajů - etapa ETL.
    Extrakce, transformace a zavedení, přenos, chyby a problémy etapy ETL, testování etapy ETL..
    7. Analýza OLAP.
    Teoretický úvod, fakta a dimenze, schémata tabulek dimenzí, úložiště multidimenzionálních údajů.
    8. OLAP.
    Vytvoření jednoduché krychle pomocí průvodce. Krychle OLAP v jazyce SQL.
    9. OLAP nad údaji z DB Oracle.
    MS SQL Server Analysis versus DB Oracle, vytvoření krychle nad údaji z DB Oracle..
    10. Administrace přístupu k databázím OLAP.
    Role pro přístup k analytickým databázím, role pro přístup k jednotlivým krychlím analytické databáze.
    11. Data mining .
    Teoretický úvod,, rozdělení pravděpodobností a testování hypotéz, statistické metody využívané data miningovými modely, neuronové sítě.
    12. Model procesu data miningu.
    Konceptuální model, logický model, fyzický model.
    13. Výběr algoritmu a modelu.
    Vícerozměrné shlukové diagramy. Nevyvážené rozhodovací stromy. Fáze učení. Analýza a predikce nových případů. Zpracování vyhodnocení a ověření modelu.
Literatura
    povinná literatura
  • LACO, L. Datové sklady analýza OLAP a dolování dat 2003. Computer Press, Brno. ISBN 80-7226-969-0. info
    doporučená literatura
  • Šarmanová, J. Informační systémy a datové sklady. VŠB - Technická univerzita Ostrava, 2007. ISBN 978-80-248-1500-8. URL info
  • HUMPHRIES, M.,HAWKINS,M.W.,Dy M.C. Data warehousing, Návrh a implementace. Brno, Computer Presss, 2002. ISBN 80-72-2656-0. info
Informace učitele
Průběžný test, seminární práce, kombinovaná zkouška, min 50% účast na seminářích
Jiná zátěž: vyhledávání a zpracování zdrojů na internetu.
Další komentáře
Předmět je dovoleno ukončit i mimo zkouškové období.
Předmět je zařazen také v obdobích zima 2007, zima 2008, léto 2010, zima 2011, zima 2012, zima 2013.