Statistické zpracování dat 1.přednáška Mgr. Radmila Krkošková, Ph.D. •Garant: Prof. RNDr. Jaroslav Ramík, CSc. •Vyučující: Mgr. Radmila Krkošková, Ph.D. •Typ zařazení do studijních programů: • Celofakultní (A) – všechny obory •Doporučený ročník/semestr: 1/1 •Rozsah studijního předmětu: 2+1 •Počet kreditů: 5 ECTS •Způsob zakončení: zkouška (písemná) •Forma výuky: přednáška, seminář v PC učebně Kód studijního předmětu: NPSTZ 2 •Aktivní účast na seminářích. • •Během zimního semestru se konají 3 (nepovinné) průběžné testy: v 5., 9. a 11. výukovém týdnu v rámci seminářů. •Za průběžné testy je možno získat až 30 bodů, které se započítávají do výsledné známky z předmětu Statistické zpracování dat. •Závěrečný zkouškový písemný test obsahuje teoretické i praktické otázky (řešení příkladů na PC) a je hodnocen 0 až 70 body K úspěšnému absolvování předmětu je zapotřebí zisk alespoň 60 bodů ze 100. • Podmínky absolvování předmětu: 3 •0 až 59 b. F •60 až 64 b E •65 až 69 b. D •70 až 79 b. C •80 až 89 b. B •90 až 100 b. A Klasifikace: 4 •Objekty statistického zkoumání – • statistické jednotky •= to co zkoumá statistika • • Příklady: zákazníci, zaměstnanci, firmy, organizace určitého typu: prodejny potravin, supermarkety (např. Hypernova), studenti SU OPF, voliči, výrobky (např. televizory, počítače aj.), události (uzávěrky, úrazy, vrhy hrací kostkou apod.) Statistická jednotka 5 •Cíl: analýza informací a odhalení zákonitostí skrytých v datech •2 přístupy: • 1.Popisná statistika (charakteristiky) 2.Induktivní statistika (pravděpodobnost rozdělení) • 1. Úkol statistiky: zpřehlednění dat 6 •Statistická jednotka je vymezena alespoň ze 3 hledisek: • •věcné hledisko • (např. student VŠ mužského pohlaví) • •prostorové hledisko • (např. student SU OPF v Karviné) • •časové hledisko (např. v letošním školním roce student 1. ročníku) Vymezení statistické jednotky 7 •Statistický soubor = souhrn statistických jednotek stejného vymezení (věcného, prostorového, časového) • •Statistický soubor, který obsahuje všechny statistické jednotky daného vymezení - základní soubor (též populační soubor nebo krátce populace) • •Vybraná část základního souboru - výběrový soubor, též vzorek Statistický soubor 8 •Statistické znaky = vlastnosti statistických jednotek statistických souborů • znaky kvalitativní (někdy též slovní, textové nebo alfanumerické) •Příklady: pohlaví zákazníka, typ podniku, bydliště voliče, barva výrobku, chuť nápoje, spokojenost zákazníka apod. • • znaky kvantitativní (též číselné, metrické, měřitelné) •Příklady: tržby firmy za měsíc, cena výrobku, počet zákazníků za den, HDP státu v USD, výsledky vrhu hrací kostkou apod. Statistický znak 9 •Kvalitativní znaky členíme na: • nominální znaky (též jmenovité) •Příklad : kategoriemi znaku „pohlaví zákazníka“ jsou „Muž“ a „Žena“ – kategorie jsou rovnocenné • •ordinální znaky (též pořadové) •Příklad : kategoriemi znaku „spokojenost zákazníka“ mohou být 3 výrazy „nízká“, „průměrná“ a „vysoká“, neboli 3 kódy „1“, „2“ a „3“ nejedná se o kvantitativní (číselný) znak !!! •Kategorie nejsou rovnocenné, lze je uspořádat Kvalitativní znaky 10 •Kvantitativní znaky členíme na: • diskrétní znaky (mají konečný nebo nekonečný počet hodnot, nabývají izolovaných číselných hodnot) •Příklady: 1.Počet zákazníků v prodejně za den - nabývá hodnot 0, 1, 2, 3,… atd., není shora omezen (alespoň teoreticky) - nekonečný diskrétní znak 2.Počet ok na hrací kostce je omezený, konkrétně nabývá hodnot 1, 2,…, 6, - konečný diskrétní znak • Kvantitativní znaky 11 •spojité znaky (mají vždy nekonečný počet hodnot, nabývají všech možných číselných hodnot z určitého číselného intervalu) •Příklady: 1.Cena výrobku, doba životnosti výrobku - nabývá hodnot z intervalu (0, +¥) není shora omezen (alespoň teoreticky) 2.Hmotnost výrobku, rozměry výrobku apod. - nabývá hodnot z intervalu [a, b], je omezený • Kvantitativní znaky 12 Statistický znak 13 14 Statistický znak (nominální) – Funkce 15 Histogram četnosti 16 •Modus - nejčetnější hodnota (kategorie) kvalitativního znaku x v daném statistickém souboru •Příklad: = „dělník“ • •Medián - představuje hodnotu odpovídající prostřední jednotce v souboru jednotek uspořádaných podle ordinálního znaku x Charakteristiky polohy kvalitativních znaků 17 • Kvalita stravy - medián 18 •Aritmetický průměr: • populační průměr - • • výběrový průměr - • •Vážený průměr: Charakteristiky polohy 19 •Medián - - prostřední hodnota • v uspořádaném souboru hodnot • (50% hodnot je menších než medián, • 50% hodnot je větších, nebo stejných) •Modus - - nejčetnější hodnota • (může jich být i více) • Charakteristiky polohy 20 Příklad – průměr, modus, medián 21 •Výběrový průměr: • • • •Výběrový modus: • •Výběrový medián: • •Populační charakteristiky: Výběrové x populační charakteristiky 22 • • Aritmetický průměr roste, • přestože nikomu se mzda • nezvýšila, 3 pracovníci byli • propuštěni (s nejnižším • platem)! • 23 •Rozpětí: R = max xi - min xi • •Rozptyl: • •Směrodatná odchylka: • • Populační charakteristiky variability 24 •Výběrový rozptyl: • • • •Výběrová směrodatná odchylka: • Výběrové charakteristiky variability 25 • • •Variační koeficient • • • • •Výběrový variační koeficient Variační koeficienty 26 Příklad 27 •Akcie 1: =100 s =60 Þ V1 =60/100 = 0,6 • •Akcie 2: = 600 s = 420 Þ V2=420/600 = 0,7 • •Akcie 1 je méně riziková, neboť variační •koeficient má menší hodnotu! •Šikmost vyjadřuje tvar rozdělení četnosti pomocí jediného čísla: • • •Pokud Sk = 0, potom je histogram četnosti symetrický v tom smyslu, že • • Šikmost 28 •Šikmost je menší než 0 (záporná), jestliže je graf četnosti zešikmen doprava. •Šikmost je větší než 0 (kladná), jestliže je graf zešikmen doleva. • Šikmost v grafu četnosti 29 Příklad 30 Sk = 0,99 > 0 Graf je sešikmen doleva. Příklad 31 Sk = – 0,51 < 0 Graf je sešikmen doprava. Závěr přednášky 32 Děkuji Vám za pozornost !!!