STATISTIKA . 9. PŘEDNÁŠKA Téma přednášky: Chi-kvadrát test a)test nezávislosti, b)test dobré shody. Mgr. Radmila Krkošková, Ph.D. Chi – kvadrát test lData mohou být nominální (nejslabší požadavek)! lTestuje se (nulová) hypotéza H0: výběr pochází z populace s daným rozdělením lZadané rozdělení je obvykle: -diskrétní rozdělení se stejnými pr- stmi -(tzv. test nezávislosti) -diskrétní rozdělení s rozdílnými pr- stmi -(tzv. test dobré shody) Příklad – test nezávislosti - limonády Nová limonáda se prodávala za stejnou cenu jeden týden ve 3 různých typech obalu: A, B, C, počet prodaných limonád viz tabulka: Ovlivňuje styl designu obalu počet prodaných limonád? Jinak: Závisí prodej na obalu? Příklad – test nezávislosti - limonády Krok 1. Nulová hypotéza H0: Počet prodaných kusů nezávisí na typu obalu (rozdíly v prodeji u vzorku jsou pouze dílem náhody). Očekávané četnosti (Expected): E1= E2 = E3 = 420/3 = 140 Pozorované četnosti (Observed): O1= 135, O2 = 130, O3 = 155 Krok 2. Testové kritérium: k - počet kategorií (k = 3) Příklad – test nezávislosti - limonády Krok 3. Porovnání hodnoty vypočítaného kritéria CHIINV(0,05;2) = 6,0 s tabulkovou kritickou hodnotou rozdělení kde a ( = 0,05) je zadaná hladina významnosti V každé kategorii: Oi alespoň 5 ! Jestliže potom H0 nezamítáme! (jinak zamítáme) p-hodnota (signifikance) = 0,287 > 0,05 (Nezamítáme) Příklad – test nezávislosti – limonády – nové zadání – domácí úkol Nová limonáda se prodávala za stejnou cenu jeden týden ve fakultním bufetu ve 3 různých typech obalu: A, B, C, počet prodaných limonád viz tabulka: NOVÉ ZADÁNÍ: Ovlivňuje styl designu obalu počet prodaných limonád? Příklad – test dobré shody – barvy automobilů Automobil Škoda - Felicia se prodává ve čtyřech barvách: l40% zákazníků požaduje zelenou barvu automobilu l25% červenou barvu, l25% modrou barvu a l10% bílou barvu. K ověření správnosti předpokladu o struktuře poptávky podle barev použijte záznamy o nákupech v dané prodejně v jistém měsíci. Příklad – test dobré shody – barvy automobilů Vstupní údaje obsahuje následující tabulka: Na hladině významnosti a = 0,05 testujte hypotézu, že uvedené pravděpodobnostní odhady odpovídají zjištěným hodnotám prodejů. Příklad – test dobré shody – barvy automobilů Krok 1. Nulová hypotéza H0: Očekávané četnosti: E1= 192, E2 = 120, E3 = 120, E4= 48 Pozorované četnosti: O1= 201, O2 = 105, O3 = 144, O4 = 30 Krok 2. Testové kritérium: k - počet kategorií (k = 4) Příklad – test dobré shody – barvy automobilů Očekáv_čet_i = Pravděp_i ´ celk_čet Příklad: i = zelená, Pravděp_i = 0,40 , celk_čet = 480 E1 = Očekáv_čet_i = 0,4*480 = 192 atd. Příklad – test dobré shody – barvy automobilů Krok 3. Porovnání hodnoty vypočítaného kritéria s tabulkovou kritickou hodnotou rozdělení V každé kategorii: Oi je alespoň 5 ( >30) Platí proto H0 zamítáme! Alternativně: Sig =CHIDIST(13,85; 3) = 0,003 < 0,05 Testování nezávislosti kvalitativních znaků • • V jednom vzorku (výběru) můžeme současně sledovat dva nebo i více (kvalitativních) znaků Příklad: Při kontrole jakosti výrobku sledujeme přítomnost nebo nepřítomnost vady A (znak A), nebo přítomnost nebo nepřítomnost vady B (znak B). A i B nabývají pouze dvě alternativní hodnoty – kategorie: Ano, Ne (Přítomnost, Nepřítomnost, apod.). Testování nezávislosti kvalitativních znaků • • Uvažujte soubor se dvěma kvalitativními znaky A a B Znak A má r možných kategorií hodnot označených: znak B má s možných kategorií hodnot: Výsledek celého složeného experimentu lze shrnout do kontingenční tabulky: Závěr přednášky • • •Děkuji Vám za pozornost !!!