STATISTIKA . 10. PŘEDNÁŠKA Téma přednášky: testování nezávislosti kvalitativních znaků Mgr. Radmila Krkošková, Ph.D. Testování nezávislosti kvalitativních znaků • • V jednom vzorku (výběru) můžeme současně sledovat dva nebo i více (kvalitativních) znaků Příklad: Při kontrole jakosti výrobku sledujeme přítomnost nebo nepřítomnost vady A (znak A), nebo přítomnost nebo nepřítomnost vady B (znak B). A i B nabývají pouze dvě alternativní hodnoty – kategorie: Ano, Ne (Přítomnost, Nepřítomnost, apod.). Testování nezávislosti kvalitativních znaků • • Uvažujte soubor se dvěma kvalitativními znaky A a B Znak A má r možných kategorií hodnot označených: znak B má s možných kategorií hodnot: Výsledek celého složeného experimentu lze shrnout do kontingenční tabulky: Testování nezávislosti kvalitativních znaků • • Kategorie znaku A / B B1 B2 B3 ................. Bs Součet A1 n11 n12 n13 .................. n1s n1. A2 n21 n22 n23 .................. n2s n2. A3 n31 n32 n33 .................. n3s n3. ............ ..... .... .... .................. ....... ................ Ar nr1 nr2 nr3 .................. nrs nr. Součet n.1 n.2 n.3 .................. n.s n Testování nezávislosti kvalitativních znaků Čtyřpolní kontingenční tabulka • • Vzhled / Hmotnost výrobků Vyhovující hmotnost Nevyhovujícíhmotnost Součet- Marg. četnost Vyhovující vzhled 239 60 299 Nevyhovující vzhled 14 7 21 Součet - Marg. četnost 253 67 320 Testování nezávislosti kvalitativních znaků • • Krok 1. Nulová hypotéza H0: Vzhled výrobku nezávisí na hmotnosti (rozdíly u vzorku jsou pouze dílem náhody). Očekávané četnosti: E11= 253*299/320 = 236,4 E21= 253*21/320 = 16,6 E12= 67*299/320 = 62,6 E22= 67*21/320 = 4,4 Pozorované četnosti: O11= 239, O12 = 14, O21 = 60, O22 = 7 Krok 2. Testové kritérium X2: df =(r-1)(s-1) počet stupňů volnosti ( k = (2-1)(2-1)=1) Testování nezávislosti kvalitativních znaků • • Očekáv_č_i,j = Marg_č_i ´ Marg_č_j / celk_č Příklad: i = 1: Hmotnost-Nevyhovující j = 2 : Vzhled-Vyhovující celk_č = 320 E12 = Očekáv_č_1,2 = 299*67/320 = 62,6 atd. Testování nezávislosti kvalitativních znaků • • Krok 3. Porovnání hodnoty vypočítaného kritéria s tabulkovou kritickou hodnotou rozdělení, kde a = 0,10 je zadaná hladina významnosti. V každé kategorii má být alespoň 5 hodnot! Jestliže potom H0 nezamítáme! Alternativně: Pro hodnotu X2 zjistíme p-hodnotu (tj. signifikanci - - má být menší než 0,1) p = CHIDIST(2,1;1) = 0,147 - tedy H0 nezamítáme! Čtyřpolní tabulka – kontingenční tabulka 2 x 2: Znak2 Součet Znak1 h1 h2 h1 A B A+B h2 C D C+D Součet A+C B+D n l l l l Kritérium: Jestliže , pak H0 zamítáme, jinak ji nezámítáme! Příklad: VZHLED X HMOTNOST • • A = 239, B = 60, C = 14, D = 7 = 2,1 Vliv kouření na úmrtnost v Karviné • • Kontingenční tabulka pro 2917 zemřelých v Karviné Kouření versus Počet zemřelých na rakovinu plic Analyzujte, zda kouření respondentů ovlivnilo úmrtnost na rakovinu plic (RP). Použijte Chi-kvadrát test. Vliv kouření na úmrtnost v Karviné • • Vliv kouření na úmrtnost v Karviné Nulovou hypotézu o nezávislosti znaků zamítáme! (Úmrtnost na rakovinu plic závisí na kouření respondentů) = 11,54 Závěr přednášky • • •Děkuji Vám za pozornost !!!