Analýza rozptylu (ANOVA) Analýza rozptylu s jedním faktorem (Jednoduché třídění) Tuto metodu použijeme, jestliže potřebujeme ověřit významnost rozdílu mezi výběrovými průměry většího počtu náhodných výběrů. Příklad 1. Testujeme tři automobily stejné značky pro závod do vrchu. Vlivem nestejných podmínek (různí řidiči, povrch vozovky, atd.) se naměřené časy liší. Naším úkolem je zjistit, zda rozdíly v různých průměrných časech při opakovaných jízdách jsou způsobeny rozdílnou kvalitou automobilů nebo je lze přičíst na vrub náhodným vlivům. A) Test proveďte na hladině významnosti alfa = 0,05. B) Test proveďte na hladině významnosti alfa = 0,01. Automobil Doba jízdy (min.) A 5,3 5,2 5,4 4,9 B 5,9 5,8 5,7 C 5,2 4,2 5,1 5,2 Řešení. Faktor typ automobilu má 3 skupiny, tzn. k = 3, s následujícími četnostmi ve skupinách . Celkový počet měření n = …... Testujeme nulovou hypotézu , tj., že doba jízdy nezávisí na automobilu. Před vypočtením testového kritéria musíme zjistit hodnoty následujících veličin: · Podmíněné průměry , pro , kde: jsou zjištěné hodnoty. · Celkový průměr , kde: n je celkový rozsah souboru. · Meziskupinový součet čtverců , kde: je počet měření v jednotlivých skupinách, je výběrový průměr v jednotlivých skupinách. · Vnitroskupinový součet čtverců . · Celkový součet čtverců . Pro ověření nulové hypotézy použijeme statistiku: , (*) která má při platnosti nulové hypotézy Fisherovo rozdělení . Kritická hodnota je , kde: je zvolená hladina významnosti. Kritický obor je dán intervalem . Výpočet Hodnoty výše uvedených veličin jsou: Testové kritérium F = A) Kritická hodnota z tabulek Závěr: B) Kritická hodnota z tabulek Závěr: ANOVA tabulka Zdroj měnlivosti Součty čtverců odchylek Počty stupňů volnosti Průměrné čtverce Testové kritérium F Faktor x (meziskupinová variabilita) S[ym] k – 1 S[ym ]/(k – 1) (*) Reziduální (vnitroskupinová variabilita S[yv] n – k S[yv] / (n – k) Celkový S[y] n – 1 Zdroj měnlivosti Součty čtverců odchylek Počty stupňů volnosti Průměrné čtverce Testové kritérium F Mezi výběry (meziskupinová variabilita) 1,34 k – 1 = 2 0,67 6,1 Všechny výběry (vnitroskupinová variabilita) 0,86 n – k = 8 0,11 Celkový 2,2 n – 1 = 12 A) Hodnota statistiky (*) , kritická hodnota , kritický obor je . Hodnota F leží v kritickém oboru, proto zamítáme na hladině významnosti 5% nulovou hypotézu. Doba jízdy závisí na automobilu. B) Hodnota statistiky (*) , kritická hodnota , kritický obor je . Hodnota F leží v oboru přijetí, proto nelze zamítnout nulovou hypotézu. Na hladině významnosti 0,01 nebylo prokázáno, že by doba jízdy závisela na automobilu. Příklad 2. Pomocí determinačního poměru zjistěte těsnost závislosti doby jízdy na použitém automobilu. Řešení. Na otázku „Jak silná je vazba mezi nezávislou nominální proměnnou (typ automobilu) a proměnnou číselnou (doba jízdy) ?“, odpovídá hodnota korelačního poměru. Korelační poměr , (**) kde: je meziskupinový součet čtverců, je celkový součet čtverců. Dosadíme-li do vztahu (**) dostaneme . Pokud hodnotu korelačního poměru umocníme, dostáváme poměr determinace . Hodnoty determinačního poměru blízké 1 svědčí o vysoké závislosti kvantitativního znaku na kvalitativním znaku. Příklad 3. Na hladině významnosti 0,05 (0,01) testujte, zda názory respondentů na spokojenost s nakupováním v OD závisí na jejich příjmech. Řešení. Protože signifikantní hodnota je 0,00; což je menší než 0,05 (než 0,01); zamítáme nulovou hypotézu o nezávislosti příjmu a hodnocením spokojenosti s nakupováním v OD. Analýza rozptylu se dvěma faktory (Dvojné třídění) Příklad. Bylo vybráno 6 řidičů , z nichž každý absolvoval s každým typem benzínu jednu jízdu. Na hladině významnosti 0,05 testujte, je-li průměrná spotřeba paliva závislá na typu použitého benzínu a na tom, který řidič s vozem jel. Řidiči Typ benzínu A B C D E F Průměry Aral 7,5 6,9 7,9 7,3 6,9 7,8 7,38 Shell 7,6 7,2 7,5 8 7,3 8,2 7,63 Benzina 7,2 8,1 7,8 7,6 7,8 6,9 7,57 Slovnaft 7 7,3 7,2 7,5 8,2 7,7 7,48 Průměry 7,33 7,38 7,6 7,6 7,55 7,65 7,5 Řešení. Zkoumáme tedy závislost průměrné spotřeby (znak Y) na typu použitého benzínu (znak X1) a na řidiči (znak X2). (V tabulce jsou již doplněny podmíněné průměry a celkový průměr.) Znak X1 má skupiny, znak X2 má bloků. Pro faktor X1 formulujeme hypotézu: faktor X1 neúčinkuje, faktor X1 účinkuje; tj. průměrná spotřeba závisí na použitém druhu benzínu. Pro faktor X2 formulujeme hypotézu: faktor X2 neúčinkuje, faktor X2 účinkuje; tj. průměrná spotřeba závisí na řidiči, který s vozem jel. Výpočet jednotlivých součtů: Potřebujeme znát i hodnotu součtu , z praktického hlediska je však výhodnější vypočítat hodnotu součtu . Součet pak dopočteme ze vztahu . Po dosazení = 3,22. Testové kritérium pro 1. hypotézu: V tabulce kritických hodnot F-rozdělení najdeme . Protože 0,33 < 3,29 , nelze zamítnout , což znamená, že použitý typ benzínu nemá na průměrnou spotřebu vliv. Testové kritérium pro 2. hypotézu: V tabulce kritických hodnot F-rozdělení najdeme . Protože 0,34 < 2,9 , nelze zamítnout , což znamená, že volba řidiče nemá na průměrnou spotřebu vliv. Domácí úkol: Proveďte analýzu rozptylu u dvojného třídění. Faktor / Blok 1 2 A 7 13 B 36 44 C 2 18 Výsledek: Hodnota Y závisí na typu faktoru, ale nezávisí na typu bloku. (pro 0,05)