Analýza rozptylu (ANOVA) Analýza rozptylu s jedním faktorem (Jednoduché třídění) Tuto metodu použijeme, jestliže potřebujeme ověřit významnost rozdílu mezi výběrovými průměry většího počtu náhodných výběrů. Příklad 1. Na hladině významnosti 0,05 testujte, zda výnosy petržele závisí na použitém druhu hnojiva. Hnojivo Výnosy (1kg/10m^2) A 40 42 45 40 44 47 B 76 75 82 68 C 60 58 62 64 70 Řešení. Faktor typ hnojiva má 3 skupiny, tzn. k = 3, s následujícími četnostmi ve skupinách . Celkový počet měření n = 15. Testujeme nulovou hypotézu , tj., že výnosy petržele nezávisí na typu hnojiva. Před vypočtením testového kritéria musíme zjistit hodnoty následujících veličin: · Podmíněné průměry , pro , kde: jsou zjištěné hodnoty. · Celkový průměr , kde: n je celkový rozsah souboru. · Meziskupinový součet čtverců , kde: je počet měření v jednotlivých skupinách, je výběrový průměr v jednotlivých skupinách. · Vnitroskupinový součet čtverců . · Celkový součet čtverců . Pro ověření nulové hypotézy použijeme statistiku: , (*) která má při platnosti nulové hypotézy Fisherovo rozdělení . Kritická hodnota je , kde: je zvolená hladina významnosti. Kritický obor je dán intervalem . Výpočet Hodnoty výše uvedených veličin jsou: ANOVA tabulka Zdroj měnlivosti Součty čtverců odchylek Počty stupňů volnosti Průměrné čtverce Testové kritérium F Faktor x (meziskupinová variabilita) S[ym] k – 1 S[ym ]/(k – 1) (*) Reziduální (vnitroskupinová variabilita S[yv] n – k S[yv] / (n – k) Celkový S[y] n – 1 Zdroj měnlivosti Součty čtverců odchylek Počty stupňů volnosti Průměrné čtverce Testové kritérium F Faktor x (meziskupinová variabilita) 2654,85 k – 1 = 2 1327,42 71,25 Reziduální (vnitroskupinová variabilita 223,55 n – k = 12 18,63 Celkový 2878,4 n – 1 = 14 Hodnota statistiky (*) , kritická hodnota , kritický obor je . Hodnota F leží v kritickém oboru, proto zamítáme na hladině významnosti 5% nulovou hypotézu. Výnosy petržele závisí na zvoleném typu hnojiva. Příklad 2. Pomocí determinačního poměru zjistěte těsnost závislost výnosů petržele na použitém druhu hnojiva. Řešení. Na otázku „Jak silná je vazba mezi nezávislou nominální proměnnou (typ hnojiva) a proměnnou číselnou (výnosy petržele) ?“, odpovídá hodnota korelačního poměru. Korelační poměr , (**) kde: je meziskupinový součet čtverců, je celkový součet čtverců. Dosadíme-li do vztahu (**) dostaneme . Pokud hodnotu korelačního poměru umocníme, dostáváme poměr determinace . Hodnoty determinačního poměru blízké 1 svědčí o vysoké závislosti výnosů petržele na použitém typu hnojiva. Příklad 3. Na hladině významnosti 0,05 (0,01) testujte, zda názory respondentů na spokojenost s nakupováním v OD závisí na jejich příjmech. Řešení. Protože signifikantní hodnota je 0,00; což je menší než 0,05 (než 0,01); zamítáme nulovou hypotézu o nezávislosti příjmu a hodnocením spokojenosti s nakupováním v OD. Analýza rozptylu se dvěma faktory (Dvojné třídění) Příklad. Bylo vybráno 6 řidičů , z nichž každý absolvoval s každým typem benzínu jednu jízdu. Na hladině významnosti 0,05 testujte, je-li průměrná spotřeba paliva závislá na typu použitého benzínu a na tom, který řidič s vozem jel. Řidiči Typ benzínu A B C D E F Průměry Aral 7,5 6,9 7,9 7,3 6,9 7,8 7,38 Shell 7,6 7,2 7,5 8 7,3 8,2 7,63 Benzina 7,2 8,1 7,8 7,6 7,8 6,9 7,57 Slovnaft 7 7,3 7,2 7,5 8,2 7,7 7,48 Průměry 7,33 7,38 7,6 7,6 7,55 7,65 7,5 Řešení. Zkoumáme tedy závislost průměrné spotřeby (znak Y) na typu použitého benzínu (znak X1) a na řidiči (znak X2). (V tabulce jsou již doplněny podmíněné průměry a celkový průměr.) Znak X1 má skupiny, znak X2 má bloků. Pro faktor X1 formulujeme hypotézu: faktor X1 neúčinkuje, faktor X1 účinkuje; tj. průměrná spotřeba závisí na použitém druhu benzínu. Pro faktor X2 formulujeme hypotézu: faktor X2 neúčinkuje, faktor X2 účinkuje; tj. průměrná spotřeba závisí na řidiči, který s vozem jel. Výpočet jednotlivých součtů: Potřebujeme znát i hodnotu součtu , z praktického hlediska je však výhodnější vypočítat hodnotu součtu . Součet pak dopočteme ze vztahu . Po dosazení = 3,22. Testové kritérium pro 1. hypotézu: V tabulce kritických hodnot F-rozdělení najdeme . Protože 0,33 < 3,29 , nelze zamítnout , což znamená, že použitý typ benzínu nemá na průměrnou spotřebu vliv. Testové kritérium pro 2. hypotézu: V tabulce kritických hodnot F-rozdělení najdeme . Protože 0,34 < 2,9 , nelze zamítnout , což znamená, že volba řidiče nemá na průměrnou spotřebu vliv. Domácí úkol: Proveďte analýzu rozptylu u dvojného třídění. Faktor / Blok 1 2 A 7 13 B 36 44 C 2 18 Výsledek: Hodnota Y závisí na typu faktoru, ale nezávisí na typu bloku. (pro 0,05)