ANALÝZA ROZPTYLU – DVOJNÉ TŘÍDĚNÍ A LATINSKÉ ČTVERCE Vícefaktorová analýza •Jde o situaci, kdy se zkoumá, zda kvantitativní znak Y je ovlivňován dvěma nebo třemi faktory, opět ne nutně kvantitativními znaky. •Vícefaktorová analýza rozptylu má svůj experimentální plán. (experimentální plány – později). •Tento plán může být navržen efektivně tak, aby výsledky analýzy rozptylu byly přesvědčivé a přitom nebylo třeba mít k dispozici příliš mnoho údajů. •Jak přibývá faktorů, které slouží ke klasifikaci sledovaného znaku Y, zvyšuje se tím rychle i požadavek na objem dat. 3 Dvoufaktorová a vícefaktorová ANOVA •Techniky testů hypotéz o rozdílech mezi skupinami, kdy rozdíly způsobuje 2 nebo více faktorů •Příklad otázek, na které odpovídá VF ANOVA: •(Příklad - Má barva auta, resp. pohlaví respondentů vliv na pravděpodobnost prodeje auta? ) • - Která složka má větší vliv? • - Je celkový vliv součtem vlivů jednotlivých znaků posuzovaných odděleně? •Účinky jednotlivých znaků mohou být vzájemně nezávislé (bez interakce) nebo závislé (s interakcí) Dvojné třídění •Sleduje-li se vliv dvou faktorů, které mohou ovlivnit hodnotu sledovaného (kvantitativního) znaku Y, hovoříme o dvojném třídění. •Obdobně jako v případě jednoduchého třídění je možné pro různé kombinace těchto dvou faktorů provést náhodné výběry a na jejich základě pak testovat individuální vliv obou faktorů. •Kromě uvedených dvou faktorů je možno uvažovat jako samostatný faktor také jejich interakci. Podle toho se pak rozlišuje analýza rozptylu dvojné třídění s interakcemi nebo bez interakcí. •My - bez interakcí. Trojné třídění •Analogická tvrzení jako pro dvojné třídění platí také pro případ, kdy pracujeme se třemi „hlavními“ faktory – v tomto případě mluvíme o analýze rozptylu trojné třídění. •Můžeme zkoumat také jako speciální faktory všechny možné dvoučlenné interakce tří hlavních faktorů a také trojčlennou interakci tvořenou všemi třemi hlavními faktory. Vyvážené třídění •Vzhledem k časté náročnosti požadavku na objem dat v případě vícefaktorové analýzy rozptylu se omezujeme na případ, kdy pro danou kombinaci faktorů obsahuje příslušný náhodný výběr pouze jedno pozorování. •Hovoříme pak o analýze rozptylu s jedním pozorováním v každé podskupině. Tento případ také patří mezi případy vyváženého třídění. •Zatímco u jednofaktorové ANOVA vyvážené třídění není až tak zásadní požadavek, v případech vícefaktorové ANOVA hraje podstatně důležitější roli a doporučujeme jej v praxi dodržovat. Splnění tohoto požadavku obvykle v praxi ani nečiní žádné zvláštní problémy. Pokud tento požadavek splněn není, potom záleží na tom, jak jsou vícefaktorové ANOVA prováděny (mohou být totiž prováděny vícero způsoby) a každý z těchto postupů může dát obecně jiný závěr a mít jinou intepretaci. •V případě vyváženého třídění toto úskalí nenastává. Dvojné třídění •Je-li sledovaný znak ovlivňován dvěma faktory, hovoříme o dvojném třídění. •I v tomto případě dochází ke vhodnému rozkladu celkové variability znaku na dílčí zdroje variability. •Rozklad celkového součtu čtverců S se provede analogicky jako v případě jednoduchého třídění s tím rozdílem, že přibyde v rozkladu nový činitel odrážející vliv druhého faktoru. • •Vysvětlení na příkladu Příklad •Bylo vybráno 6 řidičů , z nichž každý absolvoval s každým typem benzínu jednu jízdu. Na hladině významnosti 0,05 testujte, je-li průměrná spotřeba paliva závislá na typu použitého benzínu a na tom, který řidič s vozem jel. • Řidiči Typ benzínu A B C D E F Průměry Aral 7,5 6,9 7,9 7,3 6,9 7,8 7,38 Shell 7,6 7,2 7,5 8 7,3 8,2 7,63 Benzina 7,2 8,1 7,8 7,6 7,8 6,9 7,57 Slovnaft 7 7,3 7,2 7,5 8,2 7,7 7,48 Průměry 7,33 7,38 7,6 7,6 7,55 7,65 7,5 Testy hypotéz Postup testování: Součty čtverců •Celkový součet čtverců: • •Meziskupinový součet čtverců: • •Meziblokový součet čtverců: • •Vnitroskupinový součet čtverců: • • •Základní vztah ANOVA pro 2 faktory: • • • Příklad: Součty čtverců Postup testování: Testové kritérium: •Testové kritérium pro 1. hypotézu: • • • • •Testové kritérium pro 2. hypotézu: Postup testování: Kritická hodnota a výsledek Příklad: Test 1 Příklad: Test 2 Příklad: Výstup Excel TROJNÉ TŘÍDĚNÍ (LATINSKÉ ČTVERCE) •Do analýzy rozptylu patří také speciální případ trojného třídění, tzv. latinské čtverce. •Latinské čtverce patří mezi klasické metody plánování experimentů (analýza rozptylu rovněž spadá do plánování experimentů). •Historicky pochází tento pojem z 18. století, kdy L. Euler (1707 – 1783) předložil petrohradské akademii úlohu o 36 důstojnících: •Sestavte 36 důstojníků 6 různých hodností ze 6 různých pluků do čtverce tak, aby v každé řadě a v každém sloupci byli důstojníci všech hodností a všech pluků. Zobecnění problému •Úkolem je sestavit n2 objektů do čtverce tak, aby v každé vodorovné řadě i v každé svislé řadě tohoto čtverce byly vždy objekty všech kategorií vlastnosti A a zároveň všech kategorií vlastnosti B (např. v první řadě stojí podporučík z pluku 6, poručík z pluku 5,..., plukovník z pluku 1). •Takovéto schéma objektů se nazývá latinský čtverec řádu n. • Známý výsledek, který pochází od samotného Eulera, říká, že pro každé přirozené číslo n existuje alespoň jeden latinský čtverec řádu n v uvedeném slova smyslu. Tři faktory •Představme si, že sledujeme vliv tří faktorů na znak Y. •Vzhledem k tomu, že jde o tři faktory, dosti obtížně se nám podaří reprezentovat takový experiment dvojrozměrnou tabulkou. •My: pro každou kombinaci úrovní sledovaných tří faktorů budeme realizovat jediné pozorování a takový experiment budeme reprezentovat dvojrozměrnou tabulkou, jejíž záhlaví bude obsahovat různé úrovně dvou faktorů a vnitřek tabulky bude obsahovat záznam úrovní třetího faktoru. •Tyto úrovně třetího faktoru budou přitom vepsány do tabulky tak, aby vznikl latinský čtverec. Příklad tabulky •Uvažujeme-li faktory A, B, C a hovoříme o latinském čtverci řádu n = 3, můžeme náš experiment zapsat například v podobě tabulky : • • • • •Jedna strana tohoto čtverce představuje tři úrovně faktoru A. •Druhá strana tabulky - sloupce reprezentují tři úrovně faktoru B. •Vnitřek tabulky obsahuje tři úrovně třetího faktoru C. • Návrh takového experimentu čteme tak, že když je faktor A na první úrovni, faktor B je na první a faktor C je rovněž na první úrovni (to je prvek [1,1] tabulky), pak právě pro takovou kombinaci tří faktorů realizujeme jedno pozorování. •Výhoda: pracujeme s devíti údaji místo 27, přitom je tento návrh zvolen tak, aby výsledná analýza dávala věrohodné výsledky. • Součty čtverců Test •U analýzy rozptylu trojné třídění provádíme tři testy. Každý z nich se týká vlivu jednoho ze tří faktorů. •Testovaná hypotéza H0: daný faktor není významný. Alternativní hypotéza H1: negace H0 . •Testová kritéria pro testování vlivu faktorů A, B, C : Test: výsledek Příklad •Uvažujme případ, kdy sledujeme množství emisí výfukových plynů Y v závislosti na těchto třech faktorech: •Faktor 1 = typ přísady do benzinu (A, B, C, D), •Faktor 2 = řidič vozidla (I, II, III, IV), •Faktor 3 = použité vozidlo (1, 2, 3, 4). •Výsledky experimentu: Příklad: příprava •Testujeme potenciální vliv jednotlivých faktorů na Y na pětiprocentní hladině významnosti. Příklad: Součty čtverců Příklad: Test •H0: daný faktor není významný. • H1: negace H0 •Testová kritéria • • • • • • •Kritická hodnota je ve všech třech případech stejná: K = FINV(0,05,3,6) = 4,757. •Závěr testů: faktory 1 a 2 jsou statisticky významné, pokud jde o jejich vliv na znak Y, třetí faktor, tj. typ použitého vozidla, neovlivně znak Y. Děkuji za pozornost.