Statistické zpracování dat 3.přednáška Mgr. Radmila Krkošková, Ph.D. • •Dvoufaktorová a vícefaktorová ANOVA • Téma přednášky: 2 •Techniky testů hypotéz o rozdílech mezi skupinami, kdy rozdíly způsobuje 2 nebo více faktorů •Příklad otázek, na které odpovídá 2F ANOVA: •- Má typ obalu nové limonády, resp. pohlaví respondentů vliv na uváděnou pravděpodobnost prodeje limonády? • - Která složka má větší vliv? • - Je celkový vliv součtem vlivů jednotlivých znaků posuzovaných odděleně? • 2Faktorová ANOVA 3 • •Účinky jednotlivých znaků mohou být: • a)vzájemně nezávislé (bez interakce), b)závislé (s interakcí) • ANOVA bez interakce, ANOVA s interakcí 4 •Předpoklad: Účinky jednotlivých znaků jsou vzájemně nezávislé, sčítají se •Každý respondent se nachází v právě jediné skupině tříděné podle 1. faktoru X1 a právě jediné skupině podle 2. faktoru X2 •Často se jedná o vyhodnocení experimentu, kdy se sleduje vliv dvou faktorů na daný znak, jeden faktor je ovlivnitelný výběrem hodnot • • 2-faktorová ANOVA bez interakce 5 • • 2 faktorová ANOVA - Příklad 6 Každý řidič jede s každým typem benzínu právě jedenkrát – bez opakování. • •Celkový součet čtverců: • •Meziskupinový součet čtverců: • •Meziblokový součet čtverců: • •Vnitroskupinový součet čtverců: • • 2-faktorová ANOVA: Součty čtverců 7 8 2-faktorová ANOVA: Součty čtverců •Základní vztah 2F ANOVA: • •Testová kritéria: •Data®Analýza dat ®ANOVA: Jeden faktor… Jednofaktorová ANOVA – příklad v Excelu 9 p-hodnota = 0,003 < 0,05 Þ faktor benzín má na spotřebu vliv •Data®Analýza dat ®ANOVA: Jeden faktor… Jednofaktorová ANOVA – příklad v Excelu 10 p-hodnota = 0,835 > 0,05 Þ faktor řidič nemá na spotřebu vliv •Data®Analýza dat ®ANOVA: Dva faktory bez opakování Dvoufaktorová ANOVA – 1. příklad v Excelu 11 •H0: faktor řidič nemá na spotřebu vliv •H1: faktor řidič má na spotřebu vliv •Výsledek: H0 nelze zamítnout • •H0: faktor benzín nemá na spotřebu vliv •H1: faktor benzín má na spotřebu vliv •Výsledek: H0 zamítáme • • • Dvoufaktorová ANOVA – 1. příklad v Excelu - výsledek 12 Za současného působení faktorů faktor řidiči nemá na spotřebu vliv, faktor benzín vliv má! • Data®Analýza dat ®ANOVA: Dva faktory s opakováním… • • • • Dvoufaktorová ANOVA – 2. příklad v Excelu 13 • • • • 14 • • • • Dvoufaktorová ANOVA – 2. příklad v Excelu - výsledek 15 Za současného působení mají oba faktory: řidiči a benzín na spotřebu vliv! • •Faktory: •X1 - Pohlaví (2 kategorie: Muž, Žena) •X2 - Typ vybrané odměny (2 kategorie: Peníze nebo Nápoje) • • •Znak: •Y - pravděpodobnost zakoupení nové limonády • (kvantitativní data) • • Nealko nápoje - studie 16 • • • Každá hodnota prvního faktoru se kombinuje s každou • • hodnotou druhého faktoru vícekrát (15x) – • • 2F ANOVA s opakováním • Nealko nápoje - studie 17 • Data®Analýza dat ® •ANOVA: Dva faktory s opakováním… Nealko nápoje - studie 18 Nealko nápoje – studie – výpočet v Excelu 19 Nealko nápoje – formulace hypotéz H0: výběr odměny nemá na pravděpodobnost nákupu vliv H1: „opak H0“ Výsledek: H0 zamítáme; typ odměny má na pravděpodobnost nákupu vliv H0: pohlaví nemá na pravděpodobnost nákupu vliv H1: „opak H0“ Výsledek: H0 nelze zamítnout; pohlaví nemá na pravděpodobnost nákupu vliv Obliba Coca Coly (2 faktory) - studie 21 Faktory: X1 – Pohlaví (2 kategorie: Muž, Žena) X2 – Vzdělání (7 kategorií: 1=Z,…,7=VŠ) Znak: Y – spokojenost s cenou nápoje (1=velmi nespokojen až 7=velmi spokojen) Obliba Coca Coly (2 faktory) - studie 22 Každá hodnota prvního faktoru se kombinuje s každou hodnotou druhého faktoru vícekrát (4x) – 2F ANOVA s opakováním Řešení úlohy v GRETLU (spotřeba vody) – zadání 23 Ve třech městech okresu Karviná jsme v jednotlivých dnech sledovali průměrnou spotřebu pitné vody (v m3) na jednoho obyvatele. Zjistěte, zda je průměrná spotřeba vody závislá na dni v týdnu, a je-li spotřeba v různých městech různá. Uvažujte hladinu významnosti 0,05. Zjištěné údaje jsou uvedeny v následující tabulce. Karviná Petřvald Bohumín Po 0,6 0,7 0,5 Út 0,7 0,6 0,6 St 0,9 0,8 0,7 Čt 0,6 0,6 0,5 Pá 1 1,3 0,8 So 1,2 1,6 1,3 Ne 1 1,2 1,3 Řešení úlohy v GRETLU – data 24 •Formulace první dvojice hypotéz: •H0: spotřeba pitné vody nezávisí na dnu v týdnu, •H1: spotřeba pitné vody závisí na dnu v týdnu. • •Formulace druhé dvojice hypotéz: •H0: spotřeba pitné vody nezávisí na městě, •H1: spotřeba pitné vody závisí na městě. • Řešení úlohy v GRETLU – formulace hypotéz 25 • • Řešení úlohy v GRETLU – zadání hodnot do programu 26 • Řešení úlohy v GRETLU – Testování první dvojice hypotéz. 27 Řešení úlohy v GRETLU – výsledek 28 Výsledek: p-hodnota = 4,42.10-5 a tato hodnota je menší než hladina významnosti 0,05, proto nulovou hypotézu o nezávislosti spotřeby pitné vody na dnu v týdnu zamítáme. Můžeme tedy tvrdit, že spotřeba pitné vody z 95 % závisí na dnu v týdnu. Řešení úlohy v GRETLU – Testování druhé dvojice hypotéz. 29 Řešení úlohy v GRETLU – výsledek 30 Výsledek: p-hodnota = 0,123 a tato hodnota není menší než hladina významnosti 0,05, proto nulovou hypotézu o nezávislosti spotřeby pitné vody na městě nelze zamítnout. Z 95 % nebylo prokázáno, že by spotřeba pitné vody závisela na městě. •ANOVA • 1-faktorová nebo 2-faktorová • je účinným analytickým nástrojem •při analýze kvalitativních/kvantitativních dat •získaných z dotazníkových šetření! • Shrnutí 31 •Děkuji Vám za pozornost!!! Závěr přednášky 32