TESTOVÁNÍ HYPOTÉZ V MARKETINGU Mgr. Jiří Mazurek, Ph.D. Obecný postup testování • 1.Formulace hypotézy, 2.Výpočet testového kritéria 3.Nalezení kritické hodnoty pro zvolenou hladinu významnosti (vymezení oboru přijetí a kritického oboru) 4.Rozhodnutí o přijetí nebo zamítnutí hypotézy • Rozdělení statistických hypotéz •Statistické hypotézy tvoří jen část vědeckých (nebo alespoň odborných) hypotéz. Týkají se náhodných veličin a rozdělujeme je do dvou velkých tříd na: • Parametrické hypotézy: vztahují se k jednomu parametru nebo několika parametrům daného pravděpodobnostního rozdělení náhodné veličiny (neboli znaku populace). • Neparametrické hypotézy: netýkají se parametrů rozdělení náhodné veličiny, nýbrž jiných statistických vlastností, např. tvaru pravděpodobnostního rozdělení této veličiny (může nás třeba zajímat, zda lze chování náhodné veličiny modelovat binomickým rozdělením, normálním rozdělením apod.). Testované hypotézy •Zopakujme, že v každém statistickém testu vystupují proti sobě dvě hypotézy: •testovaná hypotéza (testované tvrzení), kterou nazýváme nulová hypotéza a značíme H0, • a alternativní hypotéza, značena H1. • • • H1 je obvykle logickou negací hypotézy H0. • •Příklad: H0 : V drogerii nakupují muži stejně často jako ženy. • H1 : Není pravda, že v drogerii nakupují muži stejně často jako ženy. Testování hypotézy •Při testování hypotézy máme k dispozici především výsledek náhodného výběru. Na základě výběrových dat máme nyní rozhodnout, zda testovanou hypotézu přijmout nebo zamítnout. •Další postup: •Počítáme tzv. testové kritérium T jakožto funkci dat, která jsme získali náhodným výběrem, a dále vymezujeme na reálné ose podmnožinu zvanou kritický obor. •Padne-li hodnota testového kritéria T pro získaný vzorek dat do kritického oboru, zamítneme testovanou, tj. nulovou hypotézu. •Naopak, padne-li hodnota testového kritéria mimo kritický obor, testovanou hypotézu přijímáme. •Kritický obor vymezuje obvykle reálné číslo zvané kritická hodnota K (kritický obor lze vymezit také kvantilem). Tato kritická hodnota se hledá buďto ve statistických tabulkách nebo se počítá s využitím vhodného softwaru (často např. Excelu). Poznámka •Přijetí statistické hypotézy není matematickým důkazem platnosti testovaného tvrzení! • Testování hypotéz nemusí vždy vést ke správným rozhodnutím, což je přirozené, neboť jde o náhodný proces využívající omezené informace náhodného výběru. •Nejistota závěru statistického testu souvisí mimo jiné s tzv. hladinou významnosti , kterou si statistik stanovuje při provádění statistického testu hypotézy. •Zdůrazněme opět, že základem statistického testování je náhodnost výběru, která souvisí s tím, zda vybraná data byla vybrána nezávisle na sobě. Tuto skutečnost lze rovněž testovat, Obecný postup testování Závěr testu Věrohodnost testu •Protože rozhodnutí přijmout nebo zamítnout hypotézu závisí na omezené informaci obsažené ve vzorku dat, můžeme se při testování dopustit chyb dvojího druhu: •Zamítneme nulovou hypotézu, která ve skutečnosti platí. Tím se dopustíme chyby prvního druhu. Pravděpodobnost chyby prvního druhu se značí α a nazývá se hladina významnosti. •Přijmeme nulovou hypotézu, která ve skutečnosti neplatí. Dopustíme se tak chyby druhého druhu. Pravděpodobnost chyby druhého druhu se značí β. Pravděpodobnost 1 – β se nazývá síla testu. Je to pravděpodobnost, že test povede k oprávněnému zamítnutí testované nulové hypotézy. •Hladina významnosti α se při testu volí obvykle 0,05, 0,01 nebo 0,1. • Alternativa – testování pomocí počítače Základní statistické testy • •(A) Jednovýběrový t-test. •(B) Dvouvýběrový t-test s rovností rozptylů. •(C) Dvouvýběrový t-test s nerovností rozptylů. •(D) Dvouvýběrový párový t-test. •(E) Dvouvýběrový F-test pro rovnost rozptylů. • (A) Test předpokladu o střední hodnotě základního souboru (Jednovýběrový t-test střední hodnoty) Postup testování Kritická hodnota - poznámky Příklad •Automat na plnění litrových lahví je podle výrobce seřízen tak, že střední hodnota objemu naplněných lahví je 1000 ml. Kontrola jakosti 25 naplněných lahví ukázala, že průměrný objem náplně byl 998 ml se směrodatnou odchylkou 5 ml. Je automat seřízený správně? Testujte na hladině významnosti 0,05, předpokládejte normální rozdělení základního souboru. Řešení příkladu (B) Test významnosti rozdílu mezi dvěma populačními průměry (Dvouvýběrový t-test s rovností rozptylů) Testování - Dvouvýběrový t-test s rovností rozptylů Test významnosti rozdílu mezi dvěma populačními průměry •Speciální případ testu když Příklad •Ve sportovním areálu jsou dva okruhy Y a Z, které vypadají stejně dlouhé. Závodník běžel šestkrát okruhem Y a pětkrát okruhem Z, naměřené časy v sekundách jsou v tabulce. Zjistěte, jestli je na hladině významnosti 0,05 čas oběhu okruhu Y stejný jako čas oběhu okruhu Z. Řešení příkladu (C) Test významnosti rozdílu mezi dvěma populačními průměry (Dvouvýběrový t-test s nerovností rozptylů) Testování – Dvouvýběrový t-test s nerovností rozptylů Test významnosti rozdílu mezi dvěma populačními průměry •Speciální případ testu když • Postup v EXCELu •V Excelu pro dvouvýběrový t-test s nerovností rozptylů můžete využít analytický nástroj Dvouvýběrový t-test s nerovností rozptylů a funkci TTEST, když indikátor typ nastavíte na 3. •Tento nástroj však vypočítá testové kritérium poněkud jinak, a to jako veličinu s t-rozdělením • • • •a s počtem stupňů volnosti Poznámka •Kritická hodnota, jejíž vzorec jsme vám ukázali, i výpočet pomocí programu Excel je jen aproximací. Tento test je přibližný a ztrácí hodně informací z naměřených hodnot. (D) Dvouvýběrový párový t-test Postup testování Příklad •V následující tabulce jsou data Y a Z, která určují přesnost zásahu šipkou 6 hráčů pravou a levou rukou. Zjistěte, jestli na hladině významnosti 0,05 je přesnost zásahu oběma rukama stejná, tedy že rozdíl v přesnosti je 0. Řešení (E) Dvouvýběrový F – test pro rozptyly Postup testování Příklad •Ve sportovním areálu jsou dva okruhy Y a Z, které vypadají stejně dlouhé. Závodník běžel šestkrát okruhem Y a pětkrát okruhem Z, naměřené časy v sekundách jsou v tabulce. Zjistěte, jestli je na hladině významnosti 0,05 rozptyl času oběhu okruhu Y stejný jako rozptyl času oběhu okruhu Z. Řešení příkladu Děkuji za pozornost.