Statistika 1 VIII. Intervaly spolehlivosti Statistika 2 Princip bodového a intervalového odhadu lPříklad: Odhadněte velikost průměrné hodnoty nákupů m u zákazníků hypermarketu TESCO Ka v roce 2012 l s pravděpodobností 95%. Je náhodně vybrán vzorek 64 zákazníků: vypočítán průměr = 450 Kč a je známa směrodatná odchylka: σ = 128 Kč. Statistika 3 Řešení: lPrůměrnou velkost nákupů populačního souboru (všech) zákazníků TESCO Ka v r. 2012 odhadneme jako interval [L,P]: l L - levý krajní bod, P - pravý krajní bod. Střed intervalu stanovíme jako . Hledaný interval: l L = - D , P = + D l Přitom l l lkde n = 64, σ = 128, tj. l lHledaný interval: [L,P] = [450-31,450+31] = [419,481], tedy: l Neznámý populační průměr m leží v intervalu spolehlivosti l [419,481] s pravděpodobností 95 procent („téměř jistota“) 1,96 je 2,5% krit. hodn. N(0,1) V Excelu: =NORMSINV(0,975)=1,9599 Statistika 4 Interval spolehlivosti střední hodnoty = 450 Kč - bodový odhad m [419, 481] - 95% - ní interval spolehlivosti m 2,5% Statistika 5 Dvoustranný a jednostranné intervalové odhady Levostranný IS Pravostranný IS Dvoustranný IS α/2 α Statistika 6 Výpočet intervalů spolehlivosti pro m (1) lUvažujeme PNV rozsahu n z X s parametry střední hodnoty m a rozptylu s 2, které neznáme lUvažujeme statistiku: l l kde l Statistika 7 Výpočet intervalů spolehlivosti pro m (2) lT má Studentovo rozdělení t l s df = n-1 stupni volnosti l (degree of freedom) lStanovíme kritické hodnoty rozdělení t: - dvojstranný IS } - jednostranné IS Statistika 8 Studentovo rozdělení t graf hustoty pro df=1, df=5 Statistika 9 Studentovo rozdělení t Tabulka kritických hodnot Statistika 10 Studentovo rozdělení t Graf hustoty a kritické hodnoty 0,025 0,025 Excel: TINV(0,05;4)=2,776 Statistika 11 Normální rozdělení N(0,1) Tabulka kritických hodnot Excel: NORMSINV(0,5+0,39435) = 1,25 0,5 Důležité kritické hodnoty normovaného normálního N(0,1) a studentova rozdělení t Statistika 12 Funkce Excel a=0,10 a=0,05 a=0,01 df NORMSINV(1-a/2) 1,64 1,96 2,58 2,015 2,571 4,032 df=5 TINV(a,df) 1,812 2,228 3,169 df=10 1,697 2,042 2,750 df=30 Statistika 13 Výpočet intervalů spolehlivosti pro m (3) Levostr. IS Oboustranný IS Pravostr. IS - krit. hodnota Studentova t-rozdělení Statistika 14 Výpočet intervalů spolehlivosti pro m (4) lPoznámky: • Pro n >30 můžeme namísto použít ! (tj. krit. hodnoty normovaného normálního rozdělení) • Pro n < 30 předpokládáme normálně rozdělenou veličinu X, jinak výsledky neplatí! Statistika 15 Příklad 1. Průměrná spotřeba benzínu Excel: TINV(0,05;11) = 2,200 6,92-2,20*1,04/3,46 = 6,26 Bodový odhad: = 6,92 - 99% IS - 95% IS - 90% IS Statistika 16 Příklad 1: 0,025 0,025 Excel: TINV(0,05;11)=2,200 6,92 – 2,2*1,04/3,46 6,92 6,92 + 2,2*1,04/3,46 df=11 =6,26 =7,58 0,95 α = 0,05 ž Statistika 17 Příklad 2. Průměrná hodnota nákupů oboustranný IS - 99% PrIS - 95% PrIS - 90% PrIS = 318,88 0,95 226,17 Statistika 18 Stanovení rozsahu vzorku 1 lRozsah vzorku - počet stat. jednotek ve výběrovém souboru lAbsolutní chyba odhadu D - polovina šířky IS lRelativní chyba odhadu d (vztažena k průměru) je l d = [´100 v %] l Statistika 19 Stanovení rozsahu vzorku 2 lNásledující úloha je z praktického pohledu velmi důležitá! lPotřebujeme znát rozsah vzorku pro předem zadanou chybu D lZe vzorce pro IS lze snadno vypočítat rozsah náhodného výběru nR : l Statistika 20 Stanovení rozsahu vzorku 3 lAnalogicky vypočítáme rozsah náhodného výběru nR l (počet hodnot vzorku) pro předem zadanou relativní chybu d l (např. d = 0,03 tj. 3 %) ® do vztahu (*) dosadíme l l (*) Statistika 21 Příklad 4. Rozsah vzorku lUvažujme úvodní příklad l (s hodnotami nákupů): l1. Jak velký vzorek bychom měli uvažovat, abychom se dopustili při odhadu střední hodnoty chyby maximálně 20 Kč (na hladině významnosti 5%) l2. Kolik zákazníků bychom měli uvažovat, abychom se dopustili relativní chyby 10% (na hladině významnosti 5%)? Statistika 22 Příklad 4. Rozsah vzorku - řešení l(ad 1) Vypočteme l® alespoň 158 l l(ad 2) = 0,1.450 = 45 l l ® alespoň 32 Statistika 23 Interval spolehlivosti pro parametr s2 lBodovým odhadem rozptylu s2 je výběrový rozptyl S2 lX - normálně rozdělená NV l Statistika 24 Interval spolehlivosti pro parametr s2 lStatistika l má Chi-kvadrát rozdělení c2(n-1) l s df = n-1 stupni volnosti loboustranný interval spolehlivosti: l l s2 Î l Statistika 25 Příklad 5. IS rozptylu měření velikostí lNa základě 25 nezávislých měření velikosti vyrobených součástek byl zjištěn výběrový rozptyl 36 mm. Sestrojte 95%-ní interval spolehlivosti pro odhad rozptylu délek všech součástek, za předpokladu normálního rozdělení základního souboru la = 0,05 , n = 25 l ls2 Î [ ] = [21,9 ; 69,7] s Î [4,68 ; 8,35] Statistika 26 Chi-kvadrát rozdělení Tabulka kritických hodnot Statistika 27 Chi-kvadrát rozdělení X2 Graf hustoty a kritická hodnota a = 0.90 4.17 Statistika 28 Shrnutí •Princip intervalového odhadu střední hodnoty a rozptylu •Studentovo t-rozdělení pravděpodobnosti versus Normované normální rozdělení •Jednostranné a dvoustranné intervaly spolehlivosti v konkrétních úlohách •Stanovení rozsahu náhodně vybraného vzorku při zadané přesnosti odhadu •Dvoustranné intervaly spol. pro rozptyl •Chi-kvadrát rozdělení pravděpodobnosti