Statistika
1
VIII. Intervaly spolehlivosti

Statistika
2
Princip bodového
a intervalového odhadu
lPříklad: Odhadněte velikost průměrné hodnoty nákupů m u zákazníků hypermarketu TESCO Ka v roce
2012
l s pravděpodobností 95%.                         Je náhodně vybrán vzorek 64 zákazníků:
vypočítán průměr       = 450 Kč                                  a je známa směrodatná odchylka:
          σ = 128 Kč.

Statistika
3
Řešení:
lPrůměrnou velkost nákupů populačního souboru (všech) zákazníků TESCO Ka v r. 2012 odhadneme jako
interval [L,P]:
l L - levý krajní bod, P - pravý krajní bod. Střed intervalu stanovíme jako    .      Hledaný
interval:
l L =      - D ,  P =       + D
l Přitom
l
l
lkde  n = 64, σ = 128, tj.
l
lHledaný interval: [L,P] = [450-31,450+31] = [419,481], tedy:
l Neznámý populační průměr m leží v intervalu spolehlivosti
l [419,481] s pravděpodobností 95 procent („téměř jistota“)
1,96 je 2,5% krit. hodn.     N(0,1)
V Excelu: =NORMSINV(0,975)=1,9599

Statistika
4
Interval spolehlivosti
střední hodnoty
           = 450 Kč  - bodový odhad m
[419, 481] - 95% - ní interval  spolehlivosti m

2,5%

Statistika
5
Dvoustranný a jednostranné      intervalové odhady
Levostranný IS
Pravostranný IS
Dvoustranný IS
α/2
α

Statistika
6
Výpočet intervalů spolehlivosti pro m
(1)
lUvažujeme PNV rozsahu n z  X s parametry střední hodnoty m a rozptylu s 2, které neznáme
lUvažujeme statistiku:
l
l kde
l

Statistika
7
Výpočet intervalů spolehlivosti pro m
(2)
lT má Studentovo rozdělení t
l s df = n-1 stupni volnosti
l (degree of freedom)
lStanovíme kritické hodnoty rozdělení t:
- dvojstranný IS
}     - jednostranné IS

Statistika
8
Studentovo rozdělení t
graf hustoty pro df=1, df=5

Statistika
9
Studentovo rozdělení t
Tabulka kritických hodnot

Statistika
10
Studentovo rozdělení t
Graf hustoty a kritické hodnoty
0,025
0,025
Excel: TINV(0,05;4)=2,776

Statistika
11
     Normální rozdělení N(0,1)
Tabulka kritických hodnot
Excel: NORMSINV(0,5+0,39435) = 1,25
0,5

Důležité kritické hodnoty          normovaného normálního N(0,1)
a studentova rozdělení t
Statistika
12
Funkce Excel
a=0,10
a=0,05
a=0,01
df
NORMSINV(1-a/2)

1,64
1,96
2,58

2,015
2,571
4,032
df=5
TINV(a,df)
1,812
2,228
3,169
df=10
1,697
2,042
2,750
df=30

Statistika
13
Výpočet intervalů spolehlivosti pro m
(3)
Levostr. IS
Oboustranný IS
Pravostr. IS
- krit. hodnota Studentova t-rozdělení

Statistika
14
Výpočet intervalů spolehlivosti pro m
(4)
lPoznámky:
• Pro  n >30 můžeme namísto        použít      !
(tj. krit. hodnoty normovaného normálního rozdělení)
• Pro  n < 30 předpokládáme normálně rozdělenou veličinu X, jinak výsledky neplatí!

Statistika
15
Příklad 1. Průměrná spotřeba benzínu

Excel: TINV(0,05;11) = 2,200
6,92-2,20*1,04/3,46 = 6,26
Bodový odhad:      = 6,92
-  99% IS
-  95% IS
-  90% IS

Statistika
16
Příklad 1:
0,025
0,025
Excel: TINV(0,05;11)=2,200
6,92 – 2,2*1,04/3,46     6,92             6,92 +
2,2*1,04/3,46
df=11
=6,26
=7,58
0,95
α = 0,05

ž

Statistika
17
Příklad 2. Průměrná hodnota nákupů oboustranný IS
-  99% PrIS
-  95% PrIS
-  90% PrIS
= 318,88
0,95
226,17

Statistika
18
Stanovení rozsahu vzorku 1
lRozsah vzorku - počet stat. jednotek ve výběrovém souboru
lAbsolutní chyba odhadu D - polovina šířky IS
lRelativní chyba odhadu d (vztažena k průměru)  je
l d =        [´100 v %]
l

Statistika
19
Stanovení rozsahu vzorku 2
lNásledující úloha je z praktického pohledu velmi důležitá!
lPotřebujeme znát rozsah vzorku pro předem zadanou chybu D
lZe vzorce pro IS lze snadno vypočítat rozsah náhodného výběru nR :
l

Statistika
20
Stanovení rozsahu vzorku 3
lAnalogicky vypočítáme rozsah náhodného výběru nR
l (počet hodnot vzorku) pro předem zadanou relativní chybu d
l (např. d = 0,03 tj. 3 %) ® do vztahu (*) dosadíme
l
l (*)

Statistika
21
Příklad 4. Rozsah vzorku
lUvažujme úvodní příklad
l (s hodnotami nákupů):
l1. Jak velký vzorek bychom měli uvažovat, abychom se dopustili při odhadu střední hodnoty chyby
maximálně 20 Kč          (na hladině významnosti 5%)
l2. Kolik zákazníků bychom měli uvažovat, abychom se dopustili relativní chyby 10% (na hladině
významnosti 5%)?

Statistika
22
Příklad 4. Rozsah vzorku - řešení
l(ad 1) Vypočteme
l® alespoň 158
l
l(ad 2)                 = 0,1.450 = 45
l
l ® alespoň 32

Statistika
23
Interval spolehlivosti
pro parametr s2
lBodovým odhadem rozptylu s2 je výběrový rozptyl S2
lX - normálně rozdělená NV
l

Statistika
24
Interval spolehlivosti
pro parametr s2
lStatistika
l má Chi-kvadrát rozdělení    c2(n-1)
l s df = n-1 stupni volnosti
loboustranný  interval spolehlivosti:
l
l                   s2 Î
l

Statistika
25
Příklad 5. IS rozptylu měření velikostí
lNa základě 25 nezávislých měření velikosti vyrobených součástek byl zjištěn výběrový rozptyl 36
mm. Sestrojte 95%-ní interval spolehlivosti pro odhad rozptylu délek všech součástek, za
předpokladu normálního rozdělení základního souboru
la = 0,05 , n = 25
l
ls2 Î  [                   ] = [21,9 ; 69,7]      s Î  [4,68 ; 8,35]

Statistika
26
         Chi-kvadrát rozdělení
        Tabulka kritických hodnot

Statistika
27
Chi-kvadrát rozdělení X2
 Graf hustoty a kritická hodnota
a = 0.90
4.17

Statistika
28
Shrnutí
•Princip  intervalového odhadu střední hodnoty a rozptylu
•Studentovo t-rozdělení pravděpodobnosti versus Normované normální rozdělení
•Jednostranné a dvoustranné intervaly spolehlivosti v konkrétních úlohách
•Stanovení rozsahu náhodně vybraného vzorku při zadané přesnosti odhadu
•Dvoustranné intervaly spol. pro rozptyl
•Chi-kvadrát rozdělení pravděpodobnosti