IV. Náhodná veličina Statistika Náhodná veličina… lNáhodná veličina (NV) = Číselný výsledek náhodného pokusu. lVýsledky - obecně různé vlivem náhodných činitelů mají různé pravděpodobnosti realizace lNáhodná veličina (NV) = odpovídá kvantitativnímu znaku populačního souboru (je jeho zobecněním) l Statistika Rozdělení (pravděpodobnosti) náhodné veličiny lRNV = Pravidlo (předpis), které každé číselné hodnotě nebo množině hodnot přiřazuje pravděpodobnost, že náhodná veličina nabude této hodnoty nebo hodnoty z tohoto intervalu Statistika Rozdělení náhodné veličiny lRozdělení pravděpodobnosti náhodné veličiny = úplné poznání NV: lstanovení hodnot, jichž může NV nabývat lznalost pravděpodobností, s nimiž NV nabývá určité hodnoty, nebo hodnoty z nějakého intervalu Statistika Náhodná veličina – Příklad 1 l lNV diskrétního typu: l1. Jistý hotel má 100 pokojů, počet obsazených pokojů je náhodná veličina X s možnými hodnotami x = 0,1,2,...,100 l 0 1 2 99 100 50 Statistika Náhodná veličina – Příklady l2. Roční mzda zaměstnanců podniku l - NV nabývá hodnoty 100 000 až 6000 000 Kč l l l l l3. Životnost výrobku (žárovky) je náhodná veličina X, která může (teoreticky) nabýt jakékoliv hodnoty x ³ 0 l 100 000 200 000 600 000 0 1 000 4 000 Statistika Náhodná veličina – Příklad 2 l l l l l l 100 000 200 000 600 000 300 000 PRST že roční mzda zaměstnance leží mezi 200 až 300 tis. Kč Statistika Způsoby vyjádření RNV l1. Pravděpodobnostní funkce l (typ diskrétní NV) l2. Hustota pravděpodobnosti l (typ spojité NV) l3. Distribuční funkce l (oba typy NV: diskrétní / spojitý) Statistika Pravděpodobnostní funkce l Pravděpodobnostní funkce (PF) - l p(x) – každé hodnotě x ÎD přiřazuje odpovídající pravděpodobnost: l p(x) = P(X = x) l PF p(x) splňuje vztahy: l l l lpravděpodobnost, že náhodná veličina nabude hodnoty z intervalu [a,b]ÌD, l je rovna součtu pravděpodobností hodnot l z tohoto intervalu l (D je množina diskrétních hodnot) l Statistika 10 Příklad další náhodné veličiny: „Kolo štěstí“ kolo stesti1 Statistika Statistika Příklad další náhodné veličiny: „Kolo štěstí“ l l Statistika Kolo štěstí – náhodná veličina xi - Sleva % ni - Četnost pi - Pr-st 12 12 0,12 14 25 0,25 15 24 0,24 16 17 0,17 20 15 0,15 30 3 0,03 50 1 0,01 70 1 0,01 80 1 0,01 100 1 0,01 Suma 100 1,00 Hustota pravděpodobnosti l lHP - f(x) - nezáporná funkce splňující podmínku: l l l l l lCelá plocha pod grafem funkce f(x) – nad osou x je rovna 1 Statistika Statistika Příklad funkce hustoty: lPrůměrná měsíční mzda zaměstnanců: NV nabývá hodnoty 100 až 600 tis. Kč l l l 100 000 200 000 600 000 f(x) ò f(x)dx = 1 +¥ -¥ Distribuční funkce l lDF - F(x) – je definovaná na R vztahem: l l lF(x) – je neklesající funkce splňující: l lim F(x) = 0 pro x®-¥ l lim F(x) = 1 pro x®+¥ Statistika Příklad distribuční funkce pro diskrétní NV: Hrací kostka F(x)=P(X£ x) – Pr-st, že NV X nabude hodnoty £ x Za x lze dosadit jakékoliv číslo! x 1/6 x x Statistika Distribuční funkce spojité NV 1. Neklesající spojitá funkce 2. Limity 0 a 1 pro x®±¥ Statistika Statistika Vztahy mezi Hustotou a Distribuční funkcí l l lMezi HP a DF platí následující vztahy: HP je derivací DF: l l l pro všechna x kde má DF derivaci lNaopak: DF náhodné veličiny je neurčitým integrálem (primitivní funkcí) k HP, tj. Charakteristiky náhodné veličiny (NV) lCharakteristiky polohy: l ♦ modus l ♦ medián l ♦ střední hodnota l ♦ kvantily lCharakteristiky variability: l ♦ rozptyl l ♦ směrodatná odchylka Statistika Charakteristiky polohy lRozdělení pravděpodobnosti náhodné veličiny (NV) = úplné poznání NV: l - stanovení hodnot, jichž může náhodná veličina nabývat, l - znalost pravděpodobností, s nimiž náhodná veličina nabývá určité hodnoty, nebo hodnoty z nějakého intervalu lCharakteristiky polohy (ChP) = informace o náhodné veličině koncentrovaná do jediného čísla, které veličinu „dobře“ charakterizuje (způsob výpočtu je jednoznačně definován) lAnalogie s ChP statistického souboru! Statistika Charakteristiky polohy - Modus lModus = Mod(X) NV X s rozdělením pravděpodobnosti dané FP p(x) (resp. FH f(x) ) l = hodnota Mod(X), pro kterou je p(x), resp. f(x) maximální l l Statistika Charakteristiky polohy - Kvantily lKvantil - hodnota rozdělující obor hodnot NV X v určitém poměru l100.p-procentní kvantil xp - nejmenší takové číslo, které splňuje současně nerovnosti: l l l l v případě spojité náhodné veličiny lze psát l F(xp) = P(X ≤ xp) = p Statistika Charakteristiky polohy - Medián, Kvartily, Decily l lNěkteré kvantily pro vybraná rozdělení pravděpodobnosti bývají tabelovány: lMedián Med(X) NV X je 50-procentní kvantil: l Med(X) = x0,5 lKvartil NV je 25-procentní kvantil (jsou 3: horní, dolní, prostřední je medián) l lDecil NV je 10-procentní kvantil (je jich 9, prostřední je medián) Statistika Medián, kvartily Dolní kvartil Horní kvartil Statistika Charakteristiky polohy - Střední hodnota lX - diskrétní náhodná veličina l p(x) - pravděpodobnostní funkce l střední hodnota E(X) - součet hodnot vynásobených jejich pravděpodobností: Statistika Charakteristiky polohy - Střední hodnota l X - spojitá náhodná veličina f(x) - funkce HP Střední hodnota - E(X) je určitý integrál z hodnot X násobených funkcí hustoty pravděpodobnosti f(x) : Statistika Charakteristiky polohy NV mohou být různé! Statistika Vlastnosti střední hodnoty: l 1. k - konstantní NV: E(k) = k l l 2. X - NV: E(k.X) = k.E(X) l l 3. Y - NV: E(X + Y) = E(X) + E(Y) l l 4. X a Y nezávislé NV: l E(X.Y) = E(X).E(Y) l Pro závislé NV neplatí!!! Statistika Charakteristiky variability - Rozptyl a Směrodatná odchylka lX - diskrétní náhodná veličina lp(x) - pravděpodobnostní funkce lrozptyl Var(X) - součet kvadrátů odchylek od SH vynásobených jejich pravděpodobností: l l l l l Statistika Charakteristiky variability - Rozptyl a Směrodatná odchylka lX - spojitá náhodná veličina lf(x) - funkce hustoty lrozptyl Var(X) - integrál kvadrátů odchylek od SH vynásobených jejich hustotou: l l lSměrodatná odchylka: Statistika Příklad 4: lPočet různých druhů zboží, které zákazník nakoupí při jedné návštěvě obchodního domu, je náhodná veličina X. lBylo zjištěno, že tato veličina nabývá hodnot: x = 0 1 2 3 4 5 6 lp(x) = 0,2 0,4 0,25 0,1 0,03 0,01 0,01 l lStřední hodnota počtu druhů zboží zakoupeného jedním zákazníkem l E(X) = 0*0,2+1*0,4+2*0,25+3*0,1+4*0,03 +5*0,01+6*0,01 = 1,43 Statistika Příklad 4 pokračování: l lPravděpodobnostní funkce p(x) nabývá maximální hodnotu 0,4 pro x = 1 : l Mod(X) = 1 lMedián: l p(X £ 1) = p(X=0) + p(X =1) = 0,2+0,4 = 0,6 ³ 0,5 l l p(X ³ 1) = p(X=1) + p(X=2) +…+ p(X=6) = 0,4+0,25+0,1+0,03+0,01+0,01 = 0,8 ³ 1 - 0,5 = 0,5 l Podle definice je medián: l Med(X) = 1 lVar (X) = 02.0,2+12.0,4+22.0,25+32.0,1+42.0,03+52.0,01+62.0,01 - 1,432 = 3,39 - 2,04 = 1,35 ls(x) = √1,35 = 1,16 Statistika x = 0 1 2 3 4 5 6 p(x) = 0,2 0,4 0,25 0,1 0,03 0,01 0,01 Příklad 5: l l l l l l l Hustota pravděpodobnosti náhodné veličiny X je dána funkcí l pro x ³ 1 l l = 0 pro x < 1 l l lSnadno se ověří, že platí : l l l Med(X) E(X) Mod(X)= Statistika Příklad 5: l lSvého maxima nabývá funkce hustoty zřejmě pro x = 1 Þ Mod(X) = 1 lVšechny tři charakteristiky jsou rozdílné! l l Statistika Funkce náhodné veličiny lX1, X2,…,Xn - NV l„Statistika“ - funkce náhodné veličiny: Y = f(X1, X2,…,Xn) - opět NV!!! lK nejdůležitějším statistikám patří: l- Výběrový průměr: l l- Výběrový rozptyl: l l- Výběrová směrodatná odchylka: Statistika Charakteristiky statistik lStřední hodnoty: E(Xi) = μ , Var(Xi) =σ2 l výběrového průměru : l l výběrového rozptylu S2 : l l výběrové směrodatné odchylky S : l l Statistika Charakteristiky statistik l lRozptyly: l výběrového průměru : l l výběrového rozptylu - neuvádíme (nebudeme využívat) l l Statistika