Statistika 1 XII. Metody stanovení závislosti: Regresní analýza Statistika 2 Jaké a k čemu jsou metody stanovení závislosti lzávislostí 1. kvantitativního znaku na 2. kvantitativním znaku (nebo více kvantitativních znacích) - regresní a korelační analýza lzávislost dvou znaků - jednoduchá regresní analýza (jednoduchá korelační analýza) lzávislost znaku na více znacích - vícenásobná regresní analýza lznalost závislostí umožňuje: l předvídat chování (prognózovat, predikovat) závislé veličiny Statistika 3 Příklad 1. Zisk z reklamy 1 nezávíslá - závislá veličina (proměnná) Statistika 4 Jednoduché regresní modely y = f(x) + e Lineární regresní funkce: regresní funkce nezávisle proměnná Parabolická regresní funkce : Exponenciální a logaritmická regresní funkce : závisle proměnná reziduum Statistika 5 Jednoduchá lineární regrese (JLR) lvýběr párových hodnot: l (y1, x1), (y2, x2), (y3, x3),...,(yn, xn) l2 způsoby získání dat: l(A) hodnoty nezávisle proměnné xi se předem pevně zvolí a k nim se „změří“ příslušné hodnoty yi l(B) hodnoty (yi, xi) se „změří“ na n náhodně zvolených jednotkách základního souboru lsoubor párových hodnot se geometricky znázorní v rovině bodovým grafem: reziduum l lJLR model: i = 1,2,...,n l l regresní koeficienty a jejich odhady b0, b1 Statistika 6 Příklad 1. Zisk z reklamy Statistické zpracování dat 7 Příklad 2: Výdaje na reklamu JRA Statistické zpracování dat 8 Příklad 2: Grafické znázornění Statistické zpracování dat 9 Bodový diagram (Scatter diagram) Statistika 10 Metoda nejmenších čtverců MNČ lIdea MNČ: minimalizovat reziduální součet čtverců: l SR = l Yi lPříklad 1:(pokračování) l Regresní funkce: Statistika 11 Příklad 1: „Ruční výpočty“ Statistika 12 Předpoklady (klasického) lineárního modelu l l1. Hodnoty vysvětlující proměnné xi se volí předem, nejsou to tedy náhodné veličiny. l2. Náhodné složky (rezidua) ei mají normální rozdělení pravděpodobnosti se střední hodnotou 0 a (neznámým) konstantním rozptylem s2 - tzv. homoskedasticita l3. Náhodné složky jsou nekorelované, tj. l r(ei , ej) = 0 pro každé i ¹ j , i,j = 1,2,...,n. (r - korelační koeficient) l Statistika 13 Předpoklady (klasického) lineárního modelu Statistika 14 Koeficient determinace R2 lKoeficient determinace (KD) charakterizuje přiléhavost dat k regresnímu modelu l (číslo mezi 0 a 1): l l • •- teoretický součet čtverců: Sy = SR + ST - •- reziduální součet čtverců •Pro malé soubory: Upravený KD Statistika 15 Příklad 1. Koeficient determinace lZávislost zisku z prodeje na velikosti nákladů na reklamu (viz Příklad 1): l l lKoeficient korelace („odmocnina KD“) lR = 0,979 Radj = 0,979 Statistika 16 Trendová funkce v časové řadě lHodnotami nezávisle proměnné jsou ekvidistantní (tj. stejně vzdálené) časové okamžiky ti, i=1,2,…,n lSituace je častá v ekonomických aplikacích, kdy máme k dispozici tzv. časové řady ekonomických veličin, např. tržby v jednotlivých měsících, HDP v jednotlivých za sebou jdoucích rocích apod. lLineární trendová (regresní) funkce: Statistika 17 Transformace časové osy v časové řadě lZavedení nové časové proměnné t´ následujícím způsobem: l je-li počet členů časové řady n lichý l l l je-li počet členů časové řady n sudý l lJednodušší odhad regresních koeficientů – MNČ: Statistika 18 Příklad 2. „ Časová řada “ Výrobu horských kol typu Superba / v tis. ks / udává následující tabulka: Rok 2005 2006 2007 2008 2009 2010 2011 Výroba 22,3 22,0 22,3 ??? 21,3 21,4 21,1 a) Chybějící údaj za rok 2008 doplňte průměrem hodnot sousedních roků 2007 a 2009 a doplněnou časovou řadu schématicky načrtněte. b) Z náčrtu odhadněte správný model trendu této časové řady, pak metodou regresní analýzy vypočtěte odhady neznámých regresních koeficientů. c) Pomocí modelu z b) prognózujte velikost výroby v r. 2012 a 2013. d) Vypočtěte koeficient determinace a na jeho základě slovně zhodnoťte„přiléhavost“ dat k regresnímu modelu. Statistika 19 Příklad 2. „Časová řada - výpočty“ V Excelu: Bodový graf ® Přidat spojnici trendu (lineární, rovnice regrese…) Statistika 20 Linearizované regresní funkce lregresní exponenciální funkce (např. Cobb-Douglasova produkční funkce ): l lSubstituce: l l lMNČ vypočteme odhady: l lZpětná substituce: l (odhady b0, b1 ) Statistika 21 Korelační analýza (KA) lV KA není předem známo, které jsou vysvětlující l a které vysvětlované proměnné! lPříklad: Závislost tržeb za zboží X na tržbách zboží Y l lOboustranný vztah - 2 regresní přímky: l l lKorelační koeficient: l lOdhad r : Statistika 22 Příklad 3. Výsledky testů 10 studentů 1. ročníku OPF l l l l lr > 0,6 – „vysoká“ hodnota korelace! l Počet bodů z matematiky 56 79 50 84 63 91 46 56 74 76 Počet bodů z ekonomie 82 56 46 79 74 83 51 63 75 82