Statistické zpracování dat 8.přednáška Mgr. Radmila Krkošková, Ph.D. • •Vícenásobná lineární •regresní analýza (3) • Téma přednášky: 2 Obsah přednášky 3 Fiktivní proměnné Fiktivní proměnné 4 •Doposud vysvětlující (nezávisle) proměnné: kvantitativní (číselné) Příklady: cena, příjem, náklady, výdaje na reklamu, hmotnost, teplota, vzdálenost aj. Fiktivní proměnné 5 •Nyní vysvětlující (nezávisle) proměnné: kvalitativní (kategoriální, binární) – fiktivní (dummy) proměnné Příklady: pohlaví (M,Ž), národnost (CZ, SK), vzdělání (Z, SŠ, VŠ) Obvykle se kódují binárně: 0 nebo 1 Příklad - zadání 6 Lze řešit též pomocí ANOVA (1 faktor)! Zjistěte, zda má vzdělání (VŠ,SŠ) vliv na nástupní plat. Data: Regresní model: Yi = B0 + B1Di + ui Příklad – řešení v Excelu 7 Řešení v Excelu: Nástroje ® Analýza dat ® Regrese: Y^ = 12,96 + 3,28D b0 - prům.plat SŠ b1- nárůst b0 +b1 - prům.plat VŠ Fiktivní proměnné 8 Regrese s jednou kvantitativní a jednou kvalitativní (binární) proměnnou se dvěma hodnotami Vysvětlující proměnné jak kvantitativní tak kvalitativní Yi = B0 + B1Di + B2Xi + ui Fiktivní proměnné 9 Yi = B0 + B1Di + B2Xi + ui Příklad: Závislost platu VŠ učitele na délce praxe a pohlaví Yi = měsíční plat VŠ učitele Xi = počet let praxe Di = 1 jestliže M, 0 jestliže Ž 10 X Y Y = b0 + b1X + b2D Ženy: Y = b0 + b1X Muži: Y = b0 + b2 + b1X b0 b2 Fiktivní proměnné 11 Regrese s jednou kvantitativní a jednou kvalitativní proměnnou s více hodnotami Kvalitativní proměnná nabývá 3 (nebo i více) hodnot: Yi = B0 + B1D1i + B2D2i + B3Xi + ui Fiktivní proměnné 12 Yi = B0 + B1D1i + B2D2i + B3Xi + ui Příklad: Závislost výdajů rodiny na letní dovolenou na příjmech a vzdělání otce (VŠ, SŠ, Z) Fiktivní proměnné 13 Yi = B0 + B1D1i + B2D2i + B3Xi + ui Yi = výdaje rodiny na letní dovolenou Xi = roční příjem rodiny D1i = 1 jestliže SŠ, 0 jinak D2i = 1 jestliže VŠ, 0 jinak Fiktivní proměnné 14 Yi = B0 + B1D1i + B2D2i + B3Xi + ui 15 X Y Y = b0 + b1D1 + b2D2 + b3X Z: Y = b0 + b3X SŠ: Y = b0 + b1 + b3X b0 b1 VŠ: Y = b0 + b2 + b3X b2 • • Kvalitativní proměnná s K hodnotami 16 Z – kvalitativní proměnná s hodnotami z1, z2, … , zK-1, zK Lze ji nahradit k – 1 binárními (fiktivními) proměnnými: • Kvalitativní proměnná s K hodnotami 17 Lze ji nahradit k – 1 binárními (fiktivními) proměnnými: •D2 = 1 jestliže Z = z2 = 0 jinak •D3 = 1 jestliže Z = z3 = 0 jinak …… •DK = 1 jestliže Z = zK = 0 jinak • • Regrese s proměnlivým sklonem 18 •Kvalitativní (fiktivní) proměnné neovlivňují sklony v regresních modelech (rovnicích) • •Příklad: ve 2 obdobích (kvalitativní proměnná) může mít regresní přímka různý sklon • • Regrese s proměnlivým sklonem 19 •Příklad: ve 2 obdobích (kvalitativní proměnná) může mít regresní přímka různý sklon Yt = B0 + B1Xt + B2Dt + B3XtDt + ut Yt = celkové úspory Xt = celkové příjmy Dt = 1 jestliže t je z prvního období, 0 - jinak Příklad – zadání 20 Yt = B0 + B1Xt + B2Dt + B3XtDt + ut Zt Příklad - výsledek 21 D = 1: Yt = (b0 + b2) + (b1 + b3)Xt D = 0: Yt = b0 + b1Xt 22 X- příjmy Y - úspory D=1 D=0 Y = 0,05X + 21,5 Y = -0,04X + 264,9 23 Shrnutí: fiktivní proměnné •Vysvětlující (nezávisle) proměnné: kvalitativní fiktivní (dummy) proměnné • •Kvalitativní hodnoty se kódují binárně s jednou nebo více bin. proměnnými • 24 Shrnutí: fiktivní proměnné •Kombinace více kvalitativních a kvantitativních nezávisle proměnných •Fiktivními proměnnými lze modelovat proměnlivost sklonu regresní přímky ve více časových obdobích (data jsou časové řady) • Opakování: 25 •Korelační analýza (párový korelační koeficient) • • • • Opakování: 26 •Náhodná složka (Durbin-Watsonův test autokorelace) • • • • • Párový korelační koeficient 27 Testování korelačního koeficientu 28 Durbin-Watsonův koeficient autokorelace 29 Durbin-Watsonova statistika 30 Závěr přednášky 31 Děkuji Vám za pozornost!!! • Durbin-Watsonova statistika 32 V případě nezávislosti náhodných poruch se D pohybuje okolo čísla 2. V případě přímé závislosti se D pohybuje kolem 0 a v případě nepřímé závislosti kolem 4.