Statistické zpracování dat 3. prezentace Jednoduchá regresní analýza Mgr. Radmila Krkošková, Ph.D. •Problém závislosti 2 znaků řeší • jednoduchá regresní analýza (lineární a nelineární) •Příklad: Závislost zisku z prodeje výrobku na výdajích za reklamu •Východiskem je vždy grafické znázornění •Mírami závislosti jsou regresní koeficienty, resp. koeficienty determinace (a korelace) •Někdy je výhodné využít z kvantitativních dat pouze ordinální informaci (tj. uspořádání) a aplikovat ANOVA •Míry asociace mezi více znaky řeší vícenásobné regresní a korelační metody • Závislosti mezi kvantitativními statistickými znaky 2 • • Příklad – výdaje na reklamu 3 ANOVA JRA • • Příklad – grafické znázornění 4 •Východiskem je vždy grafické znázornění •Uspořádání bodů má tvar přímky • • regresní přímka: • • • regresní model: • •Cíl: nalezení nejlepších odhadů regresních koeficientů • • Jednoduchá (jednorozměrná) lineární RA 5 6 Bodový diagram (Scatter diagram) •(K. F. Gauss, 1777 – 1855) •Data – body: (x1,y1), (x2,y2),…,(xn,yn) •Odhady regresních koeficientů B0, B1: Metoda nejmenších čtverců 7 •Interpretace regresních koeficientů: • •b0 - úroveň kritéria y při nulové úrovni prediktoru x • •b1 - přírůstek kritéria y při jednotkovém přírůstku prediktoru x • Metoda nejmenších čtverců 8 • • • Přiléhavost dat k regresní křivce 9 • Teoretický součet čtverců: • • Yi - teoretické hodnoty („na regresní přímce“) • •Reziduální součet čtverců: • •Celkový součet čtverců: • •Platí vztah: Sy = ST + SR • • • • Přiléhavost regresní přímky k datům 10 •Koeficient determinace – •míra přiléhavosti dat k regresní křivce: • • • •Platí: 0 ≤ R2 ≤ 1 •Pozor! R2 má platnost pro libovolný typ regresní funkce! • • • • Přiléhavost regresní přímky k datům 11 • • • Extrémní hodnoty koeficientu determinace R2 12 R2 = 0,00001 R2 = 1 • Předpoklady: • 1.Vysvětlující proměnná X je nestochastická – vyplývá z povahy problému • •2. Střední hodnota náhodné chyby ε je 0, tj. • E(ε) = 0 – pro MNČ vždy splněno! • •3. Rozptyl náhodné chyby ε je konstantní, tj. • Var(ε) = σ2 - test, např. Chi-kvadrát (Homoskedasticta) • 4.Náhodné chyby ε jsou nekorelované, tj. Autokorelace = 0, tj. Cov(εi, εj) = 0 pro i¹j – test nulovosti korelačního koeficientu 5. 5.Náhodná chyba má normální rozdělení, • tj. ε ~N(0, σ2) – test normality • Klasický jednoduchý lineární regresní model 13 •Děkuji Vám za pozornost!!! • Závěr přednášky 14