Statistické zpracování dat 12.přednáška Mgr. Radmila Krkošková, Ph.D. • •Analýza časových řad (4) • Téma přednášky: 2 Obsah přednášky 3 •Metody exponenciálního vyrovnání •ARIMA metody •Případové studie v Excelu a SPSS Modely analýzy časových řad - shrnutí 4 1. Dekompoziční modely: •Aditivní •Multiplikativní 2. Adaptivní modely exponenciálního vyrovnání: •Jednoduchý •Holtův •Wintersův Modely analýzy časových řad - shrnutí 5 3. Box-Jenkinsovy modely ARIMA: •AR, MA •I (náhodná procházka) •ARIMA, SARIMA (Sezónní) 1. • Dekompoziční modely: aditivní a multiplikativní 6 •trendová složka •sezónní a cyklická složka •náhodná složka Metody exponenciálního vyrovnání 7 •Jednoduché ExVy (bez trendu a sezónní složky) • Holtovo ExVy (s trendem bez sezónní složky) • •Wintersovo ExVy (s trendem a sezónní složkou) • Jednoduché exponenciální vyrovnání 8 •bez trendu a sezónní složky •1 parametr: a • Holtovo exponenciální vyrovnání 9 •lineární trend, bez sezónní složky •2 parametry: a, g •2 rovnice (složitější) • Wintersovo exponenciální vyrovnání 10 •lineární trend (tlumený) •multiplikativní sezónní složka •4 parametry: a, g, d, j •3 rovnice (komplikované) Případové studie v SPSS 11 1. Predikce zásob materiálu (model jednoduchého exponenciálního vyrovnání) 2. Predikce prodeje oděvů (sezónní model Wintersova ExVy) Model jednoduchého exponenciálního vyrovnání 12 Predikce zásob materiálu „Zasoby“ •Zásoby materiálu ve skladu kolísají v průběhu času - časová řada (ČŘ) množství zásoby •Model exponenciálního vyrovnání umožní predikci vývoje zásob na základě ČŘ dat v minulosti ® řízení zásob 1. Krok: zobrazení ČŘ: „vizuální“ analýza 2. Krok: odhad modelu ExVy 3. Krok: výpočet parametrů modelu ExVy 4. Krok: výpočet a zobrazení predikce modelu ExVy 5. Krok: posouzení validity modelu ExVy (rezidua!) 6. Krok: interpretace výsledku Zobrazení dat - graf 13 • Žádný trend • Žádná sezónnost • Pozitivní autokorelace - vhodné pro model ExVy Parametry modelu 14 4 parametry: a, g, d, j z intervalu [0,1] •a » 1 - predikce využívá výlučně „nejčerstvější“ hodnotu ČŘ •a » 0 - predikce využívá všech hodnot ČŘ „stejně“ •g » 1 - predikce využívá trend z „nejčerstvějších“ hodnot ČŘ •g » 0 - predikce využívá trend všech hodnot ČŘ „stejně“ •d » 1 - predikce využívá sezónnost z „nejčerstvějších“ hodnot ČŘ •d » 0 - predikce využívá sezónnost všech hodnot ČŘ „stejně“ •j » 1 - trend rychle vymizí •j » 0 - trend pomalu vymizí • • Odhad parametrů modelu 15 Model ExVy Zasoby: SPSS: Analyze ®Time Series ®Exponencial smoothing •Typ modelu: Simple (Holt, Winters, Custom) •g = d = j = 0, a odhadneme pomocí Grid Search - vybereme a = 0,8 (s nejmenším SSE - Sum of Squared Errors) •Interpretace a: silná závislost modelu na nejčerstvějších údajích •Vytvoří se nové proměnné fit_1 a err_1 modelových hodnot a odchylek skutečnosti od modelu •Zobrazení fit_1 a err_1 a jejich interpretace (adekvátnost modelu) 16 Zobrazení původních a modelových hodnot a = 0,8 17 Zobrazení původních a modelových hodnot a = 0,1 Predikce pomocí modelu exponenciálního vyrovnání 18 •ExVy je vhodné pro krátkodobé predikce („1 krok dopředu“) Typ modelu: •Simple - ČŘ nemá trendovou ani sezónní složku •Holt - ČŘ má lineární trend, nemá sezónní složku •Winters - ČŘ má lineární trend a multiplikativní sezónní složku (v SPSS je zapotřebí definovat sezónnost pomocí „Define Dates“) •Custom - volitelné modely trendu (lineární, exponenciální, tlumený) a sezónnosti (žádná, multiplikativní, aditivní) • 19 •Výchozí stav: Je definován model ExVy (tj. typ + parametry) •SPSS: Save ® Predict through option ® n (poslední predikovaná hodnota) • zobrazení původní a modelové ČŘ včetně predikce •Pro model „Zasoby“ predikce konstatntní (chybí trend i sezónnost), viz Obr. Predikce pomocí modelu exponenciálního vyrovnání Predikce 20 Model se sezónní a trendovou složkou 21 Model se sezónní a trendovou složkou 22 a = 0,1 , g = 0,1 , d = 0,1 (optimální parametry) Typ: Custom - lin. trend, aditivní sezónnost Data od 1/1985 Predikované hodnoty: JAN2003 až DEC2003 ARIMA modely (Box-Jenkinsovy modely) 23 •stochastický proces (ČŘ) •stacionarita ČŘ •AR - autoregresivní modely •MA - modely klouzavých průměrů •I - integrační modely (nestacionární ČŘ) „náhodná procházka“ •sezónní ARIMA modely = SARIMA ARIMA modely 24 •Auto Regressive Integrated Moving Average •3 složky: AR(p) + I(d) + MA(q) = ARIMA(p,d,q) •Příklady: •AR(1): Hodnotat = j´Hodnotat-1 + Poruchat •I(1): Hodnotat = Hodnotat-1 + Poruchat „Náhodná procházka“ (AR(1) s j = 1) •MA(1): Hodnotat = y´Poruchat-1 + Poruchat •AR(2): Hodnotat = j1´Hodnotat-1 + j2´Hodnotat-2 + Poruchat •atd. pro více zpožděné hodnoty Autokorelace a parciální autokorelace v modelech ARIMA 25 Autokorelace: korelace hodnot ČŘ se sebou o daný časový posuv Autokorelační funkce ACF(k): korelace hodnot ČŘ se sebou o časový posuv k = 1,2,… Parciální autokorelační funkce PACF(k): parciální korelace hodnot ČŘ se sebou o časový posuv k = 1,2,… ACF a PACF mají pro různé typy ARIMA modelů charakteristické vlastnosti (tvary grafů ACF a PACF) Příklad: AR(1): xt = j´ xt-1 + at , j = 1 odtud xt - xt-1 = at (tj. 1. Diference = bílý šum) •AR(1) = I(1), tj. NP, pokud at je bílý šum, tj. E(at) = 0 a ACF(k) = 0 pro k = 1,2,… Vlastnosti bílého šumu 26 1. Bílý šum at v modelu ČŘ mají: •a) střední hodnotu = 0 •b) normální rozdělení •(neznámý) konstatntní rozptyl s2 (homoskedasticita) • 2. Náhodné složky jsou nekorelované, tj. Cov(et , et´) = 0 pro každé t ¹ t´, t,t´ = 1,2,...,n • Identifikace modelu ARIMA (p, d, q) 27 Různé typy ACF a PACF (SPSS: Graphs ® Time Series ® Autocorrelations…) : •Model AR(p) - prvních p hodnot PACF je velkých, další = 0 a rychlý pokles (v absolutních hodnotách) ACF •Model MA(q) - prvních q hodnot ACF je velkých, další = 0 a rychlý pokles (v absolutních hodnotách) PACF •Model I(d) - pomalý pokles ACF - nestacionární ČŘ (diferencovat d krát) •AR(p) = ARIMA(p,0,0), MA(q) = ARIMA(0,0,q), I(d)=ARIMA(0,d,0) • ACF a PACF: bílý šum 28 ACF a PACF: AR(1) 29 ACF a PACF: ARMA(1,1) 30 Proces stanovení ARIMA modelu 31 •Identifikace modelu: stanovení řádů tj. čísel p, d, q v modelu ARIMA(p,d,q) (v sezónních modelech SARIMA ještě další parametry) využití tvarů ACF a PACF •Odhad modelu: odhad parametrů modelu 1. Diferencování modelu (d-krát) ® stacionarizace 2. Výpočet koeficientů modelu: j a y (metoda max. věrohodnosti) 3. Výpočet nových ČŘ modelových hodnot (fit, err) •Verifikace modelu: Reziduum (err) je bílý šum Þ ACF a PACF jsou nulové (tj. v 95% mezích) Závěr přednášky 32 Děkuji Vám za pozornost!!! •