Introduzione alla analisi di serie storiche Le serie storiche sono dati ordinati che si riferiscono alla stessa unità cross section per periodi di tempo diversi Consumo aggregato e GDP di un paese tassi di cambio Yen/$, pound/$ e Euro/$ consumo per capita di un bene in uno stato 1 5.4 200 punew (destra) l_punew (sinistra) 5.2 180 5 160 4.8 140 4.6 4.4 120 4.2 100 4 80 3.8 60 3.6 40 3.4 3.2 20 1960 1970 1980 1990 2000 2 Es #1 3 Es #2 4 Italy: Tasso di disoccupazione 14 12 10 8 6 4 2 0 5 Perchè le serie storiche sono utili? A fini previsivi quale sarà il tasso di inflazione l’anno prossimo? stimare l’effetto causale dinamico se la FED aumenta il tasso di interesse oggi, quale sraà l’effetto su tasso di inflazione e di disoccupazione fra 3 mesi? o in 12 mesi? 6 Novità Ritardi temporali Correlazione nel tempo (correlatione seriale, autocorrelazione) I modelli previsivi sono modelli di regressione: autoregressivi (AR) potrebbero non avere una interpretazione causale Analizziamo le condizioni sotto cui gli effetti dinamici possono essere stimati e come stimarli 7 Previsione e Stima sono 2 fasi piuttosto diverse Per la previsione, R 2 è molto importante la bias dovuta a variabili - validità interna -omesse non è un problema non c’è interesse nella interpretazione dei coefficienti la validità esterna del modello è estremamente importante 8 Introduzione alle s.s. e alla correlazione seriale Notazione per le serie storiche Yt = valore di Y al tempo t. Data set: Y1,…,YT = T osservazioni nel tempo di una v.c. Y Consideriamo solo osservazioni consecutive ad intervalli sempre uguali 9 Trasformazioni più comuni 10 ES: CPI = Consumer Price Index (Bureau of Labor Statistics) CPI nel primo trimestre del 2004 (2004:I) = 186.57 CPI nel secondo trimestre del 2004 (2004:II) = 188.60 Variazione in percentuale di CPI, da 2004:I a 2004:II 188.60 186.57 2.03 = 100 = 100 = 1.088% 186.57 186.57 Variazione in percentuale di CPI, da 2004:I a 2004:II, a tasso annuale = 41.088 = 4.359% 4.4% (percento per anno) usando un’approssimazione logaritmica 4100[log(188.60) – log(186.57)] = 4.329% 11 Es: inflazione US CPI 12 Autocorrelazione La correlazione di una serie (al tempo t) con un suo ritardo (al tempo t-1/ t-2/ t-3,.. t-p) è chiamata autocorrelazione o correlazione seriale. Autocorrelazione di ordine 1: corr(Yt,Yt–1) Autocovarianza di ordine 1: cov(Yt,Yt–1) corr(Yt,Yt–1) = cov(Yt , Yt 1 ) =1 var(Yt ) var(Yt 1 ) 13 14 Autocorrelazione campionaria La jma autocorrelazione campionaria è una stima della jma autocorrelazione della popolazione ĉovYtYt j ˆ j = v̂arYt dove T 1 ĉovYtYt j = (Yt Y j 1,T )(Yt j Y1,T j ) T t j 1 dove Y j 1,T è la media campionaria di Yt calcolata per t = j+1,…,T. 15 Es: Autocorrelazione di: (1) tasso di inflazione trimestrale U.S. (2) variazione da trimestre a trimestre 16 Il tasso di inflazione è fortemente autocorrelato (1 = .84) il trimestre passato dà molte informazioni sul trimestre attuale nel grafico ci sono molti movimenti altalenanti prevedibili ma ci sono anche molti movimenti non prevedibili 17 Altri es: 18 Altri es: 19 ln(GDP) Italy constant US $ 2005 GDP Italy US $ 2005 2E+12 28.5 1.8E+12 1.6E+12 28 1.4E+12 27.5 1.2E+12 1E+12 27 8E+11 6E+11 26.5 4E+11 2E+11 2011 2008 2005 2002 1999 1996 1993 1990 1987 1984 1981 1978 1975 1972 1969 1966 1963 1960 26 0 Differenza prima: GDP Italy US $ 2005 8E+10 6E+10 4E+10 2E+10 -2E+10 1960 1962 1964 1966 1968 1970 1972 1974 1976 1978 1980 1982 1984 1986 1988 1990 1992 1994 1996 1998 2000 2002 2004 2006 2008 2010 0 -4E+10 -6E+10 -8E+10 -1E+11 -1.2E+11 20 Funzione di autocorrelazione e funzione di autocorrelazione parziale 21 Stazionarietà La stazionarietà e un concetto chiave per la validità esterna. Una s.s. si dice stazionaria se la sua distribuzione di probabilità non cambia nel tempo, cioè se la distribuzione condizionata di ( Yt+1, Yt+2, Yt+3, .., Yt+j) non dipende da j. La condizione di stazionarietà richiede che le realizzazioni future della serie siano come quelle passate per lo meno da un punto di vista probabilistico. Per ora assumiamo che Yt è stazionaria 22 Processi AR Un punto di inizio naturale consiste in inziare a usare i valori passati Y (Yt–1, Yt–2,…) per predire Yt. autoregressione AR è una regressione in cui Yt è regredito sui suoi ritardi. il numero dei ritardi considerati si chiama ordine di autoregressione. Nel primo ordine di autoregressione, Yt è regredito su Yt–1 Nel pth ordine di autoregressione, Yt è regredito su Yt–1,Yt–2,…,Yt–p. 23 AR(1) Yt = 0 + 1Yt–1 + ut 0 e 1 non hanno interpretazione causale se 1 = 0, Yt–1 non è utile a predire Yt può essere stimato con OLS Test di ipotesi di 1 = 0 vs 1 0 fornisce un test per concludere se Yt–1 è utile o meno a predire Yt 24 Es: AR(1) Stime 1962:I – 2004:IV: ̂Inf = 0.017 – 0.238Inft–1 R 2 = 0.06 (0.126) (0.096) Il ritardo è utile a predire Inf? t = –.238/.096 = –2.47 > 1.96 Rifiutiamo H0: 1 = 0 al 5% Anche se R 2 è basso 25 . gen dinf = inf[_n]-inf[_n-1]; . reg dinf L.dinf if tin(1962q1,2004q4), r; Linear regression L.dinf is the first lag of dinf Number of obs F( 1, 170) Prob > F R-squared Root MSE = = = = = 172 6.08 0.0146 0.0564 1.6639 -----------------------------------------------------------------------------| Robust dinf | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------dinf | L1. | -.2380348 .0965034 -2.47 0.015 -.4285342 -.0475354 _cons | .0171013 .1268831 0.13 0.893 -.2333681 .2675707 -----------------------------------------------------------------------------. dis "Adjusted Rsquared = " _result(8); Adjusted Rsquared = .05082278 26 Previsioni: terminologia e notazione Valori stimati sono “all’interno del campione” Previsioni sono “fuori dal campione” – nel futuro Notazione: YT+1|T = previsione di YT+1 basata su YT,YT–1,…, usando i coefficienti della popolazione YˆT 1|T = previsione (stima) di YT+1 basata su YT,YT–1 usando i coefficienti stimati, che sono stimati usando i dati fino all’osservazione T. per un AR(1): YT+1|T = 0 + 1YT + u Yˆ = ˆ0 + ˆ1 YT, T 1|T 27 Errori di previsione L’errore di previsione di un periodo sono errore = YT+1 – YˆT 1|T un residuo è “all’interno del campione” una errore di previsione è “fuori dal campione” – il valore YT+1 non è usato nelle stime del coefficienti di regressione 28 Es: Stime 1962:I – 2004:IV: ̂Inf = 0.017 – 0.238Inft–1 R 2 = 0.05 (0.126) (0.096) Inf2004:III = 1.6 Inf2004:IV = 3.5 Inf2004:IV = 3.5 – 1.6 = 1.9 la previsione di Inf2005:I è: ̂Inf 2005:I|2004:IV = 0.017 – 0.2381.9 = -0.44 -0.4 Di conseguenza Iˆnf 2005:I|2004:IV = Inf2004:IV + ̂Inf 2005:I|2004:IV = 3.5 – 0.4 = 3.1% 29 AR(p) Yt = 0 + 1Yt–1 + 2Yt–2 + … + pYt–p + ut AR(p) usa p ritardi di Y come regressori AR(1) è un caso speciale p=1 I coefficienti non hanno una interpretazione causale F-test per testare la significatività dei coefficienti oltre Yt–1 t- o F-tests per determinare l’ordine dei ritardi p o meglio usando uno dei “criteri di informazione” 30 Example: AR(4) model of inflation ̂Inf = .02 – .26Inft–1 – .32Inft–2 + .16Inft–3 – .03Inft–4, (.12) (.09) (.08) (.08) (.09) R 2 = 0.18 F-statistica per i ritardi 2, 3, 4 è 6.91 (p-value < .001) R 2 è crescituo da .05 a .18 aggiungendo i ritardi 2, 3, 4 i ritardi 2, 3, 4 assieme aiutano a predire il cambio di inflazione oltre il primo ritardo 31 Es: AR(4) or AR(3) . reg dinf L(1/4).dinf if tin(1962q1,2004q4), r; Linear regression Number of obs F( 4, 167) Prob > F R-squared Root MSE = = = = = 172 7.93 0.0000 0.2038 1.5421 -----------------------------------------------------------------------------| Robust dinf | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------dinf | L1. | -.2579205 .0925955 -2.79 0.006 -.4407291 -.0751119 L2. | -.3220302 .0805456 -4.00 0.000 -.481049 -.1630113 L3. | .1576116 .0841023 1.87 0.063 -.0084292 .3236523 L4. | -.0302685 .0930452 -0.33 0.745 -.2139649 .1534278 _cons | .0224294 .1176329 0.19 0.849 -.2098098 .2546685 -----------------------------------------------------------------------------NOTES L(1/4).dinf is A convenient way to say “use lags 1–4 of dinf as regressors” L1,…,L4 refer to the first, second,… 4th lags of dinf 32 Example: model of inflation – STATA, ctd. . dis "Adjusted Rsquared = " _result(8); Adjusted Rsquared = .18474733 result(8) is the rbar-squared of the most recently run regression . L2.dinf is the second lag of dinf, etc. test L2.dinf L3.dinf L4.dinf; ( 1) ( 2) ( 3) L2.dinf = 0.0 L3.dinf = 0.0 L4.dinf = 0.0 F( 3, 147) = Prob > F = 6.71 0.0003 33 Perchè usiamo Inft e non Inft? AR(1) Inf: Inft = 0 + 1Inft–1 + ut AR(2) Inf: Inft = 0 + 1Inft + 2Inft–1 + vt Quando Yt è fortemente correlate serialmente, l’ OLS è bias verso lo zero Nel caso in cui il coefficiente dell’AR(1) = 1, Yt non è stazionario: gli errori ut si accumulano e Yt esplode. se Yt non è stazionario, la teoria della regressione usta fin qui non ha più valore poichè , Inft è fortemente correlate serialmente in questo esempio usiamo Inf 34 Incertezza delle previsioni dobbiamo costruire degli intervalli di previsione dobbiamo conoscere il grado di accuratezza delle previsioni date le previsioni YˆT 1|T = ˆ0 + ˆ1 YT + ˆ 2 XT l’errore di previsione è YT+1 – YˆT 1|T = uT+1 – [( ˆ0 – 0) + ( ˆ1 – 1)YT + ( ˆ 2 – 2)XT] 35 Criteri di selezione dei ritardi Come scegliere il ritardo p in un AR(p)? bias delle variabili omesse è irrilevante possiamo proporre dei test sequenziali di t- or F-tests usare criteri di informazione che costituiscono un buon tradeoff fra bias ( p pochi) e varianza (p troppi): Bayes (BIC) and Akaike (AIC) 36 The Bayes Information Criterion (BIC) ln T SSR( p ) BIC(p) = ln ( p 1) T T Primo termine: decresce in p Secondo termine: cresce in p Minimizzare BIC(p) è un giusto trade off fra bias e varianza per determinare il valore ottimale di p 37 Akaike Information Criterion (AIC) 2 SSR( p ) AIC(p) = ln ( p 1) T T ln T SSR( p ) BIC(p) = ln ( p 1) T T il secondo termine è più piccolo per AIC che per BIC (2 < lnT) AIC è desiderabile se ci sono indicazioni per includere molti lag 38 Es: ritardi 0–6: # Lags 0 1 2 3 4 5 6 BIC 1.095 1.067 0.955 0.957 0.986 1.016 1.046 AIC 1.076 1.030 0.900 0.884 0.895 0.906 0.918 R2 0.000 0.056 0.181 0.203 0.204 0.204 0.204 BIC sceglie 2 ritardi, AIC sceglie 3. 2 R tende sempre a scegliere il modello con più ritardi 39 Non Stazionarietà I: Trend Finora abbiamo assunto che i dati siano stazionari. In quanto segue discuteremo due dei più importanti casi di dati non stazionari I trend (SW Section 14.6) I break strutturali (instabilità del modello) (SW Section 14.7) 40 Temi di discussione circa i trend nelle serie storiche: 1. Che cos’è un trend? 2. Quali problemi possono causare i trend? 3. Come si possono individuare i trend (test statistici)? 4. Come risolvere i problemi causati dalla presenza di trend 41 1. Che cos’è un trend? Un trend è un movimento di lungo periodo o una tendenza di fondo nei dati I trend non sono necessariamente linee diritte Quali di queste serie ha un trend? 42 43 44 Che cosè un trend. Le tre serie: log Japan GDP chiaramente ha un trend di lungo periodo – non una linea diritta, ma un trend decrescente– crescita veloce negli anni ’60 e ‘70, più lenta durante gli anni ‘80, stagnante dal 1990 al 2000. L’inflazione è persistentemente alta per molti anni (anni ’70 e primi anni ‘80) e periodi in cui è persistentemente bassa. Forse c’è un trend ma è difficile da stabilire. NYSE daily changes non ha trend evidenti. Ci sono periodi di alta variabilità ma non c’è nessun trend 45 Trend deterministici e stocastici Un trend è un movimento di lungo periodo o una tendenza di fondo presente nei dati. Un trend deterministico è una funzione nota dei dati (ad esempio yt = t, or yt = t2). Un trend stocastico è casuale e varia nel tempo Un esempio importante di un trend stocastico è il random walk: Yt = Yt–1 + ut dove ut è serialmente non corrrelato Se Yt è un random walk, allora il valore di Y domani è il valore di Y oggi più un disturbo che non conosciamo. 46 Trend deterministici e stocastici Due caratteristiche di un random walk: (i) YT+h|T = YT La migliore previsione del valore di Y nel futuro è il valore di Y oggi Il log stock prices è random walk 2 h (ii) var(YT+h|T – YT) = u La varianza dell’errore di previsione cresce linearmente nel tempo. Più distante sarà la nostra previsione più grande sarà l’incertezza della previsione. 47 Trend deterministici e stocastici Un random walk con drift è Yt = 0 +Yt–1 + ut dove ut è serialmente in correlato. Il “drift” è 0: se 0 0, allora Yt è un random walk intorno ad un’intercetta Yt = 0 t +Yt–1 + ut se 0 0, allora Yt è un random walk intorno ad un trend 48 Trend deterministici e stocastici Se Yt è un random walk allora Yt è stazionaria e l’analisi di regressione dovrebbe essere condotta usando Yt invece di Yt. Quindi dobbiamo conoscere: La relazione tra il modello random walk e AR(1), AR(2), AR(p) (“radici unitarie autoregressive”) Un test per individuare un random walk. 49 Trend stocastici e radici unitarie autoregressive Random walk (con drift): Yt = 0 + Yt–1 + ut AR(1): Yt = 0 + 1Yt–1 + ut Il random walk è un AR(1) con 1 = 1. 1 = 1 è chiamata radice unitaria*. Quando 1 = 1, il modello AR(1) diventa Yt = 0 + ut *La terminologia deriva dall’equazione: 1 – 1z = 0 . La “radice” dell’equazione è z = 1/1, che è uguale ad uno se 1 = 1. 50 Radici unitarie nel modello AR(2) AR(2): Yt = 0 + 1Yt–1 + 2Yt–2 + ut Modificando il modello si ha: Yt = 0 + 1Yt–1 + 2Yt–2 + ut = 0 + (1+2)Yt–1 – 2Yt–1 + 2Yt–2 + ut = 0 + (1+2)Yt–1 – 2(Yt–1 – Yt–2) + ut Sottraendo Yt–1 in entrambi i lati si ha: Yt – Yt–1 = 0 + (1+2–1)Yt–1 – 2(Yt–1 – Yt–2) + ut o Yt = 0 + Yt–1 + 1Yt–1 + ut, dove = 1 + 2 – 1 e 1 = –2.. 51 Radici unitarie nel modello AR(2) Dunque il modello AR(2) può essere scritto come, Yt = 0 + Yt–1 + 1Yt–1 + ut dove = 1 + 2 – 1 e 1 = –2. Se 1 – 1z – 2z2 = 0 ha una radice unitaria, allora 1 + 2 = 1 Se c’è una radice unitaria allora = 0 e il modello AR(2) diventa, Yt = 0 + 1Yt–1 + ut Se un modello AR(2) ha una radice unitaria, allora può essere scritto come un AR(1) nelle differenze prime. 52 Radici unitarie nel modello AR(p) AR(p): Yt = 0 + 1Yt–1 + 2Yt–2 + … + pYt–p + ut Questa regressione può essere scritta come Yt = 0 + Yt–1 + 1Yt–1 + 2Yt–2 + … + p–1Yt–p+1 + ut dove = 1 + 2 + … + p – 1 1 = –(2 +… + p) 2 = –(3 +… + p) … p–1 = –p 53 Radici unitarie nel modello AR(p) Il modello AR(p) può essere scritto come, Yt = 0 + Yt–1 + 1Yt–1 + 2Yt–2 + … + p–1Yt–p+1 + ut dove = 1 + 2 + … + p – 1. Se c’è una radice unitaria nel modello AR(p), allora = 0 e il modello AR(p) diventa un AR(p–1) nelle differenze prime: Yt = 0 + 1Yt–1 + 2Yt–2 + … + p–1Yt–p+1 + ut 54 2. Quali problemi sono causati dai trend? Ci sono tre problemi causati dai trend stocastici: 1. I coefficienti del modello AR possono essere non corretti e vicini allo zero. Questo significa che se stimiamo un AR e facciamo previsioni, se c’è una radice unitaria le previsioni avranno valori basse. (I coefficienti del modello AR sono distorti verso lo zero) 2. Alcune t-statistiche non hanno una distribuzione normale standard anche in grandi campioni 3. Se Y e X son entrambe random walk allora possono sembrare legati da un legame – “regressioni spurie” Ecco un esempio… 55 Log Japan gdp (linea meno variabile) e inflazione in US 1965-1981 lgdpjs infs 4 2 0 -2 1965q1 1970q1 1975q1 time 1980q1 1985q1 56 Log Japan gdp (linea meno variabile) e inflazione in US, 1982-1999 lgdpjs infs 4 2 0 -2 -4 1980q1 1985q1 1990q1 time 1995q1 2000q1 57 3. Come individuare i trend? 1. Fare il plot dei dati (ad esempio le tre serie che abbiamo analizzato). 2. Il test Dickey-Fuller serve per riconoscere la presenza di radici unitarie. Il test Dickey-Fuller test in un AR(1) Yt = 0 + 1Yt–1 + ut o Yt = 0 + Yt–1 + ut H0: = 0 (cioè, 1 = 1) contro H1: < 0 (NB: questo test è ad una coda: < 0 significa che Yt stazionario) è 58 Test DF in modelli AR(1) Yt = 0 + Yt–1 + ut H0: = 0 (cioè 1 = 1) contro H1: < 0 Test: calcola la t-statistica testando = 0 Sotto H0, questa t statistica non ha una distribuzione normale!! Bisogna confrontare la t-statistica con la tabella dei valori critici di Dickey-Fuller. Si presentano due casi: (a) Yt = 0 + Yt–1 + ut (solo intercetta) (b) Yt = 0 + t + Yt–1 + ut (intercetta e trend) I due casi hanno differenti valori critici! 59 Tabella dei valori critici del DF (a) Yt = 0 + Yt–1 + ut (b) Yt = 0 + t + Yt–1 + ut (intercetta e trend) (solo intercetta) Rigetta l’ipotesi nulla se la t-statistica DF (la t-statistica che testa = 0) è più piccolo del valore critico specificato. Questo è un test ad una coda con l’ipotesi nulla di una radice unitaria (random walk) contro l’ipotesi alternativa che il modello è stazionario. 60 Il test Dickey-Fuller in un modello AR(p) In un modello AR(p), il test DF è basato sul modello Yt = 0 + Yt–1 + 1Yt–1 + 2Yt–2 + … + p–1Yt–p+1 + ut (*) dove = 1 + 2 + … + p – 1. Se c’è una radice unitaria (random walk trend), = 0; se il modello AR è stazionario, < 1. Il test DF in un AR(p) (solo intercetta): 1. stima (*), ottieni la t-statistica testando = 0 2. Rigetta l’ipotesi nulla di radice unitaria se la t-statistica è inferiore al valore critico DF riportato in Tabella 14.5 Modifica in presenza di trend: si incluse t come regressore in (*) 61 Quando includere un trend nel test DF? La decisione di usare il test DF con l’intercetta o l’intercetta e il trend dipende da qual’è l’alternativa e come si presentano i dati. Nella specificazione con l’intercetta, l’ipotesi alternativa è che Y è stazionaria intorno ad una costante Nella specificazione con intercetta & trend, l’ipotesi alternativa è che Y è stazionaria intorno ad un trend lineare. 62 Esempio: l’inflazione U.S. ha una radice unitaria? L’ipotesi alternativa è che l’inflazione è stazionaria intorno ad una costante 63 Esempio: l’inflazione U.S. ha una radice unitaria? DF test for a unit root in U.S. inflation – using p = 4 lags . reg dinf L.inf L(1/4).dinf if tin(1962q1,2004q4); Source | SS df MS -------------+-----------------------------Model | 118.197526 5 23.6395052 Residual | 380.599255 166 2.2927666 -------------+-----------------------------Total | 498.796781 171 2.91694024 Number of obs F( 5, 166) Prob > F R-squared Adj R-squared Root MSE = = = = = = 172 10.31 0.0000 0.2370 0.2140 1.5142 -----------------------------------------------------------------------------dinf | Coef. Std. Err. t P>|t| [95% Conf. Interval] -------------+---------------------------------------------------------------inf | L1. | -.1134149 .0422339 -2.69 0.008 -.1967998 -.03003 dinf | L1. | -.1864226 .0805141 -2.32 0.022 -.3453864 -.0274589 L2. | -.256388 .0814624 -3.15 0.002 -.417224 -.0955519 L3. | .199051 .0793508 2.51 0.013 .0423842 .3557178 L4. | .0099822 .0779921 0.13 0.898 -.144002 .1639665 _cons | .5068071 .214178 2.37 0.019 .0839431 .929671 ------------------------------------------------------------------------------ DF t-statstic = –2.69 Don’t compare this to –1.645 – use the Dickey-Fuller table! 64 La statistica DF = –2.69 (solo intercetta): = –2.69 rigetta una radice unitaria al livello del 10% ma non al 5% Qualche evidenza di radice unitaria. Che cosa significa che l’inflazione ha una radice unitaria? Consideriamo che l’inflazione abbia una radice unitaria. Note: Si può scegliere la lunghezza temporale in una regressione DF attraverso BIC or AIC 65 4. Come individuare e risolvere i problemi causati dai trend. Se Yt ha una radice unitaria (è un random walk), il modo più semplice per evitare problemi è di modellare Yt nelle differenze prime. Nel caso di un AR, questo significa specificare il modello AR usando le differenze prime di Yt (Yt) Questo è ciò che noi abbiamo fatto nel trattamento iniziale dell’inflazione, noi abbiamo stimato il modello AR usando Inft 66 Sommario: individuare i trend stocastici 1. Per determinare se Yt ha un trend stocastico, prima bisogna fare il plot della serie Yt, poi se sembra plausibile la presenza di un trend, calcola il test DF test (è importante decidere quale versione, intercetta o intercetta+trend) 2. Se con il test DF non si rigetta, concludiamo che Yt ha una radice unitaria (random walk con trend stocastico) 3. Se Yt ha una radice unitaria, si usa Yt per l’analisi di regressione e previsione 67 Non stazionarietà II: Breaks e Stabilità del modello (SW Section 14.7) Il secondo tipo di non stazionarietà che noi consideriamo riguarda il caso in cui i coefficienti del modello non sono costanti nell’intero campione. Chiaramente questo comporta problemi di previsione Test per break, e pseudo analisi di previsione out-ofsample Esempio: la curva di Phillips su dati americani 68 Tests per break (cambiamento) nei coefficienti di regressione Caso I: La data del break è nota Supponiamo che che sia noto che il break sia accaduto alla data . La stabilità dei coefficienti può essere testata. In the ADL(1,1) case: Yt = 0 + 1Yt–1 + 1Xt–1 + 0Dt() + 1[Dt()Yt–1] + 2[Dt()Xt–1] + ut dove Dt() = 1 se t , e = 0 altrimenti. Se 0 = 1 = 2 = 0, allora i coefficienti sono costanti nel tempo. Se almeno uno di 0, 1, o 2 sono diversi da zero, la funzione di regressione cambia alla data . 69 Yt = 0 + 1Yt–1 + 1Xt–1 + 0Dt() + 1[Dt()Yt–1] + 2[Dt()Xt–1] + ut dove Dt() = 1 se t , e = 0 altrimenti si può utilizzare il Chow test per un break alla data è la statistica F che testa: H0: 0 = 1 = 2 = 0 contro H1: almeno uno di 0, 1, o 2 sono diversi da zero 70