Dynamic models: GMM and other models Temi: Endogeneità, variabili strumentali interne Bond, 2002, IFS wp & J of Portoguese Economics Main Reading in addition to Greene chapter (14.7 4th edition) Theoretical dynamic model Persistent time series Endogeneous regressors ◦ IV estimations with internal instruments Rationale Ratio del modello dinamico Confronto tra vari modelli dinamici GMM: robustezza della ipotesi dinamica su Y Uso IV interne Bias del modello dinamico in campioni finiti Issues Yit = yt-1 +xitβ + i + uit, last 2 terms are vit error term Problem: yt-1 correlated with i we estimate inconsistent B even if u iid Violation of strict exogeneity. E(ut/yt+k) ≠0 * yt-1 is related to ut-1 etc.. The covariance of vit across units causes violation Problem: T is often too short to get consistent properties (Greene book) that can mitigate endogeneity induced biases Bias of order 1/T; large sample results on N growing.. Average of n inconsistent estimator will be still inconsistent.. Models other than LSDV are needed Some preliminary hints on dynamic models Soluzioni IV GMM metodo IV applicato a differenze prime IV con strumenti interni, di fatto si utilizzano i ritardi della dipendente (e delle altre covariate) + IV Con lagged Y le differenze non mi risolvono tutti i problemi Trasformazione in DIFFERENZE PRIME Problema / aiuto ! Il software fa tutto.. Ma occorre conoscere la teoria We use IV estimators, same theory, different framework ◦ GMM include IV, ma anche FE e RE….modello generale, anche OLS è GMM Tutte X endogene, Z strumenti, se X esogena X è strumento di se stessa Biv= (Z’X)-1Z’y Lo stimatore IV non ha proprietà note in campioni finiti, è consistente ma c’è bias in campioni finiti (Greene) GMM is a generelized IV estimator Ma si veda paper Judson e Owen 1999, Economic Letters, in panel bilanciati LSDV può ben performare anche vs GMM Panel bilanciati spesso rari Semi inconsistenza LSDV nel dinamico. Anderson Hsiao ivreg d.(n w k ys) yr1977-yr1984 Arellano Bond xtabond n w k ys yr1977-yr1984, Blundell Blond ……. Vediamo teoria e poi applicazioni……….. Vari stimatori GMM dinamici FirsDiff: Yit – yit-1 = (yit-1 – yit-2) + (uit – uit1) which is y = yt-1 + u Eliminato errore idiosincratico in ogni caso Ma rimane auto correlation in errors to test.. Ma abbiamo ancora correlazione e violazione esogeneità date le relazioni tra storia di y e errore u. IV good one could be yt-2 o yt-2 yt-3.. Iv interni si ricercano tra i ritardi Metodo meno ‘artigianale’ di IV esterni, più automatico gestito dal software poi posso/devo strumentare anche X (nel within non posso usare ritardi come IV, rimane endogeneità) Anderson Hsiao estimator (oldest), si veda Greene Without group effects, there is a ‘simple’ IV estimator available We can use differences (yit-1 – yit-2) or levels (yit-2, yit-3, etc..) as IV One main question is whether differences or levels are better Arellano (1989) shows levels are preferable.. But others have shown that in dynamic models there is a lot of info to be used from the relationships between levels and differences Remember IV estimators are inefficient, pros and cons IV in dynamic models: which? Con Yt-1 abbiamo difatto una endogeneità indotta dalle differenze prime… Strumento Yt-2 o ritardo della differenza prima di Y ….non correlato con errore trasformato!!!! Monte Carlo tests dimostrano che finite sample bias è piccolo, anche rispetto a Arellano Bond.. MA HS ormai poco utilizzato, un solo strumento, S.E. alti, molto impreciso…. È un modello base, storico HS IV estimator GMM large family that generalise alla models IV issue is the key one One step, two step . xtabond n w k ys yr1978-yr1984, nocons twostep vce(robust) Warning: gmm two-step standard errors are biased; robust standard errors are recommended. Instruments for differenced equation Standard: D.w D.k D.ys D.yr1978 D.yr1979 D.yr1980 D.yr1981 D.yr1982 D.yr1983 D. One step consistente ma meno efficiente del 2 steps, SE sotto stimati NB Applicando un 2 step (residui dalla prima one step, implementiamo un AB 2 steps) correggiamo usano matrice varcov Arellano Blond estimators (90’s) Xtabond2, molto usata, supera una serie di limiti: non riusciamo a escludere i ritardi secondi della dipendente, quelli remoti si, recenti no, stima qualunque modello panel lineare…….grazie alla sintassi…………Rudman spiega nei papers come funziona xtabond2 consente di ridurre numerosi strumenti sintassi piu complessa (es. Includere ritardata) tende a dare enfasi al termine Yt-1 come *** Xtabond2 y l.y w k x years nolevelq noco twostep robust iv(w k x years: esogeni) gmm(l.y) xtabond2 presenta test serial correlation e sargan tests e Hansen tests (robust, ma debole se troppi strumenti..) Si possono imporre meno restrizioni, se riduco esogene. Applica BB (noleveleq applica AB invece), system GMM option New routine XTABOND2 restringere numero strumenti (anni), e scegliere alcune X esogene, migliora le fit. Scarsa evidenza dinamica in AB può dipendere da weak instruments Abbiamo tests per weak instr. Numero IV è il problema Simile a xtabond, è xtdpdsys, applica Blundell Blond postestimation — Postestimation tools for xtdpdsys The following postestimation commands are of special interest after xtdpdsys: command description estat abond test for autocorrelation estat sargan Sargan test of overidentifying restrictions New XTPDSYS command Blundell Blond impongono restrizioni………..assenza di correlazione negli errore come in AB, però modellano condizione iniziale su Y Modello bi equazionale, una in livelli una in differenze…… In differenze usa strumenti di AB In livelli usa strumenti in differenze prime…sono validi strumenti se vale mean stationarity, non sono correlate con i BB mean stationarity Problema da testare è l’uso di strumenti Trade off, ma parsimonia raccomandata Da gestire al margine…non facile. Complexity of IV sets T high, we can use within and LSDV corrected (Judson and Owen , 1999, Economic letters) GMM rationale is then higher when T is low / N high and we have endogenous regressors. If N*T large, within and LSDV can be used consistently Only if X exogenous GMM problem! Finite sample bias (low N*T driven by low N) Test ‘induttivo’ ◦ Il B del modello GMM deve essere compreso tar quello del modello OLS con yt-1 e del modello within con yt-1 Un Byt-1 significativo almeno al 10% giustifica uso GMM (ratio teorica deve esistere sempre) Test di specificazione ◦ Hansen, sargan ◦ Problema di over identification ed eccessivo uso degli strumenti. Usare parsimonia, trade off marginali da gestire Robustezza GMM Validità (ESOGENE) ◦ TESTING? Non possiamo testare tutto nel complesso, ma controllare validità sovra identificazioni….test over identyfing restrictions……. ◦ se sono valide dovremmo avere assenza di signif diversa da 0 SARGAN TEST: se vicino non rifiutiamo hp validità strumenti Rilevanza: strumenti buoni previsori… Sargan tests estat abond Arellano-Bond test for zero autocorrelation in first-differenced errors +-----------------------+ |Order | z Prob > z| |------+----------------| | 1 |-2.5915 0.0096 | | 2 |-.75236 0.4518 | non possiamo rifiutare HO assenza di correlazione +-----------------------+ H0: no autocorrelation estat sargan Sargan test of overidentifying restrictions H0: overidentifying restrictions are valid chi2(27) = 87.26388 Prob > chi2 = 0.0000, in ambito di one test sargan over rejects, quindi ci affidiamo a ESTAT A BOND come valutazione........ tests In generale, uso parco degli strumenti………. Finite sample bias con alti strumenti, in campioni finiti hanno un bias….GMM tendono ad avere un bias piu alto in campioni finiti con numero strumenti elevato… SONO TUTTI DISTORTI Use IV difference for levels and level IV for differences This is the system of level and differences System GMM Non GMM estimators Easier, more performing but limited Lsdvc routine in STATA applies the LSDVC corrected estimator. Preferable when panel is balanced and exogenous regressors (rare cases) Reference: Judson and Owen, 1999, Economic letters; G. Bruno papers GMM vs Kiviet or corrected LSDV Differenze non mi risolvono tutti problemi endogen. Nel dinamico Uso strumenti t-2, etc.. In differenze o livelli o entrambi Modelli within consistenti se var esogene X Con endogeneità X, non consistenti nemmeno se N*T alto Devo usare GMM (non within tranformation) i ‘momenti’ di esogeneità rispetto alle lagged Y e X mi definiscono il set delle IV Summing up Da modelli storici ma limitati come Anderson Hsiao a vari Arellano Blond ai GMM SYS Trade off: necessito strumenti ma anche di uso parco strumenti, test su numero e forza strumenti Comparare sempre GMM con OLS e WiThin Posso usare LSDVC corretto se panel bialnciato ed X esogene, usa HS AB BB come stimatori di base Summing up