Dynamic models: GMM
and other models
Temi: Endogeneità, variabili strumentali interne

Bond, 2002, IFS wp & J of Portoguese
Economics
Main Reading in addition to
Greene chapter (14.7 4th edition)
Theoretical dynamic model
 Persistent time series
 Endogeneous regressors

◦ IV estimations with internal instruments
Rationale





Ratio del modello dinamico
Confronto tra vari modelli dinamici
GMM: robustezza della ipotesi dinamica su
Y
Uso IV interne
Bias del modello dinamico in campioni
finiti
Issues







Yit = yt-1 +xitβ + i + uit, last 2 terms are vit error
term
Problem: yt-1 correlated with i  we estimate
inconsistent B even if u iid
Violation of strict exogeneity. E(ut/yt+k) ≠0
* yt-1 is related to ut-1 etc.. The covariance of vit
across units causes violation
Problem: T is often too short to get consistent
properties (Greene book) that can mitigate
endogeneity induced biases
Bias of order 1/T; large sample results on N growing..
Average of n inconsistent estimator will be still
inconsistent.. Models other than LSDV are needed
Some preliminary hints on dynamic models



Soluzioni IV GMM
metodo IV applicato a differenze prime
IV con strumenti interni, di fatto si utilizzano i ritardi della
dipendente (e delle altre covariate)
+ IV
 Con lagged Y le differenze non mi
risolvono tutti i problemi

Trasformazione in DIFFERENZE PRIME

Problema / aiuto ! Il software fa tutto.. Ma occorre
conoscere la teoria
We use IV estimators, same
theory, different framework
◦ GMM include IV, ma anche FE e RE….modello
generale, anche OLS è GMM
Tutte X endogene, Z strumenti, se X
esogena X è strumento di se stessa
 Biv= (Z’X)-1Z’y
 Lo stimatore IV non ha proprietà note
in campioni finiti, è consistente ma
c’è bias in campioni finiti (Greene)

GMM is a generelized IV estimator
Ma si veda paper Judson e Owen 1999,
Economic Letters, in panel bilanciati LSDV
può ben performare anche vs GMM
 Panel bilanciati spesso rari

Semi inconsistenza LSDV nel
dinamico.





Anderson Hsiao
ivreg d.(n w k ys) yr1977-yr1984
Arellano Bond
xtabond n w k ys yr1977-yr1984,
Blundell Blond
……. Vediamo teoria e poi
applicazioni………..
Vari stimatori GMM dinamici








FirsDiff: Yit – yit-1 =  (yit-1 – yit-2) + (uit – uit1) which is y =  yt-1 + u
Eliminato errore idiosincratico in ogni caso
Ma rimane auto correlation in errors to test..
Ma abbiamo ancora correlazione e violazione
esogeneità date le relazioni tra storia di y e
errore u.
IV  good one could be yt-2 o yt-2 yt-3..
Iv interni si ricercano tra i ritardi
Metodo meno ‘artigianale’ di IV esterni, più automatico
gestito dal software
poi posso/devo strumentare anche X (nel within non posso
usare ritardi come IV, rimane endogeneità)
Anderson Hsiao estimator (oldest), si veda Greene






Without group effects, there is a ‘simple’ IV
estimator available
We can use differences (yit-1 – yit-2) or levels
(yit-2, yit-3, etc..) as IV
One main question is whether differences or
levels are better
Arellano (1989) shows levels are preferable..
But others have shown that in dynamic models
there is a lot of info to be used from the
relationships between levels and differences
Remember IV estimators are inefficient, pros and
cons
IV in dynamic models: which?

Con Yt-1 abbiamo difatto una endogeneità indotta
dalle differenze prime…


Strumento Yt-2 o ritardo della differenza prima di Y
….non correlato con errore trasformato!!!!




Monte Carlo tests dimostrano che finite sample bias
è piccolo, anche rispetto a Arellano Bond..
MA HS ormai poco utilizzato, un solo strumento, S.E.
alti, molto impreciso….
È un modello base, storico
HS IV estimator
GMM large family that
generalise alla models
IV issue is the key one

One step, two step
. xtabond n w k ys yr1978-yr1984, nocons twostep vce(robust)
 Warning: gmm two-step standard errors are biased; robust
standard errors are recommended.
 Instruments for differenced equation



Standard: D.w D.k D.ys D.yr1978 D.yr1979 D.yr1980
D.yr1981 D.yr1982 D.yr1983 D.
One step consistente ma meno efficiente del 2 steps, SE sotto
stimati

NB Applicando un 2 step (residui dalla prima one step,
implementiamo un AB 2 steps) correggiamo usano matrice varcov

Arellano Blond estimators (90’s)







Xtabond2, molto usata, supera una serie di limiti: non riusciamo a escludere i
ritardi secondi della dipendente, quelli remoti si, recenti no,
stima qualunque modello panel lineare…….grazie alla sintassi…………Rudman spiega
nei papers come funziona xtabond2
consente di ridurre numerosi strumenti
sintassi piu complessa (es. Includere ritardata)
tende a dare enfasi al termine Yt-1 come ***
Xtabond2 y l.y w k x years nolevelq noco twostep robust iv(w k x years: esogeni)
gmm(l.y)
xtabond2 presenta test serial correlation e sargan tests e Hansen tests (robust, ma
debole se troppi strumenti..)

Si possono imporre meno restrizioni, se riduco esogene.

Applica BB (noleveleq applica AB invece), system GMM option
New routine XTABOND2

restringere numero strumenti (anni),
e scegliere alcune X esogene,
migliora le fit.
Scarsa evidenza dinamica in AB può
dipendere da weak instruments
 Abbiamo tests per weak instr.

Numero IV è il problema

Simile a xtabond, è xtdpdsys, applica Blundell Blond


postestimation — Postestimation tools for xtdpdsys

The following postestimation commands are of special interest
after xtdpdsys:
 command description
 estat abond test for autocorrelation
 estat sargan Sargan test of overidentifying restrictions

New XTPDSYS command

Blundell Blond impongono restrizioni………..assenza
di correlazione negli errore come in AB, però
modellano condizione iniziale su Y

Modello bi equazionale, una in livelli una in
differenze……



In differenze usa strumenti di AB
In livelli usa strumenti in differenze prime…sono
validi strumenti se vale mean stationarity, non sono
correlate con i
BB
mean stationarity
Problema da testare è l’uso di strumenti
 Trade off, ma parsimonia raccomandata
 Da gestire al margine…non facile.

Complexity of IV sets
T high, we can use within and LSDV corrected (Judson and
Owen , 1999, Economic letters)
GMM rationale is then higher when T is low / N high and we
have endogenous regressors.
If N*T large, within and LSDV can be used
consistently
 Only if X exogenous

GMM problem! Finite sample bias
(low N*T driven by low N)

Test ‘induttivo’
◦ Il B del modello GMM deve essere compreso tar
quello del modello OLS con yt-1 e del modello
within con yt-1
Un Byt-1 significativo almeno al 10%
giustifica uso GMM (ratio teorica deve
esistere sempre)
 Test di specificazione

◦ Hansen, sargan
◦ Problema di over identification ed eccessivo uso
degli strumenti. Usare parsimonia, trade off
marginali da gestire
Robustezza GMM


Validità (ESOGENE)
◦ TESTING? Non possiamo testare tutto nel complesso, ma
controllare validità sovra identificazioni….test over
identyfing restrictions…….
◦ se sono valide dovremmo avere assenza di signif diversa
da 0
 SARGAN TEST: se vicino non rifiutiamo hp
validità strumenti
Rilevanza: strumenti buoni previsori…
Sargan tests

estat abond


Arellano-Bond test for zero autocorrelation in first-differenced errors
+-----------------------+
|Order | z
Prob > z|
|------+----------------|
| 1 |-2.5915 0.0096 |
| 2 |-.75236 0.4518 |
non possiamo rifiutare HO assenza di correlazione
+-----------------------+
H0: no autocorrelation

estat sargan









Sargan test of overidentifying restrictions
H0: overidentifying restrictions are valid



chi2(27)
= 87.26388
Prob > chi2 = 0.0000, in ambito di one test sargan over rejects, quindi ci affidiamo a
ESTAT A BOND come valutazione........
tests

In generale, uso parco degli
strumenti……….


Finite sample bias con alti strumenti,
in campioni finiti hanno un
bias….GMM tendono ad avere un bias
piu alto in campioni finiti con numero
strumenti elevato…


SONO TUTTI DISTORTI
Use IV difference for levels and level IV
for differences
 This is the system of level and differences

System GMM
Non GMM estimators
Easier, more performing but limited
Lsdvc routine in STATA applies the LSDVC
corrected estimator.
 Preferable when panel is balanced and
exogenous regressors (rare cases)
 Reference: Judson and Owen, 1999,
Economic letters; G. Bruno papers

GMM vs Kiviet or corrected LSDV
Differenze non mi risolvono tutti problemi
endogen. Nel dinamico
 Uso strumenti t-2, etc.. In differenze o livelli o
entrambi
 Modelli within consistenti se var esogene X
 Con endogeneità X, non consistenti nemmeno se
N*T alto
 Devo usare GMM (non within tranformation) i
‘momenti’ di esogeneità rispetto alle lagged Y e X
mi definiscono il set delle IV

Summing up
Da modelli storici ma limitati come Anderson
Hsiao a vari Arellano Blond ai GMM SYS
 Trade off: necessito strumenti ma anche di uso
parco strumenti, test su numero e forza
strumenti
 Comparare sempre GMM con OLS e WiThin
 Posso usare LSDVC corretto se panel bialnciato
ed X esogene, usa HS AB BB come stimatori di
base

Summing up
Scarica

GMM dynamic models