Riassumendo: ipotesi per OLS
1. Modello lineare
2. X e Y sono frutto di osservazioni indipendenti
3. X è di rango pieno
4. I residui hanno media = 0
5. I residui sono omoschedastici e incorrelati
6. X è non-stocastica
Neghiamo la 5:
E(’)=
E(’)=
Naturalmente  è una matrice simmetrica positiva definita
Allora si può scomporre secondo i suoi autovalori/autovettori:
  C C '
C  autovettori
  autovalori
matrice
diagonale
PARENTESI: Autovalori () e autovettori (C)
Sono la soluzione del sistema:
(  I )C  0
soluzione
se Det (  I )  0
1 
5 1 
5  
Es :   
 (  I )  


2
4
2
4






Det (  I )  (5   )( 4   )  2  2  9  18
Det (  I )  0 se 1  6 o 2  3
Il numero di soluzioni (autovalori) è pari alla dimensione della matrice
PARENTESI: Autovalori e autovettori
Abbiamo  torniamo all’equazione iniziale e troviamo C
(  I )C  0
sotto il vincolo C ' C  1
soluzione se Det (  I )  0
1   c1 
5  
Es : 
0



4    c2 
 2
  6  c1  c2  0  c1  c2
  3  2c1  c2  0  c1 
1
c2
2
Per trovare i valori di C (autovalori) dobbiamo sfruttare il vincolo:
1 2 
  6  c1  c2  C  

1 2 
1 5 
1
  3  c1  c2  C  

2
 1 5 
  CC '
C  autovettori
  autovalori
matrice
diagonale
C1 2  P'   1  P' P
usiamo P come " peso"
Y  X  
cioè
PY  PX  P
otteniamo Y  X   
*
per
*
*
con V ( * )  P 2  1 P'   2 I
Si possono utilizzare OLS sui dati trasformati !!!!
  C C '
C  autovettori
OLS :
b*  ( X * ' X * ) 1 X * ' Y *  ( X ' P ' PX ) 1 X ' P ' PY 
b*  ( X '  1 X ) X '  1Y
Stimatore GLS
Un esempio numerico OLS:
y
x
x'
20
1
10
1
1
1
30
1
0
10
0
5
40
1
5
OLS
X'X
(X'X)-1
X'Y
B
3
15
0,83
-0,10
90
35
15
125
-0,10
0,02
400
-1
Un esempio numerico GLS_1:
y
x
x'
20
1
10
1
1
1
30
1
0
10
0
5
40
1
5

()1
0,5
0
0
2
0
0
0
0,2
0
0
5
0
0
0
0,3
0
0 3,333
GLS
X'()1
(X'()-1X)
2
5 3,333
10,33 36,67
20
0 16,67
36,67 283,3
(X'()-1X)-1
0,18 -0,02
-0,02
0,01
X'()-1Y
B
323,3
33,16
1067
-0,53
Riassumend o
GLS
 nota
B  ( X '  1 X ) X '  1Y
E ( B)  
V ( B)   2 ( X '  1 X ) 1
NB: La varianza della stima NON va calcolata come in OLS ma tenendo conto della Ω
(Y   ' X )' (Y   ' X )
OLS : s 

N K
N K
1
1

'


(
Y


'
X
)'

(Y   ' X )
2
GLS
s 

N K
N K
2
 '
Non esiste un corrispondente dell’indice di Determinazione Lineare la funzione
minimizzata e le sue statistiche riguarda i residui dei dati pesati * non gli 
Che il modello “pesato” abbia un buon adattamento, poco dice su quello originale
Caso di  non noto, stima FGLS
Cioè  va stimata, con non pochi problemi:
, in generale, ha n(n+1)/2 parametri, ovviamente non è possibile stimarla
Direttamente a partire da n osservazioni
Dobbiamo imporre qualche restrizione, cioè ipotizzare che  dipenda da
un numero (ristretto) di parametri, cioè che sia esprimibile nella forma
=  ()
Cioè dobbiamo ipotizzare un modello per la Var-Covar del fenomeno
Determinata la forma della  non noto, la stima FGLS consiste in processo iterativo
Con i seguenti passi:
1 : stima b ignorando  (OLS oppure
MLE )
ˆ mediante stima del parametro
2 : stima 
ˆ
3 : stima b GLS con

ripeti 2,3
fino
a convergenza
NB!! Solo MLE garantisce la convergenza,
alcune strutture di  non sono “trattabili” partendo da OLS
Attenzione !!!
In
MOLTO IMPORTANTE:
B  ( X ' 1 X ) X ' 1Y
Assume la funzione di una ponderazione che viene “applicata” ai dati
In quanto ponderazione NON è necessario che i suoi elementi siano
esattamente Varianze e Covarianze
Per garantire “buone proprietà” alla stima è SUFFICIENTE che la matrice
utilizzata come “ponderazione” sia PROPORZIONALE alla matrice di
VAR-COVAR
Ad esempio possiamo ipotizzare una situazione in cui la varianza individuale sia
proporzionale alla X: p.es. (reddito-consumo) i più ricchi sono più variabili nel
determinare l’ammontare del loro consumo (legge Engels)
Alcuni esempi di modelli di VAR-COVAR
Diversa per ogni
Gruppo-Effetto fisso
costante ogni
Gruppo Effetto fisso
Max eterogeneità
Max eterogeneità
A bande
Autoregressivo
Ordine 1
Moving average
Ordine q-1
Moving average
Ordine 2
Correlazione spaziale
F(distanza)
AR(1)
eterogeneo
Simmetrico
eterogeneo
fattoriale
eterogeneo
Scarica

Lucidi GLS