Riassumendo: ipotesi per OLS 1. Modello lineare 2. X e Y sono frutto di osservazioni indipendenti 3. X è di rango pieno 4. I residui hanno media = 0 5. I residui sono omoschedastici e incorrelati 6. X è non-stocastica Neghiamo la 5: E(’)= E(’)= Naturalmente è una matrice simmetrica positiva definita Allora si può scomporre secondo i suoi autovalori/autovettori: C C ' C autovettori autovalori matrice diagonale PARENTESI: Autovalori () e autovettori (C) Sono la soluzione del sistema: ( I )C 0 soluzione se Det ( I ) 0 1 5 1 5 Es : ( I ) 2 4 2 4 Det ( I ) (5 )( 4 ) 2 2 9 18 Det ( I ) 0 se 1 6 o 2 3 Il numero di soluzioni (autovalori) è pari alla dimensione della matrice PARENTESI: Autovalori e autovettori Abbiamo torniamo all’equazione iniziale e troviamo C ( I )C 0 sotto il vincolo C ' C 1 soluzione se Det ( I ) 0 1 c1 5 Es : 0 4 c2 2 6 c1 c2 0 c1 c2 3 2c1 c2 0 c1 1 c2 2 Per trovare i valori di C (autovalori) dobbiamo sfruttare il vincolo: 1 2 6 c1 c2 C 1 2 1 5 1 3 c1 c2 C 2 1 5 CC ' C autovettori autovalori matrice diagonale C1 2 P' 1 P' P usiamo P come " peso" Y X cioè PY PX P otteniamo Y X * per * * con V ( * ) P 2 1 P' 2 I Si possono utilizzare OLS sui dati trasformati !!!! C C ' C autovettori OLS : b* ( X * ' X * ) 1 X * ' Y * ( X ' P ' PX ) 1 X ' P ' PY b* ( X ' 1 X ) X ' 1Y Stimatore GLS Un esempio numerico OLS: y x x' 20 1 10 1 1 1 30 1 0 10 0 5 40 1 5 OLS X'X (X'X)-1 X'Y B 3 15 0,83 -0,10 90 35 15 125 -0,10 0,02 400 -1 Un esempio numerico GLS_1: y x x' 20 1 10 1 1 1 30 1 0 10 0 5 40 1 5 ()1 0,5 0 0 2 0 0 0 0,2 0 0 5 0 0 0 0,3 0 0 3,333 GLS X'()1 (X'()-1X) 2 5 3,333 10,33 36,67 20 0 16,67 36,67 283,3 (X'()-1X)-1 0,18 -0,02 -0,02 0,01 X'()-1Y B 323,3 33,16 1067 -0,53 Riassumend o GLS nota B ( X ' 1 X ) X ' 1Y E ( B) V ( B) 2 ( X ' 1 X ) 1 NB: La varianza della stima NON va calcolata come in OLS ma tenendo conto della Ω (Y ' X )' (Y ' X ) OLS : s N K N K 1 1 ' ( Y ' X )' (Y ' X ) 2 GLS s N K N K 2 ' Non esiste un corrispondente dell’indice di Determinazione Lineare la funzione minimizzata e le sue statistiche riguarda i residui dei dati pesati * non gli Che il modello “pesato” abbia un buon adattamento, poco dice su quello originale Caso di non noto, stima FGLS Cioè va stimata, con non pochi problemi: , in generale, ha n(n+1)/2 parametri, ovviamente non è possibile stimarla Direttamente a partire da n osservazioni Dobbiamo imporre qualche restrizione, cioè ipotizzare che dipenda da un numero (ristretto) di parametri, cioè che sia esprimibile nella forma = () Cioè dobbiamo ipotizzare un modello per la Var-Covar del fenomeno Determinata la forma della non noto, la stima FGLS consiste in processo iterativo Con i seguenti passi: 1 : stima b ignorando (OLS oppure MLE ) ˆ mediante stima del parametro 2 : stima ˆ 3 : stima b GLS con ripeti 2,3 fino a convergenza NB!! Solo MLE garantisce la convergenza, alcune strutture di non sono “trattabili” partendo da OLS Attenzione !!! In MOLTO IMPORTANTE: B ( X ' 1 X ) X ' 1Y Assume la funzione di una ponderazione che viene “applicata” ai dati In quanto ponderazione NON è necessario che i suoi elementi siano esattamente Varianze e Covarianze Per garantire “buone proprietà” alla stima è SUFFICIENTE che la matrice utilizzata come “ponderazione” sia PROPORZIONALE alla matrice di VAR-COVAR Ad esempio possiamo ipotizzare una situazione in cui la varianza individuale sia proporzionale alla X: p.es. (reddito-consumo) i più ricchi sono più variabili nel determinare l’ammontare del loro consumo (legge Engels) Alcuni esempi di modelli di VAR-COVAR Diversa per ogni Gruppo-Effetto fisso costante ogni Gruppo Effetto fisso Max eterogeneità Max eterogeneità A bande Autoregressivo Ordine 1 Moving average Ordine q-1 Moving average Ordine 2 Correlazione spaziale F(distanza) AR(1) eterogeneo Simmetrico eterogeneo fattoriale eterogeneo