ANALISI DELLA COVARIANZA
Per stabilire come varia la domanda di un bene in
funzione non solo del reddito disponibile, ma
anche di fattori sociali o ambientali si può
impiegare l’analisi della covarianza, che combina il
modello di regressione con l’analisi della varianza,
consentendo di valutare gli effetti dei fattori sia
quantitativi che qualitativi.
1
Scopo dell’ANCOVA
Con l’analisi della covarianza si cerca di vedere se il
consumo di un bene obbedisce alla stessa legge per
diversi gruppi di famiglie.
2
Il consumo del prodotto o del gruppo di prodotti in
esame si può esprimere secondo il modello:
Yij è spesa totale
della famiglia jma appartenente
al gruppo i-mo
ai e bi sono i
parametri incogniti
che dipendono
dal gruppo i
uij è la componente
erratica della
famiglia j-ma
appartenente al
gruppo i-mo
yij  a i  bi x ij  u ij
xij è spesa per il
consumo del prodotto
in esame della famiglia
j-ma appartenente al
gruppo i-mo
i=1,2,…,q individua la modalità di raggruppamento delle famiglie;
3
j=1,2,…,p individua la singola famiglia all’interno di ciascun gruppo;
In base ai valori che possono assumere i parametri
ai e bi nell’ambito dei vari gruppi, le situazioni che si
possono presentare sono sintetizzate nella seguente
tabella:
4
ai = tra loro
ai ≠ tra loro
bi =tra loro
1
2
bi ≠ tra loro
3
4
5
Quadrante 1
ai
bi
6
Quadrante 2
ai
bi
ai
bi
7
Quadrante 3
ai
bi
ai
bi
8
Quadrante 4
ai
bi
ai
bi
9
I TEST DI IPOTESI
L’analisi consiste nel sottoporre a verifica se vi è
convenienza a suddividere l’insieme delle famiglie in
gruppi.
Si ipotizza che la suddivisione in gruppi delle famiglie
non ha alcun effetto sulla variabile dipendente, cioè
all’interno di ciascun gruppo si assiste allo stesso
andamento dei consumi in relazione a tutte le famiglie.
Tale ipotesi si verifica attraverso il test F di FisherSnedecor.
10
La verifica del test si basa sulla seguente
considerazione:
la variabilità della componente erratica nel modello di
regressione senza la suddivisione in gruppi è maggiore
dell’analoga variabilità nel modello con suddivisione in
gruppi.
11
Per la proprietà della scomposizione della devianza si ha:
q
nj
 (u
i 1 j 1
 u )   uij  u j    ui  u 
q
nj
2
2
ij
q
i 1 j 1
Devianza totale
dell’errore
2
i 1
Devianza
esterna
Devianza
interna
12
q
Essendo:
 u  u 
2
i 1
si ha che:
q
i
nj
 (u
i 1 j 1
0
 u )   uij  u j 
q
nj
2
2
ij
i 1 j 1
la devianza del modello senza suddivisione in gruppi è
maggiore di quella calcolata con la suddivisione.
13
Tale considerazione resta valida se dalle devianze si passa
alle varianze.
Con le varianze è possibile effettuare il test di verifica
utilizzando la F di Fisher-Snedecor, in cui viene ad essere
testato l’incremento di varianza nel passare dal modello
con suddivisione al modello senza, in corrispondenza di
due ipotesi.
14
H0 : b1 = b2 = b3 =…= bt
La suddivisione in gruppi è ininfluente, avendosi lo
stesso andamento della spesa per il consumo del
bene in analisi.
H1 : b1  b2  b3 ...  bt
esiste un diverso andamento
all’interno dei gruppi.
del
consumo
15
Modello con suddivisione
Per il calcolo delle varianze da utilizzare nel test F, si parte dal
modello iniziale con la suddivisione in gruppi:
yij=ai+bixij+uij
[1]
Si calcolano le medie del primo e del secondo membro
ottenendosi:
yi  a i  bi x i  u i
Sottraendo la prima equazione alla seconda si passa al
modello centrato:
y
ij
 yi   bi xij  xi   uij  ui 
2
16
Modello senza suddivisione
Il modello senza suddivisione in gruppi può essere così
formulato:
yj=at+bt xj+uj
Effettuando le medie, si ha:
y..  a t  b t x..  u..
Sottraendo la prima equazione alla seconda si ottiene il
modello centrato:
y j  y..  b t x j  x..  u j  u..
3
In cui:
- y.. e x.. sono le medie delle rispettive variabili calcolate su tutte
le famiglie;
- at e bt sono i coefficienti che si ottengono utilizzando nella stima
17
le osservazioni concernenti tutte le modalità di raggruppamento.
Indicando con ESS2 la somma delle devianze di ciascun
gruppo, nota anche come devianza interna,
ESS2 =
  u
i
j
 ui 
2
ij
e con ESS3 la devianza totale dell’errore del modello senza
suddivisione in gruppi,
2
ESS3 =
F1 è uguale a:
F1
 u  u..
j
j
E SS 3  E SS 2  / 2q  2

E SS 2 / k  2q 
q
dove: (2q-2) e (k-2q) sono i gradi di libertà e
indica il numero complessivo delle osservazioni.
k   ni
i 1
18
F1<F1*
accetto H0: la suddivisione delle famiglie in gruppi è
perfettamente inutile, c’è omogeneità di comportamento.
F1>F1*
rigetto H0: all’interno di ciascun gruppo di famiglie c’è una
relazione spesa totale-consumo diversa.
19
Accertata la significativa diversità dal modello senza
suddivisione in gruppi (F1>F1*) si possono avere due
possibilità:
- le intercette dei modelli che descrivono le varie
modalità sono tra loro diverse, ma i coefficienti angolari
sono statisticamente uguali fra loro, ma diversi da bt;
per cui le diversità nei comportamenti consistono in
differenti livelli di consumo;
- oltre alle ai sono statisticamente diverse tra loro anche
le bi ; per cui le diverse modalità di raggruppamento
sottintendono comportamenti di consumo
completamente diversi.
20
Al fine di verificare in quale delle 2 situazioni ci si
trovi si può supporre che i coefficienti angolari siano
uguali ad un particolare valore bw (w sta per within)
comune a tutti i gruppi.
21
Per verificare tale ipotesi vanno considerate:
a) la devianza dei residui di tale modello, che può scriversi:
yij=ai+bwxij+uij
Calcolando le medie si ha:
yi  a i  b w x i  u i
Sottraendo membro a membro si perviene al relativo
modello centrato:
yij  yi   ai  ai   bw xij  xi   uij  ui 
b) la devianza del modello iniziale con suddivisione in gruppi
opportunamente centrato, come nel caso visto in
precedenza, che risulta inferiore alla devianza calcolata sub
a).
22
Occorre verificare la significatività dell’incremento della
varianza che si ha passando dal modello in cui i vari gruppi
presentano coefficienti angolari bi statisticamente uguali tra
loro a quello in cui i gruppi sono caratterizzati da
coefficienti angolari statisticamente diversi tra loro.
Si calcola il test F:
H0 : b1=b2=b3=……=bw
H1 : b1b2b3……bw
23
Indicando con ESS2 la somma dei quadrati dei residui del
modello con suddivisione in gruppi e con ESS4 la devianza
totale dell’errore del modello con suddivisione in gruppi
caratterizzati da un coefficiente angolare comune bw.
 E SS 4  E SS 2  / q  1
F2 
E SS 2 / k  2q 
Dove (q-1) e (k-2q) sono i gradi di libertà e k indica il
numero totale delle osservazioni.
24
F2<F2*
si accetta H0: l’eterogeneità dei gruppi si traduce soltanto nelle
differenze fra le intercette
F2>F2*
Si accettata H1: il criterio di raggruppamento sottintende una
completa eterogeneità del comportamento di consumo nei
gruppi di famiglie individuati dalle i modalità
25
ai = tra loro
bi=
bi
(1) Accettazione
Ho di F1.
(3) Accettazione
H1 di F1
ai  tra loro
(2) Accettazione
Ho di F2
(4) Accettazione
H1 di F2
26
Scarica

l`analisi della covarianza