Corso di Laurea in
Scienze e tecniche psicologiche
Esame di
Psicometria
L’anova fattoriale between
A cura di
Matteo Forgiarini
[email protected]
1
Il test anova
Esercitazione N° 5 – L’anova
between
Spesso per scopi di ricerca siamo interessati a stabilire se due popolazioni indipendenti in media
mostrano valori statisticamente diversi per la stessa variabile osservata – misurata su scala
ordinale.
Nelle precedenti analisi abbiamo affrontato e risolto questo problema mediante il t-test:
abbiamo confrontato le due medie osservate sui due differenti campioni e analizzando la
significatività del valore t sperimentale, abbiamo potuto decidere se accettare o rifiutare
l’ipotesi nulla di uguaglianza delle due medie.
Ma...
Se si volessero confrontare contemporaneamente i valori medi di più di due campioni?
Ad esempio, in riferimento al file “competenze.sav”, è possibile domandarsi se i soggetti nati
prima del 1948, tra il 1948 e il 1954 e i dopo il 1954, abbiano in media la stessa pressione
massima.
È un tipo di domanda frequente in molte ricerche: di fatto stiamo cercando di capire se il fattore
“età” influisce sulla variabile “pressione massima”; ovvero se nelle 3 differenti fasce di età i
soggetti hanno in media la stessa pressione o se le medie differiscono significativamente.
In questo caso non è possibile utilizzare i modelli di regressione perché la V.I. non è
quantitativa.
Per rispondere a questo tipo di domande occorre utilizzare il test anova.
2
Il test anova
Esercitazione N° 5 – L’anova
between
Occorre utilizzare l’anova ogni volta che:
•Si vuole sapere se una V.D. (misurata su scala a rapporto o a intervallo) presenta valori medi
uguali nei diversi livelli di un a V.I. (misurata su scala qualsiasi).
Cioè:
•Si vuole sapere se una variabile categoriale influisce su una variabile quantitativa.
•Ogni livello della V.I. forma un gruppo di soggetti: dunque ogni livello della V.I. ha un proprio
valore medio della V.D.
•La V.I. ha più di due livelli: dunque occorre confrontare contemporaneamente più di due medie.
•Se la V.I. ha 2 livelli, è indifferente utilizzare l’anova o il t-test (cfr. diapositive successive).
Indicando con µ1, µ2, … µk le medie della V.D. nei k livelli della V.I., l’ipotesi nulla del test anova
risulta:
H0: µ1= µ2=…= µk
H1: µ i≠ µj per almeno una coppia di livelli della V.I. (i e j indicano 2 generici livelli della V.I.)
3
L’anova between fattoriale
Esercitazione N° 5 – L’anova
between
Oltre alle applicazioni fino ad ora affrontate, l’anova permette di rispondere a domande più
complesse: infatti è possibile inserire contemporaneamente più di un avariabile indipendente.
Ovvero...
È possibile eseguire l’anova su disegni fattoriali tramite i quali viene testata, oltre agli effetti
principali dei singoli fattori sulla variabile dipendente, anche l’interazione tra i fattori stessi.
Infatti se sulla variabile dipendente agiscono 2 fattori contemporaneamente è possibile che essi
interagiscano tra loro e che l’effetto di un fattore sulla variabile dipendente sia “modulato”
dall’altro fattore, ovvero è possibile che l’effetto del fattore 1 assuma valori differenti nei
diversi livelli del fattore 2.
Ipotizziamo di testare l’ipotesi che la pressione sanguigna sia influenzata contemporaneamente
dal sesso dei soggetti (livello1=femmina;livello2=maschio) e dall’essere fumatori o no dei
soggetti stessi.
Stiamo testando un anova between fattoriale 2X2.
4
L’anova between fattoriale
Esercitazione N° 5 – L’anova
between
Per testare i modelli anova fattoriali, occorre scegliere il modello lineare generalizzato univariato; nei
fattori fissi, inseriamo il “genere” e la variabile “fuma”; inoltre l’analisi dei grafici risulta interessante
e utile alla comprensione: selezioniamo “plots” e inseriamo i due fattori per ottenere due diverse linee;
infine “aggiungiamo” il grafico desiderato.
5
L’anova between fattoriale
Esercitazione N° 5 – L’anova
between
Tests of Between-Subjects Effects
Dependent Variable: pres sione mas sima
Effetti
principali
Interazione
Type III Sum
Source
of Squares
Corrected Model
10596,207 a
Intercept
1729967,459
genere
616,785
fuma
8907,754
genere * fuma
59,637
Error
9847,069
Total
1836589,000
Corrected Total
20443,276
df
3
1
1
1
1
94
98
97
Mean Square
F
3532,069
33,717
1729967,459 16514,249
616,785
5,888
8907,754
85,033
59,637
,569
104,756
Sig.
,000
,000
,017
,000
,452
a. R Squared = ,518 (Adjusted R Squared = ,503)
Testando un modello fattoriale con due variabili indipendenti verranno eseguiti 3 test f: un test
per l’effetto principale del fattore 1, un test per l’effetto principale del fattore 2 e un test
sull’interazione tra i due fattori.
Dall’analisi degli output, possiamo notare che gli effetti principali dei due fattori risultano
significativi (p-value<0,05): la media della pressione sanguigna dei maschi risulta statisticamente
diversa da quella delle femmine; similmente i non fumatori hanno una pressione media differente
dai fumatori.
Risulta interessante notare che l’interazione tra i fattori risulta non significativa: i due fattori
in modo indipendente hanno influenza sulla V.D., ma l’effetto di ogni fattore non varia nei
diversi livelli dell’altro fattore: il fattore “genere” influisce in ugual misura per i fumatori e per i
non fumatori; similmente è possibile concludere che il fattore “fuma” influisce sulla V.D. con la
6
stessa forza in modo indipendente dal genere dei soggetti.
L’anova between fattoriale
Estimated Marginal Means of pressione massima
genere del soggetto
150
maschio
femmina
Estimated Marginal Means
145
140
Esercitazione N° 5 – L’anova
between
È possibile notare la mancanza di
interferenza tra i fattori anche
osservando il grafico che spss ha
prodotto: le linee sono quasi
parallele: infatti la riduzione di
pressione nei soggetti non
fumatori ha quasi la stessa entità
per i maschi e per le femmine.
Dicendo che le linee sono
“quasi” parallele, considerando
che l ’ interazione non risulta
significativa, affermiamo che il
“quasi” identifica una differenza
tanto piccola da non rendere
significativo l ’ effetto di
interazione.
135
130
125
120
fumatore
non fumatore
fuma
7
L’anova between fattoriale
Tests of Between-Subjects Effects
Dependent Variable: pres sione mas sima
Type III Sum
Source
of Squares
Corrected Model
3945,062a
Intercept
1777436,257
genere
1404,369
città
627,491
genere * città
1690,121
Error
16915,298
Total
1881902,000
Corrected Total
20860,360
df
7
1
1
3
3
92
100
99
Mean Square
563,580
1777436,257
1404,369
209,164
563,374
183,862
a. R Squared = ,189 (Adjusted R Squared = ,127)
F
3,065
9667,234
7,638
1,138
3,064
Sig.
,006
,000
,007
,338
,032
Esercitazione N° 5 – L’anova
between
Analizziamo ora un modello
anova fattoriale che permetta di
capire se la pressione sanguigna
(V.D.) è influenzata dal genere dei
soggetti
(fattore
1)
e
contemporaneamente
dalla
residenza
in
diverse
città
lombarde (Bergamo, Milano,
Cremona e Varese) (fattore 2).
Dall’analisi degli output, notiamo che il fattore genere risulta significativo (p-value<0,05); il
fattore “città” risulta invece non significativo (p-value>0,05): possiamo quindi concludere che la
pressione sanguigna dei soggetti non è influenzata in modo significativo dai differenti stili di vita
delle 4 città lombarde.. Contemporaneamente la pressione dei soggetti maschi risulta
statisticamente diversa da quella dei soggetti femmine.
Ma...
Notiamo che l’interazione tra i due fattori risulta significativa (p-value<0,05): possiamo quindi
concludere che il fattore “genere” influenza la pressione sanguigna in modo differente nelle 4
città.
Esaminiamo il grafico...
8
L’anova between fattoriale
Esercitazione N° 5 – L’anova
between
Estimated Marginal Means of pressione massima
città di provenienza
bergamo
cremona
145
varese
Estimated Marginal Means
milano
140
135
Le quattro rette non risultano
parallele: la riduzione media della
pressione sanguigna delle femmine
rispetto ai maschi non è omogenea
nelle 4 città lombarde considerate. In
particolare a Milano si può notare
che le femmine hanno in media una
pressione maggiore dei soggetti
maschi.
130
maschio
femmina
genere del soggetto
9
Alcuni pattern di risultati possibili
MAINprincipali
EFFECTS
Effetti
B1
B2
B1
B2
A1
A2
A1
A2
Nessun
effetto
NO EFFECTS
B1
B2
B1
B2
A1
A2
A1
A2
10
Alcuni pattern di risultati possibili
INTERACTIONS
Interazione
B1
B2
B1
B2
A1
A2
A2
A1
B2
B2
B1
B1
A1
A2
A1
A2
A3
A4
11
Scarica

Lucidi 5MP - e