Corso di Laurea in Scienze e tecniche psicologiche Esame di Psicometria L’anova fattoriale between A cura di Matteo Forgiarini [email protected] 1 Il test anova Esercitazione N° 5 – L’anova between Spesso per scopi di ricerca siamo interessati a stabilire se due popolazioni indipendenti in media mostrano valori statisticamente diversi per la stessa variabile osservata – misurata su scala ordinale. Nelle precedenti analisi abbiamo affrontato e risolto questo problema mediante il t-test: abbiamo confrontato le due medie osservate sui due differenti campioni e analizzando la significatività del valore t sperimentale, abbiamo potuto decidere se accettare o rifiutare l’ipotesi nulla di uguaglianza delle due medie. Ma... Se si volessero confrontare contemporaneamente i valori medi di più di due campioni? Ad esempio, in riferimento al file “competenze.sav”, è possibile domandarsi se i soggetti nati prima del 1948, tra il 1948 e il 1954 e i dopo il 1954, abbiano in media la stessa pressione massima. È un tipo di domanda frequente in molte ricerche: di fatto stiamo cercando di capire se il fattore “età” influisce sulla variabile “pressione massima”; ovvero se nelle 3 differenti fasce di età i soggetti hanno in media la stessa pressione o se le medie differiscono significativamente. In questo caso non è possibile utilizzare i modelli di regressione perché la V.I. non è quantitativa. Per rispondere a questo tipo di domande occorre utilizzare il test anova. 2 Il test anova Esercitazione N° 5 – L’anova between Occorre utilizzare l’anova ogni volta che: •Si vuole sapere se una V.D. (misurata su scala a rapporto o a intervallo) presenta valori medi uguali nei diversi livelli di un a V.I. (misurata su scala qualsiasi). Cioè: •Si vuole sapere se una variabile categoriale influisce su una variabile quantitativa. •Ogni livello della V.I. forma un gruppo di soggetti: dunque ogni livello della V.I. ha un proprio valore medio della V.D. •La V.I. ha più di due livelli: dunque occorre confrontare contemporaneamente più di due medie. •Se la V.I. ha 2 livelli, è indifferente utilizzare l’anova o il t-test (cfr. diapositive successive). Indicando con µ1, µ2, … µk le medie della V.D. nei k livelli della V.I., l’ipotesi nulla del test anova risulta: H0: µ1= µ2=…= µk H1: µ i≠ µj per almeno una coppia di livelli della V.I. (i e j indicano 2 generici livelli della V.I.) 3 L’anova between fattoriale Esercitazione N° 5 – L’anova between Oltre alle applicazioni fino ad ora affrontate, l’anova permette di rispondere a domande più complesse: infatti è possibile inserire contemporaneamente più di un avariabile indipendente. Ovvero... È possibile eseguire l’anova su disegni fattoriali tramite i quali viene testata, oltre agli effetti principali dei singoli fattori sulla variabile dipendente, anche l’interazione tra i fattori stessi. Infatti se sulla variabile dipendente agiscono 2 fattori contemporaneamente è possibile che essi interagiscano tra loro e che l’effetto di un fattore sulla variabile dipendente sia “modulato” dall’altro fattore, ovvero è possibile che l’effetto del fattore 1 assuma valori differenti nei diversi livelli del fattore 2. Ipotizziamo di testare l’ipotesi che la pressione sanguigna sia influenzata contemporaneamente dal sesso dei soggetti (livello1=femmina;livello2=maschio) e dall’essere fumatori o no dei soggetti stessi. Stiamo testando un anova between fattoriale 2X2. 4 L’anova between fattoriale Esercitazione N° 5 – L’anova between Per testare i modelli anova fattoriali, occorre scegliere il modello lineare generalizzato univariato; nei fattori fissi, inseriamo il “genere” e la variabile “fuma”; inoltre l’analisi dei grafici risulta interessante e utile alla comprensione: selezioniamo “plots” e inseriamo i due fattori per ottenere due diverse linee; infine “aggiungiamo” il grafico desiderato. 5 L’anova between fattoriale Esercitazione N° 5 – L’anova between Tests of Between-Subjects Effects Dependent Variable: pres sione mas sima Effetti principali Interazione Type III Sum Source of Squares Corrected Model 10596,207 a Intercept 1729967,459 genere 616,785 fuma 8907,754 genere * fuma 59,637 Error 9847,069 Total 1836589,000 Corrected Total 20443,276 df 3 1 1 1 1 94 98 97 Mean Square F 3532,069 33,717 1729967,459 16514,249 616,785 5,888 8907,754 85,033 59,637 ,569 104,756 Sig. ,000 ,000 ,017 ,000 ,452 a. R Squared = ,518 (Adjusted R Squared = ,503) Testando un modello fattoriale con due variabili indipendenti verranno eseguiti 3 test f: un test per l’effetto principale del fattore 1, un test per l’effetto principale del fattore 2 e un test sull’interazione tra i due fattori. Dall’analisi degli output, possiamo notare che gli effetti principali dei due fattori risultano significativi (p-value<0,05): la media della pressione sanguigna dei maschi risulta statisticamente diversa da quella delle femmine; similmente i non fumatori hanno una pressione media differente dai fumatori. Risulta interessante notare che l’interazione tra i fattori risulta non significativa: i due fattori in modo indipendente hanno influenza sulla V.D., ma l’effetto di ogni fattore non varia nei diversi livelli dell’altro fattore: il fattore “genere” influisce in ugual misura per i fumatori e per i non fumatori; similmente è possibile concludere che il fattore “fuma” influisce sulla V.D. con la 6 stessa forza in modo indipendente dal genere dei soggetti. L’anova between fattoriale Estimated Marginal Means of pressione massima genere del soggetto 150 maschio femmina Estimated Marginal Means 145 140 Esercitazione N° 5 – L’anova between È possibile notare la mancanza di interferenza tra i fattori anche osservando il grafico che spss ha prodotto: le linee sono quasi parallele: infatti la riduzione di pressione nei soggetti non fumatori ha quasi la stessa entità per i maschi e per le femmine. Dicendo che le linee sono “quasi” parallele, considerando che l ’ interazione non risulta significativa, affermiamo che il “quasi” identifica una differenza tanto piccola da non rendere significativo l ’ effetto di interazione. 135 130 125 120 fumatore non fumatore fuma 7 L’anova between fattoriale Tests of Between-Subjects Effects Dependent Variable: pres sione mas sima Type III Sum Source of Squares Corrected Model 3945,062a Intercept 1777436,257 genere 1404,369 città 627,491 genere * città 1690,121 Error 16915,298 Total 1881902,000 Corrected Total 20860,360 df 7 1 1 3 3 92 100 99 Mean Square 563,580 1777436,257 1404,369 209,164 563,374 183,862 a. R Squared = ,189 (Adjusted R Squared = ,127) F 3,065 9667,234 7,638 1,138 3,064 Sig. ,006 ,000 ,007 ,338 ,032 Esercitazione N° 5 – L’anova between Analizziamo ora un modello anova fattoriale che permetta di capire se la pressione sanguigna (V.D.) è influenzata dal genere dei soggetti (fattore 1) e contemporaneamente dalla residenza in diverse città lombarde (Bergamo, Milano, Cremona e Varese) (fattore 2). Dall’analisi degli output, notiamo che il fattore genere risulta significativo (p-value<0,05); il fattore “città” risulta invece non significativo (p-value>0,05): possiamo quindi concludere che la pressione sanguigna dei soggetti non è influenzata in modo significativo dai differenti stili di vita delle 4 città lombarde.. Contemporaneamente la pressione dei soggetti maschi risulta statisticamente diversa da quella dei soggetti femmine. Ma... Notiamo che l’interazione tra i due fattori risulta significativa (p-value<0,05): possiamo quindi concludere che il fattore “genere” influenza la pressione sanguigna in modo differente nelle 4 città. Esaminiamo il grafico... 8 L’anova between fattoriale Esercitazione N° 5 – L’anova between Estimated Marginal Means of pressione massima città di provenienza bergamo cremona 145 varese Estimated Marginal Means milano 140 135 Le quattro rette non risultano parallele: la riduzione media della pressione sanguigna delle femmine rispetto ai maschi non è omogenea nelle 4 città lombarde considerate. In particolare a Milano si può notare che le femmine hanno in media una pressione maggiore dei soggetti maschi. 130 maschio femmina genere del soggetto 9 Alcuni pattern di risultati possibili MAINprincipali EFFECTS Effetti B1 B2 B1 B2 A1 A2 A1 A2 Nessun effetto NO EFFECTS B1 B2 B1 B2 A1 A2 A1 A2 10 Alcuni pattern di risultati possibili INTERACTIONS Interazione B1 B2 B1 B2 A1 A2 A2 A1 B2 B2 B1 B1 A1 A2 A1 A2 A3 A4 11