ANOVA BETWEEN l’ANOVA BETWEEN è un’estensione del test T per il confronto tra medie di due campioni indipendenti disegni fattoriali Variabile indipendente due più di due Anova univariata a una via Anova univariata a due vie Anova univariata a più vie una Anova bivariata a una via Anova bivariata a due vie Anova bivariata a più vie due Anova multivariata a una via Anova multivariata a due vie Anova multivariata a più vie più di due Variabile dipendente una Between subjects: c’è un diverso gruppo di soggetti per ogni livello della variabile indipendente ANOVA BETWEEN – Introduzione ANOVA BETWEEN FATTORE/I: variabile/i indipendente/i LIVELLI DEI FATTORI: numero di modalità di ogni variabile indipendente. Il numero di fattori determina il numero di gruppi k. ESEMPIO ANOVA A 1 VIA: variabile indipendente “sesso” 2 livelli (“maschio” e “femmina”) ANOVA A 2 VIE: variabili indipendenti “sesso” e “età” 3 livelli (“giovane”, “adulto”, “anziano”) ESEMPIO EFFETTI PRINCIPALI: medie della variabile dipendente per ogni livello (“maschio”, “femmina”, giovane”, “adulto”, “anziano”) INTERAZIONI: medie della variabile dipendente per ogni cella di incrocio dei livelli (“maschio*giovane”, “maschio*adulto”, “maschio*anziano”, “femmina*giovane”, “femmina*adulto”, “femmina*anziano”) ANOVA BETWEEN – Terminologia ANOVA BETWEEN Variabile indipendente X Gruppo A Media Gruppo A Gruppo B Media Gruppo B Gruppo C Media Gruppo C Variabile dipendente Y yij valore della variabile Y per il soggetto i (i=1,…,nj) appartenente al gruppo j (j=1,..,k) ANOVA BETWEEN – A UNA VIA ANOVA BETWEEN yij y ( y j y ) ij Gruppo A Gruppo C Gruppo B Le differenze TRA gruppi si misurano confrontando le medie di gruppo con la media generale y VARIABILITA’ TRA GRUPPI Misura dell’effetto del trattamento ANOVA BETWEEN – A UNA VIA yj ANOVA BETWEEN yij y ( y j y ) ij Gruppo A Gruppo B Gruppo C Le differenze NEI gruppi si misurano confrontando i valori dei singoli soggetti yij con la media del gruppo y j a cui appartengono VARIABILITA’ NEI GRUPPI. ij rappresenta il fattore casuale (detto errore sperimentale): errore non è sinonimo di sbaglio, ma indica l’effetto di uno o più fattori sconosciuti, comunque non valutati o non controllati nell'esperimento. ANOVA BETWEEN – A UNA VIA ANOVA BETWEEN Gli errori εij: devono essere tra loro indipendenti (il punteggio di un soggetto non deve essere correlato con quello di altri soggetti). L’assegnazione casuale dei soggetti alle diverse condizioni sperimentali fa in modo che le osservazioni non siano correlate – Coefficiente di correlazione interclasse per la valutazione dell’indipendenza, devono essere distribuiti normalmente, le varianze dei vari gruppi devono essere omogenee (omoschedasticità) – Test di Levene per la verifica dell’omoschedasticità, gli effetti hanno una natura additiva ANOVA BETWEEN – A UNA VIA ANOVA BETWEEN j=1,2,…,k indice di gruppo k nj i=1,2,…,nj indice dell’individuo nj k k j 1 j 1 i 1 2 2 2 ( y y ) ( y y ) n ( y y ) ij j ij j j j 1 i 1 Devianza totale (n-1) gdl Devianza TRA gruppi Devianza NEI gruppi (BETWEEN) (WITHIN) (k-1) gdl ANOVA BETWEEN – A UNA VIA (n-k) gdl ANOVA BETWEEN H0: m1=m2=…=mk (le popolazioni di provenienza dei campioni hanno medie uguali per la variabile dipendente Y) H1: mi ≠ mj per almeno un i e un j (i≠j) (almeno due campioni provengono da popolazioni con medie diverse) Statistica Test F di Snedecor Dev Between (k 1) F[( k 1),( n k )] DevW ithin (n k ) F(1,2) F(2,4) F(5,10) La zona di rifiuto dell’ipotesi nulla è sempre nella coda di destra. ANOVA BETWEEN – A UNA VIA F(10,50) ANOVA BETWEEN Lo studio investiga l’effetto che il mascheramento di un testimone ha sulla memoria e sulla percezione dei giurati rispetto alla testimonianza dello stesso testimone. Fattore between: “Presentation condition” con 4 livelli “unmasked” (non mascherato), “greyblob” (punto grigio), “pixelated” (diviso in pixel), “negated” (nero e bianco invertiti). Variabile dipendente: percentuale di fatti raccontati dai testimoni e ricordati dai giurati L’ipotesi è che ci potrebbe essere un effetto negativo del mascheramento sulla memoria. H0: munmasked=mgreyblob=mpixelated=mnegated H1: mi ≠ mj per almeno un i e un j (i≠j) ANOVA BETWEEN – A UNA VIA ANOVA BETWEEN ANALYZE → COMPARE MEANS → ONE WAY ANOVA In DEPENDENT LIST inserire la variabile dipendente In FACTOR inserire la variabile indipendente In OPTIONS selezionare Descriptive e Homogeneity of variance test Descriptives MEMORY N unmasked greyblob pixelated negated Total 10 10 10 10 40 Mean 66.70 55.70 57.70 67.20 61.83 Std. Deviation 5.334 3.802 5.417 4.590 7.001 Std. Error 1.687 1.202 1.713 1.451 1.107 95% Confidence Interval for Mean Lower Bound Upper Bound 62.88 70.52 52.98 58.42 53.82 61.58 63.92 70.48 59.59 64.06 Medie di gruppo Numerosità di gruppo ANOVA BETWEEN – A UNA VIA Minimum 58 48 51 58 48 Maximum 75 61 68 74 75 ANOVA BETWEEN Test di Levene: Test of Homogeneity of Variances MEMORY Levene Statis tic .490 H0: omoschedasticità df1 df2 3 36 Sig. .692 H1: eteroschedasticità P-value>a accetto ipotesi nulla Valore sperimentale= valore della statistica test (F di Snedecor) ANOVA P-value MEMORY Between Groups Within Groups Total Sum of Squares 1071.875 839.900 1911.775 Devianze df 3 36 39 Gradi di libertà Mean Square 357.292 23.331 F 15.314 Sig. .000 p-value < a → rifiuto l’ipotesi nulla Il mascheramento ha un effetto significativo sulla memoria. Varianze=Devianze/gdl ANOVA BETWEEN – A UNA VIA ANOVA BETWEEN Se nel confronto tra le medie di k gruppi con il test F è stata rifiutata l’ipotesi nulla H0: m1=m2=…=mk si pone il problema di verificare tra quali medie esista una differenza significativa. I confronti multipli a posteriori (confronti non pianificati, post hoc comparisons) sono utili quando non è possibile programmare i confronti a priori per mancanza di informazioni. Si effettuano, quindi, tutti i possibili confronti tra le medie alla ricerca di quelle differenze che hanno determinato la significatività totale (ogni media viene confrontata tra tutte le altre). Per questi confronti sono stati proposti diversi metodi che, come impostazione logica, derivano dal test T di Student per ipotesi bidirezionali. Il ricercatore tenderà a scegliere il test post hoc che garantisce la potenza del test maggiore (1-b=p(rifiutare H0/H1 è vera)) senza tuttavia dimenticare il problema legato all’errore di primo tipo a (vedi disuguaglianza di Bonferroni): a TOT ai p p=numero di confronti tra medie ai=significatività di ogni confronto post hoc ANALYZE → COMPARE MEANS → ONE WAY ANOVA In POST HOC selezionare TUKEY e BONFERRONI ANOVA BETWEEN – A UNA VIA ANOVA BETWEEN Multiple Comparisons Dependent Variable: MEMORY Tukey HSD (I) Presentation condition unm asked greyblob pixelated negated Bonferroni unm asked greyblob pixelated negated (J) Pres entation condition greyblob pixelated negated unm asked pixelated negated unm asked greyblob negated unm asked greyblob pixelated greyblob pixelated negated unm asked pixelated negated unm asked greyblob negated unm asked greyblob pixelated Mean Difference (I-J) 11.00* 9.00* -.50 -11.00* -2.00 -11.50* -9.00* 2.00 -9.50* .50 11.50* 9.50* 11.00* 9.00* -.50 -11.00* -2.00 -11.50* -9.00* 2.00 -9.50* .50 11.50* 9.50* Std. Error 2.160 2.160 2.160 2.160 2.160 2.160 2.160 2.160 2.160 2.160 2.160 2.160 2.160 2.160 2.160 2.160 2.160 2.160 2.160 2.160 2.160 2.160 2.160 2.160 Sig. .000 .001 .996 .000 .791 .000 .001 .791 .001 .996 .000 .001 .000 .001 1.000 .000 1.000 .000 .001 1.000 .001 1.000 .000 .001 *. The m ean difference is significant at the .05 level. H0: differenza medie nulla; H1: differenza medie non nulla ANOVA BETWEEN – A UNA VIA 95% Confidence Interval Lower Bound Upper Bound 5.18 16.82 3.18 14.82 -6.32 5.32 -16.82 -5.18 -7.82 3.82 -17.32 -5.68 -14.82 -3.18 -3.82 7.82 -15.32 -3.68 -5.32 6.32 5.68 17.32 3.68 15.32 4.97 17.03 2.97 15.03 -6.53 5.53 -17.03 -4.97 -8.03 4.03 -17.53 -5.47 -15.03 -2.97 -4.03 8.03 -15.53 -3.47 -5.53 6.53 5.47 17.53 3.47 15.53 ANOVA BETWEEN PRINCIPALI (indipendentemente dai valori delle altre variabili indipendenti) EFFETTI INTERAZIONI (l’effetto di una variabile indipendente sulla variabile dipendente non è uguale per tutti i livelli delle altre variabili indipendenti) Un’ipotesi per ogni fattore principale (ipotesi sulle medie) IPOTESI Un’ipotesi per le interazioni (ipotesi sulle differenze di medie) ANOVA BETWEEN – A DUE VIE ANOVA BETWEEN A con 4 livelli (a, b, c, d) ANOVA A 2 VIE 2 FATTORI B con 5 livelli (1, 2, 3, 4, 5) Per il fattore A H0: µa = µb = µc = µd H1: almeno una coppia di medie diversa IPOTESI Per il fattore B H0: µ1 = µ2 = µ3 = µ4 = µ5 H1: almeno una coppia di medie diversa Per l’interazione A*B H0: (µ1-µ2)a = (µ1-µ3)a = …= (µ1-µ2)b =(µ1-µ3)b=…= (µ1-µ2)c= (µ1-µ3)c=… ANOVA BETWEEN – A DUE VIE ANOVA BETWEEN y ij Valore della variabile Y per il soggetto i (i=1,…,n) appartenente al livello j (j=1,…k) y. j Media della variabile Y per il livello j (j=1,…k) - media di colonna - yi . Media della variabile Y per il soggetto i (i=1,…n) - media di riga - ANOVA BETWEEN – A DUE VIE ANOVA BETWEEN DEVIANZA TOTALE DEVIANZA NEI GRUPPI DEVIANZA TRA I GRUPPI DEVIANZA EFFETTO PRINCIPALE 1°FATTORE DEVIANZA EFFETTO PRINCIPALE 2°FATTORE DEVIANZA EFFETTO INTERAZIONE ANOVA BETWEEN – A DUE VIE ANOVA BETWEEN k1= livelli del 1°fattore (n-1) n-(k1*k2) k2=livelli del 2°fattore DEVIANZA TRA I GRUPPI (k1-1) (k2-1) Si costruiscono 3 test F del tipo DevTRA gdl Dev NEI gdl (k1-1)*(k2-1) ANOVA BETWEEN – A DUE VIE ANOVA BETWEEN Lo studio considera l’effetto che il fascino e il genere dell’imputato possono esercitare sulla giuria durante un processo. Nello studio in esame viene consegnata a 60 persone la testimonianza (sotto forma di testo scritto) di un ipotetico imputato con la descrizione dell’omicidio commesso. 20 persone ricevono solamente la testimonianza scritta, 20 persone la testimonianza scritta e una fotografia di un imputato affascinante e, infine, 20 persone ricevono la testimonianza scritta e una fotografia di un imputato non affascinante. (La fotografia può essere indifferentemente di un uomo o di una donna). Ai partecipanti viene chiesto di indicare quanti anni di prigione l’imputato dovrebbe scontare come punizione. Fattore between 1: “Attractiveness” con 3 livelli “attractive”, “unattractive”, “no picture”. Fattore between 2: “Sex differences” con 2 livelli “same sex as defendant” e “opposite sex as defendent” (indicato nella testimonianza scritta o nella fotografia). Variabile dipendente: sentenza data sotto forma di numero di anni da scontare in carcere (minimo 3, massimo 25 anni). L’ipotesi è che imputati non affascinanti ricevano pene più dure e che la durata delle pene dipenda anche dal genere dell’imputato. File: twowaybetweenANOVA.sav ANOVA BETWEEN – A DUE VIE ANOVA BETWEEN ANALYZE → GENERAL LINEAR MODEL → UNIVARIATE In DEPENDENT VARIABLE inserire la variabile dipendente In FIXED FACTORS inserire le variabili indipendenti In OPTIONS selezionare Descriptive Statistics ANOVA BETWEEN – A DUE VIE ANOVA BETWEEN Between-Subjects Factors Sex Differences 1 2 Attractivenes s 1 2 3 Value Label Sam e s ex as defendant Oppos ite s ex as defendant Attractive Unattractive No picture N 30 30 Nella prima tabella, SPSS riporta i fattori e i corrispondenti livelli nonché il numero di soggetti per ogni livello. 20 20 20 Sex Differences * Attractiveness Descriptive Statistics Dependent Variable: Sentence Sex Differences Same s ex as defendant Opposite s ex as defendant Total Attractivenes s Attractive Unattractive No picture Total Attractive Unattractive No picture Total Attractive Unattractive No picture Total Mean 7.50 11.20 14.50 11.07 7.50 10.30 13.50 10.43 7.50 10.75 14.00 10.75 Std. Deviation 1.780 2.300 1.269 3.403 2.415 2.058 1.650 3.191 2.065 2.173 1.522 3.286 Sex Differences N 10 10 10 30 10 10 10 30 20 20 20 60 ANOVA BETWEEN – A DUE VIE Attractiveness ANOVA BETWEEN Effetti principali Interazione Tests of Between-Subjects Effects Dependent Variable: Sentence Source Corrected Model Intercept SEX ATTRACT SEX * ATTRACT Error Total Corrected Total Type III Sum of Squares 431.550 a 6933.750 6.017 422.500 3.033 205.700 7571.000 637.250 df 5 1 1 2 2 54 60 59 Mean Square 86.310 6933.750 6.017 211.250 1.517 3.809 F 22.658 1820.236 1.579 55.457 .398 Sig. .000 .000 .214 .000 .674 a. R Squared = .677 (Adjusted R Squared = .647) L’effetto principale della variabile genere (SEX) non è significativo (p-value 0.214). C’è una significatività nell’effetto principale della variabile fascino (ATTRACT) (p<0.0005). Non c’è interazione significativa tra i due fattori (p-value 0.674). ANOVA BETWEEN – A DUE VIE ANOVA BETWEEN GRAPH → BAR → SIMPLE In OTHER SUMMARY FUNCTION inserire la variabile dipendente In CATEGORY AXIS inserire la variabile indipendente significativa 16 14 12 Mean Sentence 10 8 6 Attractive Attractiveness ANOVA BETWEEN – A DUE VIE Unattractive No picture