Corso di Laurea in Psicologia Clinica, dello Sviluppo e Neuropsicologia Esame di Analisi Multivariata dei Dati Il T-Test A cura di Matteo Forgiarini [email protected] 1 Il T-Test Scala nominale La scala nominale non ha le caratteristiche vere e proprie di una unità di misura poiché permette di rilevare dati solo di tipo qualitativo: è perciò privo di senso avere un indicatore che rappresenti la distribuzione dei dati. L’unico indicatore che possa essere utilizzato è la moda che indica il dato con la maggiore frequenza. Menù: analizza -> statistiche descrittive -> frequenze Statistics genere del s oggetto N Valid Mis sing Mode 100 0 1 La moda è rappresentata dal valore 1 (maschio) che ha la frequenza più alta. genere del soggetto genere del soggetto 60 50 Valid Frequency 40 mas chio femmina Total Frequency 54 46 100 Percent 54,0 46,0 100,0 Valid Percent 54,0 46,0 100,0 Cumulative Percent 54,0 100,0 30 20 10 0 maschio femmina genere del soggetto 2 Il T-Test Scala ordinale Nel caso di misure su scala ordinale in aggiunta alla moda è possibile usare la mediana come indicatore di tendenza centrale. Mediana: modalità dell’osservazione che divide la distribuzione in due parti uguali: quel valore al di sopra e al di sotto del quale cade un ugual numero di osservazioni. Statistics grado di is truzione N Valid Mis sing Median Mode grado di istruzione 99 1 2,000 2,0 40 grado di istruzione Valid Mis sing Total Frequency s cuola media inferiore 21 s cuola media s uperiore 40 laurea 24 mas ter/dottorato 14 Total 99 Sys tem 1 100 Percent 21,0 40,0 24,0 14,0 99,0 1,0 100,0 Valid Percent 21,2 40,4 24,2 14,1 100,0 Cumulative Percent 21,2 61,6 85,9 100,0 Frequency 30 20 10 0 scuola media inferiore scuola media superiore laurea master/dottorato grado di istruzione 3 Il T-Test Scala a intervallo o a rapporto Le scale ad intervalli equivalenti ed a rapporti equivalenti rappresentano il più alto livello di misurazione. È quindi possibile utilizzare analisi statistiche più raffinate rispetto a quelle possibili con variabili misurate ai precedenti livelli di misura. L’indicatore di tendenza centrale che è possibile utilizzare in questi casi è la media: la somma delle misure osservate diviso il numero di osservazioni fatte. L’indicatore di variabilità più usato con questo tipo di variabili è la varianza o scarto quadratico medio che indica la dispersione dei valori rispetto alla media della variabile. Histogram Menù: analizza -> statistiche descrittive -> frequenze -> istogramma con curva normale 20 Statistics 15 100 0 136,42 132,00 132 14,516 210,711 Frequency pres s ione mas s ima N Valid Mis sing Mean Median Mode Std. Deviation Variance 10 5 Mean = 136,42 Std. Dev. = 14,516 N = 100 0 110 120 130 140 150 pressione massima 160 170 4 Il T-Test Il test T per campioni indipendenti Il test T per campioni indipendenti viene utilizzato per confrontare COPPIE di valori medi (di una variabile dipendente) Y misurata su due gruppi diversi di soggetti, distinti per una variabile indipendente. Ad esempio, si consideri la variabile Y “punteggio ottenuto ad un certo test” e si considerino due gruppi di soggetti determinati dal genere - uomo o donna (variabile indipendente): è possibile affermare che in media le donne ottengono un punteggio y significativamente più alto? IPOTESI NULLA H0:m1=m2 IPOTESI ALTERNATIVA H1:m1<m2 oppure m1>m2 oppure m1 ≠ m2 5 Il T-Test Il test T per campioni indipendenti Mi chiedo se la media della variabile “pressione sanguigna” è uguale nei maschi e nelle femmine. Quindi: H0: µf= µm H1: µ f ≠ µ m Group Statistics pres s ione mas s ima genere del s oggetto mas chio femmina N 54 46 Mean 140,07 132,13 Std. Deviation 15,012 12,780 Std. Error Mean 2,043 1,884 Independent Samples Test Levene's Tes t for Equality of Variances F pres s ione mas s ima Equal variances ass umed Equal variances not as sumed 2,824 Sig. ,096 t-tes t for Equality of Means t df Sig. (2-tailed) Mean Difference Std. Error Difference 95% Confidence Interval of the Difference Lower Upper 2,822 98 ,006 7,944 2,815 2,357 13,530 2,858 98,000 ,005 7,944 2,779 2,429 13,459 Il test risulta significativo (significatività < 0,05), quindi posso rifiutare l’ipotesi nulla e concludere che la media della pressione sanguigna risulta statisticamente diversa nella popolazione dei maschi rispetto alla popolazione delle femmine. 6 Il T-Test Il test T per campioni dipendenti Il test T per campioni appaiati viene utilizzato per confrontare i valori medi di due variabili dipendente Y1 eY2 misurate in momenti diversi sullo stesso gruppo di soggetti o misurate su due gruppi di soggetti in qualche modo legati tra loro. Ad esempio, mi chiedo se la media delle variabili “pre-test di attenzione” e “post-test di attenzione” è uguale nella popolazione esaminata: prendo quindi in esame tutti i soggetti e confronto i valori medi delle due variabili sullo stesso campione. Quindi: H0: µy1= µy2 H1: µy1 ≠ µy2 Paired Samples Statistics Pair 1 Mean 19,52 23,00 Pre-test attenzione Pos t-tes t attenzione N 100 100 Std. Deviation 3,395 4,645 Std. Error Mean ,339 ,464 Paired Samples Test Paired Differences Mean Pair 1 Pre-test attenzione Pos t-tes t attenzione -3,480 Std. Deviation Std. Error Mean 5,629 ,563 95% Confidence Interval of the Difference Lower Upper -4,597 -2,363 t -6,182 df Sig. (2-tailed) 99 ,000 Il test risulta significativo (significatività < 0,05), posso quindi rifiutare l’ipotesi nulla e concludere che le medie delle due variabili siano significativamente differenti. 7