Corso di Laurea in
Psicologia Clinica, dello Sviluppo e Neuropsicologia
Esame di
Analisi Multivariata dei Dati
Il T-Test
A cura di
Matteo Forgiarini
[email protected]
1
Il T-Test
Scala nominale
La scala nominale non ha le caratteristiche vere e proprie di una unità di misura poiché
permette di rilevare dati solo di tipo qualitativo: è perciò privo di senso avere un indicatore
che rappresenti la distribuzione dei dati.
L’unico indicatore che possa essere utilizzato è la moda che indica il dato con la maggiore
frequenza.
Menù: analizza -> statistiche descrittive -> frequenze
Statistics
genere del s oggetto
N
Valid
Mis sing
Mode
100
0
1
La moda è rappresentata dal valore 1 (maschio) che ha la frequenza
più alta.
genere del soggetto
genere del soggetto
60
50
Valid
Frequency
40
mas chio
femmina
Total
Frequency
54
46
100
Percent
54,0
46,0
100,0
Valid Percent
54,0
46,0
100,0
Cumulative
Percent
54,0
100,0
30
20
10
0
maschio
femmina
genere del soggetto
2
Il T-Test
Scala ordinale
Nel caso di misure su scala ordinale in aggiunta alla moda è possibile usare la mediana come
indicatore di tendenza centrale.
Mediana: modalità dell’osservazione che divide la distribuzione in due parti uguali: quel
valore al di sopra e al di sotto del quale cade un ugual numero di osservazioni.
Statistics
grado di is truzione
N
Valid
Mis sing
Median
Mode
grado di istruzione
99
1
2,000
2,0
40
grado di istruzione
Valid
Mis sing
Total
Frequency
s cuola media inferiore
21
s cuola media s uperiore
40
laurea
24
mas ter/dottorato
14
Total
99
Sys tem
1
100
Percent
21,0
40,0
24,0
14,0
99,0
1,0
100,0
Valid Percent
21,2
40,4
24,2
14,1
100,0
Cumulative
Percent
21,2
61,6
85,9
100,0
Frequency
30
20
10
0
scuola media
inferiore
scuola media
superiore
laurea
master/dottorato
grado di istruzione
3
Il T-Test
Scala a intervallo o a rapporto
Le scale ad intervalli equivalenti ed a rapporti equivalenti rappresentano il più alto livello di misurazione.
È quindi possibile utilizzare analisi statistiche più raffinate rispetto a quelle possibili con variabili misurate
ai precedenti livelli di misura.
L’indicatore di tendenza centrale che è possibile utilizzare in questi casi è la media: la somma delle misure
osservate diviso il numero di osservazioni fatte.
L’indicatore di variabilità più usato con questo tipo di variabili è la varianza o scarto quadratico medio
che indica la dispersione dei valori rispetto alla media della variabile.
Histogram
Menù: analizza -> statistiche
descrittive -> frequenze -> istogramma
con curva normale
20
Statistics
15
100
0
136,42
132,00
132
14,516
210,711
Frequency
pres s ione mas s ima
N
Valid
Mis sing
Mean
Median
Mode
Std. Deviation
Variance
10
5
Mean = 136,42
Std. Dev. = 14,516
N = 100
0
110
120
130
140
150
pressione massima
160
170
4
Il T-Test
Il test T per campioni indipendenti
Il test T per campioni indipendenti viene utilizzato per confrontare COPPIE di
valori medi (di una variabile dipendente) Y misurata su due gruppi diversi di
soggetti, distinti per una variabile indipendente.
Ad esempio, si consideri la variabile Y “punteggio ottenuto ad un certo test” e si
considerino due gruppi di soggetti determinati dal genere - uomo o donna (variabile
indipendente): è possibile affermare che in media le donne ottengono un punteggio y
significativamente più alto?
IPOTESI NULLA H0:m1=m2
IPOTESI ALTERNATIVA H1:m1<m2 oppure m1>m2 oppure m1 ≠ m2
5
Il T-Test
Il test T per campioni indipendenti
Mi chiedo se la media della variabile “pressione sanguigna” è uguale nei maschi e nelle femmine. Quindi:
H0: µf= µm
H1: µ f ≠ µ m
Group Statistics
pres s ione mas s ima
genere del s oggetto
mas chio
femmina
N
54
46
Mean
140,07
132,13
Std. Deviation
15,012
12,780
Std. Error
Mean
2,043
1,884
Independent Samples Test
Levene's Tes t for
Equality of Variances
F
pres s ione mas s ima
Equal variances
ass umed
Equal variances
not as sumed
2,824
Sig.
,096
t-tes t for Equality of Means
t
df
Sig. (2-tailed)
Mean
Difference
Std. Error
Difference
95% Confidence
Interval of the
Difference
Lower
Upper
2,822
98
,006
7,944
2,815
2,357
13,530
2,858
98,000
,005
7,944
2,779
2,429
13,459
Il test risulta significativo (significatività < 0,05), quindi posso rifiutare l’ipotesi nulla e concludere che la
media della pressione sanguigna risulta statisticamente diversa nella popolazione dei maschi rispetto alla
popolazione delle femmine.
6
Il T-Test
Il test T per campioni dipendenti
Il test T per campioni appaiati viene utilizzato per confrontare i valori medi di due variabili dipendente Y1 eY2
misurate in momenti diversi sullo stesso gruppo di soggetti o misurate su due gruppi di soggetti in qualche
modo legati tra loro.
Ad esempio, mi chiedo se la media delle variabili “pre-test di attenzione” e “post-test di attenzione” è uguale
nella popolazione esaminata: prendo quindi in esame tutti i soggetti e confronto i valori medi delle due
variabili sullo stesso campione. Quindi:
H0: µy1= µy2
H1: µy1 ≠ µy2
Paired Samples Statistics
Pair
1
Mean
19,52
23,00
Pre-test attenzione
Pos t-tes t attenzione
N
100
100
Std. Deviation
3,395
4,645
Std. Error
Mean
,339
,464
Paired Samples Test
Paired Differences
Mean
Pair
1
Pre-test attenzione Pos t-tes t attenzione
-3,480
Std. Deviation
Std. Error
Mean
5,629
,563
95% Confidence
Interval of the
Difference
Lower
Upper
-4,597
-2,363
t
-6,182
df
Sig. (2-tailed)
99
,000
Il test risulta significativo (significatività < 0,05), posso quindi rifiutare l’ipotesi nulla e concludere che
le medie delle due variabili siano significativamente differenti.
7
Scarica

Lucidi 1 il test t - e