Corso di Laurea magistrale in
Psicologia Clinica, dello Sviluppo e Neuropsicologia
Esame di
Analisi Multivariata dei Dati
Introduzione all’analisi fattoriale.
A cura di
Matteo Forgiarini
1
L’analisi fattoriale è una tecnica di analisi multivariata solitamente impiegata per:
• semplificare e ridurre la quantità di informazioni di cui si dispone su un determinato
oggetto di studio; le informazioni vengono infatti sintetizzate per poter essere
comprese e gestite in modo più agevole.
• Individuare le dimensioni latenti – spesso chiamate fattori o componenti –
sottostanti all’insieme di variabili osservato.
Tali scopi sono strettamente legati e vengono raggiunti mediante l’individuazione dei
fattori comuni e delle saturazioni che indicano la “forza” del legame tra le variabili
osservate e i fattori individuati.
Per portare a temine correttamente una analisi fattoriale occorre eseguire differenti
tipologie di analisi;
Dopo avere compreso la natura dei dati di cui si dispone e avere fissato gli obiettivi
dell’analisi, è possibile riassumere le operazioni da svolgere in 2 macro steps:
• estrarre i fattori;
• interpretare la soluzione ottenuta.
2
Utilizziamo il file “Adjective list”.
Il file contiene i dati relativi ad una ricerca effettuata per identificare 5 tratti di
personalità mediante un questionario auto-compilato; il questionario è stato
strutturato con lo scopo di raccogliere i punteggi su una scala da 0 a 10 indicanti,
relativamente alle qualità espresse da ogni aggettivo, il possesso che i soggetti si
riconoscono di tali qualità.
Scopo della ricerca è quindi individuare le dimensioni latenti sottostanti – i fattori –
che semplificano, riassumono e permettono di spiegare i punteggi osservati sulle 25
variabili.
Il questionario è stato sottoposto a 300 soggetti; il file risulta quindi formato da una
matrice 300 X 25: ogni riga contiene i punteggi di un soggetto per tutte le 25
variabili. Ogni colonna contiene i punteggi di una variabile per tutti i 300 soggetti.
La variabile genere discrimina i soggetti maschi (1) dai soggetti di genere femminile
(0).
3
Estrazione dei fattori
Per estrarre i fattori latenti scegliamo il metodo delle “componenti principali”
(Principal Component Analysis): tale metodo a partire da un numero N di variabili
osservate, permette di individuare N componenti latenti ortogonali tra loro; l’insieme
delle N componenti individuate permette di riprodurre interamente la matrice di
varianza-covarianza delle variabili osservate.
4
Le componenti principali sono estratte in modo tale massimizzare la proporzione di
varianza spiegata; ogni componente spiega la massima parte della varianza delle N
variabili che non è ancora stata spiegata dalle componenti precedentemente estratte.
La varianza spiegata da ogni componente è chiamata autovalore della componente.
Risulta interessante analizzare il grafico della serie di autovalori (Scree-plot) associati
ad ogni componente estratta.
Come detto ogni componente è estratta in modo tale da massimizzare la varianza
spiegata dalla componente rispetto alla varianza totale delle N variabili osservate.
Pertanto gli autovalori hanno valore decrescente in quanto ogni componente spiega
una quantità di varianza osservata necessariamente minore rispetto alle precedenti
componenti estratte. In caso contrario la componente sarebbe stata estratta ad un
passo precedente (!)
5
Selezionare l’opzione
scree-plot per ottenere il
grafico degli autovalori.
Come vedremo,
inizialmente vengono
estratte le componenti
con autovalore>1.
6
Selezionare questa opzione in modo tale che negli output le variabili siano
ordinate in ordine decrescente rispetto alle saturazioni.
7
Riportiamo la sintassi di SPSS relativa al modello analizzato:
FACTOR
/VARIABLES v1 v2 v3 v4 v5 v6 v7 v8 v9 v10 v11 v12 v13 v14 v15 v16 v17 v18 v19 v20 v21
v22 v23 v24 v25 /MISSING LISTWISE
/ANALYSIS v1 v2 v3 v4 v5 v6 v7 v8 v9 v10 v11 v12 v13 v14 v15 v16 v17 v18 v19 v20 v21
v22 v23 v24 v25
/PRINT INITIAL EXTRACTION
/FORMAT SORT
/PLOT EIGEN
/CRITERIA MINEIGEN(1) ITERATE(25)
/EXTRACTION PC
/ROTATION NOROTATE
/METHOD=CORRELATION .
8
Analisi degli output
L’analisi degli autovalori delle componenti viene utilizzata per determinare il numero
dei fattori adeguato a spiegare l’insieme delle variabili osservate.
Infatti occorre escludere dal modello le componenti che presentano un autovalore
minore di 1: tale componente infatti permetterebbe di spiegare una quantità di
varianza inferiore alla varianza di una variabile; ricordiamo che utilizzando la PCA,
la matrice di varianza-covarianza osservata presenta tutti 1 sulla diagonale principale
(le variabili vengono standardizzate, pertanto hanno media=0 e varianza=1) e le
componenti estratte riproducono l’intera varianza delle variabili osservate.
Una componente avente un autovalore <1 renderebbe quindi il modello meno
parsimonioso, non permetterebbe di semplificare i dati osservati e renderebbe la
soluzione più difficile da interpretare senza apportare un significativo vantaggio in
termini di potenza esplicativa.
9
MINEIGEN
Scree Plot
Dal grafico risulta che le prime 8
componenti hanno un autovalore >1.
Possiamo quindi escludere dal
modello tutte le ultime 17
componenti.
Eigenvalue
3
Si noti che, come previsto dal
metodo delle componenti principali,
il numero di autovalori, che è pari al
numero di componenti estratte,
corrisponde al numero di variabili
osservate.
2
Ora, sapendo che la PCA permette di
riprodurre interamente la matrice di
var-covar osservata, è possibile
calcolare la somma di tutti gli
autovalori estratti.
1
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
Component Number
10
SCREE-TEST
Scree Plot
Tracciamo una retta interpolante i
peggiori autovalori.
3
Eigenvalue
I fattori associati agli autovalori
sovrastanti la retta sono i fattori da
tenere.
2
1
0
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25
Component Number
11
Ordine di
estrazione delle
componenti
Valori degli autovalori estratti per
ogni componente
Total Variance Explained
Component
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
Total
3,062
2,317
1,991
1,550
1,370
1,125
1,078
1,020
,951
,910
,874
,826
,781
,750
,742
,713
,659
,647
,620
,593
,548
,501
,474
,458
,441
Initial Eigenvalues
% of Variance Cumulative %
12,247
12,247
9,268
21,515
7,964
29,478
6,199
35,677
5,480
41,157
4,500
45,656
4,314
49,970
4,082
54,051
3,803
57,855
3,639
61,493
3,496
64,989
3,303
68,292
3,125
71,417
3,001
74,418
2,968
77,385
2,853
80,239
2,637
82,875
2,588
85,463
2,482
87,944
2,372
90,317
2,192
92,509
2,002
94,512
1,895
96,406
1,831
98,237
1,763
100,000
Extraction Method: Principal Component Analysis.
Tot=25
Extraction Sums of Squared Loadings
Total
% of Variance Cumulative %
3,062
12,247
12,247
2,317
9,268
21,515
1,991
7,964
29,478
1,550
6,199
35,677
1,370
5,480
41,157
1,125
4,500
45,656
1,078
4,314
49,970
1,020
4,082
54,051
% della varianza spiegata da
ogni componente rispetto alla
varianza totale delle 25
variabili.
λ1=3.062;
varianza totale osservata=
=25 X 1=25;
proporzione di varianza
spiegata da
λ1=3.062/25=0.1224
% di varianza spiegata da
λ1=0.1224 X 100=12.24.
Si noti che le 25 componenti
complessivamente spiegano il
100% della varianza delle
variabili osservate.
La somma degli autovalori è
quindi pari a 25.
12
Total Variance Explained
Component
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
Total
3,062
2,317
1,991
1,550
1,370
1,125
1,078
1,020
,951
,910
,874
,826
,781
,750
,742
,713
,659
,647
,620
,593
,548
,501
,474
,458
,441
Initial Eigenvalues
% of Variance Cumulative %
12,247
12,247
9,268
21,515
7,964
29,478
6,199
35,677
5,480
41,157
4,500
45,656
4,314
49,970
4,082
54,051
3,803
57,855
3,639
61,493
3,496
64,989
3,303
68,292
3,125
71,417
3,001
74,418
2,968
77,385
2,853
80,239
2,637
82,875
2,588
85,463
2,482
87,944
2,372
90,317
2,192
92,509
2,002
94,512
1,895
96,406
1,831
98,237
1,763
100,000
Extraction Sums of Squared Loadings
Total
% of Variance Cumulative %
3,062
12,247
12,247
2,317
9,268
21,515
1,991
7,964
29,478
1,550
6,199
35,677
1,370
5,480
41,157
1,125
4,500
45,656
1,078
4,314
49,970
1,020
4,082
54,051
Come detto, inizialmente SPSS calcola la soluzione estraendo le componenti con λ>1.
In questo modello le 8 componenti estratte riproducono complessivamente il 54% della
varianza delle variabili osservate.
Il miglior modello ottenibile rappresenta il miglior “equilibrio” tra parsimonia del
modello, interpretabilità dei fattori e capacità di riprodurre la varianza osservata. (Cfr
diapositive successive.)
Extraction Method: Principal Component Analysis.
Ora, cosa possiamo dire rispetto ad ogni singola variabile osservata? Le 8 componenti
come sono legate alle variabili? E quanta varianza permettono di spiegare di ogni
variabile?
13
Component Matrixa
Sereno
Romantico
Sicuro
Diligente
Cos cienzios o
Stabile
Divertente
generos o
Espans ivo
Ricettivo
Estroverso
Colorito
Innovativo
Spens ierato
Forte
Stravagante
Tollerante
Originale
Aperto
Ospitale
leale
Scherzoso
Prudente
Previdente
Progres sis ta
1
,584
,562
,518
,497
,496
,446
,419
,052
,084
,200
,164
,270
,392
,387
,372
,223
,049
,066
,197
-,082
,350
,075
,373
,447
,330
2
-,106
-,140
-,211
-,101
-,220
-,018
,265
,673
,616
,580
,407
,385
-,005
-,151
-,168
,138
,316
,178
,089
,274
-,037
,354
-,264
-,083
,376
3
-,184
-,173
-,199
-,112
-,160
,371
-,398
-,155
,015
,183
-,078
,223
,575
,507
,478
,420
,169
,253
,092
-,062
-,470
-,098
-,083
-,200
-,251
Extraction Method: Principal Component Analysis .
a. 8 components extracted.
Component
4
5
,036
-,065
,023
-,066
,168
,050
,161
,054
,048
,314
-,044
,270
-,175
-,253
,089
,218
,066
,114
,190
-,284
-,307
,121
-,241
-,010
-,203
,168
-,283
,085
-,197
-,097
,250
-,396
,509
,226
,509
,014
,439
-,355
,124
,679
,133
-,017
-,393
,014
,152
,293
,093
-,077
-,324
-,181
6
-,176
-,208
,051
,052
-,189
-,003
-,285
-,003
-,165
,078
,247
-,068
-,207
,185
,153
,073
,132
-,225
,275
-,050
,471
,411
,392
-,172
-,059
7
-,050
,223
,007
-,235
-,319
,154
,071
,210
,135
-,186
-,259
,084
-,060
,075
,023
,243
,068
-,291
-,151
,085
,213
,126
-,145
,464
-,428
8
-,122
-,085
,199
,303
-,164
,225
,057
-,083
,313
-,089
-,360
-,178
,059
,077
-,153
-,102
-,421
,129
,307
,167
-,060
,355
-,110
-,108
,004
In questa matrice
vengono riportate le
saturazioni delle 8
componenti sulle 25
variabili. Come
richiesto, SPSS ordina
le variabili in modo tale
da mettere in evidenza
le saturazioni più
elevate e i gruppi di
variabili massimamente
spiegati da un fattore;
Utilizzando il metodo
della ACP, le
saturazioni delle
soluzioni iniziali
possono essere
interpretate come la
correlazione tra il
fattore e la rispettiva
14
variabile.
Component Matrixa
Sereno
Romantico
Sicuro
Diligente
Cos cienzios o
Stabile
Divertente
generos o
Espans ivo
Ricettivo
Estroverso
Colorito
Innovativo
Spens ierato
Forte
Stravagante
Tollerante
Originale
Aperto
2Ospitale
leale
Scherzoso
Prudente
Previdente
Progres sis ta
1
,584
,562
,518
,497
,496
,446
,419
,052
,084
,200
,164
,270
,392
,387
,372
,223
,049
,066
,197
-,082
,350
,075
,373
,447
,330
2
-,106
-,140
-,211
-,101
-,220
-,018
,265
,673
,616
,580
,407
,385
-,005
-,151
-,168
,138
,316
,178
,089
2 ,274
-,037
,354
-,264
-,083
,376
3
-,184
-,173
-,199
-,112
-,160
,371
-,398
-,155
,015
,183
-,078
,223
,575
,507
,478
,420
,169
,253
,092
2
-,062
-,470
-,098
-,083
-,200
-,251
Component
4
5
,036
-,065
,023
-,066
,168
,050
,161
,054
,048
,314
-,044
,270
-,175
-,253
,089
,218
,066
,114
,190
-,284
-,307
,121
-,241
-,010
-,203
,168
-,283
,085
-,197
-,097
,250
-,396
,509
,226
,509
,014
,439
-,355
,124 2
,679
,133
-,017
-,393
,014
,152
,293
,093
-,077
-,324
-,181
6
-,176
-,208
,051
,052
-,189
-,003
-,285
-,003
-,165
,078
,247
-,068
-,207
,185
,153
,073
,132
-,225
,275
-,050
,471
,411
,392
-,172
-,059
7
-,050
,223
,007
-,235
-,319
,154
,071
,210
,135
-,186
-,259
,084
-,060
,075
,023
,243
,068
-,291
-,151
2,085
,213
,126
-,145
,464
-,428
8
-,122
-,085
,199
,303
-,164
,225
,057
-,083
,313
-,089
-,360
-,178
,059
,077
-,153
-,102
-,421
,129
,307
,167
-,060
,355
-,110
-,108
,004
Ora, dato che le componenti estratte sono ortogonali, è possibile calcolare la proporzione
di varianza spiegata (comunalità) di ciascuna variabile sommando per riga i quadrati delle
saturazioni, ovvero sommando i quadrati delle correlazioni tra la variabile e ciascuna
componente.
Calcoliamo la comunalità della variabile “sereno”:
0,5842 + 0,106 + 0,1842 + 0,36 + 0,065 + 0,176 + 0,052 + 0,122 =0,44.
Le 8 componenti riescono complessivamente a spiegare il 44% della varianza della
variabile “sereno”.
Extraction Method: Principal Component Analysis .
a. 8 components extracted.
15
Communalities
Scherzoso
Estroverso
Espans ivo
Divertente
Colorito
Ospitale
leale
Tollerante
generos o
Romantico
Prudente
Cos cienzios o
Diligente
Previdente
Sereno
Sicuro
Stabile
Forte
Spens ierato
Innovativo
Ricettivo
Originale
Aperto
Stravagante
Progres sista
Initial
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
Extraction
,606
,565
,548
,589
,373
,599
,633
,640
,586
,471
,512
,585
,448
,517
,440
,425
,486
,491
,563
,604
,576
,511
,567
,539
,639
Extraction Method: Principal Component Analys is .
In questa matrice vengono riportate le comunalità
delle 25 variabili. In particolare vengono distinte:
- le comunalità calcolate sulla base delle 8
componenti selezionate: ogni valore è pari alla
somma dei quadrati delle saturazioni contenute nella
“component matrix” precedentemente analizzata.
Come stimato precedentemente utilizzando i valori
delle saturazioni, la comunalità della variabile
“sereno” è pari a 0,44.
- le comunalità calcolate sulla base di tutte le 25
componenti: utilizzando tutte le componenti, la PCA
permette di riprodurre l’intera varianza delle variabili
e di avere quindi per ogni variabile una comunalità
pari ad 1.
16
Continuiamo l’analisi
della component matrix.
Component Matrixa
Sereno
Romantico
Sicuro
Diligente
Cos cienzios o
Stabile
Divertente
generos o
Espans ivo
Ricettivo
Estroverso
Colorito
Innovativo
Spens ierato
Forte
Stravagante
Tollerante
Originale
Aperto
Ospitale
leale
Scherzoso
Prudente
Previdente
Progres sis ta
1
,584
,562
,518
,497
,496
,446
,419
,052
,084
,200
,164
,270
,392
,387
,372
,223
,049
,066
,197
-,082
,350
,075
,373
,447
,330
2
-,106
-,140
-,211
-,101
-,220
-,018
,265
,673
,616
,580
,407
,385
-,005
-,151
-,168
,138
,316
,178
,089
,274
-,037
,354
-,264
-,083
,376
3
-,184
-,173
-,199
-,112
-,160
,371
-,398
-,155
,015
,183
-,078
,223
,575
,507
,478
,420
,169
,253
,092
-,062
-,470
-,098
-,083
-,200
-,251
Extraction Method: Principal Component Analysis .
a. 8 components extracted.
Component
4
5
,036
-,065
,023
-,066
,168
,050
,161
,054
,048
,314
-,044
,270
-,175
-,253
,089
,218
,066
,114
,190
-,284
-,307
,121
-,241
-,010
-,203
,168
-,283
,085
-,197
-,097
,250
-,396
,509
,226
,509
,014
,439
-,355
,124
,679
,133
-,017
-,393
,014
,152
,293
,093
-,077
-,324
-,181
6
-,176
-,208
,051
,052
-,189
-,003
-,285
-,003
-,165
,078
,247
-,068
-,207
,185
,153
,073
,132
-,225
,275
-,050
,471
,411
,392
-,172
-,059
7
-,050
,223
,007
-,235
-,319
,154
,071
,210
,135
-,186
-,259
,084
-,060
,075
,023
,243
,068
-,291
-,151
,085
,213
,126
-,145
,464
-,428
8
-,122
-,085
,199
,303
-,164
,225
,057
-,083
,313
-,089
-,360
-,178
,059
,077
-,153
-,102
-,421
,129
,307
,167
-,060
,355
-,110
-,108
,004
Dall’analisi delle
saturazioni risulta che 2
componenti su 8 hanno
saturazioni elevate con una
sola variabile; inoltre la
variabile “progressista”
risulta spiegata in maniera
diffusa dalle componenti
estratte.
Il modello risulta quindi
poco parsimonioso e i
fattori non risultano
facilmente interpretabili.
Occorre ridurre il numero
dei fattori per semplificare
maggiormente i dati:
utilizziamo i risultati dello
scree test.
17
Inoltre sappiamo che le 25 variabili rappresentano 25 item misurati con lo scopo di
individuare 5 tratti di personalità dei 300 soggetti.
Anche da un punto di vista teorico appare quindi appropriato utilizzare 5 fattori.
Eseguiamo nuovamente l’analisi imponendo che vengano estratte 5 componenti.
18
Riportiamo la sintassi del modello con 5 fattori:
FACTOR
/VARIABLES v1 v2 v3 v4 v5 v6 v7 v8 v9 v10 v11 v12 v13 v14 v15 v16 v17 v18 v19 v20 v21
v22 v23 v24 v25 /MISSING LISTWISE
/ANALYSIS v1 v2 v3 v4 v5 v6 v7 v8 v9 v10 v11 v12 v13 v14 v15 v16 v17 v18 v19 v20 v21
v22 v23 v24 v25
/PRINT INITIAL EXTRACTION
/FORMAT SORT
/PLOT EIGEN
/CRITERIA FACTORS(5) ITERATE(25)
/EXTRACTION PC
/ROTATION NOROTATE
/METHOD=CORRELATION .
19
Total Variance Explained
Component
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
Total
3,062
2,317
1,991
1,550
1,370
1,125
1,078
1,020
,951
,910
,874
,826
,781
,750
,742
,713
,659
,647
,620
,593
,548
,501
,474
,458
,441
Initial Eigenvalues
% of Variance Cumulative %
12,247
12,247
9,268
21,515
7,964
29,478
6,199
35,677
5,480
41,157
4,500
45,656
4,314
49,970
4,082
54,051
3,803
57,855
3,639
61,493
3,496
64,989
3,303
68,292
3,125
71,417
3,001
74,418
2,968
77,385
2,853
80,239
2,637
82,875
2,588
85,463
2,482
87,944
2,372
90,317
2,192
92,509
2,002
94,512
1,895
96,406
1,831
98,237
1,763
100,000
Extraction Sums of Squared Loadings
Total
% of Variance Cumulative %
3,062
12,247
12,247
2,317
9,268
21,515
1,991
7,964
29,478
1,550
6,199
35,677
1,370
5,480
41,157
Extraction Method: Principal Component Analysis.
Complessivamente le 5 componenti spiegano il 41,15% della varianza osservata.
20
Component Matrixa
Sereno
Romantico
Sicuro
Diligente
Cos cienzios o
Previdente
Stabile
Divertente
Prudente
generos o
Espans ivo
Ricettivo
Estroverso
Colorito
Progres sis ta
Innovativo
Spens ierato
Forte
leale
Stravagante
Tollerante
Originale
Aperto
Scherzoso
Ospitale
1
,584
,562
,518
,497
,496
,447
,446
,419
,373
,052
,084
,200
,164
,270
,330
,392
,387
,372
,350
,223
,049
,066
,197
,075
-,082
2
-,106
-,140
-,211
-,101
-,220
-,083
-,018
,265
-,264
,673
,616
,580
,407
,385
,376
-,005
-,151
-,168
-,037
,138
,316
,178
,089
,354
,274
Component
3
-,184
-,173
-,199
-,112
-,160
-,200
,371
-,398
-,083
-,155
,015
,183
-,078
,223
-,251
,575
,507
,478
-,470
,420
,169
,253
,092
-,098
-,062
4
,036
,023
,168
,161
,048
,093
-,044
-,175
,152
,089
,066
,190
-,307
-,241
-,324
-,203
-,283
-,197
,133
,250
,509
,509
,439
-,393
,124
5
-,065
-,066
,050
,054
,314
-,077
,270
-,253
,293
,218
,114
-,284
,121
-,010
-,181
,168
,085
-,097
-,017
-,396
,226
,014
-,355
,014
,679
Estraendo 5 fattori le variabili
formano 4 gruppi; la variabile
“ospitale” risulta spiegata
prevalentemente dalla quinta
componente
Extraction Method: Principal Component Analysis .
a. 5 components extracted.
Proviamo ora a calcolare la comunalità della variabile sereno:
0,5842 + 0,1062 + 0,1842 + 0,0362 + 0,0652=0,39
21
Communalities
Scherzoso
Estroverso
Espans ivo
Divertente
Colorito
Ospitale
leale
Tollerante
generos o
Romantico
Prudente
Cos cienzios o
Diligente
Previdente
Sereno
Sicuro
Stabile
Forte
Spens ierato
Innovativo
Ricettivo
Originale
Aperto
Stravagante
Progres sista
Initial
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
1,000
Extraction
,295
,307
,405
,499
,329
,562
,362
,442
,535
,370
,325
,420
,298
,261
,392
,382
,412
,444
,517
,554
,527
,359
,374
,464
,452
Notiamo che rispetto al modello con 8 componenti le
comunalità sono inferiori.
Per esempio la variabile “sereno”, in accordo con la
stima ottenuta utilizzando le saturazioni, ha una
comunalità di 0,39: le 5 componenti spiegano
complessivamente il 39% della sua varianza.
Nel modello con 8 componenti la comunalità della
stessa variabile era pari al 44%.
Estraendo 5 componenti è possibile spiegare meno
varianza osservata, ma il modello permette di
semplificare maggiormente i dati e di ottenere fattori
più facilmente interpretabili.
Vedremo nella prossima esercitazione come sia
possibile ruotare la soluzione per chiarire
maggiormente il significato dei fattori.
Extraction Method: Principal Component Analys is .
22
Creazione ed utilizzo dei punteggi fattoriali
I punteggi fattoriali esprimono i punteggi di ogni soggetto in un fattore comune
estratto; insieme alle saturazioni permettono di riprodurre i punteggi dei soggetti nelle
variabili osservate:
Zik=Fi1ak1 + Fi2ak2 + ... + Uik
• Zik è il punteggio standardizzato che il soggetto i ottiene nella variabile k;
• Fi1 è il punteggio fattoriale del soggetto i nel fattore 1;
• Ak1 è la saturazione del fattore 1 per la variabile k;
• Uki è il punteggio standardizzato ottenuto dal soggetto i nel fattore unico della
variable k.
Utilizzando i punteggi fattoriali è possibile riassumere i valori delle variabili
osservate e quindi eseguire analisi dei dati più sintetiche e chiare.
23
Selezionare l’opzione “salva come variabili” per salvare all’interno del file di SPSS i
punteggi fattoriali per ogni soggetto rispetto alle 5 componenti estratte.
Selezionando questa opzione, viene visualizzata la matrice di varianza-covarianza dei
punteggi fattoriali di tutte le componenti.
24
Component Score Coefficient Matrix
Scherzoso
Estroverso
Espans ivo
Divertente
Colorito
Ospitale
leale
Tollerante
generos o
Romantico
Prudente
Cos cienzios o
Diligente
Previdente
Sereno
Sicuro
Stabile
Forte
Spens ierato
Innovativo
Ricettivo
Originale
Aperto
Stravagante
Progres sis ta
1
,024
,054
,027
,137
,088
-,027
,114
,016
,017
,184
,122
,162
,162
,146
,191
,169
,146
,122
,126
,128
,065
,021
,064
,073
,108
2
,153
,175
,266
,114
,166
,118
-,016
,136
,290
-,060
-,114
-,095
-,043
-,036
-,046
-,091
-,008
-,072
-,065
-,002
,251
,077
,038
,059
,162
Component
3
-,049
-,039
,007
-,200
,112
-,031
-,236
,085
-,078
-,087
-,042
-,080
-,056
-,101
-,093
-,100
,187
,240
,255
,289
,092
,127
,046
,211
-,126
4
-,253
-,198
,043
-,113
-,155
,080
,086
,329
,057
,015
,098
,031
,104
,060
,023
,108
-,028
-,127
-,183
-,131
,122
,328
,284
,161
-,209
5
,011
,088
,083
-,185
-,007
,496
-,013
,165
,159
-,048
,214
,229
,039
-,056
-,048
,036
,197
-,071
,062
,122
-,207
,010
-,259
-,289
-,132
La matrice dei coefficient i dei
punteggi fattoriali permette di
ruotare la matrice delle
saturazioni e di ottenere i
punteggi fattoriali;
I coefficienti dei punteggi
fattoriali permettono di stimare
attraverso il metodo della
regressione i punteggi fattoriali
a partire dai punteggi
standardizzati nelle variabili
osservate.
Extraction Method: Principal Component Analysis .
Component Scores .
25
Component Score Covariance Matrix
Component
1
2
3
4
5
1
1,000
,000
,000
,000
,000
2
,000
1,000
,000
,000
,000
3
,000
,000
1,000
,000
,000
4
,000
,000
,000
1,000
,000
5
,000
,000
,000
,000
1,000
Extraction Method: Principal Component Analys is.
Component Scores .
Notiamo come tutte le covarianze tra le componenti siano 0: in accordo con la PCA
infatti, nelle soluzioni iniziali tutte le componenti e quindi anche i rispettivi punteggi
fattoriali sono ortogonali.
26
Utilizzando la variabile “genere” è possibile verificare se esista una differenza
significativa tra i maschi e le femmine nei punteggi ottenuti nel fattore 1.
In questo modo ci chiediamo se i due gruppi differiscono in modo significativo nei
valori espressi complessivamente nelle 9 variabili che afferiscono al fattore 1.
Per eseguire questa analisi utilizziamo il Test T.
Utilizziamo come variabile di gruppo la variabile “genere”;
Come variabile dipendente utilizziamo la variabile che contiene i punteggi fattoriali
del fattore 1.
27
Independent Samples Test
Levene's Test for
Equality of Variances
F
REGR factor s core
1 for analysis 1
Equal variances
ass umed
Equal variances
not as sumed
14,291
Sig.
,000
t-tes t for Equality of Means
t
df
Sig. (2-tailed)
Mean
Difference
Std. Error
Difference
95% Confidence
Interval of the
Difference
Lower
Upper
2,358
298
,019
,28886443
,12250103 ,04778772 ,52994114
2,683
262,251
,008
,28886443
,10765247 ,07689122 ,50083764
Il test risulta significativo, possiamo pertanto concludere che i punteggi fattoriali del
fattore 1 differiscono in modo significativo tra maschi e femmine.
Ovvero...
Possiamo concludere che i maschi e le femmine differiscono in modo significativo
per quanto riguarda il fattore 1.
28
Scarica

Lucidi 7_1