Corso di Laurea magistrale in
Psicologia Clinica, dello Sviluppo e Neuropsicologia
Esame di
Analisi Multivariata dei Dati
Introduzione all’analisi fattoriale.
A cura di
Matteo Forgiarini
1
Utilizziamo nuovamente il file Adjective.sav per approfondire l’analisi della
soluzione ottenuta.
Utilizzando il metodo dell’ACP si ottiene una soluzione iniziale con 5 componenti
che permettono di spiegare il 41% della varianza delle 25 variabili ossevate.
Il modello appare adeguato:
• per parsimonia della soluzione (cfr. analisi del grafico degli autovalori)
• da un punto di vista teorico è coerente con le ipotesi iniziali sulla numerosità dei
fattori.
Il passaggio successivo è l’interpretazione dei fattori, ovvero l’attribuzione di un
significato alle dimensioni latenti individuate.
2
Il significato delle dimensioni latenti viene attribuito sulla base delle saturazioni che
tali dimensioni presentano con le variabili osservate.
Infatti se una componente ha una saturazione molto elevata (circa 1) con una variabile
e le altre saturazioni sono molto basse, è possibile ipotizzare che tale dimensione
abbia lo stesso contenuto - lo stesso significato - della V.O. massimamente spiegata.
Tuttavia le soluzioni iniziali ottenute con il metodo della PCA presentano spesso per
ogni fattore saturazioni elevate per molte variabili: le componenti sono infatti estratte
con lo scopo di massimizzare tutte le saturazioni.
Occore quindi ruotare la soluzione ottenuta con lo scopo di ottenere una soluzione
semplice, ovvero una soluzione che presenti saturazioni vicine a 0 o a 1: ogni variable
sarà quindi spiegata possibilmente da un solo fattore e vi sarà un numero minimo di
variabili con saturazioni elevate con più di un fattore.
Esistono due tipi di rotazioni: quelle ortogonali e quelle oblique.
Le prime mantengono l’ortogonalità delle componenti della soluzione iniziale;
le rotazioni oblique al contrario pruducono una soluzione in cui le compomenti sono
tra loro correlate.
3
Rotazioni ortogonali
Il metodo Varimax, mantenendo l’ortogonalità delle componenti, ruota la soluzione
massimizzando la varianza delle saturazioni delle componenti: ovvero la soluzione massimizza
la seguente sommatoria
Component Matrixa
Sereno
Romantico
Sicuro
Diligente
Cos cienzios o
Previdente
Stabile
Divertente
Prudente
generos o
Espans ivo
Ricettivo
Estroverso
Colorito
Progres sis ta
Innovativo
Spens ierato
Forte
leale
Stravagante
Tollerante
Originale
Aperto
Scherzoso
Ospitale
1
,584
,562
,518
,497
,496
,447
,446
,419
,373
,052
,084
,200
,164
,270
,330
,392
,387
,372
,350
,223
,049
,066
,197
,075
-,082
2
-,106
-,140
-,211
-,101
-,220
-,083
-,018
,265
-,264
,673
,616
,580
,407
,385
,376
-,005
-,151
-,168
-,037
,138
,316
,178
,089
,354
,274
Component
3
-,184
-,173
-,199
-,112
-,160
-,200
,371
-,398
-,083
-,155
,015
,183
-,078
,223
-,251
,575
,507
,478
-,470
,420
,169
,253
,092
-,098
-,062
Extraction Method: Principal Component Analysis .
a. 5 components extracted.
4
,036
,023
,168
,161
,048
,093
-,044
-,175
,152
,089
,066
,190
-,307
-,241
-,324
-,203
-,283
-,197
,133
,250
,509
,509
,439
-,393
,124
5
-,065
-,066
,050
,054
,314
-,077
,270
-,253
,293
,218
,114
-,284
,121
-,010
-,181
,168
,085
-,097
-,017
-,396
,226
,014
-,355
,014
,679
2
1 n
2
2
 (a j  aij )
n i 1
Dove
n = numero di variabili e
aij = saturazione della variabile i per la
componente j.
Ovvero...
Il metodo Varimax ruota la soluzione
massimizzando la varianza delle colonne
della component matrix.
4
Selezioniamo inizialmente Varimax come metodo di rotazione.
5
Total Variance Explained
Rotation Sums of Squared Loadings
Extraction Sums of Squared Loadings
Initial Eigenvalues
% of Variance Cumulative %
Total
% of Variance Cumulative %
Total
% of Variance Cumulative %
Total
Component
1
10,877
10,877
2,719
12,247
12,247
3,062
12,247
12,247
3,062
2
19,465
8,588
2,147
21,515
9,268
2,317
21,515
9,268
2,317
3
28,018
8,553
2,138
29,478
7,964
1,991
29,478
7,964
1,991
4
34,822
6,804
1,701
35,677
6,199
1,550
35,677
6,199
1,550
5
41,157
6,335
1,584
41,157
5,480
1,370
41,157
5,480
1,370
6
45,656
4,500
1,125
Tot=10,289
Tot=10,289
Tot=10,289
7
49,970
4,314
1,078
8
54,051
4,082
1,020
9
57,855
3,803
,951
10
61,493
3,639
,910
11
64,989
3,496
,874
12
68,292
3,303
,826
13
71,417
3,125
,781
14
74,418
3,001
,750
15
77,385
2,968
,742
16
80,239
2,853
,713
17
82,875
2,637
,659
18
85,463
2,588
,647
19
87,944
2,482
,620
20
90,317
2,372
,593
21
92,509
2,192
,548
22
94,512
2,002
,501
23
96,406
1,895
,474
24
98,237
1,831
,458
25
100,000
1,763
,441
Extraction Method: Principal Component Analysis.
Dopo la rotazione la varianza totale spiegata dalle 5 component rimane invariata;
al contrario i singoli autovalori delle componenti cambiano poichè cambiano le
saturazioni delle variabili; la loro somma rimane però costante.
6
Rotated Component Matrixa
Sicuro
Sereno
Romantico
Cos cienzios o
leale
Diligente
Previdente
Prudente
Progres sis ta
Divertente
Estroverso
Scherzoso
generos o
Colorito
Espans ivo
Innovativo
Spens ierato
Forte
Stabile
Stravagante
Ricettivo
Aperto
Originale
Ospitale
Tollerante
1
,611
,594
,577
,574
,533
,526
,493
,472
,198
,392
,006
-,073
-,030
-,030
-,077
,042
,082
,091
,223
-,016
-,052
,165
,007
-,030
,011
2
-,067
,110
,082
-,056
,103
-,003
,066
-,193
,625
,526
,522
,516
,499
,451
,451
,069
,019
-,015
,024
-,004
,401
-,081
-,160
,062
-,064
Component
3
,056
,103
,111
,172
-,260
,105
,005
,146
-,033
-,159
,084
,040
-,168
,326
-,027
,735
,706
,613
,569
,255
,042
-,066
,047
-,019
-,001
4
,032
,070
,050
-,187
-,017
,091
,089
-,122
,011
,071
-,111
-,147
,129
,123
,219
,053
-,027
,111
,030
,620
,590
,578
,475
-,247
,372
5
-,003
-,107
-,126
,151
-,007
,051
-,078
,169
-,146
-,195
,126
-,017
,490
,058
,383
,062
-,104
-,218
,194
-,123
,116
-,046
,325
,704
,547
Massimizzando la varianza delle
colonne della component matrix, la
rotazione varimax produce poche
saturazioni elevate per ogni componente
e permette di discriminare con
precisione i gruppi di variabili che
afferiscono alla medesima componente.
Le 5 variabili con le saturazioni più
elevate permettono di interpretare le
componenti e attibuire loro un
significato.
Extraction Method: Principal Component Analysis .
Rotation Method: Varimax with Kais er Normalization.
a. Rotation converged in 7 iterations .
7
Rotazioni oblique
Le rotazioni oblique permettono di ruotare la soluzione senza mantenere
l’ortogonalità degli assi; l’angolo tra le dimensioni può essere quindi variato per
massimizzare la semplicità della soluzione.
Selezionaimo la rotazione Oblimin e aumentiamo le
iterazioni dell’algoritmo fino a 100.
8
Nelle rotazioni in cui i fattori sono correlati, il contributo unico di ogni fattore
sulle variabili non coincide con le correlazioni tra fattore e variabile; infatti come
nella retta di regressione multipla, le correlazioni tra i fattori e variabili risultano
gonfiate in quanto al contributo unico sulla variabile si sommano i contributi
condivisi tra più fattori.
Pertanto nelle soluzioni oblique – oltre alla component matrix riferita alla
soluzione iniziale non ruotata – vengono prodotte due distinte matrici:
• la Pattern matrix contiene i contributi unici tra fattore e variabile.
• la Structure Matrix contiene le correlazioni fattore-variabile.
Per l’analisi della soluzione analizziamo la pattern matrix in quanto contiene le
vere stime dei legami fattore-variabili.
9
Total Variance Explained
Component
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
Total
3,062
2,317
1,991
1,550
1,370
1,125
1,078
1,020
,951
,910
,874
,826
,781
,750
,742
,713
,659
,647
,620
,593
,548
,501
,474
,458
,441
Initial Eigenvalues
% of Variance Cumulative %
12,247
12,247
9,268
21,515
7,964
29,478
6,199
35,677
5,480
41,157
4,500
45,656
4,314
49,970
4,082
54,051
3,803
57,855
3,639
61,493
3,496
64,989
3,303
68,292
3,125
71,417
3,001
74,418
2,968
77,385
2,853
80,239
2,637
82,875
2,588
85,463
2,482
87,944
2,372
90,317
2,192
92,509
2,002
94,512
1,895
96,406
1,831
98,237
1,763
100,000
Extraction Sums of Squared Loadings
Total
% of Variance Cumulative %
3,062
12,247
12,247
2,317
9,268
21,515
1,991
7,964
29,478
1,550
6,199
35,677
1,370
5,480
41,157
Rotation
Sums
Totalof
Squared
2,780a
Loadings
2,183
2,206
1,785
1,560
Con la rotazione
vengono ricalcolati
gli autovalori in
quanto la
comunalità delle
V.O. viene
ridistribuita tra le
componenti per
massimizzare la
semplicità della
soluzione.
Extraction Method: Principal Component Analysis.
a. When components are correlated, sums of squared loadings cannot be added to obtain a total variance.
10
Pattern Matrixa
Sicuro
Sereno
Cos cienzios o
Romantico
leale
Diligente
Previdente
Prudente
Progres sis ta
Estroverso
Scherzoso
Divertente
generos o
Colorito
Espans ivo
Innovativo
Spens ierato
Forte
Stabile
Stravagante
Ricettivo
Aperto
Originale
Ospitale
Tollerante
1
,612
,586
,577
,569
,550
,522
,491
,476
,189
,000
-,080
,390
-,017
-,056
-,076
,000
,039
,048
,195
-,047
-,069
,157
,005
-,006
,019
2
-,080
,097
-,060
,070
,091
-,016
,053
-,197
,621
,527
,523
,515
,497
,452
,448
,073
,024
-,016
,025
-,022
,384
-,104
-,174
,074
-,074
Component
3
,025
,073
,145
,083
-,289
,076
-,021
,123
-,043
,084
,047
-,180
-,181
,324
-,036
,735
,709
,613
,556
,245
,027
-,087
,030
-,025
-,020
4
,025
,051
-,187
,030
-,017
,087
,077
-,116
-,016
-,118
-,162
,046
,156
,106
,236
,032
-,058
,076
,022
,605
,588
,578
,501
-,199
,412
5
,011
-,103
,191
-,120
,002
,053
-,079
,203
-,163
,123
-,017
-,213
,452
,030
,336
,063
-,090
-,220
,201
-,198
,026
-,114
,268
,728
,499
La pattern matrix contiene i contributi
unici delle componenti alla spiegazione
delle variabili.
Le saturazioni più elevate per ogni
componente permettono di interpretare
la componente stessa e attribuirle un
significato semantico.
Extraction Method: Principal Component Analysis .
Rotation Method: Oblimin with Kais er Normalization.
a. Rotation converged in 36 iterations .
11
Component Correlation Matrix
Component
1
2
3
4
5
1
1,000
,032
,110
,032
-,049
2
,032
1,000
-,001
,059
,027
3
,110
-,001
1,000
,059
,002
4
,032
,059
,059
1,000
,058
5
-,049
,027
,002
,058
1,000
Extraction Method: Principal Component Analys is.
Rotation Method: Oblimin with Kais er Normalization.
La matrice di correlazioni tra le componenti contiene le correlazioni tra le
componenti dopo che la soluzione è stata ruotata; le differenti correlazioni tra le
coppie di componenti evidenziano come il metodo oblimin ruoti la soluzione in
modo non rigido e non conservi l’ortogonalità delle componenti.
Correlazioni=0 indicano che due componenti sono ortogonali;
Correlazioni=1 indicano che due componenti sono coincidenti e dunque l’angolo
compreso tra esse è 0;
Valori intermedi indicano angoli acuti tra le due componenti.
Notiamo che i valori delle correlazioni tra le componenti sono molto basse, tutte
<0.2; pertanto una soluzione ortogonale appare più adeguata per questo modello.
12
L’analisi fattoriale permette di
posizionare le variabili osservate in
uno spazio n-dimandionale con n pari
al numero di fattori estratti;
Component Plot in Rotated Space
Le coordinate di ciascun punto,
ciascuna variabile, sono le
correlazioni parziali fattore-variabile
contenute nella pattern matrix.
1,0
v2 v1
Component 2
0,5
v25
v4
v9
v5 v3 v21
v7
v6
v24v8v10
v18
v16
v23
v13
v19 v17
v12
v22
v11
0,0
Ruotando la soluzione vengono
cambiate le coordinate delle variabili
in modo tale che siano
massimamanete vicine agli assi.
-0,5
-1,0
-1,0
-0,5
0,0
0,5
Compone
nt 1
1,0 1,0
0,5
-0,5
0,0
-1,0
nt 3
pone
Com
13
Scarica

Lucidi 8 - e