L’ANALISI IN COMPONENTI PRINCIPALI
L’Analisi in Componenti Principali è una tecnica
fattoriale. Ciò significa che: essendo una tecnica e
non un modello, si muove essenzialmente su un
versante esplorativo; essendo una tecnica
fattoriale, prevede l’analisi di fattori o dimensioni
latenti
L’ACP non è l’unica tecnica fattoriale esistente. Ad
essa si possono aggiungere l’analisi dei fattori
comuni, il metodo dei minimi quadrati generalizzati
e la massima verosimiglianza.
Analisi in componenti principali
I passaggi essenziali
• Standardizzare le variabili
(es: descriptives /variables qi_mate to creativi /options 3.)
• Scegliere il numero di fattori (o componenti) da estrarre (a meno che
non si voglia compiere questa operazione dopo avere analizzato
l’output)
• Decidere se ed eventualmente a quale tipo di rotazione sottoporre i
fattori
• Scartare le variabili che mostrano bassi valori di comunalità e che
tendono a non saturare alcuna componente
• Ripetere l’ACP nel caso in cui si vada alla ricerca di soluzioni più
convincenti
• Verificare le correlazioni tra i fattori estratti ed eventualmente variare
la tecnica di rotazione dei fattori
• Ripetere l’analisi fino a quando non si trova una soluzione
teoricamente soddisfacente
Analisi in componenti principali
Glossario
•
•
•
•
•
Matrice di correlazione. Riporta tutti i coefficienti di correlazione di un gruppo di
variabili tra loro. È proprio questa matrice che viene analizzata e semplificata
attraverso l’analisi fattoriale.
Fattore. Corrisponde ad una dimensione o costrutto non misurabile direttamente
(quindi latente) che riassume le relazioni tra un insieme di variabili originarie, che
sono state misurate e delle quali si conosce la matrice di correlazione.
Saturazione fattoriale. La saturazione è il coefficiente che esprime solitamente la
correlazione tra una variabile originaria misurata ed il fattore. Elevando la saturazione
fattoriale al quadrato otteniamo la porzione di varianza della variabile spiegata dal
fattore.
Auto yalore. La somma dei quadrati delle saturazioni delle variabili costituenti un
fattore è uguale all’autovalore (o radice caratteristica) associato al fattore;
l’autovalore diviso per il numero delle variabili costituenti un fattore è uguale alla
proporzione di varianza totale spiegata dal fattore. Ogni fattore estratto ha un
autovalore corrispondente. Nell’analisi delle componenti principali il primo fattore
estratto è quello che ha l’autovalore più grande, ossia è il fattore che spiega la
porzione maggiore di varianza dei dati rispetto agli altri fattori.
Comunaiità Indica la proporzione di varianza della variabile spiegata dai fattori,
calcolata elevando al quadrato la somma delle saturazioni fattorialì della variabile su
tutti i fattori estratti. Valori di comunalità inferiori a 0,25 devono metterci in guardia
rispetto al possibile uso di quelle determinate variabili che li producono.
Analisi in componenti principali
Operazioni preliminari: criteri per
decidere il numero di fattori da estrarre
• Teorico
• Fattori con autovalore maggiore di 1
• Uso dello scree-test, ovvero salti nell’entità
degli autovalori
Analisi in componenti principali
Operazioni preliminari: l’analisi delle
correlazioni tra variabili
• A questo punto ha inizio l'analisi in componenti
principali vera e propria. Per accertarsi della
possibilità di applicare ragionevolmente questa
tecnica di analisi multi-dimensionale, è
indispensabile che il ricercatore analizzi
preliminarmente la matrice delle correlazioni. Il
comando è il seguente:
• factor /variables [var A] to [var Z] /print
correlation.
Analisi in componenti principali
Operazioni preliminari: testare la matrice
• Ulteriori test che risultano utili, anche se non indispensabili, al
ricercatore, sono quello di Kaiser-Meyer e Olkin (KMO) e il test di
sfericità di Bartlett. Il primo si basa sul coefficiente di correlazione
parziale. Se la variabile partecipa al fattore comune, una volta tolti
gli effetti lineari delle altre variabili, ci sarà una bassa correlazione
tra coppie di variabili. La correlazione parziale stima la correlazione
con il fattore unico, che in teoria non è correlato con le altre variabili.
Un piccolo valore per la correlazione parziale è quindi appropriato
per confermare gli assunti di base dell'analisi. Il valore negativo dei
coefficienti di correlazione parziale forma l'anti-immagine della
matrice di correlazione (AIC). Se la proporzione di coefficienti alti è
grande, va riconsiderata la possibilità di adottare l'analisi fattoriale
su quei dati. Valori buoni o discreti per KMO sono maggiori di 0,60.
Valori inferiori a 0.50 sono inaccettabili.
• factor /variables [var A] to [var Z] /print kmo aic.
Analisi in componenti principali
Metodi di rotazione dei fattori
• Esistono essenzialmente due famiglie di metodi: quelli
che rendono ortogonali (cioè non correlate) le
componenti e quelli che le rendono oblique. I primi
hanno il suffisso in –max, i secondi il prefisso in obli-.
I più usati metodi di rotazione dei fattori sono:
• Varimax, rotazione ortogonale che messimizza la
somma delle varianze mantenendo i fattori tra loro non
correlati (ortogonali, appunto)
• Oblimin, in cui gli assi non sono ortogonali, ma correlati
tra loro. Le variabili in questo modo hanno tute
saturazioni vicine allo 0 in tutti i fattori, tranne uno.
Analisi in componenti principali
Il senso della rotazione dei fattori
Analisi in componenti principali
Autovalori, autovettori, comunalità
Variabile
I autovettore
II autovettore
III autovettore
IV autovettore
V autovettore
Somma per riga
(comunalità)
X1
.473
.065
.426
.033
.003
1
X2
.457
.237
.213
.092
.000
1
X3
.659
.123
.004
.213
.001
1
X4
.814
.134
.001
.000
.052
1
X5
.576
.365
.024
.002
.033
1
I autovalore
Somma per
colonna =
autovalore
2.979
II autovalore
0.924
III autovalore
0.668
IV autovalore
0.340
V autovalore
0.089
Varianza totale
5
Analisi in componenti principali
Autovalori, autovettori, comunalità
Variabile
I autovettore
II autovettore
Somma per riga (comunalità)
X1
0,473
0,065
0,538
X2
0,457
0,237
0,694
X3
0,659
0,123
0,782
X4
0,814
0,134
0,948
X5
0,576
0,365
0,941
I autovalore
II autovalore
2.979
0.924
Somma per colonna = autovalore
Varianza totale
5
Analisi in componenti principali
Fasi successive, 1
• A questo punto ha inizio l'estrazione dei fattori vera e
propria. Il comando è il seguente:
• factor /variables [var A] … [var Z].
• Per assicurarsi che qualche fattore, con autovalore
inferiore ad 1, non possa servirci per l'analisi, è
ragionevole verificare il contributo dei diversi fattori
attraverso l'analisi grafica.
• factor /variables [var A] … [var Z]/plot eigen.
• Ottenuta la conferma circa l'estrazione dei fattori
attraverso l'analisi grafica, si passa quindi a vedere in
quale misura ciascuna variabile contribuisce alla
formazione di ognuno degli N fattori.
Analisi in componenti principali
Fasi successive, 2
• L'interpretazione dei fattori può essere favorita da uno dei 4 metodi
di rotazione degli assi. I comandi possono essere dati
contemporaneamente, con questo comando:
• factor /variables [var a] … [var z] / extract pc / rotation varimax /
plot=rotaton(1,2) / rotation quartimax / plot=rotaton(1,2) / rotation
equamax / plot=rotaton(1,2) / rotation oblimin / plot=rotaton(1,2) /
rotation norotate / plot=rotaton(1,2).
• Per visualizzare meglio i contributi forniti da ciascuna variabile ad
ognuno degli N fattori, si può richiedere al calcolatore di fornire un
output che presenti soltanto i valori che superano una determinata
soglia, che può essere posta a 0,5.
• Infine, le variabili originarie sintetizzate negli N fattori possono
essere sostituite, per ciascun caso, dai pesi fattoriali ottenuti da
ognuna delle cinque componenti. Questi pesi resteranno attivi per
tutte le operazioni successive, tramite il comando:
• factor /variables [var a] … [var z] / criteria factor (5) /save bart (all
pf).
Analisi in componenti principali
Scarica

ACP