ANALISI FATTORIALE E
PSICOLOGIA
Nasce come metodo di spiegazione di dati
di tipo psicologico
XCHE’
Permette di studiare molte variabili
contemporaneamente
ANALISI FATTORIALE:
che cos’è
Corpo di metodi statistici che aiutano il
ricercatore a definire meglio le proprie
variabili e a decidere quali dovrebbero
essere studiate e messe in relazione
Sviluppo Psicologia
Tecnica utilizzata per
STUDIARE
RIASSUMERE
SEMPLIFICARE
le relazioni in un insieme di variabili
SCOPO
Ridurre l’informazione contenuta in un
insieme di dati individuando uno o più
FATTORI (dimensioni) latenti che
raggruppano una serie di variabili
RISULTATO
POCHI FATTORI partendo da MOLTE VARIABILI
ESEMPIO:
- CULTURA GENERALE
- COMPRENSIONE
- ANALOGIE
- VOCABOLARIO
FATTORE
ABILITA’
VERBALE
FASI dell’AF
PUNTO DI PARTENZA: trasformazione di
una matrice “soggetti x variabili” in una
matrice “variabili x variabili” (matrice di
correlazione R ridotta)
Matrice SOGGETTI X VARIABILI
es. 100 X 10
Item 1 Item 2 Item 3
…
Andrea
3
2
2
…
Anna
2
4
1
…
Paola
4
5
3
…
…
…
…
…
…
Matrice VARIABILI X VARIABILI
es. 10 X 10
Item 1 Item 2 Item 3
…
Item 1
?
.34
.42
…
Item 2
.34
?
.52
…
Item 3
.42
.52
?
…
…
…
…
…
…
MATRICE DI CORRELAZIONE R RIDOTTA
PUNTO DI ARRIVO: matrice delle saturazioni
A (relazioni fra variabili e fattori latenti)
Matrice VARIABILI X FATTORI
es. 10 X 2
Fattore 1 Fattore 2
Item 1
.60
.34
Item 2
.48
.23
Item 3
.56
.49
…
…
…
MATRICE DELLE SATURAZIONI A
Riassumendo
Matrice SOGGETTI X VARIABILI
Matrice VARIABILI X VARIABILI (R)
Matrice VARIABILI X FATTORI (A)
Riassumendo
Matrice 100 X 10
Matrice 10 X 10
Matrice 10X 2
Tipi di Analisi Fattoriale
• Analisi Fattoriale Esplorativa (AFE) è la
situazione in cui il ricercatore non ha in
mente nessuna ipotesi teorica (approccio
data driven)
• Analisi Fattoriale Confermatoria (AFC) il
ricercatore dispone di una precisa ipotesi a
priori sulla struttura dei fattori
Modello teorico dell’AFE
IPOTESI FONDAMENTALE
La CORRELAZIONE tra le variabili è DETERMINATA
da dimensioni non osservabili, i FATTORI, che in qualche
modo causano o DETERMINANO i PUNTEGGI
riscontrabili nelle VARIABILI osservate
Esamina la VARIANZA che le variabili hanno in comune
(VARIANZA COMUNE) per cercare di determinare i
fattori sottostanti
VARIANZA: indicatore di variabilità che corrisponde alla
media del quadrato degli scostamenti dalla media
s2 =  (xi-x)2
n
Non tutta la varianza degli item può essere
spiegata dai fattori comuni
FATTORE UNICO
VARIANZA UNICA
FATTORE 1
VAR 1
Fattore unico 1
FATTORE 2
VAR 2
Fattore unico 2
Scomposizione della varianza
• Varianza totale= varianza comune+varianza
unica (1= h2+u2)
• Comunalità = varianza totale – unicità
(h2= 1 – u2)
• Unicità = varianza totale – comunalità
(u2= 1 – h2)
COMUNALITA’: parte di varianza totale che viene
spiegata dai fattori comuni
UNICITA’: parte di varianza totale che viene
spiegata dal fattore unico
Varianza dovuta all’errore di misurazione
Varianza attribuibile a processi che agiscono
sistematicamente solo su una variabile
(specificità)
ASSUNTO FONDAMENTALE AFE
Il punteggio standardizzato di un soggetto in una
variabile è uguale alla somma ponderata del
punteggio ottenuto dallo stesso soggetto nei
fattori comuni e nel fattore unico
• Zik = Fi1ak1+ Fi2ak2+… Fimakm+uik
• Zik= punteggio standardizzato del soggetto i nella
variabile k
• Fi1= punteggio standardizzato per il soggetto i
nel fattore comune 1
• ak1= saturazione fattoriale (factor loading) della
variabile k nel fattore comune 1
• uik = punteggio standardizzato per il soggetto i
nel fattore unico associato alla variabile k
Espressione matriciale
Z = F*A’+U
• Z matrice dei punteggi standardizzati
• F matrice dei punteggi nei fattori comuni
• A’ matrice (trasposta) delle saturazioni nei
fattori comuni
• U matrice dei fattori unici per ogni soggetto
in ogni variabile
EQUAZIONE FONDAMENTALE AF
R = AA’ + U2
•
•
•
•
R matrice delle correlazioni tra le variabili
A matrice delle saturazioni nei fattori comuni
A’ matrice (trasposta) di A
U2 matrice diagonale che contiene la varianza
unica relativa ad ogni variabile
COMUNALITA’
Somme dei quadrati delle saturazioni riga x riga
Rappresentano ciò che vi è in comune tra ogni
variabile e tutti i fattori, cioè la PORZIONE
DI VARIANZA DELLA VARIABILE
SPIEGATA DAI FATTORI
Quadrato saturazioni: porzione di varianza
della singola variabile che è spiegata dal
fattore
Matrice delle saturazioni fattoriali A
Fattore 1 Fattore 2
h2
(comunalità)
Item 1
.60
.34
.602 +. 342
Item 2
.48
.23
.482 +. 232
Item 3
.56
.49
.562 +. 492
…
…
…
…
MATRICE DI CORRELAZIONE R RIDOTTA
Item 1 Item 2 Item 3
…
Item 1
?
.34
.42
…
Item 2
.34
?
.52
…
Item 3
.42
.52
?
…
…
…
…
…
…
? = STIMA DELLE COMUNALITA’
COSA ACCADREBBE SE SI METTESSE 1
SULLA DIAGONALE PRINCIPALE?
La varianza di errore e specifica
andrebbero a gonfiare la varianza
estratta dai fattori distorcendo le stime
dei parametri
LA MATRICE DI CORRELAZIONE CON 1 SULLA
DIAGONALE PRINCIPALE VIENE USATA NELL’ACP
5 PASSI FONDAMENTALI DELL’AFE
1) SELEZIONE DELLE VARIABILI
2) CALCOLO DELLA MATRICE
DELLE CORRELAZIONI TRA LE
VARIABILI (R)
3) ESTRAZIONE DEI FATTORI
(A)
4) ROTAZIONE DEI FATTORI
5) INTERPRETAZIONE DELLA
MATRICE DEI FATTORI RUOTATI
MATRICE DELLE SATURAZIONI FATTORIALI A
Fattore 1 Fattore 2
Item 1
.60
.34
Item 2
.48
.23
Item 3
.56
.49
…
…
…
RUOTARE I FATTORI = spostarne la posizione
nello spazio
In modo che:
solo poche variabili presentino saturazioni
elevate su ciascuno di essi
Ogni singola variabile tenda a correlare solo con
un fattore
MATRICE DELLE SATURAZIONI RUOTATA
Fattore 1
Item 1
Item 3
Item 4
Item 10
Item 2
Item 5
Item 6
Item 7
Item 8
Item 9
Fattore 2
.70
.63
.54
.45
.77
.75
.66
.60
.54
.51
INTERPRETAZIONE
Ci si serve di tutte le conoscenze disponibili
riguardo alle variabili così come di ogni altra
informazione pertinente
Si comincia analizzando le variabili che
presentano saturazioni più elevate nei fattori
ruotati
MATRICE SOGGETTI x VARIABILI
MATRICE DELLE CORRELAZIONI TRA LE VARIABILI R
(MATRICE VARIABILI x VARIABILI)
ESTRAZIONE DEI FATTORI
MATRICE DELLE SATURAZIONI NON RUOTATE A
ROTAZIONE DEI FATTORI
MATRICE DELLE SATURAZIONI RUOTATE
INTERPRETAZIONE DEI FATTORI
DECISIONI DA PRENDERE IN UN AFE
Il ricercatore deve DECIDERE:
1) QUALI VARIABILI E CAMPIONE UTILIZZARE
2) SE L’AFE E’ LA PIU’ APPROPRIATA FORMA DI
ANALISI PER RAGGIUNGERE GLI OBIETTIVI
DELLA SUA RICERCA
3) QUALE PROCEDURA UTILIZZARE PER
ADATTARE IL MODELLO AI DATI
4) QUANTI FATTORI INCLUDERE NELLO STUDIO
5) COME RUOTARLI PER OTTENERE UNA
SOLUZIONE FACILMENTE INTERPRETABILE
PROGETTO DI RICERCA:
VARIABILI E CAMPIONE
1) DEFINIRE PRELIMINARMENTE L’AREA CHE SI
VUOLE STUDIARE;
2) FARSI UN’IDEA DEI FATTORI CHE CI ASPETTA
DI OTTENERE;
3) SCEGLIERE LE VARIABILI
4) SELEZIONARE UN CAMPIONE
RAPPRESENTATIVO SU CUI RACCOGLIERE I
DATI
5) FARE LE ANALISI
VARIABILI:
•ogni fattore atteso deve essere sovradeterminato, cioè
rappresentato da più variabili con un rapporto di
almeno 1:4-1:5
•Le variabili con bassa comunalità dovrebbero essere
eliminate;
CAMPIONE:
CONDIZIONI OTTIMALI
VARIABILI
CONDIZIONI MODERATE
CONDIZIONI SCARSE
Campioni
anche piccoli
Campioni di
medie dimensioni
Anche campioni
grandi potrebbero
non essere
sufficienti!
Il campione deve assicurare variabilità al fattore
Attenzione alle condizioni di raccolta dati
APPROPRIATEZZA AFE
Qual è l’obiettivo del mio progetto di ricerca?
PARSIMONIOSA
RAPPRESENTAZIONE
DELLE ASSOCIAZIONI TRA
LE VARIABILI
AFE
SEMPLIFICAZIONE
DEI DATI
ACP
L’Analisi delle Componenti
Principali (ACP)
Tecnica di semplificazione dei dati diversa
dall’AF e creata per raggiungere scopi
diversi
AF: cerca di spiegare più COVARIANZA possibile delle
variabili (spiegare le correlazioni)
ACP: cerca di spiegare più VARIANZA possibile delle
variabili (trasformando linearmente le variabili originali)
• L’ACP non fa distinzione fra varianza comune
(comunalità) e varianza specifica delle
variabili
• Nel processo di calcolo delle componenti
principali è possibile individuare tante
componenti quanto sono le variabili originali
• Non si possono ruotare le componenti
• Le componenti non sono latenti
TECNICA DI ESTRAZIONE DEI FATTORI
METODO DEI
FATTORI
PRINCIPALI
(AFP)
METODO DEI
MINIMI
QUADRATI
(MQ)
METODO
DELLA
MASSIMA
VEROSIMIGLIA
NZA (ML)
AFP
MQ
ML
Vantaggi:
Vantaggi:
-No assunzione di
normalità
multivariata;
-Non necessaria stima -Test per verificare la
delle comunalità;
bontà
dell’adattamento del
Limiti:
modello ai dati;
-Spesso risultati
-Non dipendente dalla
diversi da AFP perché
scala di misura delle
non analizza gli
variabili
elementi sulla
diagonale principale
Limiti:
-Raramente risultati
distorti
Limiti:
-Necessaria stima
delle comunalità
elemento di
indeterminatezza
nella soluzione
Vantaggi:
-Assunzione di
normalità multivariata
SELEZIONE DEL NUMERO DI FATTORI
DA ESTRARRE
Non esiste un metodo certo per determinare
l’esatto numero di fattori da estrarre!
MEGLIO SBAGLIARE ESTRAENDO TROPPI
FATTORI PIUTTOSTO CHE TROPPO POCHI
PRINCIPALI TECNICHE PER DECIDERE
QUANTI FATTORI ESTRARRE
CRITERIO DEGLI
AUTOVALORI > 1
SCREE
TEST
ANALISI
PARALLELA
1) Fare riferimento alla letteratura e a
precedenti ricerche;
2) Utilizzare più indicatori possibili;
3) Se ci sono, controllare i valori di almeno
un indice di bontà dell’adattamento del
modello ai dati;
4) Testare la scelta effettuate su più gruppi di
dati
INDICI DI
BONTA’
DELL’ADATTA
MENTO DEL
MODELLO AI
DATI
ROTAZIONE DEI FATTORI
CRITERIO DELLA
STRUTTURA SEMPLICE
(THURSTONE)
Ogni fattore deve saturare una
minoranza di variabili e ogni
variabile deve essere spiegata
possibilmente da un solo fattore
MATRICE DI CORRELAZIONE DI 6 VARIABILI ARTIFICIALI
X1
X2
X3
X4
X5
X1
X2
.75
X3
.83
.70
X4
.32
.25
.39
X5
.28
.31
.25
.79
X6
.36
.32
.33
.82
.76
X6
ANALISI DEI FATTORI PRINCIPALI (AFP)
Fattore 1
Fattore 2
h2
X1
.77
.55
.89
X2
.66
.44
.63
X3
.74
.49
.78
X4
.78
–.49
.85
X5
.71
–.48
.73
X6
.77
–.45
.79
Soluzione originale AFP (i fattori coincidono con
gli assi cartesiani)
1
FATTORE II
.75
X3 X1
.5
X2
.25
FATTORE I
.25
.5
.75
X5
X6
X4
1
ROTAZIONI ORTOGONALI: durante la
rotazione i fattori mantengono il vincolo
dell’ortogonalità
ROTAZIONI OBLIQUE: durante la rotazione
i fattori divengono correlati
ROTAZIONE ORTOGONALE 45°
1
FATTORE I
.75
X3 X1
.5
X2
.25
.25
.5
.75
X5
1
X6
X4
FATTORE II
ROTAZIONE OBLIQUA (ANGOLI DIVERSI)
1
FATTORE I
.75
X3 X1
.5
X2
.25
.25
.5
.75
X5
1
X6
X4
FATTORE II
LIMITI E VANTAGGI DELLE ROTAZIONI
ORTOGONALI
● Più semplici da effettuare
● Inadeguate per molti
costrutti esaminati in psicologia
poiché costituiti da fattori
correlati
● Individuano strutture
semplici più povere di quelle
reali quando i fattori sono
correlati
● Conducono a gravi
distorsioni se si utilizzano con
fattori correlati
OBLIQUE
● Più complesse
● Adeguate per la maggior parte
dei costrutti psicologici
● Non individuano strutture
fattoriali più povere quando i
fattori non sono correlati
● Non comportano distorsioni
se si utilizzano su fattori non
correlati
● Stimando le correlazioni tra i
fattori permettono una
comprensione più approfondita
dei dati
ROTAZIONI OBLIQUE PIU’ COMPLESSE
PERCHE’:
-NO SISTEMA DI RIFERIMENTO
CARTESIANO;
-COMUNALITA’ PIU’ DIFFICILI DA
CALCOLARE;
-SOLUZIONE SU TRE MATRICI
(PATTERN, STRUCTURE E DI
CORRELAZIONE FATTORIALE)
MATRICE PATTERN (P): contiene i coefficienti
relativi all’impatto diretto di ciascun fattore sulle
variabili, al netto dell’impatto degli altri fattori
EFFETTO DIRETTO DEL FATTORE SULLA VARIABILE
MATRICE STRUCTURE (S): contiene le correlazioni
tra le variabili e i fattori, che saranno tanto maggiori
rispetto ai coefficienti della matrice Pattern quanto più è
elevata la correlazione tra i fattori
CORRELAZIONI TRA VARIABILI E FATTORI
FATTORI PIU’ CORRELATI /
ROTAZIONE PIU’ OBLIQUA
F
A
T
T
T
O
R
E
II
Pattern
Structure
FATTORE I
FATTORI MENO CORRELATI /
ROTAZIONE MENO OBLIQUA
F
A
T
T
T
O
R
E
II
Pattern
Structure
FATTORE I
Più la soluzione è obliqua più la S e la P saranno differenti, più
diminuisce il grado di obliquità più le due matrici si avvicineranno
sino ad arrivare a coincidere quando i due fattori diventano
ortogonali
DECISIONI DA PRENDERE IN UN’ANALISI
FATTORIALE ESPLORATIVA
5 TEMI PRINCIPALI:
• Progetto di ricerca
Variabili
Campione
• Appropriatezza dell’AFE
AFE o ACP?
• Tecniche di estrazione dei fattori
• Numero di fattori da estrarre
• Rotazione dei fattori
Ortogonali
Oblique
Analisi dei Fattori Principali
Minimi Quadrati
Massima Verosimiglianza
Autovalori > 1
Scree test
Analisi parallela
Indici di goodness of fit
ESEMPIO PRATICO DI AFE
SCALA DIMENSIONI DEL SELF-CONSTRUAL
(13 ITEM con Likert a 7 punti)
Scala inserita nell’European Opinion
Survey (EOS), questionario costruito per
una ricerca cross-culturale relativa al senso
di identità nazionale in alcuni Paesi Europei
PUNTI FONDAMENTALI AFE:
1) PROGETTO DI RICERCA
VARIABILI: ?
CAMPIONE: medie dimensioni (300
soggetti) in quanto i fattori, stando alla
letteratura, dovrebbero essere
sovradeterminati, ma non si hanno dati
sulle comunalità delle variabili
2) APPROPRIATEZZA AFE
SCOPO ANALISI: scoprire se
esistono e dunque individuare i
fattori latenti
AFE
ANALISI DELLA DISTIBUZIONE DEI DATI
(minimo-massimo, range, distribuzione di
frequenza, media, deviazione standard etc)
3) SCELTA TECNICA ESTRAZIONE FATTORI
Poiché la distribuzione è
NORMALE MULTIVARIATA,
conoscendo i vantaggi e gli
svantaggi delle varie tecniche, si
sceglie di utilizzare il metodo
della Massima Verosimiglianza
ML
4) SELEZIONE DEL NUMERO DEI FATTORI
DA ESTRARRE
Non esistendo un unico criterio certo
si sceglie di utilizzare:
AUTOVALORI > 1
SCREE TEST
ANALISI PARALLELA
AUTOVALORI
Autovalori iniziali
% cumulative
1
Totale
3.88
% di
varianza
29.84
2
2.66
20.51
50.36
3
1.02
7.88
58.24
4
.84
6.48
64.73
5
.78
6.00
70.73
6
.70
5.40
76.14
Fattori
…
29.84
SCREE PLOT
Scree Plot
5
4
3
Eigenvalue
2
1
0
1
2
3
Factor Number
4
5
6
7
8
9
10
11
12
13
ANALISI PARALLELA
Number of variables: 13
Number of subjects: 300
Number of replications: 1000
++++++++++++++++++++++++++++++++++++++++++++++++
Random Eigenvalue DS
++++++++++++++++++++++++++++++++++++++++++++++++
1 1.3585
.0481
2 1.2733
.0311
3 1.2056
.0305
4 1.1396
.0286
5 1.0860
.0232
6 1.0369
.0210
INDICE DI GOODNESS OF FIT
χ2
26.94
gl
p
53 .26
Valore del χ2 non significativo  il modello trovato ha
un buon fit con i dati
(se fosse stato significativo il modello a due fattori
sarebbe stato “lontano” dai dati ottenuti con la
somministrazione)
5) ROTAZIONE DEI FATTORI
FATTORI NON CORRELATI
RUOTAZIONE ORTOGONALE VARIMAX
MATRICE RUOTATA VARIMAX
Item
INT4
INT7
INT3
INT6
INT2
INT1
INT5
IND4
IND6
IND2
IND5
IND1
IND3
Fattori
1
.73
.72
.70
.64
.63
.63
.55
2
.64
.63
.62
.60
.56
.55
Scarica

Analisi Fattoriale - e