Lezione – 1
Definizione
Analisi Fattoriale
Introduzione all’analisi fattoriale
La STRUTTURA LATENTE
Ogni comportamento (dinamica) non elementare è presumibilmente
frutto dell’intervento di più fattori (struttura latente) che, ognuno con un
suo specifico contributo, ne determinano qualche aspetto (Luccio, 1996)
L’analisi fattoriale rappresenta un corpo di metodi statistici atto ad
ottenere una maggiore comprensione delle complesse e ambigue
relazioni tra grandi numeri di variabili misurate in modo impreciso.
(Comrey and Lee, 1995)
1
Analisi Fattoriale
Lezione – 1
Definizione
Scopi dell’Analisi Fattoriale
•
Trovare costrutti teorici adeguati
per
spiegare
le
correlazioni
osservate in un insieme di variabili.
•
Esaminare la validità di una teoria
rispetto al numero ed alla natura dei
costrutti
fattoriali
eventualmente
osservati tra le variabili sotto
indagine
2
Analisi Fattoriale
Lezione – 1
Definizione
Passi Fondamentali dell’Analisi Fattoriale
•
Selezione delle variabili sotto indagine
•
Calcolo della matrice di correlazione tra le variabili
•
Estrazione dei fattori (non ruotati)
•
Rotazione dei Fattori
•
Interpretazione della matrice dei fattori ruotati.
3
Lezione – 1
Definizione
Analisi Fattoriale
Esempio di Matrice delle Correlazioni (R)
Nome Variabili
I
I
-
II
III
IV
V
VI
r12
r13
r14
r15
r16
r23
r24
r25
r26
r34
r35
r36
r45
r46
II –
r21
III-
r31
r32
IV –
r41
r42
r43
V
-
r51
r52
r53
r54
VI -
r61
r62
r63
r64
r56
r65
4
Analisi Fattoriale
Lezione – 1
Definizione
Matrice delle Correlazioni (R)
Quando
la
matrice
delle
correlazioni
contiene
coefficienti elevati, ciò indica che le variabili
sono correlate tra di loro, o si sovrappongono in ciò
che misurano.
Ad esempio per la
l’altezza è il peso
costrutto fattoriale
La correlazione tra
essere spiegata dal
una
relazione
con
Grandezza.
correlazione che caratterizza
potrebbe essere “postulato” un
latente chiamato <<Grandezza>>.
altezza e peso potrebbe allora
fatto che entrambe condividono
il
fattore
ipotetico
della
5
Lezione – 2
Modello Fondamentale
Analisi Fattoriale
Analisi Fattoriale
L'analisi fattoriale nasce come un
tentativo di dare una rappresentazione
efficiente ma NON conservativa dei
dati,
ovvero
di
rappresentare
la
variabilità contenuta nella matrice R
utilizzando un numero di costrutti
latenti (fattori) molto inferiore al
numero di variabili misurate.
(m<n)
6
Analisi Fattoriale
Lezione – 2
Modello Fondamentale
Il modello dell’Analisi Fattoriale
Il
modello
statistico
dell’analisi
fattoriale
parte
dall’assunto
fondamentale
che
il
punteggio
standardizzato in una variabile può
essere espresso come somma ponderata
del punteggio nei fattori comuni, del
punteggio in un fattore specifico, e
del punteggio in un fattore di errore.
7
Analisi Fattoriale
Lezione – 2
Modello Fondamentale
Equazione di Thurstone
Z ik  ai1  F1k  ai 2  F2 k  ...  aim  Fm k  ais  Sik  aie  Eik
Zik :
ai1 :
ai2 :
aim :
ais :
aie :
F1k :
F2k :
Fmk:
Sik :
Eik :
Il punteggio standardizzato per la persona k nella variabile i
La saturazione fattoriale della variabile i nel fattore comune 1
La saturazione fattoriale della variabile i nel fattore comune 2
La saturazione fattoriale della variabile i nell’ultimo fattore comune
La saturazione fattoriale della variabile i nel fattore specifico S
La saturazione fattoriale della variabile i nel fattore di errore E.
Il punteggio standardizzato del soggetto k nel fattore comune 1
Il punteggio standardizzato del soggetto k nel fattore comune 2
Il punteggio standardizzato del soggetto k nell’ultimo dei fattori comuni
Il punteggio standardizzato del soggetto k nel fattore specifico i
Il punteggio standardizzato del soggetto k nel fattore di errore i
8
Lezione – 1
Definizione
Analisi Fattoriale
Matrice delle Correlazioni (R)
Nome Variabili
I -
I
II
r12
III
r13
IV
r14
V
r15
VI
r16
r23
r24
r25
r26
r34
r35
r36
r45
r46
II –
r21
III-
r31
r32
IV –
r41
r42
r43
V
-
r51
r52
r53
r54
VI -
r61
r62
r63
r64
r56
r65
Matrice
Simmetrica
rij = rji
L’analisi fattoriale rappresenta una maniera di
considerare queste interrelazioni ipotizzando
l’esistenza di “Fattori Latenti” o “Costrutti
Fattoriali” che spiegano i valori nella matrice
delle correlazioni tra le variabili.
9
Analisi Fattoriale
Lezione – 2
Modello Fondamentale
Equazione di Thurstone
Z ik  ai1  F1k  ai 2  F2 k  ...  aim  Fm k  ais  Sik  aie  Eik
• I punteggi Z, F, S ed E nell’equazione sono tutti
punteggi standardizzati (M = 0, D.S. = 1).
• Ogni valore a nell’equazione è una costante numerica,
o peso, chiamata saturazione fattoriale [-1.0, 1.0].
• Il punteggio Z viene ottenuto empiricamente come un
normale punteggio in una variabile.
•I valori a vengono trovati nello stesso processo di
analisi fattoriale.
10
Lezione – 2
Modello Fondamentale
Analisi Fattoriale
Equazione di Thurstone
•L’equazione di Thurstone può essere rappresentata
schematicamente in forma matriciale per tutti i
valori di i e k simultaneamente (ad esempio, per
tutte le variabili e tutti i soggetti).
Soggetti
1
1
2
...
n
 z11
z
 21
 ...

 z n1
2
…
N
z12 ... z1 N 

z 22 ... z 2 N
 =Z
... ... ... 

z n 2 ... z nN 
Variabili
11
Lezione – 2
Modello Fondamentale
Analisi Fattoriale
Equazione di Thurstone
Matrice Au
Fattori
1
 a11

2 a21

…  ...

n an1
1
2
…
m
1
2
…
n
a12 ... a1m a1s
a22 ... a2 m
a2 s
... ... ...
an 2 ... anm
1
2
a1e
a2 e
...
ans
…
n



...


ane 
Variabili
12
Lezione – 2
Modello Fondamentale
Analisi Fattoriale
Equazione di
Thurstone
Matrice Fu
Fattori
1
2
…
m
1
2
…
n
1
2
…
n
1
2
…
N
 F11
F
 21
 ...

 Fm1
 S11

 S 21
 ...

 S n1
E
 11
 E21
 ...

 En1
F12
F22
...
Fm 2
S12
S 22
...
Sn2
E12
E22
...
En 2
...
...
...
...
...
...
...
...
...
...
...
...
F1 N 
F2 N 

... 

Fm N 
S1 N 

S2 N 
... 

S nN 
E1 N 

E2 N 
... 

EnN 
Soggetti
13
Lezione – 2
Modello Fondamentale
Analisi Fattoriale
Equazione di Thurstone
•Le tre matrici precedenti possono
essere
combinate
nella
seguente
equazione matriciale:
Z = A u Fu
Ciò implica che la matrice Z dei punteggi
nelle
variabili
può
essere
ricavata
moltiplicando la matrice delle saturazioni
fattoriali Au per la matrice dei punteggi
fattoriali Fu.
14
Analisi Fattoriale
Lezione – 3
L’equazione Fondamentale
Equazione Fondamentale
Se volessimo riprodurre il punteggio nella variabile 3
per la persona 7, la terza riga della matrice Au
dovrebbe essere moltiplicata con la settima colonna
della matrice Fu. Questa operazione darebbe il
seguente risultato:
z37  a31F17  a32 F27  ...  a3m Fm 7  ...
 0  S17  0  S 27  a3 S  S37  0  S 47  ...  0  S n 7  ...
 0  E17  0  E27  a3 E  E37  0  E47  ...  0  En 7
15
Analisi Fattoriale
Lezione – 3
L’equazione Fondamentale
Dato che l’analisi fattoriale procede dalla matrice di
correlazione tra le variabili osservate, si riportano
innanzi tutto le formule della correlazione tra due
variabili i e j (standardizzate) e della varianza di
un insieme di variabili standardizzate.
Correlazione
Varianza
1 k N
rij    zik  z jk
N k 1
1 kN 2
 i    zik
N k 1
16
Lezione – 3
L’equazione Fondamentale
Analisi Fattoriale
Le condizioni di Ortogonalità
Il modello dell'analisi fattoriale prevede dei
vincoli sulla struttura dei fattori latenti,
specifici e di errore, che possono essere
descritti come condizioni di ortogonalità (ovvero
di indipendenza statistica). Tali vincoli sono
espressi dalle seguenti condizioni:
rF
ik
, Fik
rF
ik
1 k N 2
   Fik  1
N k 1
, F jk ( S jk , E jk )
1 kN 2
 F    Fik  1.0
N k 1
i
1 k N

  Fik  F jk ( S jk , E jk )  0
N k 1
17
Analisi Fattoriale
Lezione – 3
L’equazione Fondamentale
Fattori Ortogonali (Definizione)
L’ortogonalità di due fattori implica la
indipendenza lineare, in altri termini
esiste una relazione (causale o spuria)
lega
la
variabilità
osservata
nelle
“dimensioni” rappresentate dai fattori.
loro
non
che
due
18
Lezione – 3
L’equazione Fondamentale
Analisi Fattoriale
L’ortogonalità riguarda anche l’indipendenza statistica dei
fattori latenti con i fattori specifici e di errore, in quanto
calcolati sui residui di varianza non spiegata dagli altri fattori
comuni.
F1
F2
a21
S1
a11
a12
F3
a22
a1S
a1E
a23
E2
a2E
Z1
E1
a13
Z2
UNICITA’ della
variabile Z1
a2S
S2
19
Analisi Fattoriale
Lezione – 3
L’equazione Fondamentale
Equazione fondamentale
Volendo a questo punto riprodurre la correlazione fra
due variabili i e j secondo l’equazione di Thurstone:
1 k N
rij    zik  z jk
N k 1
Z ik  ai1  F1k  ai 2  F2k  ...  aim  Fmk  ais  Sik  aie  Eik
Z jk  a j1  F1k  a j 2  F2k  ...  a jm  Fmk  a js  Sik  a je  E jk
riordinando
i
termini
e
applicando
tutte
le
semplificazioni che derivano dalle condizioni di
ortogonalità dei fattori , sostituendo zero a tutte le
correlazioni tra i fattori diversi (latenti, specifici
e di errore) e 1 alle varianze dei fattori, l’equazione
risultante risulta semplificata come segue:
rij  ai1a j1  ai 2 a j 2  ...  aim a jm
20
Analisi Fattoriale
Lezione – 3
L’equazione Fondamentale
Equazione fondamentale
rij  ai1a j1  ai 2 a j 2  ...  aim a jm
L’equazione risultante implica che la correlazione tra
le variabili i e j corrisponde alla somma dei prodotti
delle loro saturazioni nei fattori comuni soltanto.
Tutti i prodotti tra i fattori specifici e di errore si
annullano fintanto che i fattori sono ortogonali (cioè
non correlati tra loro).
21
Lezione – 3
L’equazione Fondamentale
Analisi Fattoriale
Comunalità
rij  ai1a j1  ai 2 a j 2  ...  aim a jm
Nel caso in cui i sia uguale a j, la correlazione è
quella di una variabile con se stessa dovuta alla
varianza dei soli fattori comuni, avendo omesso la
varianza dei fattori specifici.
Tale quantità e definita COMUNALITA’.
E rappresenta la diagonale
della parte sinistra della
matrice
Au (che
differisce
solo in questo dalla matrice
di correlazione)
 a11
a
 21
 ...

an1
a12 ... a1m a1s
a22 ... a2 m
a2 s
... ... ...
an 2 ... anm
a1e
a2 e
...
ans



...


ane 
22
Lezione – 3
L’equazione Fondamentale
Analisi Fattoriale
Rappresentazione Matriciale
Quando nella diagonale vengono inseriti dei valori
uguali ad 1.0 al posto delle comunalità la matrice
delle correlazioni è rappresentata con il simbolo
Ru
se nella diagonale principale vengono inserite
comunalità,
la
matrice
delle
correlazioni
rappresentata con il simbolo
R
23
le
è
Analisi Fattoriale
Lezione – 3
L’equazione Fondamentale
Rappresentazione Matriciale
Usando
il
formalismo
matriciale
è
possibile
rappresentare la matrice delle correlazioni tra tutte
le variabili (Ru) con la seguente equazione:
N = Numero di soggetti (righe) della matrice Z
1
Ru   ( Z  Z ' )
N
Z = Matrice dei punteggi standardizzati per tutti i
soggetti (righe) in tutte le variabili (colonne)
Z’= Trasposta della matrice Z
Moltiplicando una riga i della matrice Z per una
colonna j della matrice Z’ si ottiene una somma di
prodotti
tra
variabili
standardizzate.
Dividendo
questa somma per N, l’espressione risultante è un
coefficiente di correlazione tra le variabili i e j.
24
Lezione – 3
L’equazione Fondamentale
Analisi Fattoriale
Rappresentazione Matriciale
1
Ru   ( Z  Z ' )
N
Richiamando la formulazione
fondamentale di Thurstone:
matriciale
dell’equazione
Z = A u ∙ Fu
Cioè la matrice dei punteggi standardizzati nelle
variabili è uguale alla moltiplicazione tra la matrice
completa delle saturazioni fattoriali e la matrice
completa dei punteggi fattoriali. Si ottiene che:
1
Ru 
 ( Au  Fu )  ( Au  Fu )'
N
25
Lezione – 3
L’equazione Fondamentale
Analisi Fattoriale
Rappresentazione Matriciale
Ru 
1
 ( Au  Fu )  ( Au  Fu )'
N
Utilizzando la proprietà che la trasposta del prodotto
di due matrici è uguale al prodotto delle loro trasposte
in ordine inverso, e ricollocando la posizione del
divisore N costante, la precedente può essere riscritta
come:
 Fu  Fu ' 
Ru  Au  
 Au '

 N 
La matrice prodotto in parentesi quadra rappresenta la
matrice delle correlazioni tra i punteggi fattoriali.
26
Lezione – 3
L’equazione Fondamentale
Analisi Fattoriale
Rappresentazione Matriciale
 Fu  Fu ' 
Ru  Au  
 Au '

 N 
Matrice delle correlazioni
tra i punteggi fattoriali
Nel caso di fattori indipendenti (ortogonali) le
correlazioni fra fattori diversi (fuori dalla diagonale
principale della matrice) sono per definizione uguali a
0, mentre le correlazioni dei fattori con se stessi
(sulla
diagonale
principale),
rappresentando
una
varianza di una variabile standardizzata sono per
definizione tutti uguali ad 1. Questo tipo di matrice
viene definito
MATRICE IDENTITA’
27
Lezione – 3
L’equazione Fondamentale
Analisi Fattoriale
Matrice FuFu’/N
1
2
3
…
m
1
2
3
…
n
1
2
3
…
n
1
2
3
1
0
0
1
0
0
0
0
1
…
m
1
2
3
…
n
1
2
3
0
0
1
0
…
n
...
1
1
1
0
...
1
1
1
0
0
1
...
1
28
Lezione – 3
L’equazione Fondamentale
Analisi Fattoriale
Matrice Identità
1
0
0
0
1
0
0
0
1
0
0
0
0
0
0
1 ( 4 x 4)
= I
Matrice Identità di ordine 4
La matrice identità (I) ha sempre valori uno nella
diagonale principale e valori zero in tutte le altre
celle.
La matrice identità è l’equivalente dello scalare 1
nell’algebra scalare. Quindi moltiplicare una matrice
per la matrice identità equivale a lasciare la prima
invariata.
29
Lezione – 3
L’equazione Fondamentale
Analisi Fattoriale
Riformulazione dell’equazione matriciale
 Fu  Fu ' 
Ru  Au  
 Au '

 N 
 R  A I A ' 
u
u
u
Ru  Au  Au '
Dove Ru è la matrice delle correlazioni tra le variabili
con valori 1 nella diagonale principale e Au è la matrice
completa delle saturazioni fattoriali, che include i
fattori comuni, specifici e di errore. La matrice Ru è
simmetrica per cui:
Ru = Ru’
30
Lezione – 3
L’equazione Fondamentale
Analisi Fattoriale
I valori della matrice Au rappresentano le correlazioni
tra le variabili e i fattori. Queste correlazioni sono
chiamate saturazioni fattoriali nel modello dei fattori
ortogonali, il quale richiede che i fattori siano
ciascuno ad angolo retto rispetto agli altri (cioè non
correlati). La matrice A rappresenta solo la parte dei
fattori comuni della matrice Au.
Da quanto visto finora è chiaro che solo i fattori
comuni entrano nella determinazione degli elementi di R
al di fuori della diagonale principale. Per gli
elementi sulla diagonale, tuttavia, ovvero per gli
elementi:
i fattori
contributo.
Rij
specifici
dove
e
di
i=j
errore
forniscono
un
31
Lezione – 3
L’equazione Fondamentale
Analisi Fattoriale
Comunalità ed Unicità
Tutti gli elementi sulla diagonale della matrice Ru sono
uguali ad 1, che equivale anche alla varianza di ogni
variabile standardizzata. Questa varianza può essere
divisa come segue:
1 = hii2 + uii2
Dove:
hii2 = ai12 + ai22 + … + aim2 - Comunalità
uii2 = ais2 + aie2
- Unicità
32
Analisi Fattoriale
Lezione – 3
L’equazione Fondamentale
Equazione fondamentale dell’analisi Fattoriale
L’equazione fondamentale dell’analisi
fattoriale così come è stata formulata
da Thurstone (1947) stabilisce che la
matrice
delle
correlazioni
tra
le
variabili
può
essere
scomposta
nel
prodotto di una matrice di fattori per
la sua trasposta.
33
Analisi Fattoriale
Lezione – 3
L’equazione Fondamentale
Equazione fondamentale dell’analisi Fattoriale
Ru = AuAu’
riproduce la matrice delle
correlazioni
con
valori
1
sulla
diagonale, utilizzando una matrice di
saturazioni Au che contiene i fattori
comuni, specifici e di errore.
R = AA’
riproduce la matrice delle
correlazioni R con i valori delle
comunalità nella diagonale principale al
posto degli 1.Tutti gli altri elementi
delle matrici R ed Ru sono identici
34
Lezione – 3
L’equazione Fondamentale
Analisi Fattoriale
Dalla forma Analitica alla forma Matriciale
rij  ai1a j1  ai 2 a j 2  ...  aim a jm
Considerando tutti i valori di i e j simultaneamente,
quindi rappresentando in matrici il sistema costituito
dalle n equazioni del tipo della precedente (forma
analitica), otteniamo la seguente equazione matriciale:
R
=
A A’
L’equazione implica che la matrice delle correlazioni
(R) con le comunalità (h2) nella diagonale principale
può essere rappresentata come il prodotto della matrice
delle saturazioni nei fattori comuni moltiplicato per
la sua trasposta.
35
Lezione – 3
L’equazione Fondamentale
Analisi Fattoriale
Equazione fondamentale
Riassumendo:
Per spiegare le correlazioni tra le
variabili sono necessari solo i fattori
comuni.
Per spiegare la varianza totale delle
variabili sono necessari i fattori
comuni, specifici e di errore.
36
Analisi Fattoriale
Lezione – 4
Estrazione dei fattori
Estrazione dei Fattori
Dopo aver calcolato la matrice delle
correlazioni R, il passo successivo
consiste
nel
determinare
quanti
costrutti fattoriali sono necessari
per spiegare l’insieme dei valori di
R.
Tutti i metodi di estrazione fattoriale
finiscono
con
una
colonna
di
numeri
(vettore), uno per ciascuna variabile, che
rappresentano le saturazioni (o pesi) delle
variabili in quel fattore.
37
Analisi Fattoriale
Lezione – 4
Estrazione dei fattori
Estrazione dei Fattori
La procedura che va sotto il nome di
Estrazione
dei
Fattori
consiste
nell’estrarre fattori dalla matrice di
correlazione fino a che non rimanga
più nessuna porzione apprezzabile di
varianza da spiegare, cioè finche le
correlazioni residue sono prossime
allo zero (e quindi di importanza
trascurabile).
38
Analisi Fattoriale
Lezione – 4
Estrazione dei fattori
Estrazione dei Fattori
Dopo che il primo fattore è stato
estratto,
“l’effetto”
di
questo
fattore
(nel
determinare
le
correlazioni osservate nei dati) viene
rimosso
dalla
matrice
delle
correlazioni R per produrre la matrice
delle correlazioni residue rispetto al
primo fattore.
39
Analisi Fattoriale
Lezione – 4
Estrazione dei fattori
Estrazione dei Fattori
Esempio:
Supponendo che un ipotetico primo fattore
estratto abbia saturazioni di -.7 per una
variabile
(i)
e
di
.8
per
un’altra
variabile(j).
Moltiplicando
-.7
per
.8
abbiamo
-.56,
che
rappresenta
la
correlazione tra queste due variabili dovuta
SOLTANTO al primo fattore. Sottraendo -.56
al valore rij otteniamo la correlazione
residua rispetto al primo fattore.
40
Lezione – 4
Estrazione dei fattori
Analisi Fattoriale
Estrazione dei Fattori
Una volta che i fattori necessari per spiegare le
correlazioni nella matrice R sono stati estratti, i
valori delle correlazioni tra variabili e fattori
vengono sistemati in una tabella definita “Matrice
delle Saturazioni non Ruotate”.
Fattori
V
a
r
i
a
b
i
l
i
SSQ
1
2
3
4
5
6
7
I
II
III
.48  .67  .01
.38  .63 .12
.40  .65  .14
.51 .27
.36
.61 .26
.37
.46 .22
.46
.41 .26  .11
1.55 1.52
.52
IV
 .05
.08
 .10
 .17
 .02
.09
 .40
h2
.68
.56
.61
.50
.57
.48
.41
.22
41
Lezione – 4
Estrazione dei fattori
Analisi Fattoriale
Estrazione dei Fattori
Il primo fattore risulta il più grande
dei
quattro
estratti
e
l’ultimo
ovviamente il più piccolo
La
varianza
totale
spiegata
dalla
soluzione fattoriale (SSQ) per ogni
fattore è rappresentata dalla Somma dei
quadrati delle saturazioni fattoriali.
L’ultima
colonna
(h2)
contiene
le
comunalità
delle
variabili,
che
è
calcolata come somma dei quadrati delle
saturazioni nei fattori.
Fattori
V
a
r
i
a
b
i
l
i
SSQ
1
2
3
4
5
6
7
I
II
III
.48  .67  .01
.38  .63 .12
.40  .65  .14
.51 .27
.36
.61 .26
.37
.46 .22
.46
.41 .26  .11
1.55 1.52
.52
IV
 .05
.08
 .10
 .17
 .02
.09
 .40
.22
42
h2
.68
.56
.61
.50
.57
.48
.41
Lezione – 4
Estrazione dei fattori
Analisi Fattoriale
Comunalità
Se
la
comunalità
per
una
variabile
raggiunge
il
valore
di
1.0,
questo
significa che il punteggio nella variabile
potrebbe essere perfettamente predetto da
una combinazione pesata dei punteggi che
rappresentano i soli fattori estratti. In
altri termini tutta la varianza di questa
variabile può essere spiegata dai punteggi
che rappresentano la posizione di ogni
soggetto
nei
fattori
comuni
estratti
dall’analisi fattoriale.
43
Lezione – 4
Estrazione dei fattori
Analisi Fattoriale
Comunalità
D’altro canto se una variabile avesse
comunalità uguale a 0 le saturazioni
di
tutti
i
fattori
per
quella
variabile sarebbero uguali a 0 e la
variabile non avrebbe nulla in comune
con nessuno dei fattori.
44
45
Scarica

Document