Lezione – 1 Definizione Analisi Fattoriale Introduzione all’analisi fattoriale La STRUTTURA LATENTE Ogni comportamento (dinamica) non elementare è presumibilmente frutto dell’intervento di più fattori (struttura latente) che, ognuno con un suo specifico contributo, ne determinano qualche aspetto (Luccio, 1996) L’analisi fattoriale rappresenta un corpo di metodi statistici atto ad ottenere una maggiore comprensione delle complesse e ambigue relazioni tra grandi numeri di variabili misurate in modo impreciso. (Comrey and Lee, 1995) 1 Analisi Fattoriale Lezione – 1 Definizione Scopi dell’Analisi Fattoriale • Trovare costrutti teorici adeguati per spiegare le correlazioni osservate in un insieme di variabili. • Esaminare la validità di una teoria rispetto al numero ed alla natura dei costrutti fattoriali eventualmente osservati tra le variabili sotto indagine 2 Analisi Fattoriale Lezione – 1 Definizione Passi Fondamentali dell’Analisi Fattoriale • Selezione delle variabili sotto indagine • Calcolo della matrice di correlazione tra le variabili • Estrazione dei fattori (non ruotati) • Rotazione dei Fattori • Interpretazione della matrice dei fattori ruotati. 3 Lezione – 1 Definizione Analisi Fattoriale Esempio di Matrice delle Correlazioni (R) Nome Variabili I I - II III IV V VI r12 r13 r14 r15 r16 r23 r24 r25 r26 r34 r35 r36 r45 r46 II – r21 III- r31 r32 IV – r41 r42 r43 V - r51 r52 r53 r54 VI - r61 r62 r63 r64 r56 r65 4 Analisi Fattoriale Lezione – 1 Definizione Matrice delle Correlazioni (R) Quando la matrice delle correlazioni contiene coefficienti elevati, ciò indica che le variabili sono correlate tra di loro, o si sovrappongono in ciò che misurano. Ad esempio per la l’altezza è il peso costrutto fattoriale La correlazione tra essere spiegata dal una relazione con Grandezza. correlazione che caratterizza potrebbe essere “postulato” un latente chiamato <<Grandezza>>. altezza e peso potrebbe allora fatto che entrambe condividono il fattore ipotetico della 5 Lezione – 2 Modello Fondamentale Analisi Fattoriale Analisi Fattoriale L'analisi fattoriale nasce come un tentativo di dare una rappresentazione efficiente ma NON conservativa dei dati, ovvero di rappresentare la variabilità contenuta nella matrice R utilizzando un numero di costrutti latenti (fattori) molto inferiore al numero di variabili misurate. (m<n) 6 Analisi Fattoriale Lezione – 2 Modello Fondamentale Il modello dell’Analisi Fattoriale Il modello statistico dell’analisi fattoriale parte dall’assunto fondamentale che il punteggio standardizzato in una variabile può essere espresso come somma ponderata del punteggio nei fattori comuni, del punteggio in un fattore specifico, e del punteggio in un fattore di errore. 7 Analisi Fattoriale Lezione – 2 Modello Fondamentale Equazione di Thurstone Z ik ai1 F1k ai 2 F2 k ... aim Fm k ais Sik aie Eik Zik : ai1 : ai2 : aim : ais : aie : F1k : F2k : Fmk: Sik : Eik : Il punteggio standardizzato per la persona k nella variabile i La saturazione fattoriale della variabile i nel fattore comune 1 La saturazione fattoriale della variabile i nel fattore comune 2 La saturazione fattoriale della variabile i nell’ultimo fattore comune La saturazione fattoriale della variabile i nel fattore specifico S La saturazione fattoriale della variabile i nel fattore di errore E. Il punteggio standardizzato del soggetto k nel fattore comune 1 Il punteggio standardizzato del soggetto k nel fattore comune 2 Il punteggio standardizzato del soggetto k nell’ultimo dei fattori comuni Il punteggio standardizzato del soggetto k nel fattore specifico i Il punteggio standardizzato del soggetto k nel fattore di errore i 8 Lezione – 1 Definizione Analisi Fattoriale Matrice delle Correlazioni (R) Nome Variabili I - I II r12 III r13 IV r14 V r15 VI r16 r23 r24 r25 r26 r34 r35 r36 r45 r46 II – r21 III- r31 r32 IV – r41 r42 r43 V - r51 r52 r53 r54 VI - r61 r62 r63 r64 r56 r65 Matrice Simmetrica rij = rji L’analisi fattoriale rappresenta una maniera di considerare queste interrelazioni ipotizzando l’esistenza di “Fattori Latenti” o “Costrutti Fattoriali” che spiegano i valori nella matrice delle correlazioni tra le variabili. 9 Analisi Fattoriale Lezione – 2 Modello Fondamentale Equazione di Thurstone Z ik ai1 F1k ai 2 F2 k ... aim Fm k ais Sik aie Eik • I punteggi Z, F, S ed E nell’equazione sono tutti punteggi standardizzati (M = 0, D.S. = 1). • Ogni valore a nell’equazione è una costante numerica, o peso, chiamata saturazione fattoriale [-1.0, 1.0]. • Il punteggio Z viene ottenuto empiricamente come un normale punteggio in una variabile. •I valori a vengono trovati nello stesso processo di analisi fattoriale. 10 Lezione – 2 Modello Fondamentale Analisi Fattoriale Equazione di Thurstone •L’equazione di Thurstone può essere rappresentata schematicamente in forma matriciale per tutti i valori di i e k simultaneamente (ad esempio, per tutte le variabili e tutti i soggetti). Soggetti 1 1 2 ... n z11 z 21 ... z n1 2 … N z12 ... z1 N z 22 ... z 2 N =Z ... ... ... z n 2 ... z nN Variabili 11 Lezione – 2 Modello Fondamentale Analisi Fattoriale Equazione di Thurstone Matrice Au Fattori 1 a11 2 a21 … ... n an1 1 2 … m 1 2 … n a12 ... a1m a1s a22 ... a2 m a2 s ... ... ... an 2 ... anm 1 2 a1e a2 e ... ans … n ... ane Variabili 12 Lezione – 2 Modello Fondamentale Analisi Fattoriale Equazione di Thurstone Matrice Fu Fattori 1 2 … m 1 2 … n 1 2 … n 1 2 … N F11 F 21 ... Fm1 S11 S 21 ... S n1 E 11 E21 ... En1 F12 F22 ... Fm 2 S12 S 22 ... Sn2 E12 E22 ... En 2 ... ... ... ... ... ... ... ... ... ... ... ... F1 N F2 N ... Fm N S1 N S2 N ... S nN E1 N E2 N ... EnN Soggetti 13 Lezione – 2 Modello Fondamentale Analisi Fattoriale Equazione di Thurstone •Le tre matrici precedenti possono essere combinate nella seguente equazione matriciale: Z = A u Fu Ciò implica che la matrice Z dei punteggi nelle variabili può essere ricavata moltiplicando la matrice delle saturazioni fattoriali Au per la matrice dei punteggi fattoriali Fu. 14 Analisi Fattoriale Lezione – 3 L’equazione Fondamentale Equazione Fondamentale Se volessimo riprodurre il punteggio nella variabile 3 per la persona 7, la terza riga della matrice Au dovrebbe essere moltiplicata con la settima colonna della matrice Fu. Questa operazione darebbe il seguente risultato: z37 a31F17 a32 F27 ... a3m Fm 7 ... 0 S17 0 S 27 a3 S S37 0 S 47 ... 0 S n 7 ... 0 E17 0 E27 a3 E E37 0 E47 ... 0 En 7 15 Analisi Fattoriale Lezione – 3 L’equazione Fondamentale Dato che l’analisi fattoriale procede dalla matrice di correlazione tra le variabili osservate, si riportano innanzi tutto le formule della correlazione tra due variabili i e j (standardizzate) e della varianza di un insieme di variabili standardizzate. Correlazione Varianza 1 k N rij zik z jk N k 1 1 kN 2 i zik N k 1 16 Lezione – 3 L’equazione Fondamentale Analisi Fattoriale Le condizioni di Ortogonalità Il modello dell'analisi fattoriale prevede dei vincoli sulla struttura dei fattori latenti, specifici e di errore, che possono essere descritti come condizioni di ortogonalità (ovvero di indipendenza statistica). Tali vincoli sono espressi dalle seguenti condizioni: rF ik , Fik rF ik 1 k N 2 Fik 1 N k 1 , F jk ( S jk , E jk ) 1 kN 2 F Fik 1.0 N k 1 i 1 k N Fik F jk ( S jk , E jk ) 0 N k 1 17 Analisi Fattoriale Lezione – 3 L’equazione Fondamentale Fattori Ortogonali (Definizione) L’ortogonalità di due fattori implica la indipendenza lineare, in altri termini esiste una relazione (causale o spuria) lega la variabilità osservata nelle “dimensioni” rappresentate dai fattori. loro non che due 18 Lezione – 3 L’equazione Fondamentale Analisi Fattoriale L’ortogonalità riguarda anche l’indipendenza statistica dei fattori latenti con i fattori specifici e di errore, in quanto calcolati sui residui di varianza non spiegata dagli altri fattori comuni. F1 F2 a21 S1 a11 a12 F3 a22 a1S a1E a23 E2 a2E Z1 E1 a13 Z2 UNICITA’ della variabile Z1 a2S S2 19 Analisi Fattoriale Lezione – 3 L’equazione Fondamentale Equazione fondamentale Volendo a questo punto riprodurre la correlazione fra due variabili i e j secondo l’equazione di Thurstone: 1 k N rij zik z jk N k 1 Z ik ai1 F1k ai 2 F2k ... aim Fmk ais Sik aie Eik Z jk a j1 F1k a j 2 F2k ... a jm Fmk a js Sik a je E jk riordinando i termini e applicando tutte le semplificazioni che derivano dalle condizioni di ortogonalità dei fattori , sostituendo zero a tutte le correlazioni tra i fattori diversi (latenti, specifici e di errore) e 1 alle varianze dei fattori, l’equazione risultante risulta semplificata come segue: rij ai1a j1 ai 2 a j 2 ... aim a jm 20 Analisi Fattoriale Lezione – 3 L’equazione Fondamentale Equazione fondamentale rij ai1a j1 ai 2 a j 2 ... aim a jm L’equazione risultante implica che la correlazione tra le variabili i e j corrisponde alla somma dei prodotti delle loro saturazioni nei fattori comuni soltanto. Tutti i prodotti tra i fattori specifici e di errore si annullano fintanto che i fattori sono ortogonali (cioè non correlati tra loro). 21 Lezione – 3 L’equazione Fondamentale Analisi Fattoriale Comunalità rij ai1a j1 ai 2 a j 2 ... aim a jm Nel caso in cui i sia uguale a j, la correlazione è quella di una variabile con se stessa dovuta alla varianza dei soli fattori comuni, avendo omesso la varianza dei fattori specifici. Tale quantità e definita COMUNALITA’. E rappresenta la diagonale della parte sinistra della matrice Au (che differisce solo in questo dalla matrice di correlazione) a11 a 21 ... an1 a12 ... a1m a1s a22 ... a2 m a2 s ... ... ... an 2 ... anm a1e a2 e ... ans ... ane 22 Lezione – 3 L’equazione Fondamentale Analisi Fattoriale Rappresentazione Matriciale Quando nella diagonale vengono inseriti dei valori uguali ad 1.0 al posto delle comunalità la matrice delle correlazioni è rappresentata con il simbolo Ru se nella diagonale principale vengono inserite comunalità, la matrice delle correlazioni rappresentata con il simbolo R 23 le è Analisi Fattoriale Lezione – 3 L’equazione Fondamentale Rappresentazione Matriciale Usando il formalismo matriciale è possibile rappresentare la matrice delle correlazioni tra tutte le variabili (Ru) con la seguente equazione: N = Numero di soggetti (righe) della matrice Z 1 Ru ( Z Z ' ) N Z = Matrice dei punteggi standardizzati per tutti i soggetti (righe) in tutte le variabili (colonne) Z’= Trasposta della matrice Z Moltiplicando una riga i della matrice Z per una colonna j della matrice Z’ si ottiene una somma di prodotti tra variabili standardizzate. Dividendo questa somma per N, l’espressione risultante è un coefficiente di correlazione tra le variabili i e j. 24 Lezione – 3 L’equazione Fondamentale Analisi Fattoriale Rappresentazione Matriciale 1 Ru ( Z Z ' ) N Richiamando la formulazione fondamentale di Thurstone: matriciale dell’equazione Z = A u ∙ Fu Cioè la matrice dei punteggi standardizzati nelle variabili è uguale alla moltiplicazione tra la matrice completa delle saturazioni fattoriali e la matrice completa dei punteggi fattoriali. Si ottiene che: 1 Ru ( Au Fu ) ( Au Fu )' N 25 Lezione – 3 L’equazione Fondamentale Analisi Fattoriale Rappresentazione Matriciale Ru 1 ( Au Fu ) ( Au Fu )' N Utilizzando la proprietà che la trasposta del prodotto di due matrici è uguale al prodotto delle loro trasposte in ordine inverso, e ricollocando la posizione del divisore N costante, la precedente può essere riscritta come: Fu Fu ' Ru Au Au ' N La matrice prodotto in parentesi quadra rappresenta la matrice delle correlazioni tra i punteggi fattoriali. 26 Lezione – 3 L’equazione Fondamentale Analisi Fattoriale Rappresentazione Matriciale Fu Fu ' Ru Au Au ' N Matrice delle correlazioni tra i punteggi fattoriali Nel caso di fattori indipendenti (ortogonali) le correlazioni fra fattori diversi (fuori dalla diagonale principale della matrice) sono per definizione uguali a 0, mentre le correlazioni dei fattori con se stessi (sulla diagonale principale), rappresentando una varianza di una variabile standardizzata sono per definizione tutti uguali ad 1. Questo tipo di matrice viene definito MATRICE IDENTITA’ 27 Lezione – 3 L’equazione Fondamentale Analisi Fattoriale Matrice FuFu’/N 1 2 3 … m 1 2 3 … n 1 2 3 … n 1 2 3 1 0 0 1 0 0 0 0 1 … m 1 2 3 … n 1 2 3 0 0 1 0 … n ... 1 1 1 0 ... 1 1 1 0 0 1 ... 1 28 Lezione – 3 L’equazione Fondamentale Analisi Fattoriale Matrice Identità 1 0 0 0 1 0 0 0 1 0 0 0 0 0 0 1 ( 4 x 4) = I Matrice Identità di ordine 4 La matrice identità (I) ha sempre valori uno nella diagonale principale e valori zero in tutte le altre celle. La matrice identità è l’equivalente dello scalare 1 nell’algebra scalare. Quindi moltiplicare una matrice per la matrice identità equivale a lasciare la prima invariata. 29 Lezione – 3 L’equazione Fondamentale Analisi Fattoriale Riformulazione dell’equazione matriciale Fu Fu ' Ru Au Au ' N R A I A ' u u u Ru Au Au ' Dove Ru è la matrice delle correlazioni tra le variabili con valori 1 nella diagonale principale e Au è la matrice completa delle saturazioni fattoriali, che include i fattori comuni, specifici e di errore. La matrice Ru è simmetrica per cui: Ru = Ru’ 30 Lezione – 3 L’equazione Fondamentale Analisi Fattoriale I valori della matrice Au rappresentano le correlazioni tra le variabili e i fattori. Queste correlazioni sono chiamate saturazioni fattoriali nel modello dei fattori ortogonali, il quale richiede che i fattori siano ciascuno ad angolo retto rispetto agli altri (cioè non correlati). La matrice A rappresenta solo la parte dei fattori comuni della matrice Au. Da quanto visto finora è chiaro che solo i fattori comuni entrano nella determinazione degli elementi di R al di fuori della diagonale principale. Per gli elementi sulla diagonale, tuttavia, ovvero per gli elementi: i fattori contributo. Rij specifici dove e di i=j errore forniscono un 31 Lezione – 3 L’equazione Fondamentale Analisi Fattoriale Comunalità ed Unicità Tutti gli elementi sulla diagonale della matrice Ru sono uguali ad 1, che equivale anche alla varianza di ogni variabile standardizzata. Questa varianza può essere divisa come segue: 1 = hii2 + uii2 Dove: hii2 = ai12 + ai22 + … + aim2 - Comunalità uii2 = ais2 + aie2 - Unicità 32 Analisi Fattoriale Lezione – 3 L’equazione Fondamentale Equazione fondamentale dell’analisi Fattoriale L’equazione fondamentale dell’analisi fattoriale così come è stata formulata da Thurstone (1947) stabilisce che la matrice delle correlazioni tra le variabili può essere scomposta nel prodotto di una matrice di fattori per la sua trasposta. 33 Analisi Fattoriale Lezione – 3 L’equazione Fondamentale Equazione fondamentale dell’analisi Fattoriale Ru = AuAu’ riproduce la matrice delle correlazioni con valori 1 sulla diagonale, utilizzando una matrice di saturazioni Au che contiene i fattori comuni, specifici e di errore. R = AA’ riproduce la matrice delle correlazioni R con i valori delle comunalità nella diagonale principale al posto degli 1.Tutti gli altri elementi delle matrici R ed Ru sono identici 34 Lezione – 3 L’equazione Fondamentale Analisi Fattoriale Dalla forma Analitica alla forma Matriciale rij ai1a j1 ai 2 a j 2 ... aim a jm Considerando tutti i valori di i e j simultaneamente, quindi rappresentando in matrici il sistema costituito dalle n equazioni del tipo della precedente (forma analitica), otteniamo la seguente equazione matriciale: R = A A’ L’equazione implica che la matrice delle correlazioni (R) con le comunalità (h2) nella diagonale principale può essere rappresentata come il prodotto della matrice delle saturazioni nei fattori comuni moltiplicato per la sua trasposta. 35 Lezione – 3 L’equazione Fondamentale Analisi Fattoriale Equazione fondamentale Riassumendo: Per spiegare le correlazioni tra le variabili sono necessari solo i fattori comuni. Per spiegare la varianza totale delle variabili sono necessari i fattori comuni, specifici e di errore. 36 Analisi Fattoriale Lezione – 4 Estrazione dei fattori Estrazione dei Fattori Dopo aver calcolato la matrice delle correlazioni R, il passo successivo consiste nel determinare quanti costrutti fattoriali sono necessari per spiegare l’insieme dei valori di R. Tutti i metodi di estrazione fattoriale finiscono con una colonna di numeri (vettore), uno per ciascuna variabile, che rappresentano le saturazioni (o pesi) delle variabili in quel fattore. 37 Analisi Fattoriale Lezione – 4 Estrazione dei fattori Estrazione dei Fattori La procedura che va sotto il nome di Estrazione dei Fattori consiste nell’estrarre fattori dalla matrice di correlazione fino a che non rimanga più nessuna porzione apprezzabile di varianza da spiegare, cioè finche le correlazioni residue sono prossime allo zero (e quindi di importanza trascurabile). 38 Analisi Fattoriale Lezione – 4 Estrazione dei fattori Estrazione dei Fattori Dopo che il primo fattore è stato estratto, “l’effetto” di questo fattore (nel determinare le correlazioni osservate nei dati) viene rimosso dalla matrice delle correlazioni R per produrre la matrice delle correlazioni residue rispetto al primo fattore. 39 Analisi Fattoriale Lezione – 4 Estrazione dei fattori Estrazione dei Fattori Esempio: Supponendo che un ipotetico primo fattore estratto abbia saturazioni di -.7 per una variabile (i) e di .8 per un’altra variabile(j). Moltiplicando -.7 per .8 abbiamo -.56, che rappresenta la correlazione tra queste due variabili dovuta SOLTANTO al primo fattore. Sottraendo -.56 al valore rij otteniamo la correlazione residua rispetto al primo fattore. 40 Lezione – 4 Estrazione dei fattori Analisi Fattoriale Estrazione dei Fattori Una volta che i fattori necessari per spiegare le correlazioni nella matrice R sono stati estratti, i valori delle correlazioni tra variabili e fattori vengono sistemati in una tabella definita “Matrice delle Saturazioni non Ruotate”. Fattori V a r i a b i l i SSQ 1 2 3 4 5 6 7 I II III .48 .67 .01 .38 .63 .12 .40 .65 .14 .51 .27 .36 .61 .26 .37 .46 .22 .46 .41 .26 .11 1.55 1.52 .52 IV .05 .08 .10 .17 .02 .09 .40 h2 .68 .56 .61 .50 .57 .48 .41 .22 41 Lezione – 4 Estrazione dei fattori Analisi Fattoriale Estrazione dei Fattori Il primo fattore risulta il più grande dei quattro estratti e l’ultimo ovviamente il più piccolo La varianza totale spiegata dalla soluzione fattoriale (SSQ) per ogni fattore è rappresentata dalla Somma dei quadrati delle saturazioni fattoriali. L’ultima colonna (h2) contiene le comunalità delle variabili, che è calcolata come somma dei quadrati delle saturazioni nei fattori. Fattori V a r i a b i l i SSQ 1 2 3 4 5 6 7 I II III .48 .67 .01 .38 .63 .12 .40 .65 .14 .51 .27 .36 .61 .26 .37 .46 .22 .46 .41 .26 .11 1.55 1.52 .52 IV .05 .08 .10 .17 .02 .09 .40 .22 42 h2 .68 .56 .61 .50 .57 .48 .41 Lezione – 4 Estrazione dei fattori Analisi Fattoriale Comunalità Se la comunalità per una variabile raggiunge il valore di 1.0, questo significa che il punteggio nella variabile potrebbe essere perfettamente predetto da una combinazione pesata dei punteggi che rappresentano i soli fattori estratti. In altri termini tutta la varianza di questa variabile può essere spiegata dai punteggi che rappresentano la posizione di ogni soggetto nei fattori comuni estratti dall’analisi fattoriale. 43 Lezione – 4 Estrazione dei fattori Analisi Fattoriale Comunalità D’altro canto se una variabile avesse comunalità uguale a 0 le saturazioni di tutti i fattori per quella variabile sarebbero uguali a 0 e la variabile non avrebbe nulla in comune con nessuno dei fattori. 44 45