ANALISI FATTORIALE E PSICOLOGIA Nasce come metodo di spiegazione di dati di tipo psicologico XCHE’ Permette di studiare molte variabili contemporaneamente ANALISI FATTORIALE: che cos’è Corpo di metodi statistici che aiutano il ricercatore a definire meglio le proprie variabili e a decidere quali dovrebbero essere studiate e messe in relazione Sviluppo Psicologia Tecnica utilizzata per STUDIARE RIASSUMERE SEMPLIFICARE le relazioni in un insieme di variabili SCOPO Ridurre l’informazione contenuta in un insieme di dati individuando uno o più FATTORI (dimensioni) latenti che raggruppano una serie di variabili RISULTATO POCHI FATTORI partendo da MOLTE VARIABILI ESEMPIO: - CULTURA GENERALE - COMPRENSIONE - ANALOGIE - VOCABOLARIO FATTORE ABILITA’ VERBALE FASI dell’AF PUNTO DI PARTENZA: trasformazione di una matrice “soggetti x variabili” in una matrice “variabili x variabili” (matrice di correlazione R ridotta) Matrice SOGGETTI X VARIABILI es. 100 X 10 Item 1 Item 2 Item 3 … Andrea 3 2 2 … Anna 2 4 1 … Paola 4 5 3 … … … … … … Matrice VARIABILI X VARIABILI es. 10 X 10 Item 1 Item 2 Item 3 … Item 1 ? .34 .42 … Item 2 .34 ? .52 … Item 3 .42 .52 ? … … … … … … MATRICE DI CORRELAZIONE R RIDOTTA PUNTO DI ARRIVO: matrice delle saturazioni A (relazioni fra variabili e fattori latenti) Matrice VARIABILI X FATTORI es. 10 X 2 Fattore 1 Fattore 2 Item 1 .60 .34 Item 2 .48 .23 Item 3 .56 .49 … … … MATRICE DELLE SATURAZIONI A Riassumendo Matrice SOGGETTI X VARIABILI Matrice VARIABILI X VARIABILI (R) Matrice VARIABILI X FATTORI (A) Riassumendo Matrice 100 X 10 Matrice 10 X 10 Matrice 10X 2 Tipi di Analisi Fattoriale • Analisi Fattoriale Esplorativa (AFE) è la situazione in cui il ricercatore non ha in mente nessuna ipotesi teorica (approccio data driven) • Analisi Fattoriale Confermatoria (AFC) il ricercatore dispone di una precisa ipotesi a priori sulla struttura dei fattori Modello teorico dell’AFE IPOTESI FONDAMENTALE La CORRELAZIONE tra le variabili è DETERMINATA da dimensioni non osservabili, i FATTORI, che in qualche modo causano o DETERMINANO i PUNTEGGI riscontrabili nelle VARIABILI osservate Esamina la VARIANZA che le variabili hanno in comune (VARIANZA COMUNE) per cercare di determinare i fattori sottostanti VARIANZA: indicatore di variabilità che corrisponde alla media del quadrato degli scostamenti dalla media s2 = (xi-x)2 n Non tutta la varianza degli item può essere spiegata dai fattori comuni FATTORE UNICO VARIANZA UNICA FATTORE 1 VAR 1 Fattore unico 1 FATTORE 2 VAR 2 Fattore unico 2 Scomposizione della varianza • Varianza totale= varianza comune+varianza unica (1= h2+u2) • Comunalità = varianza totale – unicità (h2= 1 – u2) • Unicità = varianza totale – comunalità (u2= 1 – h2) COMUNALITA’: parte di varianza totale che viene spiegata dai fattori comuni UNICITA’: parte di varianza totale che viene spiegata dal fattore unico Varianza dovuta all’errore di misurazione Varianza attribuibile a processi che agiscono sistematicamente solo su una variabile (specificità) ASSUNTO FONDAMENTALE AFE Il punteggio standardizzato di un soggetto in una variabile è uguale alla somma ponderata del punteggio ottenuto dallo stesso soggetto nei fattori comuni e nel fattore unico • Zik = Fi1ak1+ Fi2ak2+… Fimakm+uik • Zik= punteggio standardizzato del soggetto i nella variabile k • Fi1= punteggio standardizzato per il soggetto i nel fattore comune 1 • ak1= saturazione fattoriale (factor loading) della variabile k nel fattore comune 1 • uik = punteggio standardizzato per il soggetto i nel fattore unico associato alla variabile k Espressione matriciale Z = F*A’+U • Z matrice dei punteggi standardizzati • F matrice dei punteggi nei fattori comuni • A’ matrice (trasposta) delle saturazioni nei fattori comuni • U matrice dei fattori unici per ogni soggetto in ogni variabile EQUAZIONE FONDAMENTALE AF R = AA’ + U2 • • • • R matrice delle correlazioni tra le variabili A matrice delle saturazioni nei fattori comuni A’ matrice (trasposta) di A U2 matrice diagonale che contiene la varianza unica relativa ad ogni variabile COMUNALITA’ Somme dei quadrati delle saturazioni riga x riga Rappresentano ciò che vi è in comune tra ogni variabile e tutti i fattori, cioè la PORZIONE DI VARIANZA DELLA VARIABILE SPIEGATA DAI FATTORI Quadrato saturazioni: porzione di varianza della singola variabile che è spiegata dal fattore Matrice delle saturazioni fattoriali A Fattore 1 Fattore 2 h2 (comunalità) Item 1 .60 .34 .602 +. 342 Item 2 .48 .23 .482 +. 232 Item 3 .56 .49 .562 +. 492 … … … … MATRICE DI CORRELAZIONE R RIDOTTA Item 1 Item 2 Item 3 … Item 1 ? .34 .42 … Item 2 .34 ? .52 … Item 3 .42 .52 ? … … … … … … ? = STIMA DELLE COMUNALITA’ COSA ACCADREBBE SE SI METTESSE 1 SULLA DIAGONALE PRINCIPALE? La varianza di errore e specifica andrebbero a gonfiare la varianza estratta dai fattori distorcendo le stime dei parametri LA MATRICE DI CORRELAZIONE CON 1 SULLA DIAGONALE PRINCIPALE VIENE USATA NELL’ACP 5 PASSI FONDAMENTALI DELL’AFE 1) SELEZIONE DELLE VARIABILI 2) CALCOLO DELLA MATRICE DELLE CORRELAZIONI TRA LE VARIABILI (R) 3) ESTRAZIONE DEI FATTORI (A) 4) ROTAZIONE DEI FATTORI 5) INTERPRETAZIONE DELLA MATRICE DEI FATTORI RUOTATI MATRICE DELLE SATURAZIONI FATTORIALI A Fattore 1 Fattore 2 Item 1 .60 .34 Item 2 .48 .23 Item 3 .56 .49 … … … RUOTARE I FATTORI = spostarne la posizione nello spazio In modo che: solo poche variabili presentino saturazioni elevate su ciascuno di essi Ogni singola variabile tenda a correlare solo con un fattore MATRICE DELLE SATURAZIONI RUOTATA Fattore 1 Item 1 Item 3 Item 4 Item 10 Item 2 Item 5 Item 6 Item 7 Item 8 Item 9 Fattore 2 .70 .63 .54 .45 .77 .75 .66 .60 .54 .51 INTERPRETAZIONE Ci si serve di tutte le conoscenze disponibili riguardo alle variabili così come di ogni altra informazione pertinente Si comincia analizzando le variabili che presentano saturazioni più elevate nei fattori ruotati MATRICE SOGGETTI x VARIABILI MATRICE DELLE CORRELAZIONI TRA LE VARIABILI R (MATRICE VARIABILI x VARIABILI) ESTRAZIONE DEI FATTORI MATRICE DELLE SATURAZIONI NON RUOTATE A ROTAZIONE DEI FATTORI MATRICE DELLE SATURAZIONI RUOTATE INTERPRETAZIONE DEI FATTORI DECISIONI DA PRENDERE IN UN AFE Il ricercatore deve DECIDERE: 1) QUALI VARIABILI E CAMPIONE UTILIZZARE 2) SE L’AFE E’ LA PIU’ APPROPRIATA FORMA DI ANALISI PER RAGGIUNGERE GLI OBIETTIVI DELLA SUA RICERCA 3) QUALE PROCEDURA UTILIZZARE PER ADATTARE IL MODELLO AI DATI 4) QUANTI FATTORI INCLUDERE NELLO STUDIO 5) COME RUOTARLI PER OTTENERE UNA SOLUZIONE FACILMENTE INTERPRETABILE PROGETTO DI RICERCA: VARIABILI E CAMPIONE 1) DEFINIRE PRELIMINARMENTE L’AREA CHE SI VUOLE STUDIARE; 2) FARSI UN’IDEA DEI FATTORI CHE CI ASPETTA DI OTTENERE; 3) SCEGLIERE LE VARIABILI 4) SELEZIONARE UN CAMPIONE RAPPRESENTATIVO SU CUI RACCOGLIERE I DATI 5) FARE LE ANALISI VARIABILI: •ogni fattore atteso deve essere sovradeterminato, cioè rappresentato da più variabili con un rapporto di almeno 1:4-1:5 •Le variabili con bassa comunalità dovrebbero essere eliminate; CAMPIONE: CONDIZIONI OTTIMALI VARIABILI CONDIZIONI MODERATE CONDIZIONI SCARSE Campioni anche piccoli Campioni di medie dimensioni Anche campioni grandi potrebbero non essere sufficienti! Il campione deve assicurare variabilità al fattore Attenzione alle condizioni di raccolta dati APPROPRIATEZZA AFE Qual è l’obiettivo del mio progetto di ricerca? PARSIMONIOSA RAPPRESENTAZIONE DELLE ASSOCIAZIONI TRA LE VARIABILI AFE SEMPLIFICAZIONE DEI DATI ACP L’Analisi delle Componenti Principali (ACP) Tecnica di semplificazione dei dati diversa dall’AF e creata per raggiungere scopi diversi AF: cerca di spiegare più COVARIANZA possibile delle variabili (spiegare le correlazioni) ACP: cerca di spiegare più VARIANZA possibile delle variabili (trasformando linearmente le variabili originali) • L’ACP non fa distinzione fra varianza comune (comunalità) e varianza specifica delle variabili • Nel processo di calcolo delle componenti principali è possibile individuare tante componenti quanto sono le variabili originali • Non si possono ruotare le componenti • Le componenti non sono latenti TECNICA DI ESTRAZIONE DEI FATTORI METODO DEI FATTORI PRINCIPALI (AFP) METODO DEI MINIMI QUADRATI (MQ) METODO DELLA MASSIMA VEROSIMIGLIA NZA (ML) AFP MQ ML Vantaggi: Vantaggi: -No assunzione di normalità multivariata; -Non necessaria stima -Test per verificare la delle comunalità; bontà dell’adattamento del Limiti: modello ai dati; -Spesso risultati -Non dipendente dalla diversi da AFP perché scala di misura delle non analizza gli variabili elementi sulla diagonale principale Limiti: -Raramente risultati distorti Limiti: -Necessaria stima delle comunalità elemento di indeterminatezza nella soluzione Vantaggi: -Assunzione di normalità multivariata SELEZIONE DEL NUMERO DI FATTORI DA ESTRARRE Non esiste un metodo certo per determinare l’esatto numero di fattori da estrarre! MEGLIO SBAGLIARE ESTRAENDO TROPPI FATTORI PIUTTOSTO CHE TROPPO POCHI PRINCIPALI TECNICHE PER DECIDERE QUANTI FATTORI ESTRARRE CRITERIO DEGLI AUTOVALORI > 1 SCREE TEST ANALISI PARALLELA 1) Fare riferimento alla letteratura e a precedenti ricerche; 2) Utilizzare più indicatori possibili; 3) Se ci sono, controllare i valori di almeno un indice di bontà dell’adattamento del modello ai dati; 4) Testare la scelta effettuate su più gruppi di dati INDICI DI BONTA’ DELL’ADATTA MENTO DEL MODELLO AI DATI ROTAZIONE DEI FATTORI CRITERIO DELLA STRUTTURA SEMPLICE (THURSTONE) Ogni fattore deve saturare una minoranza di variabili e ogni variabile deve essere spiegata possibilmente da un solo fattore MATRICE DI CORRELAZIONE DI 6 VARIABILI ARTIFICIALI X1 X2 X3 X4 X5 X1 X2 .75 X3 .83 .70 X4 .32 .25 .39 X5 .28 .31 .25 .79 X6 .36 .32 .33 .82 .76 X6 ANALISI DEI FATTORI PRINCIPALI (AFP) Fattore 1 Fattore 2 h2 X1 .77 .55 .89 X2 .66 .44 .63 X3 .74 .49 .78 X4 .78 –.49 .85 X5 .71 –.48 .73 X6 .77 –.45 .79 Soluzione originale AFP (i fattori coincidono con gli assi cartesiani) 1 FATTORE II .75 X3 X1 .5 X2 .25 FATTORE I .25 .5 .75 X5 X6 X4 1 ROTAZIONI ORTOGONALI: durante la rotazione i fattori mantengono il vincolo dell’ortogonalità ROTAZIONI OBLIQUE: durante la rotazione i fattori divengono correlati ROTAZIONE ORTOGONALE 45° 1 FATTORE I .75 X3 X1 .5 X2 .25 .25 .5 .75 X5 1 X6 X4 FATTORE II ROTAZIONE OBLIQUA (ANGOLI DIVERSI) 1 FATTORE I .75 X3 X1 .5 X2 .25 .25 .5 .75 X5 1 X6 X4 FATTORE II LIMITI E VANTAGGI DELLE ROTAZIONI ORTOGONALI ● Più semplici da effettuare ● Inadeguate per molti costrutti esaminati in psicologia poiché costituiti da fattori correlati ● Individuano strutture semplici più povere di quelle reali quando i fattori sono correlati ● Conducono a gravi distorsioni se si utilizzano con fattori correlati OBLIQUE ● Più complesse ● Adeguate per la maggior parte dei costrutti psicologici ● Non individuano strutture fattoriali più povere quando i fattori non sono correlati ● Non comportano distorsioni se si utilizzano su fattori non correlati ● Stimando le correlazioni tra i fattori permettono una comprensione più approfondita dei dati ROTAZIONI OBLIQUE PIU’ COMPLESSE PERCHE’: -NO SISTEMA DI RIFERIMENTO CARTESIANO; -COMUNALITA’ PIU’ DIFFICILI DA CALCOLARE; -SOLUZIONE SU TRE MATRICI (PATTERN, STRUCTURE E DI CORRELAZIONE FATTORIALE) MATRICE PATTERN (P): contiene i coefficienti relativi all’impatto diretto di ciascun fattore sulle variabili, al netto dell’impatto degli altri fattori EFFETTO DIRETTO DEL FATTORE SULLA VARIABILE MATRICE STRUCTURE (S): contiene le correlazioni tra le variabili e i fattori, che saranno tanto maggiori rispetto ai coefficienti della matrice Pattern quanto più è elevata la correlazione tra i fattori CORRELAZIONI TRA VARIABILI E FATTORI FATTORI PIU’ CORRELATI / ROTAZIONE PIU’ OBLIQUA F A T T T O R E II Pattern Structure FATTORE I FATTORI MENO CORRELATI / ROTAZIONE MENO OBLIQUA F A T T T O R E II Pattern Structure FATTORE I Più la soluzione è obliqua più la S e la P saranno differenti, più diminuisce il grado di obliquità più le due matrici si avvicineranno sino ad arrivare a coincidere quando i due fattori diventano ortogonali DECISIONI DA PRENDERE IN UN’ANALISI FATTORIALE ESPLORATIVA 5 TEMI PRINCIPALI: • Progetto di ricerca Variabili Campione • Appropriatezza dell’AFE AFE o ACP? • Tecniche di estrazione dei fattori • Numero di fattori da estrarre • Rotazione dei fattori Ortogonali Oblique Analisi dei Fattori Principali Minimi Quadrati Massima Verosimiglianza Autovalori > 1 Scree test Analisi parallela Indici di goodness of fit ESEMPIO PRATICO DI AFE SCALA DIMENSIONI DEL SELF-CONSTRUAL (13 ITEM con Likert a 7 punti) Scala inserita nell’European Opinion Survey (EOS), questionario costruito per una ricerca cross-culturale relativa al senso di identità nazionale in alcuni Paesi Europei PUNTI FONDAMENTALI AFE: 1) PROGETTO DI RICERCA VARIABILI: ? CAMPIONE: medie dimensioni (300 soggetti) in quanto i fattori, stando alla letteratura, dovrebbero essere sovradeterminati, ma non si hanno dati sulle comunalità delle variabili 2) APPROPRIATEZZA AFE SCOPO ANALISI: scoprire se esistono e dunque individuare i fattori latenti AFE ANALISI DELLA DISTIBUZIONE DEI DATI (minimo-massimo, range, distribuzione di frequenza, media, deviazione standard etc) 3) SCELTA TECNICA ESTRAZIONE FATTORI Poiché la distribuzione è NORMALE MULTIVARIATA, conoscendo i vantaggi e gli svantaggi delle varie tecniche, si sceglie di utilizzare il metodo della Massima Verosimiglianza ML 4) SELEZIONE DEL NUMERO DEI FATTORI DA ESTRARRE Non esistendo un unico criterio certo si sceglie di utilizzare: AUTOVALORI > 1 SCREE TEST ANALISI PARALLELA AUTOVALORI Autovalori iniziali % cumulative 1 Totale 3.88 % di varianza 29.84 2 2.66 20.51 50.36 3 1.02 7.88 58.24 4 .84 6.48 64.73 5 .78 6.00 70.73 6 .70 5.40 76.14 Fattori … 29.84 SCREE PLOT Scree Plot 5 4 3 Eigenvalue 2 1 0 1 2 3 Factor Number 4 5 6 7 8 9 10 11 12 13 ANALISI PARALLELA Number of variables: 13 Number of subjects: 300 Number of replications: 1000 ++++++++++++++++++++++++++++++++++++++++++++++++ Random Eigenvalue DS ++++++++++++++++++++++++++++++++++++++++++++++++ 1 1.3585 .0481 2 1.2733 .0311 3 1.2056 .0305 4 1.1396 .0286 5 1.0860 .0232 6 1.0369 .0210 INDICE DI GOODNESS OF FIT χ2 26.94 gl p 53 .26 Valore del χ2 non significativo il modello trovato ha un buon fit con i dati (se fosse stato significativo il modello a due fattori sarebbe stato “lontano” dai dati ottenuti con la somministrazione) 5) ROTAZIONE DEI FATTORI FATTORI NON CORRELATI RUOTAZIONE ORTOGONALE VARIMAX MATRICE RUOTATA VARIMAX Item INT4 INT7 INT3 INT6 INT2 INT1 INT5 IND4 IND6 IND2 IND5 IND1 IND3 Fattori 1 .73 .72 .70 .64 .63 .63 .55 2 .64 .63 .62 .60 .56 .55