Corso di Laurea magistrale in Psicologia Clinica, dello Sviluppo e Neuropsicologia Esame di Analisi Multivariata dei Dati Introduzione all’analisi fattoriale. A cura di Matteo Forgiarini 1 Utilizziamo nuovamente il file Adjective.sav per approfondire l’analisi della soluzione ottenuta. Utilizzando il metodo dell’ACP si ottiene una soluzione iniziale con 5 componenti che permettono di spiegare il 41% della varianza delle 25 variabili ossevate. Il modello appare adeguato: • per parsimonia della soluzione (cfr. analisi del grafico degli autovalori) • da un punto di vista teorico è coerente con le ipotesi iniziali sulla numerosità dei fattori. Il passaggio successivo è l’interpretazione dei fattori, ovvero l’attribuzione di un significato alle dimensioni latenti individuate. 2 Il significato delle dimensioni latenti viene attribuito sulla base delle saturazioni che tali dimensioni presentano con le variabili osservate. Infatti se una componente ha una saturazione molto elevata (circa 1) con una variabile e le altre saturazioni sono molto basse, è possibile ipotizzare che tale dimensione abbia lo stesso contenuto - lo stesso significato - della V.O. massimamente spiegata. Tuttavia le soluzioni iniziali ottenute con il metodo della PCA presentano spesso per ogni fattore saturazioni elevate per molte variabili: le componenti sono infatti estratte con lo scopo di massimizzare tutte le saturazioni. Occore quindi ruotare la soluzione ottenuta con lo scopo di ottenere una soluzione semplice, ovvero una soluzione che presenti saturazioni vicine a 0 o a 1: ogni variable sarà quindi spiegata possibilmente da un solo fattore e vi sarà un numero minimo di variabili con saturazioni elevate con più di un fattore. Esistono due tipi di rotazioni: quelle ortogonali e quelle oblique. Le prime mantengono l’ortogonalità delle componenti della soluzione iniziale; le rotazioni oblique al contrario pruducono una soluzione in cui le compomenti sono tra loro correlate. 3 Rotazioni ortogonali Il metodo Varimax, mantenendo l’ortogonalità delle componenti, ruota la soluzione massimizzando la varianza delle saturazioni delle componenti: ovvero la soluzione massimizza la seguente sommatoria Component Matrixa Sereno Romantico Sicuro Diligente Cos cienzios o Previdente Stabile Divertente Prudente generos o Espans ivo Ricettivo Estroverso Colorito Progres sis ta Innovativo Spens ierato Forte leale Stravagante Tollerante Originale Aperto Scherzoso Ospitale 1 ,584 ,562 ,518 ,497 ,496 ,447 ,446 ,419 ,373 ,052 ,084 ,200 ,164 ,270 ,330 ,392 ,387 ,372 ,350 ,223 ,049 ,066 ,197 ,075 -,082 2 -,106 -,140 -,211 -,101 -,220 -,083 -,018 ,265 -,264 ,673 ,616 ,580 ,407 ,385 ,376 -,005 -,151 -,168 -,037 ,138 ,316 ,178 ,089 ,354 ,274 Component 3 -,184 -,173 -,199 -,112 -,160 -,200 ,371 -,398 -,083 -,155 ,015 ,183 -,078 ,223 -,251 ,575 ,507 ,478 -,470 ,420 ,169 ,253 ,092 -,098 -,062 Extraction Method: Principal Component Analysis . a. 5 components extracted. 4 ,036 ,023 ,168 ,161 ,048 ,093 -,044 -,175 ,152 ,089 ,066 ,190 -,307 -,241 -,324 -,203 -,283 -,197 ,133 ,250 ,509 ,509 ,439 -,393 ,124 5 -,065 -,066 ,050 ,054 ,314 -,077 ,270 -,253 ,293 ,218 ,114 -,284 ,121 -,010 -,181 ,168 ,085 -,097 -,017 -,396 ,226 ,014 -,355 ,014 ,679 2 1 n 2 2 (a j aij ) n i 1 Dove n = numero di variabili e aij = saturazione della variabile i per la componente j. Ovvero... Il metodo Varimax ruota la soluzione massimizzando la varianza delle colonne della component matrix. 4 Selezioniamo inizialmente Varimax come metodo di rotazione. 5 Total Variance Explained Rotation Sums of Squared Loadings Extraction Sums of Squared Loadings Initial Eigenvalues % of Variance Cumulative % Total % of Variance Cumulative % Total % of Variance Cumulative % Total Component 1 10,877 10,877 2,719 12,247 12,247 3,062 12,247 12,247 3,062 2 19,465 8,588 2,147 21,515 9,268 2,317 21,515 9,268 2,317 3 28,018 8,553 2,138 29,478 7,964 1,991 29,478 7,964 1,991 4 34,822 6,804 1,701 35,677 6,199 1,550 35,677 6,199 1,550 5 41,157 6,335 1,584 41,157 5,480 1,370 41,157 5,480 1,370 6 45,656 4,500 1,125 Tot=10,289 Tot=10,289 Tot=10,289 7 49,970 4,314 1,078 8 54,051 4,082 1,020 9 57,855 3,803 ,951 10 61,493 3,639 ,910 11 64,989 3,496 ,874 12 68,292 3,303 ,826 13 71,417 3,125 ,781 14 74,418 3,001 ,750 15 77,385 2,968 ,742 16 80,239 2,853 ,713 17 82,875 2,637 ,659 18 85,463 2,588 ,647 19 87,944 2,482 ,620 20 90,317 2,372 ,593 21 92,509 2,192 ,548 22 94,512 2,002 ,501 23 96,406 1,895 ,474 24 98,237 1,831 ,458 25 100,000 1,763 ,441 Extraction Method: Principal Component Analysis. Dopo la rotazione la varianza totale spiegata dalle 5 component rimane invariata; al contrario i singoli autovalori delle componenti cambiano poichè cambiano le saturazioni delle variabili; la loro somma rimane però costante. 6 Rotated Component Matrixa Sicuro Sereno Romantico Cos cienzios o leale Diligente Previdente Prudente Progres sis ta Divertente Estroverso Scherzoso generos o Colorito Espans ivo Innovativo Spens ierato Forte Stabile Stravagante Ricettivo Aperto Originale Ospitale Tollerante 1 ,611 ,594 ,577 ,574 ,533 ,526 ,493 ,472 ,198 ,392 ,006 -,073 -,030 -,030 -,077 ,042 ,082 ,091 ,223 -,016 -,052 ,165 ,007 -,030 ,011 2 -,067 ,110 ,082 -,056 ,103 -,003 ,066 -,193 ,625 ,526 ,522 ,516 ,499 ,451 ,451 ,069 ,019 -,015 ,024 -,004 ,401 -,081 -,160 ,062 -,064 Component 3 ,056 ,103 ,111 ,172 -,260 ,105 ,005 ,146 -,033 -,159 ,084 ,040 -,168 ,326 -,027 ,735 ,706 ,613 ,569 ,255 ,042 -,066 ,047 -,019 -,001 4 ,032 ,070 ,050 -,187 -,017 ,091 ,089 -,122 ,011 ,071 -,111 -,147 ,129 ,123 ,219 ,053 -,027 ,111 ,030 ,620 ,590 ,578 ,475 -,247 ,372 5 -,003 -,107 -,126 ,151 -,007 ,051 -,078 ,169 -,146 -,195 ,126 -,017 ,490 ,058 ,383 ,062 -,104 -,218 ,194 -,123 ,116 -,046 ,325 ,704 ,547 Massimizzando la varianza delle colonne della component matrix, la rotazione varimax produce poche saturazioni elevate per ogni componente e permette di discriminare con precisione i gruppi di variabili che afferiscono alla medesima componente. Le 5 variabili con le saturazioni più elevate permettono di interpretare le componenti e attibuire loro un significato. Extraction Method: Principal Component Analysis . Rotation Method: Varimax with Kais er Normalization. a. Rotation converged in 7 iterations . 7 Rotazioni oblique Le rotazioni oblique permettono di ruotare la soluzione senza mantenere l’ortogonalità degli assi; l’angolo tra le dimensioni può essere quindi variato per massimizzare la semplicità della soluzione. Selezionaimo la rotazione Oblimin e aumentiamo le iterazioni dell’algoritmo fino a 100. 8 Nelle rotazioni in cui i fattori sono correlati, il contributo unico di ogni fattore sulle variabili non coincide con le correlazioni tra fattore e variabile; infatti come nella retta di regressione multipla, le correlazioni tra i fattori e variabili risultano gonfiate in quanto al contributo unico sulla variabile si sommano i contributi condivisi tra più fattori. Pertanto nelle soluzioni oblique – oltre alla component matrix riferita alla soluzione iniziale non ruotata – vengono prodotte due distinte matrici: • la Pattern matrix contiene i contributi unici tra fattore e variabile. • la Structure Matrix contiene le correlazioni fattore-variabile. Per l’analisi della soluzione analizziamo la pattern matrix in quanto contiene le vere stime dei legami fattore-variabili. 9 Total Variance Explained Component 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 Total 3,062 2,317 1,991 1,550 1,370 1,125 1,078 1,020 ,951 ,910 ,874 ,826 ,781 ,750 ,742 ,713 ,659 ,647 ,620 ,593 ,548 ,501 ,474 ,458 ,441 Initial Eigenvalues % of Variance Cumulative % 12,247 12,247 9,268 21,515 7,964 29,478 6,199 35,677 5,480 41,157 4,500 45,656 4,314 49,970 4,082 54,051 3,803 57,855 3,639 61,493 3,496 64,989 3,303 68,292 3,125 71,417 3,001 74,418 2,968 77,385 2,853 80,239 2,637 82,875 2,588 85,463 2,482 87,944 2,372 90,317 2,192 92,509 2,002 94,512 1,895 96,406 1,831 98,237 1,763 100,000 Extraction Sums of Squared Loadings Total % of Variance Cumulative % 3,062 12,247 12,247 2,317 9,268 21,515 1,991 7,964 29,478 1,550 6,199 35,677 1,370 5,480 41,157 Rotation Sums Totalof Squared 2,780a Loadings 2,183 2,206 1,785 1,560 Con la rotazione vengono ricalcolati gli autovalori in quanto la comunalità delle V.O. viene ridistribuita tra le componenti per massimizzare la semplicità della soluzione. Extraction Method: Principal Component Analysis. a. When components are correlated, sums of squared loadings cannot be added to obtain a total variance. 10 Pattern Matrixa Sicuro Sereno Cos cienzios o Romantico leale Diligente Previdente Prudente Progres sis ta Estroverso Scherzoso Divertente generos o Colorito Espans ivo Innovativo Spens ierato Forte Stabile Stravagante Ricettivo Aperto Originale Ospitale Tollerante 1 ,612 ,586 ,577 ,569 ,550 ,522 ,491 ,476 ,189 ,000 -,080 ,390 -,017 -,056 -,076 ,000 ,039 ,048 ,195 -,047 -,069 ,157 ,005 -,006 ,019 2 -,080 ,097 -,060 ,070 ,091 -,016 ,053 -,197 ,621 ,527 ,523 ,515 ,497 ,452 ,448 ,073 ,024 -,016 ,025 -,022 ,384 -,104 -,174 ,074 -,074 Component 3 ,025 ,073 ,145 ,083 -,289 ,076 -,021 ,123 -,043 ,084 ,047 -,180 -,181 ,324 -,036 ,735 ,709 ,613 ,556 ,245 ,027 -,087 ,030 -,025 -,020 4 ,025 ,051 -,187 ,030 -,017 ,087 ,077 -,116 -,016 -,118 -,162 ,046 ,156 ,106 ,236 ,032 -,058 ,076 ,022 ,605 ,588 ,578 ,501 -,199 ,412 5 ,011 -,103 ,191 -,120 ,002 ,053 -,079 ,203 -,163 ,123 -,017 -,213 ,452 ,030 ,336 ,063 -,090 -,220 ,201 -,198 ,026 -,114 ,268 ,728 ,499 La pattern matrix contiene i contributi unici delle componenti alla spiegazione delle variabili. Le saturazioni più elevate per ogni componente permettono di interpretare la componente stessa e attribuirle un significato semantico. Extraction Method: Principal Component Analysis . Rotation Method: Oblimin with Kais er Normalization. a. Rotation converged in 36 iterations . 11 Component Correlation Matrix Component 1 2 3 4 5 1 1,000 ,032 ,110 ,032 -,049 2 ,032 1,000 -,001 ,059 ,027 3 ,110 -,001 1,000 ,059 ,002 4 ,032 ,059 ,059 1,000 ,058 5 -,049 ,027 ,002 ,058 1,000 Extraction Method: Principal Component Analys is. Rotation Method: Oblimin with Kais er Normalization. La matrice di correlazioni tra le componenti contiene le correlazioni tra le componenti dopo che la soluzione è stata ruotata; le differenti correlazioni tra le coppie di componenti evidenziano come il metodo oblimin ruoti la soluzione in modo non rigido e non conservi l’ortogonalità delle componenti. Correlazioni=0 indicano che due componenti sono ortogonali; Correlazioni=1 indicano che due componenti sono coincidenti e dunque l’angolo compreso tra esse è 0; Valori intermedi indicano angoli acuti tra le due componenti. Notiamo che i valori delle correlazioni tra le componenti sono molto basse, tutte <0.2; pertanto una soluzione ortogonale appare più adeguata per questo modello. 12 L’analisi fattoriale permette di posizionare le variabili osservate in uno spazio n-dimandionale con n pari al numero di fattori estratti; Component Plot in Rotated Space Le coordinate di ciascun punto, ciascuna variabile, sono le correlazioni parziali fattore-variabile contenute nella pattern matrix. 1,0 v2 v1 Component 2 0,5 v25 v4 v9 v5 v3 v21 v7 v6 v24v8v10 v18 v16 v23 v13 v19 v17 v12 v22 v11 0,0 Ruotando la soluzione vengono cambiate le coordinate delle variabili in modo tale che siano massimamanete vicine agli assi. -0,5 -1,0 -1,0 -0,5 0,0 0,5 Compone nt 1 1,0 1,0 0,5 -0,5 0,0 -1,0 nt 3 pone Com 13