Analisi fattoriale Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°9 Orari Laboratorio Grande DATE ORARIO 26 novembre 2009 pomeriggio 27 novembre 2009 mattina 1 dicembre 2009 pomeriggio 3 dicembre 2009 pomeriggio 9 dicembre 2009 dalle 9 alle 11 10 dicembre 2009 dalle 9 alle 11 15 dicembre 2009 dalle 9 alle 11 e dalle 14 alle 16 16 dicembre 2009 dalle 9 alle 11 18 dicembre 2009 dalle 9 alle 11 21 dicembre 2009 mattina e pomeriggio 22 dicembre 2009 mattina e pomeriggio dall' 11 gennaio 2010 almeno 4 ore tutti i giorni mattina o pomeriggio Esercizio Il data set BANCA95 contiene informazioni relative ai comportamenti di circa 1000 clienti di una banca. A partire dalle seguenti variabili estrarre un opportuno numero di fattori tramite il metodo delle componenti principali, interpretarli e salvarli in un data set. # 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 Variable ASSIC CD CUSTODIA IMPA IMPD LEAS NASSIC NCD NCUST NLEAS NRIMBAFF NSTICONV NTIT RIMBAFF S_ASSICU S_CERTIF S_CUSTOD S_LEASIN S_RIMBOR S_STIPEN S_TITOLI STICONV Label Importo totale polizze assicurative Importo totale certificati di deposito Importo commissioni titoli a custodia Importo operazioni avere Importo operazioni dare Importo totale causale leasing Num. operazioni polizze assicurative Num. operazioni certificati di deposit Num. oper. commissioni titoli a custodia Num. operazioni causale leasing Num. operazioni rimborsi affidamenti Num. operazioni accredito stipendio Num. operazioni causale titoli Importo totale rimborsi affidamenti Polizze assicurative si/no Possesso certificati di deposito Possesso titoli a custodia Leasing si/no Utilizzo affidamenti Accredito automatico stipendio si/no Possesso titoli si/no Importo totale accredito stipendio Soluzione (1/7) Estrazione fattori: PROC FACTOR DATA=CORSO.Banca95 SCREE FUZZ=0.35; VAR IMPD IMPA NCUST S_CUSTOD CUSTODIA S_TITOLI NTIT NSTICONV STICONV S_STIPEN NLEAS S_LEASIN LEAS NCD S_CERTIF CD S_ASSICU NASSIC ASSIC S_RIMBOR NRIMBAFF RIMBAFF; RUN; Soluzione (2/7) Quanti fattori considerare? 1 2 3 4 5 6 7 1.63877426 0.83715657 0.0745 0.8345 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 0.8016177 0.63717139 0.4753427 0.41429424 0.30829998 0.2246368 0.20344371 0.14311433 0.12846586 0.09984238 0.09577031 0.06202492 0.04182374 0.00441542 0 0.16444631 0.16182868 0.06104846 0.10599427 0.08366318 0.02119308 0.06032938 0.01464847 0.02862348 0.00407207 0.03374539 0.02020117 0.03740833 0.00441542 0.0364 0.029 0.0216 0.0188 0.014 0.0102 0.0092 0.0065 0.0058 0.0045 0.0044 0.0028 0.0019 0.0002 0 0.871 0.8999 0.9215 0.9404 0.9544 0.9646 0.9738 0.9803 0.9862 0.9907 0.9951 0.9979 0.9998 1 1 Totale 22 5 SCREE PLOT 4 3 AUTOVALORI Eigenvalues of the Correlation Matrix: Total = 22 Average = 1 Eigenvalue Difference Proportion Cumulative 4.04546691 1.02483585 0.1839 0.1839 3.02063106 0.21816529 0.1373 0.3212 2.80246577 0.38156324 0.1274 0.4486 2.42090253 0.07504094 0.11 0.5586 2.34586158 0.26022716 0.1066 0.6652 2.08563442 0.44686016 0.0948 0.76 2 1 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 FATTORI La regola degli autovalori > 1 suggerisce di prendere in considerazione 7 fattori, che spiegano insieme il 83% della varianza totale. Lo scree plot mostra un primo gomito in corrispondenza di 6 fattori e un altro in corrispondenza di 8 fattori. Soluzione (3/7) Estrazione fattori per la soluzione a 6 fattori: PROC FACTOR DATA=CORSO.Banca95 SCREE FUZZ=0.35 N=6; VAR lista variabili; RUN; N.B. La soluzione a 7 fattori l’abbiamo già estratta: quando nella PROC FACTOR non viene indicato il numero di fattori con l’opzione “N = “ SAS adotta la regola degli autovalori >1 per scegliere il numero di fattori. Soluzione (4/7) Variabili Descrizione CUMUNALITA' N=6 N=7 IMPD IMPA IMPORTO OPERAZIONI DARE IMPORTO OPERAZIONI AVERE 0.40 0.39 0.97 0.97 NCUST S_CUSTOD CUSTODIA S_TITOLI NTIT NSTICONV STICONV S_STIPEN NLEAS S_LEASIN LEAS NCD S_CERTIF CD S_ASSICU NASSIC ASSIC S_RIMBOR NRIMBAFF RIMBAFF NUM. OPER. COMMISSIONI TITOLI A CUSTODIA POSSESSO TITOLI A CUSTODIA IMPORTO COMMISSIONI TITOLI A CUSTODIA POSSESSO TITOLI SI/NO NUM. OPERAZIONI CAUSALE TITOLI NUM. OPERAZIONI ACCREDITO STIPENDIO IMPORTO TOTALE ACCREDITO STIPENDIO ACCREDITO AUTOMATICO STIPENDIO SI/NO NUM. OPERAZIONI CAUSALE LEASING LEASING SI/NO IMPORTO TOTALE CAUSALE LEASING NUM. OPERAZIONI CERTIFICATI DI DEPOSIT POSSESSO CERTIFICATI DI DEPOSITO IMPORTO TOTALE CERTIFICATI DI DEPOSITO POLIZZE ASSICURATIVE SI/NO NUM. OPERAZIONI POLIZZE ASSICURATIVE IMPORTO TOTALE POLIZZE ASSICURATIVE UTILIZZO AFFIDAMENTI NUM. OPERAZIONI RIMBORSI AFFIDAMENTI IMPORTO TOTALE RIMBORSI AFFIDAMENTI 0.78 0.66 0.66 0.54 0.59 0.90 0.90 0.85 0.98 0.98 0.93 0.96 0.82 0.74 0.93 0.78 0.70 0.91 0.71 0.59 0.90 0.87 0.76 0.57 0.60 0.90 0.90 0.85 0.98 0.98 0.93 0.97 0.82 0.74 0.93 0.78 0.70 0.91 0.71 0.60 16.72 18.36 76% 83% totale % Per ogni variabile si evidenziano le celle in corrispondenza delle quali la comunalità aumenta in maniera sostanziale per effetto dell’estrazione di un ulteriore fattore. La soluzione a 7 sarebbe motivata dal recupero di capacità esplicativa su due variabili molto importanti. Per queste due variabili la % di varianza spiegata aumenta in maniera sostanziale per effetto dell’estrazione del settimo fattore. Soluzione (5/7) Consideriamo la soluzione a 7 fattori e operiamo una rotazione dei fattori con il metodo Varimax. PROC FACTOR DATA=CORSO.Banca95 OUT=CORSO.FACTORS N=7 ROTATE=VARIMAX REORDER FUZZ=0.35; VAR lista variabili; RUN; IMPORTANTE:la % di varianza complessiva dei fattori ruotati rimane inalterata, mentre si modifica la % di varianza spiegata da ciascun fattore N.B. l’opzione N=7 non è necessaria perché quando non viene indicato il numero di fattori con l’opzione “N = “ SAS adotta la regola degli autovalori >1 per scegliere il numero di fattori. Soluzione (6/7) Interpretazione fattori: Rotated Factor Pattern Factor1 Factor2 Factor3 NCUST NUM. OPER. COMMISSIONI TITOLI A CUSTODIA 0.93552 . S_CUSTOD POSSESSO TITOLI A CUSTODIA 0.92517 . CUSTODIA IMPORTO COMMISSIONI TITOLI A CUSTODIA 0.85781 . S_TITOLI POSSESSO TITOLI SI/NO NTIT NUM. OPERAZIONI CAUSALE TITOLI NLEAS NUM. OPERAZIONI CAUSALE LEASING . 0.99139 . S_LEASIN LEASING SI/NO . 0.99139 . LEAS IMPORTO TOTALE CAUSALE LEASING . 0.96498 . NSTICONV NUM. OPERAZIONI ACCREDITO STIPENDIO . STICONV IMPORTO TOTALE ACCREDITO STIPENDIO . Factor4 Factor5 Factor6 Factor7 . . . . . . . . . . TITOLI . . . . . 0.70381 . . . . . . 0.60924 . . . . . . . . . LEASING 0.45934 . . . . . . . . . 0.94545 . . . . . 0.94519 . 0.92017 . STIPENDIO . . . . . . . . S_STIPEN ACCREDITO AUTOMATICO STIPENDIO SI/NO . . NCD NUM. OPERAZIONI CERTIFICATI DI DEPOSIT . . . 0.98086 . S_CERTIF POSSESSO CERTIFICATI DI DEPOSITO . . . 0.9057 . CD IMPORTO TOTALE CERTIFICATI DI DEPOSITO . . . 0.85968 . S_ASSICU POLIZZE ASSICURATIVE SI/NO . . . NASSIC NUM. OPERAZIONI POLIZZE ASSICURATIVE . . ASSIC IMPORTO TOTALE POLIZZE ASSICURATIVE . S_RIMBOR UTILIZZO AFFIDAMENTI NRIMBAFF DEPOSITO . . . . . 0.96531 . . . . 0.88222 . . . . 0.83214 . . . . . . 0.95067 . NUM. OPERAZIONI RIMBORSI AFFIDAMENTI . . . . . 0.84046 . RIMBAFF IMPORTO TOTALE RIMBORSI AFFIDAMENTI . . . . . 0.76842 . IMPA IMPORTO OPERAZIONI AVERE . . . . . . 0.96563 IMPD IMPORTO OPERAZIONI DARE . . . . . . 0.96468 ASSICURAZIONE . . AFFIDAMENTI DARE/AVERE Values less than 0.35 are not printed. Estraendo 7 fattori riusciamo a spiegare il 83% della varianza totale. Soluzione (7/7) Varianza spiegata dai fattori: La % di varianza complessiva dei fattori ruotati rimane inalterata, mentre si modifica la % di varianza spiegata da ciascun fattore PRIMA DELLA ROTAZIONE Variance Explained by Each Factor TOTALE Factor1 4.0454669 Factor2 Factor3 Factor4 Factor5 Factor6 Factor7 3.0206311 2.8024658 2.4209025 2.3458616 2.0856344 1.6387743 18.36 DOPO LA ROTAZIONE Variance Explained by Each Factor TOTALE Factor1 Factor2 Factor3 Factor4 Factor5 Factor6 Factor7 3.4228786 2.9061603 2.7124729 2.5515705 2.4122828 2.2231786 2.1311928 18.36