Analisi fattoriale Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°10 Libro di Testo Luigi Fabbris, “Statistica multivariata: analisi esplorativa dei dati “, Milano, McGraw-Hill • Capitoli 1, 2.1, 2.2, 2.3, 3, 5 in alternativa: Paul Newbold, William L. Carlson, Betty Thorne, “Statistics for Business and Economics”, Pearson, ed. 2010 • Capitoli 1,2, Analisi Univariata • Capitolo 6, par. 6.1, Capitolo 17, Campionamento • Capitolo 15, par. 15.1, 15.2, Analisi della Varianza • Capitoli 11, 12, 13 Modello di Regressione Naresh K. Malhotra, “Marketing Research – An Applied Orientation”, Pearson – Prentice Hall, ed. 2010 • Capitolo 15, Analisi Bivariata & Test d’Ipotesi • Capitolo 19, Analisi Fattoriale PROC FACTOR – Opzioni Analisi fattoriale con il metodo delle componenti principali. PROC FACTOR DATA=libreria.dataset N=8 FUZZ=0.35 SCREE OUT=FACTORS ROTATE=VARIMAX REORDER; VAR elenco variabili; RUN; OPZIONE DESCRIZIONE OUT = Produce in output un data set che contiene le variabili originali e i fattori non ruotati N=num Consente di specificare il numero di fattori che si vuole estrarre ROTATE=metodo Specifica che il criterio per la rotazione dei fattori (VARIMAX, …) SCREE Produce scree plot REORDER Ordina le variabili in modo da facilitare la lettura dei loadings FUZZ=valore Stampa solo |loadings| > valore indicato. Step di analisi (1/2) STEP 1: scegliere quanti fattori considerare (scelta di varie soluzioni) la regola autovalori > 1 lettura dello SCREE PLOT PROC FACTOR DATA=data set SCREE FUZZ=k; VAR elenco variabili; RUN; STEP 2: confrontare le soluzioni scelte loadings cumunalità finali PROC FACTOR DATA=data set SCREE FUZZ=k N=n; VAR elenco variabili; RUN; Step di analisi (2/2) STEP 3: una volta scelta la soluzione finale ruotare i fattori interpretare i fattori salvare il data set con i fattori PROC FACTOR DATA=data set SCREE FUZZ=k OUT=data set output ROTATE= metodo di rotazione REORDER N=n; VAR elenco variabili; RUN; STEP 4: se l’interpretazione non è soddisfacente ripetere lo step n°3 variando metodo di rotazione o provando un’altra soluzione. Analisi Fattoriale - Esercizio 2 Il data set ECONOMIC_FREEDOM contiene i seguenti indicatori relativi alla libertà economica nei diversi stati del mondo. Svolgere un’analisi fattoriale a partire da tali indicatori. A. Attività del settore pubblico e tassazione C. Accesso al contante D. Commercio internazionale E. Regolamentazi one del credito, del lavoro e del business COUNTRY Nome del paese CONTINENTE AF-Africa; AM-America Nord; AS-Asia; OC-Oceania; EU-Europa A_ GVT_CONSUMPT Consumi pubblici Rapporto tra consumi pubblici e consume totali (indice) A_ GVT_INVEST Investimenti pubblici Rapporto tra investimenti pubblici e investimenti totali (indice) B_JUD_IMPART Imparzialità delle corti: contesto legale in cui i privati possono opporsi legalmente ad azioni del governo. B_MILITARY_POL Interferenza militare nel sistema giudiziario e politico (indice elevato se l’interferenza è bassa) B_LAW_INTEGRITY Integrità del sistema giudiziario C_GR_MONEY_SUPPLY Crescita media annuale dell’offerta di moneta (ultimi 5 anni) - Crescita media annuale PIL (ultimi 10 anni) C_INFL Tasso di inflazione recente (indice alto se inflazione bassa) C_STD_INFL Variabilità del tasso di inflazione negli ultimi 5 anni. (indice alto se inflazione stabile) C_FREEDOM_BANK Libertà di possedere conti presso banche straniere nel paese o all’estero D_TARIF Tasse sul commercio con l’estero (indice alto se tasse basse e poco variabili) D_ACTUAL_EXP_TRADE Dimensione del settore del commercio internazionale rispetto a quella attesa D_INT_CAP_CONTROL Livello del controllo sul mercato dei capitali internazionali (indice elevato se è elevata la libertà di accesso ai capitali e ai mercati internazionali) E_CREDIT_REG Regolamentazione del mercato del credito (indice elevato se c’è concorrenza con banche straniere, se molte banche sono private, se il credito al settore privato è elevato, se i tassi di interesse sono determinati dal libero mercato) E_NEW_BUSINESS Faciltà e trasparenza nella realizzazione di nuovi business Soluzione es 2 (1/7) Estrazione fattori: PROC FACTOR DATA=CORSO.ECONOMIC_FREEDOM SCREE FUZZ=0.35 ; VAR A_GVT_CONSUMPT A_GVT_INVEST B_JUD_IMPART B_LAW_INTEGRITY B_MILITARY_POL C_FREEDOM_BANK C_GR_MONEY_SUPPLY C_INFL C_STD_INFL D_ACTUAL_EXP_TRADE D_INT_CAP_CONTROL D_TARIF E_CREDIT_REG E_NEW_BUSINESS ; RUN; Soluzione es 2 (2/7) Quanti fattori considerare? 7 AUTOVALORI 6 Difference Proportion Cumulative 1 5.7462 4.0829 0.4104 0.4104 2 1.6633 0.2815 0.1188 0.5293 3 1.3818 0.3921 0.0987 0.6280 4 0.9898 0.1855 0.0707 0.6986 5 0.8043 0.0997 0.0574 0.7561 6 0.7046 0.0992 0.0503 0.8064 7 0.6053 0.1194 0.0432 0.8497 8 0.4859 0.0524 0.0347 0.8844 9 0.4335 0.0979 0.0310 0.9153 10 0.3356 0.0733 0.0240 0.9393 11 0.2623 0.0098 0.0187 0.9580 12 0.2525 0.0544 0.0180 0.9761 13 0.1981 0.0613 0.0142 0.9902 14 0.1368 0.0098 1.0000 5 4 Autovalori Eigenvalue 3 2 1 0 0 1 2 3 4 5 6 7 8 9 10 11 12 13 Fattori La regola degli autovalori > 1 suggerisce di prendere in considerazione 3 fattori, che spiegano insieme il 63% della varianza totale. Lo scree plot mostra un gomito netto in corrispondenza di 2 fattori e uno ‘accennato’ in corrispondenza di 4 fattori. 14 15 Soluzione es 2 (3/7) Estrazione fattori per la soluzione a 2 e a 4 fattori: PROC FACTOR DATA=CORSO.ECONOMIC_FREEDOM SCREE FUZZ=0.35 N=2; VAR lista variabili; RUN; PROC FACTOR DATA=CORSO.ECONOMIC_FREEDOM SCREE FUZZ=0.35 N=4; VAR lista variabili; RUN; N.B. La soluzione a 3 fattori l’abbiamo già estratta: quando nella PROC FACTOR non viene indicato il numero di fattori con l’opzione “N = “ SAS adotta la regola degli autovalori >1 per scegliere il numero di fattori. Soluzione es 2 (4/7) Variable A_GVT_CONSUMPT LOADINGS Prin1 Prin2 Prin3 CUMUNALITA' Prin4 n=2 n=3 n=4 0.53 0.62 0.72 0.35 0.42 0.54 0.54 -0.38 0.62 0.77 0.78 -0.73 0.31 A_GVT_INVEST 0.64 B_JUD_IMPART 0.79 0.31 B_MILITARY_POL 0.8 0.65 0.65 0.66 B_LAW_INTEGRITY 0.8 0.64 0.67 0.69 0.62 0.63 0.75 0.65 0.65 0.69 0.56 0.77 0.83 0.51 0.53 0.53 0.51 0.58 0.58 0.38 0.07 0.58 0.73 0.41 0.59 0.65 0.82 -0.54 0.42 0.45 0.74 0.63 0.70 0.73 C_GR_MONEY_SUPPLY 0.43 0.66 C_INFL 0.45 0.66 0.6 -0.45 C_STD_INFL 0.45 0.55 D_TARIF 0.69 C_FREEDOM_BANK D_ACTUAL_EXP_TRADE 0.35 0.46 -0.72 D_INT_CAP_CONTROL 0.65 E_CREDIT_REG 0.65 E_NEW_BUSINESS 0.78 -0.4 Per ogni variabile si evidenziano le celle in corrispondenza delle quali la comunalità aumenta in maniera sostanziale per effetto dell’estrazione di un ulteriore fattore. La soluzione a 2 fattori non fornisce una spiegazione adeguata di alcune variabili: tali variabili hanno probabilmente un alto contenuto di specificità. La soluzione a 4 sarebbe motivata dal recupero di capacità esplicativa solo su un paio di variabili. Inoltre per ogni variabile la % di varianza spiegata dati fattori è già soddisfacente e non aumenta in maniera sostanziale per effetto dell’estrazione del quarto fattore. Soluzione es 2 (5/7) Consideriamo la soluzione a 3 fattori e operiamo una rotazione dei fattori con il metodo Varimax. PROC FACTOR DATA=CORSO.ECONOMIC_FREEDOM OUT=CORSO.FACTORS N=3 ROTATE=VARIMAX REORDER FUZZ=0.35; VAR lista variabili; RUN; IMPORTANTE:la % di varianza complessiva dei fattori ruotati rimane inalterata, mentre si modifica la % di varianza spiegata da ciascun fattore Soluzione es 2 (6/7) Interpretazione fattori: Variabile Descrizione Factor1 Factor2 Factor3 C_FREEDOM_BANK Libertà conti c/o banche stran. o estero 0.87 D_INT_CAP_CONTROL Libertà di accesso a cap. e mkt internaz. 0.77 D_TARIF Basse tasse su comm. con estero 0.71 A_GVT_INVEST Investimenti pubblici 0.62 B_MILITARY_POL Bassa Interf. militare 0.58 E_CREDIT_REG Regolament. mkt credito 0.54 B_JUD_IMPART Imparzialità delle corti E_NEW_BUSINESS Faciltà realizz. newbusiness D_ACTUAL_EXP_TRADE Dim. settore comm. internaz. B_LAW_INTEGRITY Integrità sist. giudiz. A_GVT_CONSUMPT Consumi pubblici C_INFL Bassa infl. recente 0.79 C_GR_MONEY_SUPPLY Crescita offerta di moneta 0.78 C_STD_INFL Bassa variab. tasso infl. 0.7 LIBERTA’ DI CAPITALI 0.39 0.52 0.76 0.44 0.69 0.69 0.44 0.61 LIBERTA’ DI BUSINESS -0.66 Estraendo 3 fattori riusciamo a spiegare il 63% della varianza totale. MONETA Soluzione es 2 (7/7) Varianza spiegata dai fattori: La % di varianza complessiva dei fattori ruotati rimane inalterata, mentre si modifica la % di varianza spiegata da ciascun fattore PRIMA DELLA ROTAZIONE Varianza spiegata da ciascun fattore Factor1 Factor2 5.75 Totale Factor3 1.66 1.38 8.79 DOPO LA ROTAZIONE Varianza spiegata da ciascun fattore Factor1 Factor2 3.55 Totale Factor3 2.83 2.41 8.79 Esercizio Esercizio Variabile dipendente e 21 variabili di soddisfazione Nome variabile soddisfazione_globale AccessoWeb_2 AltriOperatori_2 assistenza_2 Autoricarica_2 CambioTariffa_2 ChiamateTuoOperatore_2 ChiarezzaTariffe_2 ComodatoUso_2 copertura_2 CostoMMS_2 CostoSMS_2 diffusione_2 DurataMinContratto_2 immagine_2 MMSTuoOperatore_2 NavigazioneWeb_2 NoScattoRisp_2 NumeriFissi_2 Promozioni_2 SMSTuoOperatore_2 vsPochiNumeri_2 Livello di Livello di Livello di Livello di Livello di Descrizione variabile soddisfazione globale relativo al telefono cellulare soddisfazione relativo al costo di accesso a internet soddisfazione relativo ai costi verso altri operatori soddisfazione relativo al servizio di assistenza soddisfazione relativo alla possibilità di autoricarica Livello di soddisfazione relativo alla facilità di cambiamento della tariffa Livello di soddisfazione relativo alla possibilità di effettuare chiamate a costi inferiori verso numeri dello stesso operatore Livello di soddisfazione relativo alla chiarezza espositiva delle tariffe Livello di soddisfazione relativo alla possibilità di rivecere un cellulare in comodato d'uso Livello di soddisfazione relativo alla copertura della rete Livello di soddisfazione relativo al costo degli MMS Livello di soddisfazione relativo al costo degli SMS Livello di soddisfazione relativo alla diffusione Livello di soddisfazione relativo alla presenza di una durata minima del contratto Livello di soddisfazione relativo all'immagine Livello di soddisfazione relativo alla possibilità inviare MMS a costi inferiori verso numeri dello stesso operatore Livello di soddisfazione relativo al costo di navigazione in internet Livello di soddisfazione relativo all'assenza di scatto alla risposta Livello di soddisfazione relativo alle agevolazioni verso numeri fissi Livello di soddisfazione relativo alla possibilità di attivare promozioni sulle tariffe Livello di soddisfazione relativo alla possibilità inviare SMS a costi inferiori verso numeri dello stesso operatore Livello di soddisfazione relativo alle agevolazioni verso uno o più numeri di telefono Esercizio 1. Analisi fattoriale sulle 21 variabili di soddisfazione (esclusa la soddisfazione globale) del dataset TELEFONIA. 2. Creazione di un dataset di output contenente i fattori scelti. 3. Stimare un Modello di regressione lineare sul dataset salvato in output al punto (2) (quello che contiene i fattori). 4. La variabile dipendente è il livello di soddisfazione globale sull’utilizzo del telefono cellulare (SODDISFAZIONE_GLOBALE) 5. Utilizzare come regressori SOLO i fattori ottenuti al punto (2) Esercizio 6. Utilizzare la proc reg selezionando i regressori con la procedura automatica stepwise 7. Commentare • R-quadro • Capacità esplicativa del modello (test F) • Significatività dei singoli regressori (test t) • Interpretare i coefficienti standardizzati • Ordinare i regressori per importanza nella spiegazione della variabile dipendente Esercizio Variabile dipendente: soddisfazione_globale Lista regressori: CambioTariffa_2 MMSTuoOperatore_2 Copertura_2 NoScattoRisp_2 Autoricarica_2 CostoMMS_2 NumeriFissi_2 DurataMinContratto_2 vsPochiNumeri_2 Diffusione_2 ComodatoUso_2 ChiarezzaTariffe_2 AccessoWeb_2 AltriOperatori_2 SMSTuoOperatore_2 Assistenza_2 Immagine_2 ChiamateTuoOperatore_2 Promozioni_2 CostoSMS_2 NavigazioneWeb_2