Esercizi riepilogativi Analisi Univariata e Bivariata Analisi Fattoriale Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°5 Metodi Quantitativi per Economia, Finanza e Management Obiettivi di questa esercitazione: 1 3 2 Breve ripasso teorico Analisi Univariata e Bivariata Analisi Fattoriale Argomenti trattati Analisi univariata Analisi bivariata Test statistici per lo studio dell’associazione tra variabili: test t, test chi-quadro e test F. Analisi Fattoriale Misure di sintesi Misure di posizione: Misure di tendenza centrale: – Media aritmetica – Mediana – Moda Misure di tendenza non centrale: – Quantili di ordine p (percentili, quartili) Misure di dispersione: • Campo di variazione • Differenza interquantile • Varianza • Scarto quadratico medio • Coefficiente di variazione Misure di forma della distribuzione: • Skewness • Kurtosis Lettura di un test statistico (1) Esempio: H0: b1= b2 = ....=bk = 0 1) Ipotesi H1: almeno un bi≠0 2) Statistica test 3) p-value Statistica F Rappresenta la probabilità di commettere l’errore di prima specie. Può essere interpretato come la probabilità che H0 sia “vera” in base al valore osservato della statistica test Lettura di un test statistico (2) Fissato un livello di significatività : Se p-value piccolo (< ) RIFIUTO H0 Altrimenti (>= ) ACCETTO H0 Il p-value è il più piccolo valore di per il quale H0 può essere rifiutata Analisi Bivariata In base alla natura delle due variabili in esame si utilizzato Test Statistici differenti. Due Variabili Qualitative • Indipendenza Statistica • Test Chi-Quadro Due Variabili Quantitative • Indipendenza Lineare • Test t Una Qualitative e Una Quantitativa continua • Indipendenza in media • Test F Step di analisi Numero di fattori • Regola Autovalori >1 • Lettura SCREEPLOT • 1/3 variabili originali • Variabilità spiegata 60%75% Confronto soluzioni scelte • Comunalità finali Analisi soluzione • Rotazione fattori • Interpretazione fattori • Produzione dataset con fattori Metodi Quantitativi per Economia, Finanza e Management Obiettivi di questa esercitazione: 1 3 2 Breve ripasso teorico Analisi Univariata e Bivariata Analisi Fattoriale Dataset Il dataset Banca95 informazioni relative ai comportamenti di 1000 clienti di una banca. Le variabili presenti nel dataset riguardano informazioni sullo stato economico del cliente (es. saldo CC, importi vari) e informazioni contrattuali (es. utilizzo plastic card, accredito stipendio). Variabili (1) # 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Variable UTE NUTE CARBCM NCARBCM STICONV NSTICONV TIT NTIT RIMBAFF NRIMBAFF LEAS NLEAS ASS NASS TASSE NTASSE ASSIC NASSIC CD NCD Type Num Num Num Num Num Num Num Num Num Num Num Num Num Num Num Num Num Num Num Num Len 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 Label IMPORTO TOTALE UTENZE DOMICILIATE NUM. OPERAZIONI UTENZE DOMICILIATE IMPORTO TOTALE PLASTIC CARDS NUM. OPERAZIONI PLASTIC CARDS IMPORTO TOTALE ACCREDITO STIPENDIO NUM. OPERAZIONI ACCREDITO STIPENDIO IMPORTO TOTALE CAUSALE TITOLI NUM. OPERAZIONI CAUSALE TITOLI IMPORTO TOTALE RIMBORSI AFFIDAMENTI NUM. OPERAZIONI RIMBORSI AFFIDAMENTI IMPORTO TOTALE CAUSALE LEASING NUM. OPERAZIONI CAUSALE LEASING IMPORTO TOTALE ASSEGNI NUM. OPERAZIONI ASSEGNI IMPORTO TOTALE CAUSALE TASSE NUM. OPERAZIONI CAUSALE TASSE IMPORTO TOTALE POLIZZE ASSICURATIVE NUM. OPERAZIONI POLIZZE ASSICURATIVE IMPORTO TOTALE CERTIFICATI DI DEPOSITO NUM. OPERAZIONI CERTIFICATI DI DEPOSIT Variabili (2) # 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 Variable CUSTODIA NCUST IMPA IMPAP IMPD IMPDP NAVEP NAVERE NDARE NDARP SMEDIO S_UTENZE S_PLASTI S_STIPEN S_TITOLI S_RIMBOR S_LEASIN S_ASSICU S_CERTIF S_CUSTOD CLIENTE sesso Type Len Label Num 8 IMPORTO COMMISSIONI TITOLI A CUSTODIA Num 8 NUM. OPER. COMMISSIONI TITOLI A CUSTODIA Num 8 IMPORTO OPERAZIONI AVERE Num 8 IMPORTO OPERAZIONI AVERE ANNO PRECEDENTE Num 8 IMPORTO OPERAZIONI DARE Num 8 IMPORTO OPERAZIONI DARE ANNO PRECEDENTE Num 8 NUM. OPERAZIONI AVERE ANNO PRECEDENTE Num 8 NUM. OPERAZIONI AVERE Num 8 NUM. OPERAZIONI DARE Num 8 NUM. OPERAZIONI DARE ANNO PRECEDENTE Num 8 SALDO MEDIO DI CONTO CORRENTE Num 8 DOMICILIAZIONE UTENZE SI/NO Num 8 UTILIZZO PLASTIC CARD SI/NO Num 8 ACCREDITO AUTOMATICO STIPENDIO SI/NO Num 8 POSSESSO TITOLI SI/NO Num 8 UTILIZZO AFFIDAMENTI Num 8 LEASING SI/NO Num 8 POLIZZE ASSICURATIVE SI/NO Num 8 POSSESSO CERTIFICATI DI DEPOSITO Num 8 POSSESSO TITOLI A CUSTODIA Num 8 CODICE PROGRESSIVO CLIENTE Char 1 SESSO DEL CLIENTE Modalità di svolgimento Allocare la libreria ‘corso’ Importare il file banca95.xls, salvarlo nella libreria ‘corso’ e attribuire il nome Banca95 Svolgere gli esercizi utilizzando il dataset banca95. Modificare il file word ‘Esercitazione_5’ riportando i risultati delle analisi (solo quelli richiesti) e i commenti a tali output. Esercizi (1) 1. Qual è la media del saldo medio del conto corrente [smedio]? 2. Si può affermare che la maggior parte dei clienti utilizza la plastic card [s_plasti]? 3. E’ corretto affermare che il 66.67% dei clienti non possiede titoli [s_titoli]? 4. E’ corretto affermare che il saldo medio del conto corrente è una variabile con asimmetria positiva [smedio]? 5. Tra coloro che hanno una polizza assicurativa, qual è l’importo medio delle polizze assicurative [assic][s_assicu]? Esercizi (2) 6. Chi ha effettuato molte ‘operazioni dare’ l’anno precedente ha effettuato molte ‘operazioni dare’ nell’anno analizzato [ndare][ndarp]? 7. Si può affermare che esiste una relazione tra il numero di ‘operazioni dare’ e ‘operazioni avere’ [ndare][navere]? 8. C’è una relazione tra la domiciliazione delle utenze e l’utilizzo della plastic card [s_utenze][s_plasti]? E tra il possesso di certificati di deposito e il possesso di titoli a custodia [s_certif][s_custod]? 9. Si può affermare che esiste una relazione tra il sesso e l'accredito stipendio [sesso][sticonv]? Esercizio Variabile dipendente e 21 variabili di soddisfazione Nome variabile soddisfazione_globale AccessoWeb_2 AltriOperatori_2 assistenza_2 Autoricarica_2 CambioTariffa_2 ChiamateTuoOperatore_2 ChiarezzaTariffe_2 ComodatoUso_2 copertura_2 CostoMMS_2 CostoSMS_2 diffusione_2 DurataMinContratto_2 immagine_2 MMSTuoOperatore_2 NavigazioneWeb_2 NoScattoRisp_2 NumeriFissi_2 Promozioni_2 SMSTuoOperatore_2 vsPochiNumeri_2 Livello di Livello di Livello di Livello di Livello di Descrizione variabile soddisfazione globale relativo al telefono cellulare soddisfazione relativo al costo di accesso a internet soddisfazione relativo ai costi verso altri operatori soddisfazione relativo al servizio di assistenza soddisfazione relativo alla possibilità di autoricarica Livello di soddisfazione relativo alla facilità di cambiamento della tariffa Livello di soddisfazione relativo alla possibilità di effettuare chiamate a costi inferiori verso numeri dello stesso operatore Livello di soddisfazione relativo alla chiarezza espositiva delle tariffe Livello di soddisfazione relativo alla possibilità di rivecere un cellulare in comodato d'uso Livello di soddisfazione relativo alla copertura della rete Livello di soddisfazione relativo al costo degli MMS Livello di soddisfazione relativo al costo degli SMS Livello di soddisfazione relativo alla diffusione Livello di soddisfazione relativo alla presenza di una durata minima del contratto Livello di soddisfazione relativo all'immagine Livello di soddisfazione relativo alla possibilità inviare MMS a costi inferiori verso numeri dello stesso operatore Livello di soddisfazione relativo al costo di navigazione in internet Livello di soddisfazione relativo all'assenza di scatto alla risposta Livello di soddisfazione relativo alle agevolazioni verso numeri fissi Livello di soddisfazione relativo alla possibilità di attivare promozioni sulle tariffe Livello di soddisfazione relativo alla possibilità inviare SMS a costi inferiori verso numeri dello stesso operatore Livello di soddisfazione relativo alle agevolazioni verso uno o più numeri di telefono Esercizio 1. Analisi fattoriale sulle 21 variabili di soddisfazione (esclusa la soddisfazione globale) del dataset TELEFONIA. Identificazione soluzioni possibili Confronto comunalità Interpretazione dei fattori 2. Creazione di un dataset di output contenente i fattori scelti. Elenco variabili da inserire nella proc factor: AccessoWeb_2 AltriOperatori_2 assistenza_2 Autoricarica_2 CambioTariffa_2 ChiamateTuoOperatore_2 ChiarezzaTariffe_2 ComodatoUso_2 copertura_2 CostoMMS_2 CostoSMS_2 diffusione_2 DurataMinContratto_2 immagine_2 MMSTuoOperatore_2 NavigazioneWeb_2 NoScattoRisp_2 NumeriFissi_2 Promozioni_2 SMSTuoOperatore_2 vsPochiNumeri_2