Esercizi riepilogativi Analisi Univariata e Bivariata Metodi Quantitativi per Economia, Finanza e Management Esercitazione n°6 Metodi Quantitativi per Economia, Finanza e Management Obiettivi di questa esercitazione: 1 2 Breve ripasso teorico Esercizi Analisi Univariata: Procedure SAS Studio della distribuzione di ogni variabile, singolarmente considerata, all’interno della popolazione PROC SAS PROC FREQ PROC UNIVARIATE TIPO VARIABILE FUNZIONE Distribuzione di frequenze Variabili qualitative o (frequenze assolute, quantitative discrete relative e cumulate) Variabili quantitative Calcolo misure di sintesi di tipo univariato: - Misure di posizione - Misure di dispersione - Misure di forma della distribuzione NB: possibilità di analizzare la distribuzione della variabile rispetto ad una variabile di classificazione Analisi Bivariata: Riepilogo Studio della distribuzione di due variabili congiuntamente considerate e delle relazioni esistenti tra esse TIPO DI VARIABILI TIPO DI RELAZIONE INDAGATA INDICI DI DIPENDENZA Due Variabili Qualitative Indipendenza Statistica Chi Quadro, Cramer V Due Variabili Quantitative Indipendenza Lineare coeff. di correlazione lineare PROC CORR Una Qualitative e Una Quantitativa continua Indipendenza in media indice eta-quadro PROC ANOVA PROCEDURA SAS PROC FREQ Test d’Ipotesi • Formulazione ipotesi nulla e ipotesi alternativa • Impostazione a priori del livello di significatività α 2) Calcolo Statistica test • Calcolo del valore della statistica test (specifica del test che si sta conducendo) sulla base dei dati campionari 3) Calcolo P-value • Calcolo del livello di significatività osservato 1) Sistema di Ipotesi • Se p-value < α sulla base dei dati campionari, la probabilità di rifiutare H0 quando H0 è vera è inferiore alla soglia scelta rifiuto H0 • Se p-value ≥ α accetto H0 Test d’Ipotesi per l’Indipendenza H0: X e Y sono indipendenti H1: X e Y dipendenti 1) Sistema di Ipotesi • Fissiamo α = 0.05 2) Calcolo Statistica test 3) Calcolo P-value • Se p-value < 0.05 rifiuto H0 concludo che X e Y sono dipendenti • Se p-value ≥ 0.05 accetto H0 concludo che X e Y sono indipendenti Metodi Quantitativi per Economia, Finanza e Management Obiettivi di questa esercitazione: 1 2 Breve ripasso teorico Esercizi Dataset Il dataset Banca contiene informazioni comportamenti di 1000 clienti di una banca. relative Le variabili presenti nel dataset riguardano informazioni sullo stato economico del cliente (es. saldo CC, importi vari) e informazioni contrattuali (es. utilizzo plastic card, accredito stipendio). ai Variabili (1) # 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Variable UTE NUTE CARBCM NCARBCM STICONV NSTICONV TIT NTIT RIMBAFF NRIMBAFF LEAS NLEAS ASS NASS TASSE NTASSE ASSIC NASSIC CD NCD Type Num Num Num Num Num Num Num Num Num Num Num Num Num Num Num Num Num Num Num Num Len 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 Label IMPORTO TOTALE UTENZE DOMICILIATE NUM. OPERAZIONI UTENZE DOMICILIATE IMPORTO TOTALE PLASTIC CARDS NUM. OPERAZIONI PLASTIC CARDS IMPORTO TOTALE ACCREDITO STIPENDIO NUM. OPERAZIONI ACCREDITO STIPENDIO IMPORTO TOTALE CAUSALE TITOLI NUM. OPERAZIONI CAUSALE TITOLI IMPORTO TOTALE RIMBORSI AFFIDAMENTI NUM. OPERAZIONI RIMBORSI AFFIDAMENTI IMPORTO TOTALE CAUSALE LEASING NUM. OPERAZIONI CAUSALE LEASING IMPORTO TOTALE ASSEGNI NUM. OPERAZIONI ASSEGNI IMPORTO TOTALE CAUSALE TASSE NUM. OPERAZIONI CAUSALE TASSE IMPORTO TOTALE POLIZZE ASSICURATIVE NUM. OPERAZIONI POLIZZE ASSICURATIVE IMPORTO TOTALE CERTIFICATI DI DEPOSITO NUM. OPERAZIONI CERTIFICATI DI DEPOSIT Variabili (2) # 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 Variable CUSTODIA NCUST IMPA IMPAP IMPD IMPDP NAVEP NAVERE NDARE NDARP SMEDIO S_UTENZE S_PLASTI S_STIPEN S_TITOLI S_RIMBOR S_LEASIN S_ASSICU S_CERTIF S_CUSTOD CLIENTE sesso Type Len Label Num 8 IMPORTO COMMISSIONI TITOLI A CUSTODIA Num 8 NUM. OPER. COMMISSIONI TITOLI A CUSTODIA Num 8 IMPORTO OPERAZIONI AVERE Num 8 IMPORTO OPERAZIONI AVERE ANNO PRECEDENTE Num 8 IMPORTO OPERAZIONI DARE Num 8 IMPORTO OPERAZIONI DARE ANNO PRECEDENTE Num 8 NUM. OPERAZIONI AVERE ANNO PRECEDENTE Num 8 NUM. OPERAZIONI AVERE Num 8 NUM. OPERAZIONI DARE Num 8 NUM. OPERAZIONI DARE ANNO PRECEDENTE Num 8 SALDO MEDIO DI CONTO CORRENTE Num 8 DOMICILIAZIONE UTENZE SI/NO Num 8 UTILIZZO PLASTIC CARD SI/NO Num 8 ACCREDITO AUTOMATICO STIPENDIO SI/NO Num 8 POSSESSO TITOLI SI/NO Num 8 UTILIZZO AFFIDAMENTI Num 8 LEASING SI/NO Num 8 POLIZZE ASSICURATIVE SI/NO Num 8 POSSESSO CERTIFICATI DI DEPOSITO Num 8 POSSESSO TITOLI A CUSTODIA Num 8 CODICE PROGRESSIVO CLIENTE Char 1 SESSO DEL CLIENTE Modalità di svolgimento Allocare la libreria ‘corso’ che punti al percorso fisico ‘C:\corso’ Importare il file banca.xls, salvarlo nella libreria ‘corso’ e attribuire il nome banca Svolgere gli esercizi utilizzando il dataset banca. Riportare i risultati delle analisi svolte (copiando gli output SAS necessari e commentando adeguatamente) nel file Esercitazione6.docx contenuto nella cartella C:\corso Esercizi (1) 1. Qual è la media del saldo medio del conto corrente [smedio]? 2. Si può affermare che la maggior parte dei clienti utilizza la plastic card [s_plasti]? 3. E’ corretto affermare che il 66.67% dei clienti non possiede titoli [s_titoli]? 4. E’ corretto affermare che il saldo medio del conto corrente è una variabile con asimmetria positiva [smedio]? 5. Tra coloro che hanno una polizza assicurativa, qual è l’importo medio delle polizze assicurative [assic][s_assicu]? Esercizi (2) 6. Chi ha effettuato molte ‘operazioni dare’ l’anno precedente ha effettuato molte ‘operazioni dare’ nell’anno analizzato [ndare][ndarp]? 7. Si può affermare che esiste una relazione tra il numero di ‘operazioni dare’ e ‘operazioni avere’ [ndare][navere]? 8. C’è una relazione tra la domiciliazione delle utenze e l’utilizzo della plastic card [s_utenze][s_plasti]? E tra il possesso di certificati di deposito e il possesso di titoli a custodia [s_certif][s_custod]? 9. Si può affermare che esiste una relazione tra il sesso e l'accredito stipendio [sesso][sticonv]?