Statistica per l’Analisi Organizzativa Università Commerciale L. Bocconi Anno Accademico 2006-2007 Bruno Scarpa 21 settembre 2006 le aziende 21 settembre 2006 statistica in azienda Diversi livelli di coinvolgimento della statistica nel „fare business“ focus sui prodotti Analisi di marketing: “reports” e statistiche descrittive di base Supporto all’uomo di marketing: aiuto quantitativo alle idee di marketing Fare analisi e proporre idee: è il motore delle azioni di marketing Guida commerciale e tecnologica focus sul cliente Strumenti: Reports Tabelle Semplici indicatori 21 settembre 2006 Reports Tabelle Semplici indicatori Semplici modelli Tabelle Indicatori/tassi Modelli Data mining Modelli Statistici Data mining Reports Tabelle Indicatori Customer base: approccio strategico Un unico obiettivo Aumentare il Customer Lifetime Value attraverso la riduzione del churn e l’aumento dell’ARPU … attraverso PROFILING & SEGMENTATION Identificare i potenziali “churners” Massimizzare la soddisfazione dei clienti Focalizzarsi su target per cross e up sell 21 settembre 2006 Ridurre il churn Massimizzare il valore del cliente Customer Relationship Management Identificare Realizzare Praticare tutte le attività necessarie a garantire il processo di attenzione e fidelizzazione dell’individuo verso l’azienda e la sua offerta di prodotti e servizi e, conseguentemente la massimizzazione delle opportunità di business attraverso la soddisfazione costante dei bisogni 21 settembre 2006 Profiling Identificare Classificare Acquisire Gestire tutte le informazioni che consentono la conoscenza e l’analisi del proprio target di riferimento e, conseguentemente la realizzazione di prodotti e servizi ad elevata probabilità di soddisfazione dei suoi bisogni sources 21 settembre 2006 analysis mgmnt VALORE DEL CLIENTE 100% Customer base: segmentazione di base MASSIMIZZARE IL VALORE COSTRUIRE FELDELTA’ DIFFERENZIAZIONE DEI SERVIZI INBOUND & OUTBOUND SCHEMA DI LOYALTY (Incentivi) BLOCCHI (Disincentivi alla fuga) AZIONI A BASSO COSTO/ NO PROMOZIONI 0% NON COSTI AGGIUNTIVI PER LA GESTIONE DEL CLIENTE AZIONI DI “MASSA” 0% OPERATORE CC PERSONALE NUOVI VAS MEMBER GETS MEMBER CURA & ATTENZIONE AUMENTARE IL VALORE AZIONI DI UP / CROSS SELL INCENTIVARE L’USO INCENTIVARE ATTIVAZIONE DI VAS FEDELTA’ DEL CLIENTE …ALLA CONCORRENZA! 21 settembre 2006 100% 100% L’approccio di crm OBIETTIVI AZIONI ANALISI (PROFILING) DATI “GREZZI” Generazione di profitti attraverso l’acquisizione di clienti ad alto valore, la creazione di valore e un’attenta politica di “cost to serve” 4Acquisizione di clienti (conversione di prospect in clienti) 4Aumento del valore dei clienti attraverso azioni di cross-sell e di up-sell 4“trattenere” i clienti (retention) 4Attenzione al “cost to serve” 4Campagne 4Programmi di “Loyalty” 4Personalizzazione dei Servizi 4Gestione dei canali di contatto 4(sviluppo di nuovi prodotti) 4Analisi di dati sui clienti 4Segmentazione & micro-segmentazione 4Suggerimenti sui bisogni e le preferenze dei clienti CUSTOMER DATA 4ID (nome, indirizzo, num. di telefono, piano tariffario...) 4Dati Demografici (età, città, ...) 4Dati Socio-economici (reddito, professione, titolo di studio, classe di valore, ...) 4Dati Psicografici (ambiente, preferenze, hobbies, ...) 4Patterns d’uso (spesa telefonica, servizi usati e frequenza, ...) 21 settembre 2006 4Analisi delle propensioni sui “contatti” •Uso dei canali •Ragioni di contatto 4Esperienza del cliente per ogni canale (CC, Portale,chat, Messaging, Dealers) 4Efficienza del Customer Care 4Storia dei contatti del cliente •Uso dei canali •Motivo di contatto •Numero di contatti DATI SUI LIVELLI DI SERVIZIO DEI CANALI ... L’approccio di crm OBIETTIVI AZIONI ANALISI (PROFILING) DATI “GREZZI” Generazione di profitti attraverso l’acquisizione di clienti ad alto valore, la creazione di valore e un’attenta politica di “cost to serve” 4Acquisizione di clienti (conversione di prospect in clienti) 4Aumento del valore dei clienti attraverso azioni di cross-sell e di up-sell 4“trattenere” i clienti (retention) 4Attenzione al “cost to serve” 4Campagne 4Programmi di “Loyalty” 4Personalizzazione dei Servizi 4Gestione dei canali di contatto 4(sviluppo di nuovi prodotti) 4Analisi di dati sui clienti 4Segmentazione & micro-segmentazione 4Suggerimenti sui bisogni e le preferenze dei clienti CUSTOMER DATA 4ID (nome, indirizzo, num. di telefono, piano tariffario...) 4Dati Demografici (età, città, ...) 4Dati Socio-economici (reddito, professione, titolo di studio, classe di valore, ...) 4Dati Psicografici (ambiente, preferenze, hobbies, ...) 4Patterns d’uso (spesa telefonica, servizi usati e frequenza, ...) 21 settembre 2006 4Analisi delle propensioni sui “contatti” •Uso dei canali •Ragioni di contatto 4Esperienza del cliente per ogni canale (CC, Portale,chat, Messaging, Dealers) 4Efficienza del Customer Care 4Storia dei contatti del cliente •Uso dei canali •Motivo di contatto •Numero di contatti DATI SUI LIVELLI DI SERVIZIO DEI CANALI ... *costa poco rilevare dati in modalità automatica *costa poco immagazzinare sempre più grandi dati in data-base Contesti rilevanti: * data-base aziendali (customer-base, CRM, ...) soprattutto per telefoniche, banche e assicurazioni, grande distribuzione (cfr carte fedeltà) * ambito scientifico: microarrays, radiotelescopi, fisica delle alte energie * tecnologie varie: telerilevazione, riconoscimento vocale, OCR, etc. * dati non strutturati - text-mining (motori di ricerca web) 21 settembre 2006 Il DWH Esempio: TLC Dati sui VAS & Killer Applications Dati di Billing Offerta della pagine/ contenuti web(es. page views, Dati di traffico da web unique visitors, ...) Dati raccolti attraverso il web (questionari, indagini e comportamenti dei visitatori) Dati sulle e-mail Dati di traffico telefonico Dati sulle communities Dati sulle attivazioni (e.g. Data di sottoscrizione del contratto, Tipo di contratto, Piano tariffario, ...) Informazioni sociodemografiche ... ... ... 21 settembre 2006 Dati sui costi DWH Dati e indici ottenuti dalle analisi della CB Dati sui “gravi errori” che l’azienda compie nella gestione di clienti (es. errori dibilling, ...) Altri dati sui servizi a valore aggiunto (interni e sui siti “amici”) Dati dal CRM operativo Dati sul Campaign Management & storia dei contatti di Marketing Ricerce di mercato e dati esterni Dati sui programmi di Loyalty *il data-base disponibile è enorme! è quindi opportuno: - tener conto degli obiettivi delle analisi - non concentrarsi solo su da dove e come raccogliere informazioni - utilizzare estrazioni di parti del data-base diverse a seconda degli obiettivi Ad esempio: * Nel datamart per la previsione della disattivazione, è più utile tenere l’informazione sugli errori di fatturazione rispetto ai dettagli sociodemografici * Campioni casuali di clienti possono essere molto utili 21 settembre 2006 L’approccio di crm OBIETTIVI AZIONI ANALISI (PROFILING) DATI “GREZZI” Generazione di profitti attraverso l’acquisizione di clienti ad alto valore, la creazione di valore e un’attenta politica di “cost to serve” 4Acquisizione di clienti (conversione di prospect in clienti) 4Aumento del valore dei clienti attraverso azioni di cross-sell e di up-sell 4“trattenere” i clienti (retention) 4Attenzione al “cost to serve” 4Campagne 4Programmi di “Loyalty” 4Personalizzazione dei Servizi 4Gestione dei canali di contatto 4(sviluppo di nuovi prodotti) 4Analisi di dati sui clienti 4Segmentazione & micro-segmentazione 4Suggerimenti sui bisogni e le preferenze dei clienti CUSTOMER DATA 4ID (nome, indirizzo, num. di telefono, piano tariffario...) 4Dati Demografici (età, città, ...) 4Dati Socio-economici (reddito, professione, titolo di studio, classe di valore, ...) 4Dati Psicografici (ambiente, preferenze, hobbies, ...) 4Patterns d’uso (spesa telefonica, servizi usati e frequenza, ...) 21 settembre 2006 4Analisi delle propensioni sui “contatti” •Uso dei canali •Ragioni di contatto 4Esperienza del cliente per ogni canale (CC, Portale,chat, Messaging, Dealers) 4Efficienza del Customer Care 4Storia dei contatti del cliente •Uso dei canali •Motivo di contatto •Numero di contatti DATI SUI LIVELLI DI SERVIZIO DEI CANALI ... Alcuni problemi acquisizione della clientela prospect →Raggiungere →Trovare una soglia minima di clienti ASAP e attrarre i clienti giusti: quanto spendere per ciascun diverso cliente potenziale? Scoprire frodi di sottoscrizione →determinare domande di sottoscrizione fraudolente profittabilità dei clienti valore del cliente „dormienti“ e share of wallet monitoraggio e management del rischio →Determinare 21 settembre 2006 e ottimizzare i parametri di rischio Alcuni problemi Customer profiling fedeltà approccio predittivo →modelli di previsione del churn cosa ciascun cliente vuole? come contattare ogni cliente? attrito e retention →Modellazione chi sono i clienti? e determinazione e delle valutazione delle azioni principali cause azioni: programmi di Spesso non è possibile effettuare esperimenti caso-controllo loyalty/campagne/up sell-cross sell →I relazione col cliente →Personalizzazione contatto 21 settembre 2006 clienti sono autoselezionati Valutare a posteriori alcune azioni dell‘attenzione e del →Stima gli effetti delle azioni condizionatamente all’effetto di tutte le altre variabili L’approccio di crm OBIETTIVI AZIONI ANALISI (PROFILING) DATI “GREZZI” Generazione di profitti attraverso l’acquisizione di clienti ad alto valore, la creazione di valore e un’attenta politica di “cost to serve” 4Acquisizione di clienti (conversione di prospect in clienti) 4Aumento del valore dei clienti attraverso azioni di cross-sell e di up-sell 4“trattenere” i clienti (retention) 4Attenzione al “cost to serve” 4Campagne 4Programmi di “Loyalty” 4Personalizzazione dei Servizi 4Gestione dei canali di contatto 4(sviluppo di nuovi prodotti) 4Analisi di dati sui clienti 4Segmentazione & micro-segmentazione 4Suggerimenti sui bisogni e le preferenze dei clienti CUSTOMER DATA 4ID (nome, indirizzo, num. di telefono, piano tariffario...) 4Dati Demografici (età, città, ...) 4Dati Socio-economici (reddito, professione, titolo di studio, classe di valore, ...) 4Dati Psicografici (ambiente, preferenze, hobbies, ...) 4Patterns d’uso (spesa telefonica, servizi usati e frequenza, ...) 21 settembre 2006 4Analisi delle propensioni sui “contatti” •Uso dei canali •Ragioni di contatto 4Esperienza del cliente per ogni canale (CC, Portale,chat, Messaging, Dealers) 4Efficienza del Customer Care 4Storia dei contatti del cliente •Uso dei canali •Motivo di contatto •Numero di contatti DATI SUI LIVELLI DI SERVIZIO DEI CANALI ... Modelli statistici e data mining 4Utilizzo di tecniche e metodologie statistiche di vario tipo e di diverso livello di complessità 4L’approccio è graduale: si parte da soluzioni e metodologie semplici e poi man mano ci si sposta su modelli e strumenti più sofisticati (KISS = Keep It Simple. Sam!) 4È preferibile non affidarsi a soluzioni automatiche (black box) che propongono “schiaccia il bottone e il computer farà tutto da solo” (la proposta tipica dei tools in vendita) 4Data mining: Insieme di tecniche statistiche (e non) per la stima di modelli non-lineari per grosse quantità di dati, ma caratterizzate da ridotta complessità computazionale. 21 settembre 2006 Definizione abbastanza condivisa: 'Data mining' rappresenta l'attività di elaborazione in forma grafica o numerica di grandi raccolte o di flussi continui di dati con lo scopo di estrarre informazione utile a chi detiene i dati stessi. *ma di fatto ognuno la vive in modo diverso *soprattutto in aree disciplinari diverse 21 settembre 2006 Voci autorevoli: Data mining is fundamentally an applied discipline (...) data mining requires an understanding of both statistical and computational issues. (p. xxviii) The most fundamental difference between classical statistical applications and data mining is the size of the data. (p. 19) [da Hand, Mannila & Smith, 2001] 21 settembre 2006 Aspetti salienti: •la dimensione dei dati lievita (qui n.righe ~ 103/106, n.colonne ~ 102/103) * ambito osservazionale * ma non esiste un "piano campionamento"; semplicemente i dati "esistono“ * dati raccolti per esigenze gestionali non per scopi di analisi * i dati sono sporchi, anzi luridi * campioni o censimenti? 21 settembre 2006 o simili, Di cosa ci occuperemo? Gli interrogativi: come costruire l’informazione in azienda? come interpretarla? come utilizzarla? come analizzarla? Cosa studieremo: insieme di metodi e tecniche statistiche specificamente pertinenti per lo studio empirico-quantitativo dei fenomeni aziendali. Caratteristiche specifiche (a) In questo contesto non è, in generale, possibile la sperimentazione controllata. Si ha invece osservazione in condizioni non sperimentali (b) la ‘teoria’ disponibile sul comportamento economico o sociale può fornire informazioni a priori, che conviene utilizzare: • identità contabili [es. 1: reddito = consumo + risparmio]; • specificazione di relazioni funzionali [es. 2: funzione di consumo: consumo = f(reddito, ricchezza, …)]; • restrizioni sui parametri e/o sulla distribuzione degli errori [es. 3: consumo = α + β reddito + ε, con 0<β<1]. 21 settembre 2006 Il target potenziale •L’ufficio marketing di un’azienda italiana che offre servizi Internet è interessato a conoscere qual è la presenza attuale del suo prodotto (la connessione a internet) in Italia. •Interessa inoltre avere delle previsioni su quale sarà la percentuale di famiglie connesse alla rete nel prossimo anno. •Qual è il target potenziale, il massimo numero di possibili clienti del prodotto? Qual è il margine su cui è possibile agire? •Come si posiziona l’azienda tra i competitors? E’ conosciuta dai potenziali clienti? Target potenziale 21 settembre 2006 Esempio 2: la customer base •Il direttore marketing di un’azienda di telecomunicazioni vuole avere ogni giorno sotto controllo l’andamento delle vendite del giorno precedente ma anche l’utilizzo medio del serivizio dei suoi clienti. •Quando il numero dei clienti diventa grande è importante che siano bene identificati i clienti “migliori”, in modo da trattarli meglio. Come sceglierli? 21 settembre 2006 customer base: il churn Modellare la disattivazione: costruire, validare, interpretare un modello che descriva il comportamento degli utenti in termini di disattivazione in relazione ad altre variabili note Perché? Per descrivere il fenomeno Per prevedere i potenziali futuri disattivi Per predisporre azioni Per verificare l’efficacia di operazioni di marketing/Customer Operation 21 settembre 2006 customer base: il churn Le fonti Aziendali: (“DWH”, database operazionali, …) •Per tutti i clienti •Informazioni su traffico Altre fonti: Ricerche di mercato •Per un piccolo campione “casuale” di clienti •Informazioni su servizi opzionali comportamenti comportamento del cliente stili di vita reclami-rapporti con customer care motivi della disattivazione azioni di marketing/customer care tempi della scelta fatture/ricariche dati demografico/anagrafici 21 settembre 2006 •ottenuti tramite interviste il churn: gli obiettivi Determinare un indicatore di propensione alla disattivazione per ogni cliente Prevedere i potenziali futuri disattivi Capire i motivi fondamentali che portano alla disattivazione e i comportamenti che la precedono Individuare possibili azioni volte alla retention del cliente Verificare l’efficacia di operazioni di Marketing/Customer Operation 21 settembre 2006 il churn: gli obiettivi Chi è a rischio di abbandono? Caratteristiche demografiche Usage Comportamenti di traffico Contatti con l’azenda Informazioni sul billing Copertura della rete dei pop Quando è maggiore il rischio di abbandono? Comportamento dei clienti sul churn Perché sono a rischio di abbandono? 21 settembre 2006 Promozioni della concorrenza Eventi della vita Offerte della concorrenza convenienza dei prezzi Prezzo dell’Hardware Servizio al cliente Programmi a premi Il churn: l’analisi statistica •Come si ottiene l’indice di propensione? •Quali caratteristiche dei clienti hanno effetto sulla decisione di disattivare e qual è l’effetto di ogni “variabile” considerata tra le altre? •Ma non ci potrebbe essere qualche effetto di “sovrapposizione” tra le variabili? Come tenerne conto? •Avendo a che fare con stime come dare una misura di “affidabilità” di queste stime? Come ottenere misure di qualità di adattamento ai dati? 21 settembre 2006 Segmentazione e profiling •Conoscere i clienti, per suddividerli in gruppi a seconda di interessi, propensioni all’utilizzo di uno o più prodotti o servizi offerti dall’azienda •Tutto finalizzato a personalizzare ogni eventuale contatto, azione di marketing, relazione... •Alcuni esperti della società italiana propongono di suddividere i clienti sulla base di due “assi” che descrivono le caratteristiche socio-culturali degli individui 21 settembre 2006 Segmentazione e profiling CENTRALITÀ DEL CORPO E DEL CONSUMO CULTURA PICCOLO BORGHESE [21.7%] [7.0%] TRADIZIONALISMO [11.6%] NUOVA FRONTIERA [12.0%] [12.0%] IMPEGNO [10.3%] INTERIORITÀ [8.1%] RADICI [17.3%] •L’altro asso Privato-Sociale è caratterizzato da una parte dal Privato, cioè la cultura intessuta di valori materiali ed aspirazioni individualistiche orientata ai valori del sé e del privato, dall’altra dal Sociale, indicante la cultura solidaristica impregnata di valori etici e spirituali orientata alla collettività e al sociale. •Un asse di Apertura-Chiusura dove Apertura indica la cultura industriale e post-industriale, aperta al cambiamento, all’innovazione e alla complessità sociale, mentre Chiusura indica la cultura di stampo arcaico e preindustriale arroccata sui valori tradizionali e diffidente verso il nuovo. •Ma come determinare questi assi (o altri)? •Come inserire ciascun cliente nel suo esatto punto della “mappa”? •Come assegnarlo a un gruppo definito? 21 settembre 2006 La valutazione delle azioni Azioni: massimizzare la redemption L’analisi ex post è essenziale per identificare quale azione agisce meglio e su quale target AC M E NT PLOY •I modelli di misura (indicatori/modelli di analisi e algoritmi) N O I T E ON D ACTI Per misurare le azioni è necessario definire: N G I S E D •Gli strumenti di misurazione ACTION MEASUREMENT 21 settembre 2006 La valutazione delle azioni caso-controllo Target: Azione: clienti “a rischio” con una determinata caratteristica (1A) - Lettera con suggerimenti per l’utilizzo (DM) (1B) - Lettera con suggerimenti per l’utilizzo + 1 regalo (DM) Disegno di indagine: Caso-controllo Alcuni risultati Test di significatività Abbandoni Azione casi controllo differenza 1A 61.30% 61.13% +0.17% +0.12 0.90 1B 59.21% 61.13% -1.92% -1.40 0.16 21 settembre 2006 t p-value La valutazione delle azioni …ma, se l’azione dipende dalla scelta del cliente? Target: Tutti i clienti Azione: Sottoscrizione di un particolare servizio Disegno di indagine: non è possibile confrontare i sottoscrittori con un analogo campione di non sottoscrittori del servizio (autoselezione) Non è possibile disegnare a priori l'indagine! 21 settembre 2006 Consumo di gas e prezzo Per alcune città del Texas sono rilevati prezzo e consumo di gas C’è una relazione? È possibile prevedere il consumo di gas se si fissa un prezzo? 21 settembre 2006 Il problema... ...è quello di capire la dinamica all’interno dei dati osservati. Si tratta di •capire quali sono le strutture di relazione, •individuare se eventuali relazioni evidenti sono attribuibili al caso, o se sono davvero presenti nel fenomeno in esame •scoprire eventuali relazioni nascoste dalla componente di “rumore” presente nei i dati •avere degli elementi per capire la realtà •predisporre una strumentazione che sia utile per fare previsioni 21 settembre 2006 Che cosa sviluppiamo in questo corso? Ci concentreremo soprattutto su alcuni strumenti quantitativi utili per affrontare i diversi problemi che si incontrano nel mondo aziendale Faremo dei richiami di alcuni aspetti di matematica che ci saranno utili per l’analisi statistica dei dati Approfondiremo semplici modelli per studiare la relazione tra variabili. Durante il corso utilizzeremo semplici strumenti informatici di supporto per le analisi 21 settembre 2006 L’approccio •Una comprensione delle caratteristiche degli strumenti è essenziale per poter scegliere adeguatamente lo strumento adatto •Lo stesso tipo di padronanza è richiesto per poter interpretare correttamente i risultati prodotti dagli algoritmi •Una certa competenza sugli aspetti algoritmici e computazionali è di aiuto per meglio valutare l’output del calcolatore anche in termini della sua attendibilità Quindi: cercheremo di combinare assieme metodologie aggiornate con una certa comprensione sia del problema operativo, sia delle caratteristiche dei metodi e modelli utilizzati 21 settembre 2006 Il Programma •Lo studio delle relazioni tra i fenomeni. •Richiami del modello lineare Modello lineare semplice Inferenza sui parametri del modello Estensioni del modello Modello lineare multiplo •Le tecniche statistiche e l’approccio analitico alla soluzione dei problemi. Contrasto tra aderenza ai dati e complessità del modello (contrasto tra distorsione e varianza) tecniche generali per la selezione del modello •Metodi di previsione di variabili quantitative. Regressione lineare e metodi legati (GLM, …) Cenni ai metodi di regressione non parametrica Modelli di regressione strutturata (modelli additivi, alberi, reti neurali) •Metodi di classificazione Modelli lineari e generalizzazioni (regressione lineare e logistica, analisi discriminante lineare e quadratica) Modelli strutturati (alberi, GAM, reti neurali) •Cenni ai metodi di raggruppamento 21 settembre 2006 L’ambiente R •Molti pacchetti statistici forniscono procedure che aiutano nel calcolo dei modelli e metodi che incontreremo in questo corso… È quindi possibile utilizzare un qualsiasi software statistico, purché sia in grado di effettuare i calcoli necessari; ogni inadeguatezza del software è responsabilità vostra. •Noi, per le esercitazioni in aula, ne abbiamo scelto uno: l’ambiente R Alcuni motivi per la scelta: In termini di qualità, R costituisce uno dei migliori prodotti disponibili È un prodotto “open source”, e quindi gratuito Il fatto che sia gratuito non significa che valga poco: R è curato e aggiornato continuamente da esperti di massimo livello scientifico R è anche un linguaggio, si presta quindi facilmente alla programmazione di varianti di metodi esistenti Sono inoltre disponibili un’amplissima gamma di moduli aggiuntivi predisposti, da esperti di vari ambiti. L’insieme delle tecniche utilizzabili copre l’intero panorama delle più aggiornate metodologie Essendo “open source” consente a ciunque di poter contribuire al progetto anche correggendo eventuali ‘bachi’ La modalità di utilizzo di R è tale per cui l’utente è indotto a prendere consapevolezza del funzionamento dei metodi usati. 21 settembre 2006 Lo studio e l’esame •La materia non è tra le più comuni •L’approccio è di tipo “operativo” Per cui la frequenza è vivamente consigliata! •Non ci sono grossi libri da studiare: conviene riprendere ogni giorno quanto fatto a lezione studiate insieme in piccoli gruppi •Per i frequentanti la valutazione fatevi/fate domande sarà basata su: sfruttate il ricevimento Partecipazione attiva - domande •Attività di lavoro personale/di gruppo bi-settimanale Attività bisettimanali – “per casa” Approfondimenti Ricerche e Analisi Attività (assegnata a metà corso) Attività per casa - Homeworks Prova Finale (I appello) Studi di Caso •Laboratorio Per quasi la metà delle lezioni si utilizzerà direttamente il Computer ->Aule Informatiche per il lavoro personale •Valutazione 21 settembre 2006 Testi e altre fonti utili Libro di testo: A. Azzalini, B. Scarpa (2004). Analisi dei dati e data mining. Springer. Altri libri: Sui contenuti del corso: T. Hastie, R. Tibshirani, J. Friedman. The Element of Statistical Learning. Springer-Verlag. Sul programma R: S.M. Iacus, G. Masarotto (2003). Laboratorio di Statistica con R. McGrawHill, Milano. P. Bortot, L. Ventura, A. Salvan (2000). Inferenza Statistica: Applicazioni con S-PLUS e R. CEDAM, Padova Software: R 21 settembre 2006 http://www.r-project.org Notizie Orario delle lezioni: Giovedì Venerdì Docente: Ufficio: Bruno Scarpa Dipartimento di metodi quantitativi – Stanza 124 Orario di ricevimento: Giovedì email: url: [email protected] http://www.unipv.it/dipstea/bruno Collaboratore: Ufficio: Paola Cerchiello Dipartimento di metodi quantitativi – Stanza 110 21 settembre 2006 14:30-16:00 10:30-12:00 N21 INFO4 16:30-17:30 Buon Lavoro! 21 settembre 2006