Area Statistica (Prof. Cerioli) 1. Il modello di regressione logistica per la previsione del comportamento del consumatore e le sue estensioni nelle applicazioni di marketing (livello B oppure R) 2. I metodi bayesiani di classificazione supervisionata per la previsione del comportamento del consumatore e le loro applicazioni (livello B oppure R) 3. Il modello di regressione lineare e le sue estensioni come strumento di previsione di aggregati aziendali (livello B oppure R) 4. La regressione robusta: aspetti metodologici e applicazioni (livello R) 5. I metodi non supervisionati di classificazione per la segmentazione della clientela (livello B oppure R) 6. I modelli statistici per la classificazione non supervisionata e le loro applicazioni (livello B oppure R) 7. La scelta del numero di gruppi nei metodi non supervisionati di classificazione (livello R) 8. L’Analisi in Componenti Principali e l’Analisi Fattoriale per la riduzione dimensionale: metodologia e applicazioni (livello B oppure R) 9. I metodi statistici per l’individuazione di valori anomali e per l’analisi preliminare dei dati (livello B oppure R) 10. Statistical learning e data mining (livello B oppure R) 11. I metodi statistici per l’analisi di database di grandi dimensioni (livello B oppure R) 12. I metodi statistici per il Text Mining e le loro applicazioni nel marketing (livello B oppure R) Area Statistica (Prof. Cerioli) – segue 13. Recenti sviluppi nella metodologia degli alberi di classificazione (livello R) 14. Le Foreste Casuali (livello R) 15. Le Support Vector Machines (livello R) 16. Le Regole di associazione e l’algoritmo Apriori per la Market Basket Analysis (livello B oppure R) 17. Il software free di programmazione “R” per il data mining (livello B oppure R) 18. Excel per il data mining (livello B oppure R) 19. La Legge di Benford e le sue applicazioni in ambito aziendale e agli studi di antifrode (livello B oppure R) Gli argomenti indicati possono essere svolti a livelli differenti, a seconda del grado di sofisticazione della metodologia e della volontà di approfondimento dello studente: livello base (B) oppure livello avanzato / di ricerca (R). In tutti i casi è richiesta una buona padronanza della lingua inglese scritta, per comprendere la bibliografia (quasi esclusivamente in inglese). Una buona dimestichezza con il software, ed eventualmente con la programmazione in proprio, possono contribuire a migliorare il lavoro di tesi. Il docente è disponibile a valutare – su richiesta della studente – anche argomenti di tesi differenti da quelli riportati nella lista, purché coerenti con gli argomenti del corso di Data Mining per il Marketing.