Titolo: Sistemi di bigliettazione elettronica: analisi dati e data mining Relatore: Andrea Gaffi M.A.I.O.R. Software house con svariate soluzioni sw per il TPL Prodotti che coprono l’intero processo Stima matrice OD pubblica Pianificazione dei percorsi e delle frequenze Programmazione orari e turni Assegnamento alle risorse (bus, autisti) Reportistica, analisi Supporto di Business intelligence per prendere decisioni M.A.I.O.R. Circa 100 istallazioni in Italia (Firenze, Roma, Milano, Torino, Napoli, Bologna...) Installazioni in Germania, Spagna...) Potenti algoritmi a supporto dell’intero processo, in collaborazione con varie Università (Pisa, Firenze, Milano…) Un nuovo prodotto: CBE. Cosa è Permette di analizzare i dati della bigliettazione elettronica (smartcard) E’ un approccio di Business Intelligence orientatao al supporto alle decisioni E’ integrato con MBI, una applicazione di business intelligence sul TPL Fornisce informazioni in tempo reale su vendite, validazioni e la relazione con corse, fermate, percorsi (linee). Aiuta a conoscere i clienti del TPL e le loro abitudini Venduto per età Validazioni per fascia oraria su una linea Validazioni per fascia oraria per linea e categoria utente Vendite: correlazione tra tipo di biglietto e categoria utente Trend delle vendite: italiani e stranieri Trend vendite (casalinghe): italiani e stranieri Vendite: ricavi per competenza Relazione tra validazioni e vendite Ricavo medio a validazione per titolo di viaggio Utenti (Viaggiatori) Data mining Cosa significa? Processo per scoprire nuove relazioni tra dati (grossa quantità di dati) Obiettivi prinicpali Scoprire spostamenti abituali delle persone con il TPL (analisi dei viaggi) Analizzare la correlazione tra attributi vari legati alle vendite Il lavoro si è svolto con il supporto dell’Universita di Pisa (prof. Dino Pedreschi) I risultati degli algoritmi saranno integrati nel sw di Business intelligence CBE Analisi dei viaggi Si basa sulla bigliettazione elettronica (smart card) Conoscenza su: Chi compra i biglietti Quando i biglietti sono usati Come i biglietti sono usati Check in OK Check out ??? Stima del punto di check out Check out intervals: 1000 metri 3 giorni Dati Flussogramma Clustering individuale Esempio di clustering Clustering Clustering individuale: risultati Numero di cluster per ogni utente: distribuzione Molto spesso 2 (house<->work, house<>school), più del 70% degli utenti hanno meno di 7 cluster Clustering globale Viaggi con trasbordo A volte un utente usa più di un autobus per il proprio viaggio Abbiamo bisogno di: Una stima del tempo di percorrenza tra fermate Colleghiamo tra loro corse se hanno un tempo tra check-in e check-out inferiore a 30 minut IN 13:15 OUT ? IN 13:58 OUT ? Viaggi con trasbordo Abbiamo usato i tempi di percorrenza programmati differenziati per fascia oraria e giorno tipo per ogni coppia di fermate IN 13:15 OUT 13.41 Sosta: 17' IN 13:58 OUT 14:21 Viaggi con trasbordo Colleghiamo corse con link inferiore a 30 minuti IN 13:15 OUT 13.41 IN 13:58 OUT 14:21 Risultati principali Un insieme di cluster che descrivono viaggi anche complessi (cioè con più veicoli) sul TPL Il risultato, integrati nella sulzione di Business Intelligence CBE, permette di analizzare le caratteristiche di ogni cluster (i.e. Un cluster è usato soprattutto la mattina, gli utenti sono soprattutto studenti, il tipo di biglietto è un abbonamento settimanale ecc…) I risultati possono essere usati per effettuare l’aggiornamento della matrice OD del TPL Correlazione tra attributi legati alle vendite Analizziamo i dati sulle vemndite per scoprire automaticamente correlazioni positive o negative. Correlazione tra tipo di biglietti e categoria utenti Correlazione tra tipo di biglietti e categoria utenti Correlazione tra durata biglietto, categoria utente e genere Correlazione tra durata biglietto, categoria utente e genere Grazie per l’attenzione