Titolo: Sistemi di bigliettazione elettronica: analisi dati e data mining
Relatore: Andrea Gaffi
M.A.I.O.R.
Software house con svariate soluzioni sw per il TPL
Prodotti che coprono l’intero processo
Stima matrice OD pubblica
Pianificazione dei percorsi e delle frequenze
Programmazione orari e turni
Assegnamento alle risorse (bus, autisti)
Reportistica, analisi
Supporto di Business intelligence per prendere
decisioni
M.A.I.O.R.
Circa 100 istallazioni in Italia
(Firenze, Roma, Milano, Torino, Napoli, Bologna...)
Installazioni in Germania, Spagna...)
Potenti algoritmi a supporto dell’intero processo, in
collaborazione con varie Università (Pisa, Firenze,
Milano…)
Un nuovo prodotto: CBE. Cosa è
Permette di analizzare i dati della bigliettazione
elettronica (smartcard)
E’ un approccio di Business Intelligence orientatao
al supporto alle decisioni
E’ integrato con MBI, una applicazione di business
intelligence sul TPL
Fornisce informazioni in tempo reale su vendite,
validazioni e la relazione con corse, fermate,
percorsi (linee).
Aiuta a conoscere i clienti del TPL e le loro abitudini
Venduto per età
Validazioni per fascia oraria su una linea
Validazioni per fascia oraria per linea e categoria utente
Vendite: correlazione tra tipo di biglietto e categoria utente
Trend delle vendite: italiani e stranieri
Trend vendite (casalinghe): italiani e stranieri
Vendite: ricavi per competenza
Relazione tra validazioni e vendite
Ricavo medio a validazione per titolo di viaggio
Utenti (Viaggiatori)
Data mining
Cosa significa?
Processo per scoprire nuove relazioni tra dati (grossa quantità di
dati)
Obiettivi prinicpali
Scoprire spostamenti abituali delle persone
con il TPL (analisi dei viaggi)
Analizzare la correlazione tra attributi vari
legati alle vendite
Il lavoro si è svolto con il supporto
dell’Universita di Pisa (prof. Dino Pedreschi)
I risultati degli algoritmi saranno integrati nel
sw di Business intelligence CBE
Analisi dei viaggi
Si basa sulla bigliettazione
elettronica (smart card)
Conoscenza su:
Chi compra i biglietti
Quando i biglietti sono usati
Come i biglietti sono usati
Check
in OK
Check
out
???
Stima del punto di check out
Check out intervals:
1000 metri
3 giorni
Dati
Flussogramma
Clustering individuale
Esempio di clustering
Clustering
Clustering individuale: risultati
Numero di cluster per ogni utente: distribuzione
Molto spesso 2 (house<->work, house<>school), più del 70% degli utenti hanno meno
di 7 cluster
Clustering globale
Viaggi con trasbordo
A volte un utente usa più di un autobus per il proprio viaggio
Abbiamo bisogno di:
Una stima del tempo di percorrenza tra fermate
Colleghiamo tra loro corse se hanno un tempo tra check-in e check-out inferiore
a 30 minut
IN
13:15
OUT ?
IN
13:58
OUT ?
Viaggi con trasbordo
Abbiamo usato i tempi di percorrenza programmati
differenziati per fascia oraria e giorno tipo per ogni
coppia di fermate
IN
13:15
OUT 13.41
Sosta: 17'
IN
13:58
OUT 14:21
Viaggi con trasbordo
Colleghiamo corse con link inferiore a 30 minuti
IN
13:15
OUT 13.41
IN
13:58
OUT 14:21
Risultati principali
Un insieme di cluster che descrivono viaggi anche
complessi (cioè con più veicoli) sul TPL
Il risultato, integrati nella sulzione di Business Intelligence
CBE, permette di analizzare le caratteristiche di ogni cluster
(i.e. Un cluster è usato soprattutto la mattina, gli utenti sono
soprattutto studenti, il tipo di biglietto è un abbonamento
settimanale ecc…)
I risultati possono essere usati per effettuare
l’aggiornamento della matrice OD del TPL
Correlazione tra attributi legati alle vendite
Analizziamo i dati sulle vemndite per scoprire automaticamente
correlazioni positive o negative.
Correlazione tra tipo di biglietti e categoria utenti
Correlazione tra tipo di biglietti e categoria utenti
Correlazione tra durata biglietto, categoria utente e
genere
Correlazione tra durata biglietto, categoria utente e genere
Grazie per l’attenzione
Scarica

data analysis and data mining Relatore: Andrea Gaffi