MICROMARKETING DI SUCCESSO SFRUTTANDO “DAVVERO” IL CUSTOMER DATABASE Innovative tecniche statistiche che consentono di mirare le azioni di marketing, vendita e comunicazione valorizzando i dati dei database clienti e l’esperienza dei manager. Marco Di Dio Roccazzella [email protected] Partner ************* Oggi si parla molto di investimenti in soluzioni di CRM, di Customer Database, di Sistemi Informativi di marketing, anche se spesso si perde la coscienza che questi sono solo strumenti che possono aiutare i manager ad una presa di decisione basata su dati quantitativi e scientificità. Talvolta si dimentica che l’aver “messo a sistema i dati” è condizione necessaria, ma non sufficiente alla presa di decisione in quanto la mancanza di modelli interpretativi, di processi di analisi strutturata genera solamente troppi dati (…e poche informazioni) con conseguente creazione di confusione nei processi decisionali. Questo paper si pone come obiettivo quello di “indossare i panni di un manager” che deve massimizzare i risultati di vendita, di marketing e di comunicazione e che necessita di metodologie, modelli di analisi di Data Mining che gli permettano di risolvere questi problemi … parlando il suo linguaggio con un approccio non accademico, ma estremamente pratico e “vissuto” personalmente in numerosi progetti sul campo. ************* “Fare Data Mining” significa dare vita ad un processo costituito dalle seguenti fasi logiche: • individuazione dei problemi/opportunità di business prioritari • traduzione delle problematiche di business in un obiettivo dì analisi quantitativa • costruzione del database funzionale alla presa di decisione • scelta della o delle tecniche più adeguate per definire un modello di analisi e risoluzione della problematica • test del modello e sua successiva implementazione • definizione dei processi organizzativi che rendono vivo il modello e ne garantiscono l’utilizzo in azienda. In realtà è proprio questo processo che distingue il Data Mining da un’analisi statistica tradizionale; non è tanto l’ampiezza del database, il software o le tecniche utilizzate, quanto l’integrazione tra metodologie di analisi quantitativa ed esperienza di business. L’attività di analisi, perciò, nasce ed è finalizzata alle esigenze decisionali ed è svolta in un ambiente fortemente orientato all’integrazione di contributi tecnici e conoscenze dì business. Non meno importante è l’aspetto organizzativo, ossia la messa in opera di procedure tecniche e organizzative che permettono di alimentare correttamente il database di marketing, di “pulire i dati” attraverso le attività di normalizzazione, doblonatura e spesso di integrarli con dati anagrafici e territoriali (Geo - Mining) che a loro volta devono essere costantemente aggiornati. Le tecniche di Data Mining supportano il marketing e le vendite nelle attività di: • Classificazione. La classificazione, nasce dalla necessità di caratterizzare un cliente sulla base del suo profilo di acquisto (es. alto spendente, basso spendente) e porta alla individuazione di regole, attraverso l’analisi di: o variabili comportamentali (acquisto del prodotto/brand A, prodotto/brand B, ecc.) o variabili socio demografiche (es. età del cliente, reddito, cluster sociodemografico Value Lab, scoring finanziario, ecc.) o variabili territoriali (caratteristiche della microzona di residenza, distanza dal punto vendita / agenzia). Dall’analisi dei comportamenti/degli attributi del cliente il manager può: o selezionare tra i clienti attuali sottogruppi omogenei a maggior probabilità di adesione all’acquisto di un nuovo prodotto o acquistare liste di clienti prospect coerenti con il profilo dei migliori clienti individuati e più vicini ai propri punti vendita/agenzie. Figura 1 – Identificazione dei clienti rispondenti ad una campagna di marketing Alberi decisionali In quali segmenti devo mirare le mie campagne di direct marketing? In quali segmenti devo mirare le mie campagne di direct marketing? Profitto medio per cliente £ 355.000 Costo per contatto - invio 1° mailing £ 2.000 - invio catalogo ai soli richiedenti £ 8.000 23 32 Gain Summary Target variable: Risposta alla promozione Node-by-Node Cumulative Node: n Node: % Gain Index (%) Node: n Node: % 78 0,1 11.731 19236 78 0,1 6937 8,56 2.175 3567 7015 8,66 6855 8,46 753 1234 13870 17,12 4303 5,31 288 472 18173 22,42 25384 31,32 142 232 43557 53,75 36337 44,84 551 -903 79894 98,59 1146 1,41 914 -1500 81040 100 Gain 915 16.003 21.163 22.401 26.000 5.990 4.942 Profitti cumulati (£/1.000) per attrattività dei segmenti decrescente 26.000 22.401 21.163 16.003 26 31 Node 40 32 33 31 23 26 41 5.990 33 915 40 WWW.VALUELAB.IT - PROPRIETARY AND CONFIDENTIAL 40 41 4.942 32 VALUE LAB CONSULENZA DI DIREZIONE AZIENDALE 33 31 23 26 Segmenti WWW.VALUELAB.IT - PROPRIETARY AND CONFI DENTIAL 41 VALUE LAB CONSULENZA DI DIREZIONE AZIENDALE La figura 1 mostra un esempio di identificazione di quali caratteristiche anagrafiche e socioterritoriali determinano l’aver risposto positivamente ad una campagna di marketing con la finalità di effettuare campagne acquisendo nuovi prospect il più simili possibile ai migliori clienti. • Assegnazione di punteggi / priorità. Consiste nell’attribuzione di un punteggio ad ogni cliente con la finalità di selezionare il target di una azione mirata di marketing. Per esempio, un trade marketing manager che deve offrire un determinato prodotto potrebbe selezionare i possibili clienti attraverso un modello che assegni a ognuno un valore legato a caratteristiche strutturali del cliente, al comportamento di acquisto o alla sua localizzazione, per stimare la probabilità di risposta positiva a una certa offerta, focalizzando gli sforzi commerciali sui clienti maggiormente ricettivi. Altro caso in cui vengono assegnati gli score è quello in cui si ha la necessità di prevedere i clienti a rischio di abbandono su cui focalizzare azioni di rivitalizzazione. Ad esempio il rischio di abbandono di un cliente che ha sottoscritto una polizza assicurativa può essere funzione dei parametri che seguono: • la posizione sulla sua “curva di sopravvivenza” (tecnica di data mining mutuata dal settore medico), che descrive la probabilità di vita residua dello stesso misurata sulla vita media dei clienti • appartenenza ad uno specifico cluster sociodemografico • numero di contatti tra Call Center Aziendale e cliente. Figura 2 – Individuazione del rischio di abbandono di un cliente – Hazard Function Nei primi 10 giorni (ed in misura minore in tutto il primo mese) il rischio di abbandono è più alto che nei periodi successivi Hazard Function ,0010 ,0009 10 gg 30 gg ,0008 ,0007 ,0006 ,0005 ,0004 ,0003 ,0001 0,0000 0 2 4 6 8 10 12 14 16 18 20 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52 54 56 58 60 62 64 66 68 70 72 74 76 78 80 Hazard ,0002 Durata --- WWW.VALUELAB.IT --- VALUE LAB Marketing – Sales – Retailing SOLUTIONS Nella Figura 2 viene mostrato un output della tecnica di sopravvivenza (la curva degli Hazard, che indica la probabilità che un cliente sopravvissuto al tempo T0 abbandoni al tempo T1) da cui si evince che esiste una elevata mortalità nei clienti che hanno appena sottoscritto un contratto. Inoltre, l’analisi della pendenza di una curva di sopravvivenza permette di identificare quali sono le variabili che garantiscono una maggiore longevità dei clienti. Quanto più la pendenza della curva di sopravvivenza è bassa, tanto più la variabile esplicativa (nell’esempio sottostante, “numero di chiamate al call center” – Figura 3 ) agisce in modo positivo sulla longevità del cliente. Figura 3 – Impatto delle chiamate al call center Curva di sopravvivenza I titolari che hanno chiamato il call center hanno un tasso di retention più alto 1,1 1,1 1,0 1,0 ,9 ,9 ,8 ,8 N. of calls ,7 ,7 ,6 Yes No ,5 0 Time 200 400 600 800 1000 1200 1400 Cum Survival Cum Survival 3 or more Call to call center 2 ,6 1 0 ,5 0 200 600 800 1000 1200 1400 Time --- WWW.VALUELAB.IT --- • 400 VALUE LAB Marketing – Sales – Retailing SOLUTIONS Previsione. La previsione è uno dei temi maggiormente affrontati in azienda. I modelli previsionali possono essere utilizzati ad esempio per stimare il fatturato di un nuovo punto vendita isolando tra un set di variabili descrittive conosciute a priori (es. localizzazione su via commerciale, struttura del punto vendita, contesto del micromercato, ecc.) quelle a maggior impatto sul risultato del punto vendita. I dati con cui vengono costruiti tali modelli sono quelli storici (quelli dei punti vendita già esistenti), da cui si acquisisce conoscenza e con i quali si cerca di elaborare un modello che spieghi il fatturato delle nuove location e da cui si derivano le regole da applicare alle nuove ipotesi di apertura. Figura 4 – Modello di stima del fatturato di una nuova location Regressione Lineare Come stimo il fatturato delle nuove aperture ? FATTURATO STIMATO = + Dimensione (mq) + Localizzazione nel centro Italia + Popolazione nei 15 minuti + Reddito pro capite - N° concorrenti nei 10 minuti Grado di significatività (R²) : 0,708 • Errore medio: 7,8% 1400000 1200000 1000000 800000 Fatturato set 2001-ago 2002 • 600000 400000 200000 200000 400000 600000 800000 1000000 1200000 1400000 Altri comuni previsione VALUE LAB WWW.VALUELAB.IT - PROPRIETARY AND CONFIDENTIAL CONSULENZA DI DIREZIONE AZIENDALE La Figura 4 mostra un modello di regressione che permette di stimare il fatturato di una nuova location tenendo congiuntamente presente parametri localizzativi, di potenzialità di mercato e livello di concorrenza. Un’altra delle applicazioni di maggior successo è quella dei modelli gravitazionali che permette di prevedere il fatturato di una nuova location fondendo in un unico approccio metodologico tecniche e strumenti di Geomarketing e algoritmi di Statistica e Data mining finalizzati alla stima per sezione censuaria della percentuale di popolazione o consumi che il nuovo punto vendita potrà attrarre. Il modello tiene conto congiuntamente di: • profilo socio demografico della popolazione residente o lavorativa (day & night population) • tempo impiegato dai consumatori per raggiungere la nuova location rispetto alle alternative di consumo concorrenti considerando diversi livelli di traffico (scorrevole o intenso a seconda dei giorni della settimana e/o delle fasce orarie) • attrattività delle alternative di consumo in termini di offerta (dimensione, n. addetti, n. vetrine, brand trattati, ampiezza e profondità dell’assortimento, posizionamento di prezzo dei prodotti trattati, ecc.).” Figura 5 – Consumi attratti dalla nuova location. Modelli Gravitazionali - Soluzione Geo - Gravity by VALUE LAB Tali soluzioni garantiscono modelli di stima del fatturato molto più precisi e puntuali e soprattutto tengono conto dell’impatto del portafoglio di alternative di acquisto per il consumatore. Il consumatore, a parità di offerta, si recherà presso il punto vendita più vicino, mentre a parità di tempo / distanza si recherà al punto vendita con una migliore offerta. • Segmentazione. La segmentazione della base clienti è focalizzata sulla ricerca di cluster di clienti con comportamenti simili tra loro con la finalità di mirare al meglio le attività di vendita, marketing e comunicazione. Le tecniche di cluster analysis consentono di individuare gruppi di clienti omogenei al loro interno e differenziati tra loro. Ciò che distingue questa attività da quella di classificazione è il fatto che nel clustering le classi o i gruppi non sono definiti a priori, ma attraverso un’opera di maieutica vengono “riconosciuti” e descritti a posteriori dal manager. Figura 6 – Segmentazione comportamentale Cluster analysis BANCA Z - Segmentazione comportamentale dei clienti 1 35,4 51,2 0,9 44,9 68,6 2,2 2,7 96,4 4,6 5,6 1,4 50,9 Bancomat Carta di credito Carte revolving Domiciliazione utenze Prodotto assicurativo Home banking Credito personale Fondi Gestione patrimoniale Libretto di risparmio Mutui Deposito titoli 2 39,2 59,0 1,5 14,8 10,8 7,4 2,7 24,8 0,1 3,7 2,2 4,6 1 2 3 Bancomat 100,0 3 40,1 82,7 2,1 86,8 21,9 74,4 4,4 58,8 3,5 5,8 3,0 79,9 Deposito titoli Mutui Carta di credito 50,0 Libretto di risparmio - Gestione patrimoniale Bancomat Carte revolving Domiciliazione utenze Prodotto assicurativo Carta di credito Fondi Carte revolving Domiciliaz. utenze Home banking Credito personale Prod. assicurativo Home banking Credito personale Fondi comuni Ges t. patrimoniale Cluster Libretto risparmio 1 Mutui 2 Depos ito titoli 3 0 10 20 30 40 50 60 70 80 90 100 VALUE LAB CONSULENZA DI DIREZIONE AZIENDALE Nella figura 6 il cluster 3 è rappresentato dai cosiddetti “correntisti tecnologici-propensi al rischio” che fanno largo utilizzo di home banking, carta di credito, domiciliazione utenze e hanno un consistente deposito titoli. Su tale cluster l’azienda può focalizzare l’offerta di prodotti finanziari specifici per il target in oggetto ottenendo redemption significativamente più elevate rispetto alle estrazioni classiche effettuate tramite semplici query. • Associazione. L’associazione permette di prevedere, per esempio, quali prodotti vengono acquistati congiuntamente e individuare opportunità di cross-selling, o per evidenziare la relazione tra i diversi consumatori e i prodotti acquistati. Figura 7 – Prodotti acquistati “insieme” dai clienti Basket Analysis Associazioni tra Brand concorrenti nella category Caffè Caffè utilizz ata: a Tecnic lysis t Ana Baske Intensità della relazione (N. acquirenti che hanno acquistato entrambi i prodotti nei 3 mesi considerati) Famiglie non rappresentate: < 5 Linea tratteggiata: 5 - 10 Linea continua fine: 10 - 15 Linea continua spessa: >15 WWW.VALUELAB.IT - PROPRIETARY AND CONFIDENTIAL VALUE LAB CONSULENZA DI DIREZIONE AZIENDALE Le tipiche applicazioni sono quelle del “carrello della spesa” in ambito retail (Figura 7) anche se numerose sono le esperienze nel settore bancario e assicurativo. Tali analisi permettono di avere un quadro degli acquisti per singola famiglia e per ogni carta, di individuare delle regole associative tra una famiglia target di prodotto e le altre e, di conseguenza, selezionare un campione di carte target per effettuare azioni di couponing mirato. Ad esempio, ponendo come variabile target quella dei libri, è possibile identificare le famiglie di prodotto che più frequentemente sono acquistate insieme alla famiglia target e che, pertanto, hanno una maggior probabilità di associarsi a questa. Figura 8 – Prodotti acquistati insieme alla category libri Basket Analysis Quali altri prodotti compra tipicamente un cliente che acquista libri? MIA MARCA Intensità della relazione (% acquirenti dei diversi tipi di caffè che acquistano anche illy espresso lattina) Famiglie non rappresentate: < 1% Linea tratteggiata: 2% - 7,5% Linea continua fine: 7,5% - 15% Linea continua spessa: >15% WWW.VALUELAB.IT - PROPRIETARY AND CONFIDENTIAL VALUE LAB CONSULENZA DI DIREZIONE AZIENDALE Nella Figura 8 si osserva come la famiglia libri si associ con intensità diverse (rappresentate graficamente dallo spessore delle rette) alle altre famiglie di prodotto, prese a singolarmente. Tale associazione può avvenire anche per combinazioni di famiglie di prodotto. Infatti, entrando ancora di più nello specifico nel caso in esame, se si analizza il totale delle carte fedeltà, solo il 28,3% acquista libri. Se, invece, ci si focalizza su un campione formato da chi acquista abbigliamento, frutta e verdura confezionata, salumi e latticini da banco assistito (271 carte), si scopre che la frequenza (e quindi la probabilità) con cui un campione con queste caratteristiche acquisterà libri cresce al 51%. Questo tipo di analisi mette in luce come, estraendo dal database di tutte le carte solo quelle con definiti basket di acquisto, si possa proporre una nuova famiglio di prodotto, sapendo che la probabilità che a quel basket si aggiunga quella famiglia specifica risulterà molto più elevata rispetto ad una proposta indifferenziata su tutto il parco clienti. Marco Di Dio Roccazzella [email protected]