Metodi Quantitativi per Economia, Finanza e Management Lezione n° 13 Orari di ricevimento Gennaio-Febbraio 2008 • 08/01/2008 • 15/01/2008 • 22/01/2008 • 12/02/2008 • Aula 224 11.00-12.00 09.30-10.30 09.30-10.30 11.00-12.00 November 22nd, 2006 Individuals Churn Model Prepared by for Alberto Saccardi, Paola Bauce, Elena Pallini (Nunatac) XXX Banka Version: 5.0 – Final Review 3 Modello di Churn su “Losts” e “Technically Losts” Dopo una serie di analisi preliminari si è deciso di considerare come evento target per il modello di Churn la prima volta in cui un cliente attivo diventa “technical lost” (TL2) oppure “lost” (LOS) all’interno di un periodo di previsione fissato. La scelta di tale evento target è stata supportata anche dal numero dei cosidetti “eventi positivi” osservati. Per avere un modello di Churn (e in generale un modello statistico) robusto è necessario un numero minimo di eventi positivi. 4 Struttura dei dati CT Jul05 History ACTIVE in the end of Jul05 Aug05 Sept05 Dark Period Oct05 Nov05 Latency Period Not TL2 or LOST or OLD Dec05 Jan06 Feb06 Prevision Period Target Event: TL2 or LOST in one of the 2 months Per definire l’evento target sono stati considerati i seguenti intervalli di tempo: • Dark Period: dipende dal gap tra l’aggiornamento della base dati e il momento in cui si stima il modello • Latency Period: dipende dalla scelta dell’evento target e dalle esigenze di business • Prevision Period: dipende dal numero di eventi positivi osservati e dalla stagionalità. Nel nostro caso sono state fissate le durate seguenti: • Dark Period: due mesi • Latency Period: tre mesi, che è l’intervallo minimo perchè un clienti passi da attivo a TL2 o LOST • Prevision Period: due mesi. I dati più recenti disponibili sono aggiornati a Febbraio 2006. Questo significa che è necessario considerare le variabili dipendenti relative alla CT di Luglio 2005. Inoltre, possono essere considerate solo variabili relative ad uno storico di sei mesi. 5 Due fotografie E’ necessario analizzare almeno due fotografie distinte per essere sicuri che il fenomeno (evento target) sia stazionario nel tempo. E’ stata verificata la stabilità per i mesi di Luglio 2005 e Febbraio 2005. Il tasso di abbandono di Lug05 è 2.3%, quello di Feb05 è 2.4%. Il modello viene sviluppato sulla base della CT di Luglio 2005, per la quale si ha un numero di eventi positivi sufficientemente elevato, adeguato per sviluppare il modello. Non è pertanto necessario considerare CT relative a periodi anteriori. T-2 CT 6 MONTS History T0 MONTH T -2 MONTH T -1 Dark Period T3 MONTH T +1 MONTH T +2 Latency Period MONTH T +3 T5 MONTH T +4 MONTH T +5 Prevision Period 6 Filtri Il clienti attivi alla fine di Luglio 2005 sono 729.73, con un tasso di abbandono di circa 2.3%. Vengono applicati i seguenti filtri: Black list, Dipendente, Età (<=70), Non residente, Prestito a lungo termine. Il numero di clienti attivi diminuisce (570.397), il numero di eventi positivi ha un abbattimento dell’11% (passa da 16920 a 13419) e il nuovo tasso di abbandono è di circa 2.35%. 1° Filtro Flag Black List Cliente attivo 2° Filtro Flag Dipendent e Target # % # % # 0 712811 97.6 8 22193 94.7 8 1002 1 Total e 16920 2.32 1222 5.22 0 729731* 100 23415 100 % 1002 3° Filtro Flag Età # % 100 92546 97.6 7 0.00 2205 2.33 100 94751 100 4° Filtro Flag Non residente # 5° Filtro Flag Prestito Lungo Termine Totale % # % # % 4772 93.8 3 44254 99.77 55697 8 97.65 314 6.17 104 0.23 13419 2.35 100 57039 7 100 5086 100 44358 (*) Questi clienti sono attivi alla fine di Luglio 2005, attivi/dormienti nel Dark Period e Latency Period e attivi/dormienti/TL2/LOST nel Prevision Period. 7 ... eventuali ulteriori filtri: Tenure Period # % 0-6 16209 2.84% 7-12 16267 2.85% 13-24 33299 5.84% 25-36 42460 7.44% 37-48 49157 8.62% >48 409075 71.72% Missing 3930 0.69% 570397 100.00% Totale > 6 mesi Target # % 0 537938 97.76% 1 12320 2.24% Totale 550258 100.00% 8 Popolazione target Dopo l’applicazione dell’ulteriore filtro Tenure la numerosità della popolazione target è di 550.258 clienti attivi. Gli eventi positivi sono circa il 9% (passano da 13419 a12320), con un tasso di abbandono di circa 2.24%. 6° Filtro Tenure Clienti attivi Target # % # % 0 556978 97.65% 537938 97.76% 1 13419 2.35% 12320 2.24% 570397 100.00 % 550258 100.00% Totale • 6° Filtro Esclusione dei clienti che hanno aperto il loro primo c/c entro gli ultimi sei mesi. 9 Variabili Esplicative Nella CT di Luglio 2005 sono state selezionate le seguenti variabili esplicative MACROCATEGORIA Number of products utilized by the customer with at least one open account on Core Account - POINT SELECTION Selezionate Ownership of Packages-POINT Avg Balance (Monthly) - PERIOD: Credit cards, Current Account, FX Account, Giro Account, Total Investment, Saving and Deposit Cumulative monthly avg. Balance - POINT: on Total Accounts, Credit Cards, Core Account, Current Account, FX Account, Giro Account, Total Investment, Loan, Saving and Deposit AVG LIMIT 12 MONTHS - CURRENT: on Credit Cards, Core Account, Current Problemi relativi ai dati Ulteriori informazioni Account, FX Account, Giro Account, Total Investment, Loans, Credit Cards CURRENT LIMIT: on Credit Cards, Current Account, FX Account, Giro Account, Total Investment, Saving and Deposit Non selezionate 10 Scelta del primo set di variabili Una prima selezione delle variabili è stata effettuata dopo aver analizzato le distribuzioni univariate di tutte le variabili presenti nella CT di Luglio 2005. Criteri di selezione: forma della distribuzione (ad es. il numero totale di transazioni per investimenti è stato scartato per la bassa % di casi ≠0) esclusione delle variabili definite su 12 mesi, dal momento che i dati disponibili consentono un’analisi limitata ad un orizzonte temporale di 6 mesi. altri problemi relativi ai dati 11 Trasformazioni delle variabili Oltre alle variabili originarie sono state prese in considerazione alcune loro trasformate sulla base dei seguenti criteri: trend Δ comportamenti dei clienti In genere variabili di questo tipo hanno una buona capacità predittiva nell’ambito delle dinamiche dell’abbandono. 12 Prodotti ( ) * Products % Customers Products Churn Rate CORE Accounts 99.5% CORE Accounts 2.23% Current Account 89.4% Current Account 1.93% FX Accounts 46.2% FX Accounts 1.61% Savings and Deposits 32.0% Savings and Deposits 1.16% Giro Accounts 18.6% Giro Accounts 2.54% Investments 1.8% Investments 0.61% Credit Card 18.0% Credit Card 0.30% Loans not LT 20.6% Loans not LT 0.58% Total # Customers 2.24% Total # Customers 550.258 (*) I dati si riferiscono a Luglio 2005 13 Prodotti (CR+FX+SV+GR) # Product 0 1 2 3 4 Total Customers Target 0 1 0 1 0 1 0 1 0 1 0 1 (*) I dati si riferiscono a Luglio 2005 # 2418 111 203138 7276 212820 3911 100892 947 18670 75 537938 12320 (*) % 95.61% 4.39% 96.54% 3.46% 98.20% 1.80% 99.07% 0.93% 99.60% 0.40% 97.76% 2.24% % pop 0.46% 38.24% 39.39% 18.51% 3.41% 100% 14 Età dei clienti Age 18-25 26-35 Age # % 18-25 64279 11.68 26-35 118016 21.45 36-45 115651 21.02 46-55 118488 21.53 56-65 91535 16.63 65-70 42289 7.69 Total 550258* 100.00% 36-45 46-55 56-65 65-70 Total Target 0 1 0 1 0 1 0 1 0 1 0 1 0 1 # 61672 2607 114892 3124 113198 2453 116168 2320 90225 1310 41783 506 537938 12320 % 95.94% 4.06% 97.35% 2.65% 97.88% 2.12% 98.04% 1.96% 98.57% 1.43% 98.80% 1.20% 97.76% 2.24% (*) Dati relativi alla popolazione target dopo l’applicazione di tutti i filtri. 15 Modelli di Churn Modello n°1 Variabili in input: variabili originarie della CT Modello n°2 Variabili in input: Variabili originarie della CT+trasformate 16 Scelta del modello Modello n°1 Modello n°2 Test Chi-Square DF Pr > ChiSq Test Chi-Square DF Pr > ChiSq Likelihood Ratio 17896.971 11 <.0001 Likelihood Ratio 20356.2095 19 <.0001 Association of Predicted Probabilities and Observed Responses Association of Predicted Probabilities and Observed Responses Percent Concordant 88.2 Somers'D 0.769 Percent Discordant 11.3 Gamma 0.773 0.5 Tau-a 0.141 Percent Tied Pairs 643691936 c 89.6 Somers' D Percent Discordant 10 Gamma Percent Tied 0.4 Tau-a Pairs 0.885 Peggior 5% dei clienti: il tasso di abbandono atteso è 7.45 volte il tasso di abbandono medio. Peggior 10% dei clienti: il tasso di abbandono atteso è 5.63 volte il tasso di abbandono medio. 8 Percent Concordant 0.796 0.8 0.146 643691936 c 0.898 Peggior 5% dei clienti: il tasso di abbandono atteso è 8.37 volte il tasso di abbandono medio. Peggior 10% dei clienti: il tasso di abbandono atteso è 6.04 volte il tasso di abbandono medio. 9 8 7 7 6 6 5 lift lift 5 4 4 3 3 2 2 1 1 0 0 5 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100 % population % population Dopo aver analizzato le statistiche di fit e la curva lift è stato scelto il Modello n°2 17 Modello n°2 - Lift Chart sulla popolazione target Peggior 5% dei clienti: il tasso di abbandono atteso è 8.37 volte il tasso di abbandono medio. Peggior 10% dei clienti: il tasso di abbandono atteso è 6.04 volte il tasso di abbandono medio. 9 8 7 6 lift 5 4 3 2 1 0 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100 % population 18 Modello n°2 - % di risposta catturata 100 90 % response captured 80 Il peggiore 10% dei clienti contiente il 60.36% dei lost/TL. Il peggiore 5% dei clienti contiente il 41.83% dei lost/TL. 70 60 50 40 30 5 10 15 20 25 30 35 40 45 50 55 60 65 70 75 80 85 90 95 100 % population 19 Regressori selezionati 40 30 20 - + - + - - - - - A:-0.02/0.02 + B:-0.4/-0.02 or 0.02/0.01 - B:-0.4/-0.02 or 0.02/0.01 - A:-0.02/0.02 B:-0.4/-0.05 or 0.05/0.4 - B:-1600/1300 - C:>0.4 0 A:-0.05/0.05 10 + + + # of transaction on COR in T1 Bill pay service Δ %: # of transactions on COR Monthly avg. balance for Loans in T1 # of transaction on SV in T1 Δ between Products holding in the previous half-year and in the current month A:<-1600 or D:>=9000 PER_TXN_COR_3MTH_CNT BILL_PAY_SERVICE_FLG SC_PER_TXN_COR_CNT_BIN SC_SUM7_ACC_6MTH_CNT TRIM1_LN_AVG_BAL_AMT_FLG AGE_AT_ANALYSIS_MTH_CNT new _TRIM1_CORAVGBALAMT_BIN SC_AVG_CR_TXN_COR_AMT_BIN DF_AVG_CRDB_TXN_COR_3MTH_AMT_FLG SC_COR_AVG_BAL_A +LAST_ACCT_COR_FLG +SC_AVG_CR_TXN_COR_AMT_BIN + GENDER_CD - SC_PER_TXN_COR_CNT_BIN - SC_PER_TXN_COR_CNT_BIN +PER_TXN_SV_3MTH_CNT + new _TRIM1_CORAVGBALAMT_BIN - SC_AVG_DB_TXN_COR_AMT_BIN - SC_AVG_DB_TXN_COR_AMT_BIN + Δ %: monthly avg. Δ %: amount of credit transaction on COR Monthly avg. balance for all COR in T1 Age of Customer balance for all COR Last Product assigned is a COR account Δ % : amount of debit transaction on COR Δ amount of credit and debit transaction on COR in T1 20 Sex of Customer Come utilizzare il modello 1. 2. 3. 4. 5. Validazione del modello Definizione di una campagna di retention Definizione dell’ampiezza del target Descrizione della target list Misurazione della campagna 21 Definizione della campagna di retention Periodo della campagna? Un mese? Due mesi? Quante campagne posso essere fatte in un anno? Campagna centrale vs campagna locale? Una combinazione delle due? Canale per contattare la clientela? Posta – telefono? Obiettivo del contatto? Visite in filiale per riesaminare le clausole del contratto? Oppure per migliorare le clausole del contratto? Oppure per vendere un’offerta speciale? Come fare in modo che tutti i direttori di filiale seguano la stessa linea? Come guadagnarsi la loro fiducia/impegno? Per quali ragioni i direttori di filiale dovrebbero usare la Target list basata sul modello di churn? Stanziamento di un budget su quella lista? O sul loro portafoglio? Bonus plan? Quanto tempo dovrebbero dedicare alle politiche di retention i direttori di filiale? E durante questa attività quanti conttati dovrebbero essere in grado di gestire? 22 Definizione dell’ampiezza del target Target Popolazione target Target Churn List Test Churn List Descrizione • Clienti attivi • Non dipendenti • No prestiti a lungo termine • Età 18-70 • Apertura primo c/c > 6 month • Residenti • Il primo X% della popolazione target Si considera ad es. Il top 10%+altre priorità di business (depositi, entrate, prestiti,…) • Campione rappresentativo della Churn Target List che non verrà considerato per la campagna di retention. • Si considera ad es. Il 10% della Target Churn List. Ampiezza • Totale: • Totale: – Rischio Elevato (Rosso) – Rischio medio/alto (Arancione) – Rischio medio (Giallo) • Totale: – Rosso – Arancione – Giallo 550.258 55.000 11.500 16.500 27.000 5.500 1.150 1.650 2.700 23 Descrizione della target list Il modello di churn assegna uno score ad ogni cliente, proporzionale alla probabilità di abbandono Utilizzando tale score si possono identificare varie popolazioni target Il profilo di tali popolazioni deve essere descritto utilizzando le linee guida del modello di churn Per guadagnare la fiducia dei direttori di filiale il linguaggio del modello va però semplificatoutilizzare indicatori molto semplici: Selezionare le sei variabili più significative (criteri statistici) Selezionare le sei variabili più comprensibili (criteri di business) Unire i due insiemi e se quattro delle variabili sono comuni utilizzarle per definire i profili di rischio di abbandono Confrontare il profilo dei clienti a rischio di abbandono con il profilo della popolazione target Costruire grafici efficaci e condividerli con i direttori di filiale 24 Misurazione della campagna di retention Dicembre 2006 – Gennaio 2007 Tasso di abbandono su due mesi Control Churn Rate Target Churn Rate 585 Population Churn Rate 453 412 344 250 293 229 174 100 Popolazione target Top 10% Rosso Arancione E’ necessario misurare la redemption della campagna considerando diversi tipi di eventi: •% contatti positivi •% retention su due mesi •% retention su sei mesi •Trend dei clienti rientrati: •A&L •Profittabilità •.... Giallo Clienti target per la campagna 25 Utilizzo del modello – Business Case % Population Score MIN-MAX 5 10 15 1:0.15770.8055 2:0.08350.1576 3:0.05090.0834 Avg Score Cum. # Cum. Cum. # Target Customers Redemption Cum. Lift % Response Captured 0.2703 27509 5.00 18.73 8.37 41.83 0.1141 55026 10.00 13.51 6.04 60.36 0.0655 82537 15.00 10.59 4.73 70.96 20 4:0.033-0.0508 0.0409 110025 20.00 8.74 3.90 78.04 25 5:0.02310.0329 0.0276 137442 24.98 7.41 3.31 82.62 30 6:0.0169-0.023 0.0197 165356 30.05 6.42 2.87 86.12 0.0146 192621 35.01 5.68 2.54 88.84 0.0110 219814 39.95 5.09 2.27 90.88 0.0083 247301 44.94 4.62 2.06 92.69 0.0061 275370 50.04 4.21 1.88 94.12 0.0045 303506 55.16 3.87 1.73 95.36 0.0033 329490 59.88 3.60 1.61 96.27 0.0024 356163 64.73 3.36 1.50 97.09 0.0017 386197 70.18 3.12 1.39 97.79 35 40 45 50 55 60 65 70 7:0.01270.0168 8:0.00960.0126 9:0.00720.0095 10:0.00530.0071 11:0.00390.0052 12:0.00290.0038 13:0.00210.0028 14:0.00140.002 26 Utilizzo del modello – Business Case Dicembre 2006 – Gennaio 2007 Tasso di abbandono su due mesi 55.000 Nell’ipotesi di ripetere la campagna di retention quattro volte all’anno, è stato stimato un numero pari a 7000 clienti rientrati. Se si considera un guadagno annuo pari a 100€ per cliente, si stima che il risparmio totale ottenuto grazie alla campagna di retention è di 700.000 €. 7.425* 1.850 3.085 2.490 Clienti target per la campagna Clienti target che avrebbero dovuto abbandonare (*) Clienti target che non sono stati contattati e hanno abbandonato (**) Clienti target contattati che hanno abbandonato (***) Clienti target contattati che non hanno abbandonato (***) (*) Calcolato usando il top 10% del tasso di abbandono della popolazione target (13.5%) (** ) Calcolato usando un “positive contact rate” di 75% (*** ) Calcolato usando come benchmark un tasso di retention di 45% 27