Metodi Quantitativi per Economia, Finanza
e Management
Lezione n° 13
Orari di ricevimento
Gennaio-Febbraio 2008
• 08/01/2008
• 15/01/2008
• 22/01/2008
• 12/02/2008
• Aula 224
11.00-12.00
09.30-10.30
09.30-10.30
11.00-12.00
November 22nd, 2006
Individuals Churn Model
Prepared
by
for
Alberto Saccardi, Paola Bauce,
Elena Pallini (Nunatac)
XXX Banka
Version: 5.0 – Final Review
3
Modello di Churn su “Losts”
e “Technically Losts”
Dopo una serie di analisi preliminari si è deciso di considerare come evento target
per il modello di Churn la prima volta in cui un cliente attivo diventa “technical lost”
(TL2) oppure “lost” (LOS) all’interno di un periodo di previsione fissato.
La scelta di tale evento target è stata supportata anche dal numero dei cosidetti
“eventi positivi” osservati.
Per avere un modello di Churn (e in generale un modello statistico)
robusto è necessario un numero minimo di eventi positivi.
4
Struttura dei dati
CT Jul05
History
ACTIVE in the end of
Jul05
Aug05
Sept05
Dark Period
Oct05
Nov05
Latency Period
Not TL2 or LOST or OLD
Dec05
Jan06
Feb06
Prevision Period
Target Event: TL2 or LOST in
one of the 2 months
Per definire l’evento target sono stati considerati i seguenti intervalli di tempo:
• Dark Period: dipende dal gap tra l’aggiornamento della base dati e il momento in cui si stima il modello
• Latency Period: dipende dalla scelta dell’evento target e dalle esigenze di business
• Prevision Period: dipende dal numero di eventi positivi osservati e dalla stagionalità.
Nel nostro caso sono state fissate le durate seguenti:
• Dark Period: due mesi
• Latency Period: tre mesi, che è l’intervallo minimo perchè un clienti passi da attivo a TL2 o LOST
• Prevision Period: due mesi.
I dati più recenti disponibili sono aggiornati a Febbraio 2006. Questo significa che è necessario considerare le
variabili dipendenti relative alla CT di Luglio 2005. Inoltre, possono essere considerate solo variabili relative ad
uno storico di sei mesi.
5
Due fotografie
E’ necessario analizzare almeno due fotografie distinte per essere sicuri che il
fenomeno (evento target) sia stazionario nel tempo.
E’ stata verificata la stabilità per i mesi di Luglio 2005 e Febbraio 2005. Il tasso di
abbandono di Lug05 è 2.3%, quello di Feb05 è 2.4%.
Il modello viene sviluppato sulla base della CT di Luglio 2005, per la quale si ha
un numero di eventi positivi sufficientemente elevato, adeguato per sviluppare il
modello. Non è pertanto necessario considerare CT relative a periodi anteriori.
T-2
CT
6 MONTS
History
T0
MONTH
T -2
MONTH
T -1
Dark Period
T3
MONTH
T +1
MONTH
T +2
Latency Period
MONTH
T +3
T5
MONTH
T +4
MONTH
T +5
Prevision Period
6
Filtri
Il clienti attivi alla fine di Luglio 2005 sono 729.73, con un tasso di abbandono di circa 2.3%.
Vengono applicati i seguenti filtri: Black list, Dipendente, Età (<=70), Non residente, Prestito a
lungo termine. Il numero di clienti attivi diminuisce (570.397), il numero di eventi positivi ha un
abbattimento dell’11% (passa da 16920 a 13419) e il nuovo tasso di abbandono è di circa 2.35%.
1° Filtro
Flag
Black List
Cliente
attivo
2° Filtro
Flag
Dipendent
e
Target
#
%
#
%
#
0
712811
97.6
8
22193
94.7
8
1002
1
Total
e
16920
2.32
1222
5.22
0
729731*
100
23415
100
%
1002
3° Filtro
Flag Età
#
%
100
92546
97.6
7
0.00
2205
2.33
100
94751
100
4° Filtro
Flag
Non
residente
#
5° Filtro
Flag Prestito
Lungo
Termine
Totale
%
#
%
#
%
4772
93.8
3
44254
99.77
55697
8
97.65
314
6.17
104
0.23
13419
2.35
100
57039
7
100
5086
100
44358
(*) Questi clienti sono attivi alla fine di Luglio 2005, attivi/dormienti nel Dark Period e Latency Period e
attivi/dormienti/TL2/LOST nel Prevision Period.
7
... eventuali ulteriori filtri: Tenure
Period
#
%
0-6
16209
2.84%
7-12
16267
2.85%
13-24
33299
5.84%
25-36
42460
7.44%
37-48
49157
8.62%
>48
409075
71.72%
Missing
3930
0.69%
570397
100.00%
Totale
> 6 mesi
Target
#
%
0
537938
97.76%
1
12320
2.24%
Totale
550258
100.00%
8
Popolazione target
Dopo l’applicazione dell’ulteriore filtro Tenure la numerosità della popolazione target è di 550.258
clienti attivi. Gli eventi positivi sono circa il 9% (passano da 13419 a12320), con un tasso di
abbandono di circa 2.24%.
6° Filtro
Tenure
Clienti attivi
Target
#
%
#
%
0
556978
97.65%
537938
97.76%
1
13419
2.35%
12320
2.24%
570397
100.00
%
550258
100.00%
Totale
• 6° Filtro Esclusione dei clienti che hanno aperto il loro primo c/c entro gli ultimi sei mesi.
9
Variabili Esplicative
Nella CT di Luglio 2005 sono state selezionate le seguenti variabili esplicative
MACROCATEGORIA
Number of products utilized by the customer with at least one open account on Core
Account - POINT
SELECTION
Selezionate
Ownership of Packages-POINT
Avg Balance (Monthly) - PERIOD: Credit cards, Current Account, FX Account, Giro
Account, Total Investment, Saving and Deposit
Cumulative monthly avg. Balance - POINT: on Total Accounts, Credit Cards, Core
Account, Current Account, FX Account, Giro Account, Total Investment, Loan, Saving
and Deposit
AVG LIMIT 12 MONTHS - CURRENT: on Credit Cards, Core Account, Current
Problemi
relativi ai dati
Ulteriori
informazioni
Account, FX Account, Giro Account, Total Investment, Loans, Credit Cards
CURRENT LIMIT: on Credit Cards, Current Account, FX Account, Giro Account, Total
Investment, Saving and Deposit
Non selezionate
10
Scelta del primo set di variabili
Una prima selezione delle variabili è stata effettuata dopo aver analizzato le
distribuzioni univariate di tutte le variabili presenti nella CT di Luglio 2005.
Criteri di selezione:



forma della distribuzione (ad es. il numero totale di transazioni per
investimenti è stato scartato per la bassa % di casi ≠0)
esclusione delle variabili definite su 12 mesi, dal momento che i dati
disponibili consentono un’analisi limitata ad un orizzonte temporale di 6
mesi.
altri problemi relativi ai dati
11
Trasformazioni delle variabili
Oltre alle variabili originarie sono state prese in considerazione alcune loro
trasformate sulla base dei seguenti criteri:


trend
Δ comportamenti dei clienti
In genere variabili di questo tipo hanno una buona capacità predittiva nell’ambito
delle dinamiche dell’abbandono.
12
Prodotti ( )
*
Products
%
Customers
Products
Churn
Rate
CORE Accounts
99.5%
CORE Accounts
2.23%
Current Account
89.4%
Current Account
1.93%
FX Accounts
46.2%
FX Accounts
1.61%
Savings and
Deposits
32.0%
Savings and
Deposits
1.16%
Giro Accounts
18.6%
Giro Accounts
2.54%
Investments
1.8%
Investments
0.61%
Credit Card
18.0%
Credit Card
0.30%
Loans not LT
20.6%
Loans not LT
0.58%
Total #
Customers
2.24%
Total #
Customers
550.258
(*) I dati si riferiscono a Luglio 2005
13
Prodotti (CR+FX+SV+GR)
# Product
0
1
2
3
4
Total
Customers
Target
0
1
0
1
0
1
0
1
0
1
0
1
(*) I dati si riferiscono a Luglio 2005
#
2418
111
203138
7276
212820
3911
100892
947
18670
75
537938
12320
(*)
%
95.61%
4.39%
96.54%
3.46%
98.20%
1.80%
99.07%
0.93%
99.60%
0.40%
97.76%
2.24%
% pop
0.46%
38.24%
39.39%
18.51%
3.41%
100%
14
Età dei clienti
Age
18-25
26-35
Age
#
%
18-25
64279
11.68
26-35
118016
21.45
36-45
115651
21.02
46-55
118488
21.53
56-65
91535
16.63
65-70
42289
7.69
Total
550258*
100.00%
36-45
46-55
56-65
65-70
Total
Target
0
1
0
1
0
1
0
1
0
1
0
1
0
1
#
61672
2607
114892
3124
113198
2453
116168
2320
90225
1310
41783
506
537938
12320
%
95.94%
4.06%
97.35%
2.65%
97.88%
2.12%
98.04%
1.96%
98.57%
1.43%
98.80%
1.20%
97.76%
2.24%
(*) Dati relativi alla popolazione target dopo l’applicazione di tutti i filtri.
15
Modelli di Churn
 Modello n°1
Variabili in input: variabili originarie della CT
 Modello n°2
Variabili in input:
Variabili originarie della CT+trasformate
16
Scelta del modello
Modello n°1
Modello n°2
Test
Chi-Square
DF
Pr > ChiSq
Test
Chi-Square
DF
Pr > ChiSq
Likelihood Ratio
17896.971
11
<.0001
Likelihood Ratio
20356.2095
19
<.0001
Association of Predicted Probabilities and Observed
Responses
Association of Predicted Probabilities and Observed
Responses
Percent Concordant
88.2 Somers'D
0.769
Percent Discordant
11.3 Gamma
0.773
0.5 Tau-a
0.141
Percent Tied
Pairs
643691936 c
89.6 Somers' D
Percent Discordant
10 Gamma
Percent Tied
0.4 Tau-a
Pairs
0.885
Peggior 5% dei clienti: il tasso di abbandono atteso è 7.45
volte il tasso di abbandono medio.
Peggior 10% dei clienti: il tasso di abbandono atteso è 5.63
volte il tasso di abbandono medio.
8
Percent Concordant
0.796
0.8
0.146
643691936 c
0.898
Peggior 5% dei clienti: il tasso di abbandono atteso è 8.37
volte il tasso di abbandono medio.
Peggior 10% dei clienti: il tasso di abbandono atteso è 6.04
volte il tasso di abbandono medio.
9
8
7
7
6
6
5
lift
lift
5
4
4
3
3
2
2
1
1
0
0
5
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
% population
% population
Dopo aver analizzato le statistiche di fit e la curva lift è stato
scelto il Modello n°2
17
Modello n°2 - Lift Chart sulla popolazione
target
Peggior 5% dei clienti: il tasso di abbandono atteso è 8.37
volte il tasso di abbandono medio.
Peggior 10% dei clienti: il tasso di abbandono atteso è 6.04
volte il tasso di abbandono medio.
9
8
7
6
lift
5
4
3
2
1
0
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
% population
18
Modello n°2 - % di risposta catturata
100
90
% response captured
80
Il peggiore 10% dei clienti contiente il 60.36% dei lost/TL.
Il peggiore 5% dei clienti contiente il 41.83% dei lost/TL.
70
60
50
40
30
5
10
15
20
25
30
35
40
45
50
55
60
65
70
75
80
85
90
95
100
% population
19
Regressori selezionati
40
30
20
-
+
-
+
-
-
-
-
-
A:-0.02/0.02
+
B:-0.4/-0.02 or
0.02/0.01
-
B:-0.4/-0.02 or
0.02/0.01
-
A:-0.02/0.02
B:-0.4/-0.05 or
0.05/0.4
-
B:-1600/1300
-
C:>0.4
0
A:-0.05/0.05
10
+
+
+
# of
transaction
on COR in
T1
Bill pay
service
Δ %: # of
transactions
on COR
Monthly avg.
balance for
Loans in T1
# of
transaction
on SV in T1
Δ between Products
holding in the previous
half-year and in the
current month
A:<-1600 or D:>=9000
PER_TXN_COR_3MTH_CNT
BILL_PAY_SERVICE_FLG
SC_PER_TXN_COR_CNT_BIN
SC_SUM7_ACC_6MTH_CNT
TRIM1_LN_AVG_BAL_AMT_FLG
AGE_AT_ANALYSIS_MTH_CNT
new _TRIM1_CORAVGBALAMT_BIN
SC_AVG_CR_TXN_COR_AMT_BIN
DF_AVG_CRDB_TXN_COR_3MTH_AMT_FLG
SC_COR_AVG_BAL_A
+LAST_ACCT_COR_FLG
+SC_AVG_CR_TXN_COR_AMT_BIN
+ GENDER_CD
- SC_PER_TXN_COR_CNT_BIN
- SC_PER_TXN_COR_CNT_BIN
+PER_TXN_SV_3MTH_CNT
+ new _TRIM1_CORAVGBALAMT_BIN
- SC_AVG_DB_TXN_COR_AMT_BIN
- SC_AVG_DB_TXN_COR_AMT_BIN
+ Δ %: monthly avg.
Δ %: amount of credit
transaction on COR
Monthly avg. balance for
all COR in T1
Age of Customer
balance for all
COR
Last Product
assigned is a
COR account
Δ % : amount of
debit transaction
on COR
Δ amount of
credit and debit
transaction on
COR in T1
20
Sex of Customer
Come utilizzare il modello
1.
2.
3.
4.
5.
Validazione del modello
Definizione di una campagna di retention
Definizione dell’ampiezza del target
Descrizione della target list
Misurazione della campagna
21
Definizione della campagna di retention







Periodo della campagna? Un mese? Due mesi? Quante campagne posso
essere fatte in un anno?
Campagna centrale vs campagna locale? Una combinazione delle due?
Canale per contattare la clientela? Posta – telefono?
Obiettivo del contatto? Visite in filiale per riesaminare le clausole del
contratto? Oppure per migliorare le clausole del contratto? Oppure per
vendere un’offerta speciale?
Come fare in modo che tutti i direttori di filiale seguano la stessa linea? Come
guadagnarsi la loro fiducia/impegno?
Per quali ragioni i direttori di filiale dovrebbero usare la Target list basata sul
modello di churn? Stanziamento di un budget su quella lista? O sul loro
portafoglio? Bonus plan?
Quanto tempo dovrebbero dedicare alle politiche di retention i direttori di
filiale? E durante questa attività quanti conttati dovrebbero essere in grado di
gestire?
22
Definizione dell’ampiezza del target
Target
Popolazione
target
Target Churn
List
Test Churn
List
Descrizione
• Clienti attivi
• Non dipendenti
• No prestiti a lungo termine
• Età 18-70
• Apertura primo c/c > 6
month
• Residenti
• Il primo X% della popolazione
target
Si considera ad es. Il top
10%+altre priorità di business
(depositi, entrate, prestiti,…)
• Campione rappresentativo
della Churn Target List che non
verrà considerato per la
campagna di retention.
• Si considera ad es. Il 10%
della Target Churn List.
Ampiezza
• Totale:
• Totale:
– Rischio Elevato (Rosso)
– Rischio medio/alto
(Arancione)
– Rischio medio (Giallo)
• Totale:
– Rosso
– Arancione
– Giallo
550.258
55.000
11.500
16.500
27.000
5.500
1.150
1.650
2.700
23
Descrizione della target list




Il modello di churn assegna uno score ad ogni cliente,
proporzionale alla probabilità di abbandono
Utilizzando tale score si possono identificare varie popolazioni
target
Il profilo di tali popolazioni deve essere descritto utilizzando le
linee guida del modello di churn
Per guadagnare la fiducia dei direttori di filiale il linguaggio del
modello va però semplificatoutilizzare indicatori molto semplici:

Selezionare le sei variabili più significative (criteri
statistici)

Selezionare le sei variabili più comprensibili (criteri di
business)

Unire i due insiemi e se quattro delle variabili sono
comuni utilizzarle per definire i profili di rischio di
abbandono

Confrontare il profilo dei clienti a rischio di abbandono
con il profilo della popolazione target

Costruire grafici efficaci e condividerli con i direttori di
filiale
24
Misurazione della campagna di retention
Dicembre 2006 – Gennaio 2007
Tasso di abbandono su due mesi
Control Churn Rate
Target Churn Rate
585
Population Churn Rate
453
412
344
250
293
229
174
100
Popolazione
target
Top 10%
Rosso
Arancione
E’ necessario misurare la
redemption della campagna
considerando diversi tipi di
eventi:
•% contatti positivi
•% retention su due mesi
•% retention su sei mesi
•Trend dei clienti rientrati:
•A&L
•Profittabilità
•....
Giallo
Clienti target per
la campagna
25
Utilizzo del modello – Business Case
% Population Score MIN-MAX
5
10
15
1:0.15770.8055
2:0.08350.1576
3:0.05090.0834
Avg Score
Cum. #
Cum.
Cum. # Target
Customers
Redemption
Cum. Lift
%
Response
Captured
0.2703
27509
5.00
18.73
8.37
41.83
0.1141
55026
10.00
13.51
6.04
60.36
0.0655
82537
15.00
10.59
4.73
70.96
20
4:0.033-0.0508
0.0409
110025
20.00
8.74
3.90
78.04
25
5:0.02310.0329
0.0276
137442
24.98
7.41
3.31
82.62
30
6:0.0169-0.023
0.0197
165356
30.05
6.42
2.87
86.12
0.0146
192621
35.01
5.68
2.54
88.84
0.0110
219814
39.95
5.09
2.27
90.88
0.0083
247301
44.94
4.62
2.06
92.69
0.0061
275370
50.04
4.21
1.88
94.12
0.0045
303506
55.16
3.87
1.73
95.36
0.0033
329490
59.88
3.60
1.61
96.27
0.0024
356163
64.73
3.36
1.50
97.09
0.0017
386197
70.18
3.12
1.39
97.79
35
40
45
50
55
60
65
70
7:0.01270.0168
8:0.00960.0126
9:0.00720.0095
10:0.00530.0071
11:0.00390.0052
12:0.00290.0038
13:0.00210.0028
14:0.00140.002
26
Utilizzo del modello – Business Case
Dicembre 2006 – Gennaio 2007
Tasso di abbandono su due mesi
55.000
Nell’ipotesi di ripetere la
campagna di retention quattro
volte all’anno, è stato stimato
un numero pari a 7000 clienti
rientrati.
Se si considera un guadagno
annuo pari a 100€ per cliente,
si stima che il risparmio totale
ottenuto grazie alla campagna
di retention è di 700.000 €.
7.425*
1.850
3.085
2.490
Clienti target
per la
campagna
Clienti target
che avrebbero
dovuto
abbandonare
(*)
Clienti target
che non sono
stati
contattati e
hanno
abbandonato
(**)
Clienti target
contattati che
hanno
abbandonato
(***)
Clienti target
contattati che non
hanno
abbandonato
(***)
(*) Calcolato usando il top 10% del tasso di abbandono della popolazione target (13.5%)
(** ) Calcolato usando un “positive contact rate” di 75%
(*** ) Calcolato usando come benchmark un tasso di retention di 45%
27
Scarica

0 - My LIUC