LA SEGMENTAZIONE DEL MERCATO
Un caso di analisi CHAID
COOP
Emilio Gagliardi
Debora Facchini
Giulia Bravo
[email protected]
[email protected]
[email protected]
Strumento di analisi ed obiettivo
Tecniche di segmentazione a priori basate sull’ implementazione
dell’ algoritmo CHAID (Chi-squared Automatic Interaction Detection)
valutazione del grado di omogeneità entro i gruppi e di
eterogeneità tra gli stessi tramite il test 2, la cui significatività
statistica viene normalizzata con fattore di Bonferroni
OBIETTIVO
analisi di un collettivo oggetto di studio al fine di suddividere lo
stesso in gruppi di consumatori omogenei al loro interno ma tra
loro eterogenei sulla base di variabili maggiormente correlate ad
uno specifico target, per poter così predisporre specifiche
politiche di marketing
Analisi preliminare
Dataset iniziale: 7200 osservazioni, ciascuna delle quali riferita ad
un’intervista effettuata in un PV Coop a soci Coop o ad individui
appartenenti a nuclei familiari che comprendono soci Coop
Variabili:
- socio-demografiche ed economiche
- punteggi di soddisfazione sul servizio di
distribuzione e relative variazioni
- variabili coop
tutte le variabili sono state categorizzate per
limitare l’ impatto della metrica sui predittori, e
presentano le modalità di seguito illustrate:
Analisi preliminare
Età: meno di 35 anni; da 36 a 50 anni; da 51 a 65 anni; più di
65 anni
Professione: ‘1’; ‘2’; ‘3’; ‘4’
Titolo di studio: elementare/media inferiore; media
superiore/università
Stato civile: celibe/nubile; sposato/a; vedovo/a
Area di acquisto: Romagna/Marche; Veneto; Bologna
Componenti della famiglia: 1; 2; 3; più di 3
Numero minorenni: 1; più di 1
Numero percettori reddito: 1; 2; più di 2
Numero occupati: modalità corrispondenti
Numero auto possedute: 1; più di 1
Analisi preliminare
Punteggi soddisfazione relativi al servizio distributivo: - bassa (da 1 a 7)
- media (8)
- alta
(9-10)
Giudizi su variazioni del servizio distributivo: - peggiorato/molto peggiorato
- più o meno uguale
- migliorato
Preferenza su Coop: dicotomica si/no
Canale di Vendita: iper; non iper(supermercato,discount,tradizionali,mercato,altro)
Numero di soci presenti in famiglia: 1; da 2 in poi
I VALORI MISSING VENGONO INCLUSI NELL’ANALISI COME CATEGORIA DISTINTA
Scelta della variabile target
Primo
livello di
analisi
Target: CANALE DI VENDITA
49.90%
Variabili
indipendenti:
- tutte insieme
- a blocchi
20.45%
MISSING
29.65%
Scelta della variabile target
Secondo
livello di
analisi
Target: SOCIO
per la modalità NON IPER di CANALE DI VENDITA
56.05%
43.95%
Variabili
indipendenti:
- tutte insieme
- a blocchi
Primo livello di analisi
Intero data set
variabile target CANALE DI VENDITA
SEGMENTAZIONE IN BASE ALLA
VARIABILE TARGET CANALE
Variabile target: CANALE con modalità - IPER
- NON IPER
Variabili indipendenti:
- Socio-demografiche ed economiche
- Punteggi di soddisfazione sul
servizio di distribuzione e relative
variazioni
- Variabili “Coop”
Tasso di corretta classificazione
Dimensione dell’albero che ottimizza il tasso di corretta
classificazione: 14 nodi terminali
leaves
1
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
training validation
0,6113
0,6114
0,6438
0,6348
0,6557
0,6650
0,6887
0,6678
0,7006
0,6980
0,7038
0,6980
0,7119
0,7265
0,7154
0,7282
0,7212
0,7288
0,7245
0,7288
0,7248
0,7385
0,7283
0,7402
0,7341
0,7407
0,7341
0,7407
0,7341
0,7407
0,7341
0,7407
0,7341
0,7407
0,7341
0,7407
0,7341
0,7407
0,7341
0,7407
0,7341
0,7407
0,7374
0,7407
0,7374
0,7407
0,7374
0,7407
Matrice di Confusione
IPER
NON
IPER
Totale
IPER
420
262
682
23.93% 14.93% 38.86%
NON
IPER
193
880
1073
11.00% 50.14% 61.14%
Totale
613
1142
34.93% 65.07%
1755
100%
Frequenza valori mancanti=1
Tassi di corretta classificazione
Rappresentazione grafica dell’albero
-1-
-2-
-3-
-4-
-5-
-3-
-2-7-
-8-
-11-
-12-
-13-
Variabile target CANALE
-14-
-4-9-
-5-10-
-6-
Variabili esplicative maggiormente
influenti sulla variabile target
VARIABLE
S_PESCE
ZONA
S_ASSORTIMENTO
S_PREZZI
INSEGNA
SOCIO
ETA
Variabile target CANALE
NODES IMPORTANCE
1
1,000
2
0,903
2
0,726
1
0,514
1
0,450
1
0,286
1
0,237
Descrizione nodi terminali
NODO
DESCRIZIONE NODO
%IPER
%NON
IPER
Numerosità
NODO
1
Unità che frequentano PV in Romagna-Marche aventi medio-bassa
soddisfazione per pesce
36%
64%
488
2
Unità che frequentano PV in Veneto aventi medio-bassa soddisfazione per
pesce
26%
74%
214
3
Unità che frequentano PV in Romagna-Marche e Veneto aventi alta
soddisfazione per pesce
44%
56%
367
4
Unità che frequentano PV in zona Bologna aventi alta soddisfazione per pesce
69%
31%
454
5
Unità con media soddisfazione per l’assortimento e soddisfazione non nota
per pesce
19%
81%
402
6
Unità con bassa soddisfazione per l’assortimento e soddisfazione non nota
per pesce
6%
94%
662
7
Unità con alta soddisfazione per l’assortimento che frequentano PV in zona
Bologna e hanno una medio-bassa soddisfazione per pesce
78%
22%
243
8
Unità che frequentano PV in Veneto con alta soddisfazione per l’assortimento
e soddisfazione sconosciuta per pesce
10%
90%
79
9
Unità che frequentano PV in Romagna_Marche con alta soddisfazione per
l’assortimento e soddisfazione sconosciuta per pesce
23%
77%
175
…….continua
Descrizione nodi terminali
10
11
12
13
14
Unità che frequentano PV in Zona Bologna con alta soddisfazione per
l’assortimento e soddisfazione sconosciuta per pesce
67%
33%
151
Soci Coop con media soddisfazione per l’assortimento, frequentano punti
vendita in zona Bologna e hanno medio-bassa soddisfazione per pesce
69%
31%
270
45%
55%
128
56%
44%
185
27%
73%
146
Non soci coop con media soddisfazione per l’assortimento, frequentano
punti vendita in zona Bologna e hanno medio-bassa soddisfazione per
pesce
Soci Coop con bassa soddisfazione per l’assortimento, frequentano punti
vendita in zona Bologna e hanno medio-bassa soddisfazione per pesce
Non soci coop con bassa soddisfazione per l’assortimento, frequentano
punti vendita in zona Bologna e hanno medio-bassa soddisfazione per
pesce
Variabile target CANALE
SEGMENTAZIONE:
VARIABILE TARGET CANALE
VARIABILI INDIPENDENTI SOCIO-DEMOGRAFICHE ED
ECONOMICHE
Variabile target: CANALE con modalità - IPER
- NON IPER
Variabili indipendenti:
-
Sesso
Età
Professione
Titolo di studio
Stato civile
Area di acquisto
Numero componenti famiglia
Numero minorenni
Numero percettori reddito
Numero occupati
Numero auto possedute
Tasso di corretta classificazione
leaves
1
3
4
5
6
7
8
Dimensione dell’albero ottimale: 4 nodi terminali
training validation
0,6113
0,6114
0,6428
0,6456
0,6559
0,6638
0,6428
0,6638
0,6559
0,6638
0,6428
0,6456
0,6559
0,6638
Matrice di confusione
IPER
NON
IPER
Totale
IPER
467
215
682
26.61% 12.25% 38.86%
NON
IPER
375
698
1073
21.37% 39.77% 61.14%
Totale
842
913
47.98% 52.02%
1755
100%
Frequenza valori mancanti=1
Tassi di corretta classificazione
Rappresentazione grafica dell’albero
-1-
-3-
Variabile target: CANALE
-2-
-4-
variabili indipendenti: SOCIO-DEMOGRAFICHE
ed ECONOMICHE
Variabili esplicative maggiormente
influenti sulla variabile target
VARIABLE NODES
ZONA
N_AUTO
Variabile target: CANALE
IMPORTANCE
1
1,000
1
0,371
variabili indipendenti: SOCIO-DEMOGRAFICHE
ed ECONOMICHE
Descrizione nodi terminali
NODO
NODO
1
DESCRIZIONE NODO
DESCRIZIONE NODO
%IPER
1UnitàUnità
frequentanti
PVinsituati
in Romagna-Marche
frequentanti
PV situati
Romagna-Marche
29%
29%
71%
71%
1308
2
16%
84%
84%
55%
653
45%
45%
35%
1831
65%
Unità frequentanti PV situati in Veneto
2
frequentanti PV situati in Veneto
16%
3UnitàUnità
che possiedono 1 o più auto e la cui zona
d’acquisto è Bologna
3
4d’acquisto
UnitàèilBologna
cui numero di auto possedute non è 55%
conosciuto, ma la cui zona d’acquisto è Bologna
4
Numerosità
%NON IPER
%IPER
%NONNODO
IPER
Unità che possiedono 1 o più auto e la cui zona
Unità il cui numero di auto possedute non è
conosciuto, ma la cui zona d’acquisto è Bologna
Variabile target: CANALE
35%
65%
172
variabili indipendenti: SOCIO-DEMOGRAFICHE
ed ECONOMICHE
SEGMENTAZIONE:
VARIABILE TARGET CANALE
VARIABILI INDIPENDENTI PUNTEGGI DI SODDISFAZIONE
SERVIZIO DISTRIBUTIVO E RELATIVE VARIAZIONI
Variabile target: CANALE con modalità
Variabili indipendenti:
-
Generale
Prezzi
Promozioni
Assortimento
Personale, servizio
Pulizia, igiene
Qualità prodotti freschi
Reparto ortofrutta
Reparto carne
Reparto pane, pasticceria
Reparto salumi, formaggi, Gastronomia
Reparto pesce fresco
Prodotti non food.
-IPER
-NON IPER
Tasso di corretta classificazione
leaves
1
3
4
5
6
7
8
9
10
11
12
13
13
14
15
Dimensione dell’albero ottimale: 12 nodi terminali
training validation
0,6113
0,6114
0,6438
0,6438
0,6516
0,6467
0,6826
0,6672
0,6905
0,6792
0,6995
0,6815
0,7033
0,6815
0,6930
0,6866
0,7021
0,6889
0,7059
0,6889
0,7046
0,6900
0,7084
0,6900
0,7084
0,6900
0,7084
0,6900
0,7084
0,6900
Matrice di confusione
IPER
NON
IPER
Totale
IPER
417
265
682
23.76% 15.10% 38.86%
NON
IPER
279
794
1073
15.90% 45.24% 61.14%
Totale
696
1059
39.66% 60.34%
1755
100%
Frequenza valori mancanti=1
Tassi di corretta classificazione
Rappresentazione grafica dell’albero
Variabili esplicative maggiormente
influenti sulla variabile target
VARIABLE
NODES
S_PESCE
S_ASSORTIMENTO
S_PROMOZIONI
S_PREZZI
S_PERSONALE
Variabile target: CANALE
1
2
2
1
1
IMPORTANCE
1,000
0,826
0,464
0,314
0,265
variabili indipendenti: PUNTEGGI SODDISF.
SERV. DISTRIB.E RELATIVE VARIAZ.
Descrizione dei nodi terminali
NODO
DESCRIZIONE NODO
%IPER
%NON IPER
Numerosità
NODO
1
Unità con bassa soddisfazione per assortimento ed
una media-bassa soddisfazione per pesce
33%
67%
570
2
Unità con media-alta soddisfazione per le promozioni
ed un’alta soddisfazione per pesce
61%
39%
700
3
Unità con bassa soddisfazione per le promozioni ed
un’alta soddisfazione per pesce
37%
63%
121
4
Unità con una media soddisfazione per l’assortimento
la cui soddisfazione per pesce non è nota
18%
81%
402
5
Unità con bassa soddisfazione per l’assortimento la cui
soddisfazione per pesce non è nota
6%
94%
662
6
Unità con alta soddisfazione per i prezzi, per
l’assortimento ma medio-bassa per pesce
78%
22%
190
……continua
Descrizione dei nodi terminali
7
Unità con una media soddisfazione per i prezzi, alta per
l’assortimento e medio-bassa per pesce
68%
32%
162
8
Unità con bassa soddisfazione per i prezzi, alta per
l’assortimento e medio-bassa per pesce
44%
56%
82
9
Unità con media soddisfazione per le promozioni e per
l’assortimento e medio-bassa per pesce
55%
45%
378
10
Unità con alta/bassa soddisfazione per le promozioni, media
per l’assortimento e medio-bassa per pesce
40%
60%
292
11
Unità con alta soddisfazione per il personale, per
l’assortimento e con soddisfazione per pesce non nota
28%
71%
277
12
Unita con medio-bassa soddisfazione per il personale, alta
per l’assortimento e con soddisfazione per pesce non nota
54%
46%
128
Variabile target: CANALE
variabili indipendenti: PUNTEGGI SODDISF.
SERV. DISTRIB.E RELATIVE VARIAZ.
SEGMENTAZIONE:
VARIABILE TARGET CANALE
VARIABILI INDIPENDENTI COOP
Variabile target: CANALE con modalità -IPER
-NON IPER
Variabili indipendenti:
-
Canale di vendita
Socio/non socio
Insegna
Numero soci in famiglia
Preferenza su Coop
Area di acquisto
Tasso di corretta classificazione
leaves
1
3
4
5
6
7
8
9
10
Numero di foglie ottimale
training validation
0,6113
0,6114
0,6428
0,6456
0,6428
0,6456
0,7023
0,6963
0,7056
0,7117
0,7056
0,7117
0,7056
0,7117
0,7056
0,7117
0,7056
0,7117
Matrice di confusione
IPER
NON
IPER
Totale
IPER
375
307
682
21.37% 17.49% 38.86%
NON
IPER
199
874
1073
11.34% 49.80% 61.14%
Totale
574
1181
32.71% 67.29%
1755
100%
Frequenza valori mancanti=1
Tassi di corretta classificazione
Rappresentazione grafica dell’albero
-1-
-3-
-5-
-2-
-4-
-6-
Variabile target: CANALE
variabili indipendenti: COOP
Variabili esplicative maggiormente
influenti sulla variabile target
VARIABLE
ZONA
INSEGNA
SOCIO_
Variabile target: CANALE
NODES
IMPORTANCE
1
1,000
1
0,557
1
0,523
variabili indipendenti: COOP
Descrizione nodi terminali
NODO
1
2
DESCRIZIONE NODO
Unità che frequentano punti vendita in
Romagna-Marche
Unità che frequentano PV in Veneto
%IPER
%NON IPER
Numerosità
NODO
29%
71%
1308
16%
84%
653
3
Unità che scelgono altre insegne e che
frequentano PV di Bologna
30%
70%
239
4
Unità che frequentano PV di Bologna di cui
non è nota la preferenza per l’insegna
2%
98%
147
5
Unità non soci che frequentano PV Coop a
Bologna
49%
51%
435
66%
34%
1182
6
Unità soci che frequentano PV Coop a Bologna
Variabile target: CANALE
variabili indipendenti: COOP
Confronto tra modelli
name
target
Target
event
Root ASE
Valid: root ASE
CANALE_TUTTE
canale
non iper
0,424182
0,427693
CANALE_COOP
canale
non iper
0,444124
0,445294
CANALE_SODDISF
canale
non iper
0,437022
0,445671
CANALE_DEMOG
canale
non iper
0,462142
0,460323
il modello canale_demog presenta un errore superiore agli altri
modelli considerati
Confronto tra modelli
name
target
Target
event
Misclassification
Rate
Valid:
Misclassification Rate
CANALE_TUTTE
canale
non iper
0,265893
0,259259
CANALE_COOP
canale
non iper
0,264399
0,288319
CANALE_SODDISF
canale
non iper
0,295409
0,309972
CANALE_DEMOG
canale
non iper
0,344097
0,336182
i modelli canale_coop e canale_soddisf presentano un tasso di errata
classificazione pressoché simile a quello del modello completo
canale_tutte
Confronto tra modelli
Confrontando le curve, nel
primo decile i modelli
canale_tutte e
canale_soddisf hanno un
potere di classificazione
migliore rispetto agli altri
due modelli.
Dal quinto all’ottavo decile
il modello canale_coop
acquisisce un potere di
classificazione superiore
rispetto al modello
canale_soddisf.
Confronto tra modelli
La funzione lift
evidenzia che i modelli
canale_tutte e
canale_soddisf
consentono di
ottenere un
miglioramento rispetto
ad una classificazione
casuale delle unità
(baseline).
Secondo livello di analisi
dataset NON IPER
variabile target SOCIO
Segmentazione con tutte le variabili
Variabile target: SOCIO modalità - SI
- NO
Variabili indipendenti:
- Variabili Socio-demografiche ed economiche
- Punteggi di soddisfazione sul servizio di distribuzione
e relative variazioni
- Variabili “Coop”
Tasso di corretta classificazione
Leaves Training Validation
1 0,5705
0,5472
2 0,7953
0,7741
3 0,8300
0,8112
4 0,8619
0,8484
5 0,8619
0,8484
6 0,8619
0,8484
7 0,8619
0,8484
8 0,8619
0,8484
9 0,8619
0,8484
10 0,8619
0,8484
11 0,8619
0,8484
12 0,8619
0,8484
la dimensione dell’albero che ottimizza il tasso di corretta classificazione è
pari a 5 foglie
Matrice di confusione
NO
SI
Totale
NO
329
146
475
31.36% 13.92% 45.28%
SI
13
561
574
1.24% 53.48% 54.72%
Totale
342
707
32.60% 67.40%
1049
100%
Tassi di corretta classificazione
Rappresentazione grafica dell’albero
-1-
-2-
-3-
-4-
-5-
Variabile target: SOCIO per canale di vendita NON IPER
Variabili esplicative maggiormente
influenti sulla variabile target
Variable
INSEGNA
PRIMO_PV
Nodes Importance
1
1.000
2
0,611
Variabile target: SOCIO per canale di vendita NON IPER
Descrizione nodi terminali
NODO
DESCRIZIONE
% SOCI
% NON SOCI
Numerosità
NODO
1
Unità di cui non si conosce il valore per
la variabile insegna
7%
93%
276
2
Unità che frequentano come primo PV
Coop
81%
19%
1591
3
Unità che non frequentano come primo
PV Coop
11%
89%
100
4
Unità che frequentano come primo PV
altre insegne
0%
100%
395
5
Unità che non frequentano come primo
PV altre insegne
100%
0%
85
Variabile target: SOCIO per canale di vendita NON IPER
Segmentazione con
variabili socio-demografiche ed economiche
Variabile target: SOCIO con modalità - SI
Variabili indipendenti:
-
Sesso
Età
Professione
Titolo di studio
Stato civile
Area di acquisto
Numero componenti famiglia
Numero minorenni
Numero percettori reddito
Numero occupati
Numero auto possedute
- NO
Tasso di corretta classificazione
LeavesTrainingValidation
1 0,5705 0,5472
3 0,5783 0,5806
4 0,5938 0,5796
5 0,5783 0,5806
6 0,5938 0,5796
l’albero si arresta a tre nodi terminali
Matrice di confusione
NO
SI
Totale
NO
223
252
475
21.26% 24.02% 45.28%
SI
188
386
574
17.92% 36.80% 54.72%
Totale
411
638
39.18% 60.82%
1049
100%
Tassi di corretta classificazione
Rappresentazione grafica dell’albero
-1-
-2-
-3-
Variabile target: SOCIO per canale di vendita NON IPER e variabili indipendenti
SOCIO-DEMOGRAFICHE ED ECONOMICHE
Descrizione dei nodi terminali
NODO
DESCRIZIONE
% SOCI
% NON
SOCI
Numerosità
NODO
1
Unità che frequentano PV in zona Bologna
49%
51%
959
2
Unità che frequentano PV in zona
Romagna-Marche
60%
40%
957
3
Unità che frequentano PV in zona Veneto
66%
34%
531
L’ unica variabile utilizzata nella costruzione dell’albero è ZONA
Segmentazione con variabili relative alla
soddisfazione
Variabile target: SOCIO con modalità -SI
Variabili indipendenti:
-
-NO
Generale
Prezzi
Promozioni
Assortimento
Personale, servizio
Pulizia, igiene
Qualità prodotti freschi
Reparto ortofrutta
Reparto carne
Reparto pane, pasticceria
Reparto salumi, formaggi, Gastronomia
Reparto pesce fresco
Prodotti non food
Tasso di corretta classificazione
Leaves Training Validation
1 0,5705
0,5472
3 0,6485
0,6730
4 0,6485
0,6730
5 0,6510
0,6816
6 0,6510
0,6816
7 0,6653
0,6902
8 0,6678
0,6902
9 0,6678
0,6902
10 0,6678
0,6902
11 0,6678
0,6902
12 0,6676
0,6864
dimensione ottimale dell’albero: 8 nodi terminali
Matrice di confusione
NO
SI
Totale
NO
244
231
475
23.26% 22,02% 45.28%
SI
94
480
574
8.96% 45.76% 54.72%
Totale
338
711
32.22% 67.78%
1049
100%
Tassi di corretta classificazione
Rappresentazione grafica dell’albero
-1-
-2-
-3-
-4-
-5-
-6-
-7-
-8-
Variabili esplicative maggiormente
influenti sulla variabile target
Variable
Nodes Importance
S_GENERALE
1
1,0000
S_PROMOZIONI
1
0,6970
V_PESCE
1
0,5290
S_CARNE
1
0,3520
Variabile target: SOCIO per canale di vendita NON IPER e variabili indipendenti
di SODDISFAZIONE
Descrizione nodi terminali
NODO
DESCRIZIONE
% SOCI
% NON
SOCI
Numerosità
NODO
1
Unità con alta soddisfazione per le promozioni ed una
soddisfazione generale medio-alta
76%
24%
544
2
Unità con medio-bassa soddisfazione per le promozioni ed
una soddisfazione generale medio-alta
64%
36%
946
3
Unità con soddisfazione per le promozioni non nota ed una
soddisfazione generale medio-alta
40%
60%
30
4
Unità per le quali la soddisfazione per pesce è migliorata e
che presentano bassa soddisfazione generale ed una
soddisfazione generica per carne
38%
62%
93
5
Unità per le quali la soddisfazione per pesce è peggiorata e
che presentano bassa soddisfazione generale ed una
soddisfazione generica per carne
47%
53%
426
6
Unità per le quali la variazione di soddisfazione per pesce non
è nota e che presentano bassa soddisfazione generale ed una
soddisfazione generica per carne
62%
38%
165
7
Unità di cui non è nota la soddisfazione per carne, con bassa
soddisfazione generale
26%
74%
94
8
Unità con soddisfazione generale non nota
4%
96%
149
Segmentazione con variabili coop
Variabile target: SOCIO con modalità - SI
- NO
Variabili indipendenti:
-
Canale di vendita
Insegna
Numero soci in famiglia
Preferenza su Coop
Area di acquisto
Tasso di corretta classificazione
LeavesTraining Validation
1 0,5705
0,5472
3 0,7953
0,7741
4 0,8300
0,8112
5 0,8619
0,8484
6 0,8271
0,8112
7 0,8619
0,8484
l’albero si arresta a cinque nodi terminali
Matrice di confusione
NO
SI
Totale
NO
329
146
475
31.36% 13.92% 45.28%
SI
13
561
574
1.24% 53.48% 54.72%
Totale
342
707
32.60% 67.40%
1049
100%
Tassi di corretta classificazione
Rappresentazione grafica dell’albero
-1-
-2-
-3-
-4-
-5-
Variabile target: SOCIO per canale di vendita NON IPER e variabili indipendenti
COOP
Variabili esplicative maggiormente
influenti sulla variabile target
Variable
Nodes
Importance
INSEGNA
1
1,0000
PRIMO_PV
2
0,6110
Variabile target: SOCIO per canale di vendita NON IPER e variabili indipendenti
COOP
Descrizione nodi terminali
NODO
DESCRIZIONE
% SOCI
% NON SOCI
Numerosità
NODO
7%
93%
276
1
Unità di cui non è nota la preferenza per insegna
2
Unità il cui primo PV è Coop
81%
19%
1591
3
Unità il cui primo PV non è Coop
11%
89%
100
4
Unità il cui primo PV è rappresentato da altre insegne
0%
100%
395
5
Unità il cui primo PV non è rappresentato da altre
insegne
100%
0%
85
Variabile target: SOCIO per canale di vendita NON IPER e variabili indipendenti
COOP
Confronto tra modelli
name
target
Target event
Root
ASE
Valid:
root ASE
SOCIO_COOP
socio
si
0.3356
0.3473
SOCIO_SODDIS
socio
si
0.4591
0.4582
SOCIO_DEMO
socio
si
0.4903
0.4925
SOCIO_TUTTE
socio
si
0.3356
0.3473
il modello socio_demog presenta un errore superiore agli altri
modelli considerati
Confronto tra modelli
name
target
Target event
Misclassification
Rate
Valid:
Misclassification
Rate
SOCIO_COOP
socio
si
0.1381
0.1515
SOCIO_SODDIS
socio
si
0.3322
0.3098
SOCIO_DEMO
socio
si
0.4217
0.4194
SOCIO_TUTTE
socio
si
0.1381
0.1515
il modello socio_coop presenta un tasso di errata classificazione
corrispondente a quello del modello completo socio_tutte, a conferma dei
risultati ottenuti nella costruzione degli alberi
Confronto tra modelli
Confrontando le
curve, i modelli
socio_tutte e
socio_coop hanno il
medesimo potere di
classificazione (le
curve sono
sovrapposte),
superiore rispetto agli
altri due modelli.
Confronto tra modelli
La funzione lift
evidenzia che i modelli
socio_tutte e
socio_coop (curve
sovrapposte)
consentono di
ottenere un
miglioramento rispetto
ad una classificazione
casuale delle unità
(baseline).
Scarica

Chaid - Bravo, Facchini, Gagliardi