STUDIO DI CASI
(seconda parte)
Argomenti della lezione
 Impiego degli alberi
decisionali:
 Indagine sugli acquirenti di
automobili nuove
 Analisi del ricordo della pubblicità
televisiva
Caso I
Variabile dipendente:
disponibilità a comprare
di nuovo la stessa marca.
4364 interviste telefoniche
Variabili predittive
 casa costruttrice
 qualità complessiva
della nuova auto
Variabili predittive
 sequenza dei guasti
 caratteristiche
sociodemografiche degli
intervistati
Metodo di costruzione
dell'albero:
Automatic Interction
Detection
(il criterio di disomogeneità
è la devianza)
Y=0,27
n=4.364
Qualità complessiva della nuova auto
Da pessima a
soddisfacente
Da sufficiente a
eccellente
Y=0,10
Y=0,32
n=1.012
n=3.352
Nr. totale di guasti
Età
Da 0 a 6
7 o più
Y=0,13
n=372
Y=0,05
n=640
Fino a
34 anni
Y=0,25
n=1.682
35 anni
o più
Y=0,39
n=1.670
Numero totale di guasti
Da 0 a 3
4 o più
Y=0,44
Y=0,30
n=1.046
n=624
Qualità complessiva della nuova auto
Eccellente
Sufficiente o buona
Y=0,52
Y=0,40
n=340
n=706
Casa costruttrice
General Motors o Ford
Altre
Y=0,68
Y=0,43
n=130
n=210
Commento
La variabile criterio
assume il valore più
elevato (y =0,68) se:
 la marca attuale è General
Motors o Ford
 la qualità complessiva
dell'auto è valutata eccellente
La variabile criterio
assume il valore più
elevato (y =0,68) se:
 si sono verificati non più
di tre guasti
 il proprietario ha più di 35
anni
Al contrario, il valore più
basso della variabile
dipendente (y = 0,05) si ha se:
 si sono verificati sette o più
guasti
 la qualità complessiva
dell'auto è giudicata
insoddisfacente o pessima
Caso II
Variabile dipendente
ricordo della pubblicità
televisiva di una marca
di caffè
Interviste telefoniche
Variabili predittive:

classe di età

sesso

professione
Analisi dei
risultati per la
Marca 1
Marca 1
2=0,59
n=3895
134
2=2,11
n=665
25 - 8
2=0,28
n=3230
1
2=0,64
n=783
1-6
2=0,00
n=481
7
2=3,09
n=162
2
2=0,16
n=2447
8
2=0,00
n=140
Il segmento con il tasso di
ricordanti più alto è il segmento 3.
Costituisce il 4,02% dei ricordanti
una qualsiasi pubblicità di caffè e
presenta un tasso di ricordanti la
pubblicità della Marca 1 del 3,09%,
pari a cinque volte il tasso medio
riscontrato
Gain chart relativa
ai ricordanti della
Marca 1
Gruppo Numerosità Peso % Variabile
criterio
Indice
3
162
4,2
3,09
523
1
665
17,1
2,11
357
5
2447
62,8
0,16
28
2
481
12,3
0,00
0
4
140
3,6
0,00
0
Emerge come la pubblicità
della Marca 1 venga ricordata
soprattutto da persone che
siano studenti o che svolgono
professioni che richiedono, in
generale, un'elevata scolarità
Analisi dei
ricordanti per la
Marca 2
Marca 2
2=73,32
n=3895
1-4
2=81,36
n=810
5
2=71,80
n=695
1
2=63,51
n=222
6
2=76,75
n=728
2
2=75,69
n=473
14578
2=65,91
n=176
26
2=81,48
n=297
78
2=68,59
n=1662
Gains chart dei
ricordanti la
pubblicità della
Marca 2
Gruppo Numerosità Peso % Variabile
criterio
Indice
4
297
7,6
81,48
111
1
810
20,8
81,36
111
5
728
18,7
76,65
105
6
1662
42,7
68,59
94
3
176
4,5
65,91
90
2
222
5,7
63,51
87
Si può concludere che la pubblicità
della Marca 2 è ricordata
soprattutto da giovani sotto i 35
anni e che la percentuale di
ricordanti non varia
significativamente considerando
professioni e sessi diversi, ma varia
per lo più al variare dell'età
Argomenti del corso
 Sistema informativo aziendale
 Data warehouse e data mining
 Metodi statistici per il data
mining
 Studio di casi
Scarica

lezione 7