STUDIO DI CASI (seconda parte) Argomenti della lezione Impiego degli alberi decisionali: Indagine sugli acquirenti di automobili nuove Analisi del ricordo della pubblicità televisiva Caso I Variabile dipendente: disponibilità a comprare di nuovo la stessa marca. 4364 interviste telefoniche Variabili predittive casa costruttrice qualità complessiva della nuova auto Variabili predittive sequenza dei guasti caratteristiche sociodemografiche degli intervistati Metodo di costruzione dell'albero: Automatic Interction Detection (il criterio di disomogeneità è la devianza) Y=0,27 n=4.364 Qualità complessiva della nuova auto Da pessima a soddisfacente Da sufficiente a eccellente Y=0,10 Y=0,32 n=1.012 n=3.352 Nr. totale di guasti Età Da 0 a 6 7 o più Y=0,13 n=372 Y=0,05 n=640 Fino a 34 anni Y=0,25 n=1.682 35 anni o più Y=0,39 n=1.670 Numero totale di guasti Da 0 a 3 4 o più Y=0,44 Y=0,30 n=1.046 n=624 Qualità complessiva della nuova auto Eccellente Sufficiente o buona Y=0,52 Y=0,40 n=340 n=706 Casa costruttrice General Motors o Ford Altre Y=0,68 Y=0,43 n=130 n=210 Commento La variabile criterio assume il valore più elevato (y =0,68) se: la marca attuale è General Motors o Ford la qualità complessiva dell'auto è valutata eccellente La variabile criterio assume il valore più elevato (y =0,68) se: si sono verificati non più di tre guasti il proprietario ha più di 35 anni Al contrario, il valore più basso della variabile dipendente (y = 0,05) si ha se: si sono verificati sette o più guasti la qualità complessiva dell'auto è giudicata insoddisfacente o pessima Caso II Variabile dipendente ricordo della pubblicità televisiva di una marca di caffè Interviste telefoniche Variabili predittive: classe di età sesso professione Analisi dei risultati per la Marca 1 Marca 1 2=0,59 n=3895 134 2=2,11 n=665 25 - 8 2=0,28 n=3230 1 2=0,64 n=783 1-6 2=0,00 n=481 7 2=3,09 n=162 2 2=0,16 n=2447 8 2=0,00 n=140 Il segmento con il tasso di ricordanti più alto è il segmento 3. Costituisce il 4,02% dei ricordanti una qualsiasi pubblicità di caffè e presenta un tasso di ricordanti la pubblicità della Marca 1 del 3,09%, pari a cinque volte il tasso medio riscontrato Gain chart relativa ai ricordanti della Marca 1 Gruppo Numerosità Peso % Variabile criterio Indice 3 162 4,2 3,09 523 1 665 17,1 2,11 357 5 2447 62,8 0,16 28 2 481 12,3 0,00 0 4 140 3,6 0,00 0 Emerge come la pubblicità della Marca 1 venga ricordata soprattutto da persone che siano studenti o che svolgono professioni che richiedono, in generale, un'elevata scolarità Analisi dei ricordanti per la Marca 2 Marca 2 2=73,32 n=3895 1-4 2=81,36 n=810 5 2=71,80 n=695 1 2=63,51 n=222 6 2=76,75 n=728 2 2=75,69 n=473 14578 2=65,91 n=176 26 2=81,48 n=297 78 2=68,59 n=1662 Gains chart dei ricordanti la pubblicità della Marca 2 Gruppo Numerosità Peso % Variabile criterio Indice 4 297 7,6 81,48 111 1 810 20,8 81,36 111 5 728 18,7 76,65 105 6 1662 42,7 68,59 94 3 176 4,5 65,91 90 2 222 5,7 63,51 87 Si può concludere che la pubblicità della Marca 2 è ricordata soprattutto da giovani sotto i 35 anni e che la percentuale di ricordanti non varia significativamente considerando professioni e sessi diversi, ma varia per lo più al variare dell'età Argomenti del corso Sistema informativo aziendale Data warehouse e data mining Metodi statistici per il data mining Studio di casi