MODELLO DI SCELTA DEL PIANO TELEFONICO FISSO Giulia Bravo Valeria Carloni Andrea Coralli Elena Santi OBIETTIVO stimare le probabilità di scelta di diversi piani telefonici fissi presenti sul mercato, a partire dal comportamento di un campione di famiglie DATI • 434 famiglie residenti in Pennsylvania (USA), suddivise in 5 aree urbane: » » » » » Suburbana Metropolitana Perimetrale con servizio esteso Perimetrale senza servizio esteso Non metropolitana » » » » » BM a misura fissa SM a misura variabile LF tariffa locale EF tariffa estesa MF tariffa metropolitana • Variabile dipendente (CHOICE-piani telefonici): • Variabili esplicative (COST): costo mensile del piano telefonico in $ Frequenze d’uso dei piani telefonici effettivamente osservate nel campione 13% 1% 17% BM SM LF EF MF 41% La maggior parte degli intervistati utilizza il piano ‘LF’ 28% Solo l’1% del campione utilizza ‘EF’ Tabella di name_choice per area area(area) name_choice 1 2 3 4 5 Totale bm 13 3.00 17.81 13.40 22 5.07 30.14 14.01 2 0.46 2.74 15.38 2 0.46 2.74 15.38 34 7.83 46.58 22.08 73 16.82 ef 0 0.00 0.00 0.00 0 0.00 0.00 0.00 3 0.69 100.00 23.08 0 0.00 0.00 0.00 0 0.00 0.00 0.00 3 0.69 lf 29 6.68 16.29 29.90 84 19.35 47.19 53.50 3 0.69 1.69 23.08 5 1.15 2.81 38.46 57 13.13 32.02 37.01 178 41.01 mf 16 3.69 28.07 16.49 35 8.06 61.40 22.29 4 0.92 7.02 30.77 2 0.46 3.51 15.38 0 0.00 0.00 0.00 57 13.13 sm 39 8.99 31.71 40.21 16 3.69 13.01 10.19 1 0.23 0.81 7.69 4 0.92 3.25 30.77 63 14.52 51.22 40.91 123 28.34 97 22.35 157 36.18 13 3.00 13 3.00 154 35.48 434 100.00 Totale Distribuzione per area di residenza dei piani telefonici ANALISI EFFETTUATE • Stima del modello Multinomial Logit per ogni famiglia, rispetto a ciascun piano telefonico disponibile • Suddivisione del dataset in due parti,basandosi sui valori assunti dalla variabile choice: –BM Dataset ‘Minute’ –SM –LF –EF –MF Dataset ‘Flat’ – Stima del modello Nested Logit per piani distinti 1.MULTINOMIAL LOGIT VBM = bBM + bC ln (costoBM) VSM = bSM + bC ln (costoSM) VLF = bLF + bC ln (costoLF) VEF = bEF + bC ln (costoEF) VMF = bC ln (costoMF) eVj P(i| C) Vj e jC i=1,2,3,…,434 famiglie jC piani tariffari Stime modello Multinomial Logit TEST DEL RAPPORTO DI VEROSIMIGLIANZA test H0: b=0 test Chi-Square DF Pr > ChiSq Likelihood Ratio 165,3854 5 <,0001 Score 151,686 5 <,0001 Wald 114,8514 5 <,0001 SIGNIFICATIVITA’ DEI PARAMETRI variabile DF stima se Chi-Square Pr>ChiSq b_costo 1 -2,0262 0,2138 89,7616 <0,0001 b_bm 1 -2,4576 0,3133 61,5250 <0,0001 b_sm 1 -1,7364 0,2763 39,4831 <0,0001 b_lf 1 -0,5351 0,2081 6,6114 0,0101 b_ef 1 -0,7372 0,7233 1,0386 0,3081 I parametri sono tutti significativi tranne quello riferito al piano ‘EF’ Stime modello Multinomial Logit maximum likelihood iteration history iter ridge log_likelihood b_costo 0,0000 b_bm b_sm 0,0000 0,0000 b_lf 0,0000 b_ef 0 0 -560,2496 0,0000 4 0 -477,5569 -2,0262 -2,4576 -1,7364 -0,5351 -0,7372 A partire dalla variazione della stima della massima verosimiglianza tra la prima e l’ultima iterazione si calcola la BONTA’ DI ADATTAMENTO DEL MODELLO : 2=0,15 2.MODELLO NESTED LOGIT Probabilità per la famiglia i-esima di scegliere i piani Minute (M) e Flat (F), con rispettivi inclusive value (valori complessivi per le alternative annidate) e vj P(i | M) vj e ∑ j∈M e vj P(i | F) ∑e vj j∈F IM ln(eVBM eVSM ) VLF IF ln(e VEF e e VMF ) 1.MULTINOMIAL LOGIT – probabilità di scelta dei rispettivi piani tariffari prob_bm prob_sm prob_ef prob_lf prob_mf 0,1682 0,2835 0,0069 0,4101 0,1313 Probabilità calcolate sul totale delle famiglie appartenenti al campione Il piano telefonico con maggiore probabilità di scelta è l’LF Stime modello Nested Logit – piano Minute TEST DEL RAPPORTO DI VEROSIMIGLIANZA test H0: b=0 test Chi-Square DF Pr > ChiSq Likelihood Ratio 38,0438 2 <,0001 Score 36,0952 2 <,0001 Wald 32,2707 2 <,0001 SIGNIFICATIVITA’ DEI PARAMETRI variabile DF stima se Chi-Square Pr>ChiSq b_costo 1 -3,1223 0,6560 22,6498 <0,0001 b_sm 1 0,7609 0,1680 20,4973 <0,0001 I parametri sono tutti significativi Stime modello Nested Logit – piano Minute maximum likelihood iteration history iter ridge log_likelihood b_costo b_sm 0 0 -135,8568 0,0000 0,0000 3 0 -116,8349 -3,1223 0,7609 BONTA’ DI ADATTAMENTO DEL MODELLO : 2=0,14 2.MODELLO NESTED LOGIT – probabilità di scelta piani Minute prob_min_bm prob_min_sm 0,3486 0,6514 Probabilità calcolate sul totale delle famiglie appartenenti al campione Il modello Nested Logit attribuisce,all’interno dei piani tariffari ‘a minuto’,una maggiore probabilità di scelta ad ‘SM’ Stime modello Nested Logit – piano Flat TEST DEL RAPPORTO DI VEROSIMIGLIANZA test H0: b=0 test Chi-Square DF Pr > ChiSq Likelihood Ratio 100,1645 3 <,0001 Score 80,9243 3 <,0001 Wald 53,7113 3 <,0001 SIGNIFICATIVITA’ DEI PARAMETRI variabile DF stima se Chi-Square Pr>ChiSq b_costo 1 -3,7305 0,5997 38,6941 <0,0001 b_lf 1 -1,2075 0,3809 10,0484 0,0015 b_ef 1 -1,4204 0,9144 0,4127 0,1204 I parametri sono tutti significativi tranne quello riferito al piano ‘EF’ Stime modello Nested Logit – piano Flat maximum likelihood iteration history iter ridge log_likelihood 0 0 5 0 b_costo b_lf b_ef 0,0000 0,0000 0,0000 -79,4320 -3,7305 -1,2075 -1,4204 -129,5143 BONTA’ DI ADATTAMENTO DEL MODELLO : 2=0,39 Tra tutti i modelli stimati, il Nested Logiot per i piani ‘a Tariffa’ è quello che si adatta meglio ai dati disponibili 2.MODELLO NESTED LOGIT – probabilità di scelta piani Flat prob_flat_ef prob_flat_lf prob_flat_mf 0,0091 0,7780 0,2129 Probabilità calcolate sul totale delle famiglie appartenenti al campione Il modello Nested Logit attribuisce,all’interno dei piani tariffari ‘a tariffa’,una maggiore probabilità di scelta ad ‘LF’ 3.MODELLO PER L’ALTERNATIVA TIPO DI PIANO Stima delle seguenti probabilità di scelta: eVM P(M) VM e eVF Probabilità di scelta del piano Minute eVF P(F) VM e eVF Probabilità di scelta del piano Flat dove: VM= bM+IM VF = IF IM ed IF sono gli IN CLUSIVE VALUE per Minute e Flat con stima compresa tra 0 e 1 Stima modello per tipo di piano TEST DEL RAPPORTO DI VEROSIMIGLIANZA test H0: b=0 test Chi-Square DF Pr > ChiSq Likelihood Ratio 40,8802 2 <,0001 Score 36,9278 2 <,0001 Wald 32,1325 2 <,0001 SIGNIFICATIVITA’ DEI PARAMETRI variabile DF stima se Chi-Square Pr>ChiSq incl_v 1 0,4319 0,0787 30,1269 <0,0001 b_m 1 -2,3160 0,4086 32,1320 <0,0001 I parametri sono tutti significativi Stima modello per tipo di piano maximum likelihood iteration history iter ridge log_likelihood incl_v b_m 0,0000 0 0 -300,8258 0,0000 3 0 -280,3858 0,4319 -2,3160 BONTA’ DI ADATTAMENTO DEL MODELLO : 2=0,07 3.MODELLO PER L’ALTERNATIVA TIPO DI PIANO – probabilità di scelta Minute/Flat prob_Minute prob_Flat 0,451609065 0,548390935 Probabilità calcolate sul totale delle famiglie appartenenti al campione Il modello attribuisce una maggiore probabilità di scelta ai piani telefonici ‘a Tariffa’ anche se la differenza tra i due valori rilevati non è elevata Confronto tra modelli nested 2 mnl minute flat tipo_piano 0,15 0,14 0,39 0,07 Tutti i modelli stimati presentano un indicatore di bontà molto basso, probabilmente dovuto al fatto che la variabile ‘cost’ utilizzata non è sufficientemente esplicativa del fenomeno analizzato. fine