Esempio: Obiettivo Misura del costo economico - monetizzabile - che una famiglia deve sostenere per la presenza di un figlio Diversi problemi nella misura: Non si dispone di rilevazioni dirette sul consumo individuale. Ma anche se ci fossero….. Non è banale definire le spese effettuate per un figlio Quali beni devono essere considerati ? Come trattare le spese indivisibili ? E poi…. Vi sono RIALLOCAZIONI nella spesa famigliare La composizione della spesa famigliare è influenzata dalla presenza di figli, quindi Il tenore di vita è modificato Non basta confrontare le spese di nuclei con e senza figli Il costo dei figli ha una componente di costo-ombra Qualche dato 2011 Spesa media mensile famigliare: Coppia (fino a 64 anni) : 2.716 € Coppia con 1 figlio : 2.960 € Dovremmo concludere che un figlio costa 2.960 – 2.716 = 244 € al mese ?? Ovviamente no, perché Spesa media mensile pro-capite: Coppia : 2.716 / 2 = 1.358 € Coppia con 1 figlio : 2.960 / 3 = 987 € Cioè ciascun componente ha meno soldi a disposizione E’ EVIDENTE CHE UN FIGLIO RIDUCE IL TENORE DI VITA DEI SINGOLI Una prima (ingenua) valutazione del costo (reale+ombra) sarebbe: 987 A cui si fa fronte aumentando la spesa totale: + 244 e riducendo i consumi della coppia : ((1358-987)x2)= 371 x 2 = 742 Una valutazione ingenua: perché? Perché implica che il costo del figlio sia identico a quello di un adulto, cioè si nega una valutazione autonoma del costo. Il problema si risolverebbe se avessimo a disposizione una misura del “tenore di vita” complessivo della famiglia In quel caso potremmo valutare di quanto il figlio abbassa il tenore di vita (del nucleo e non dei comèponenti) e quindi arrivare ad una valutazione del costo-ombra. E’ necessaria una valutazione indiretta che assuma uno schema teorico, un modello . Misura del costo ombra Misura della variazione del tenore di vita Legge di Engel (1895) - Versione Deaton-Muellbauer (1980) Scale di equivalenza Engel in pillole Relazione empirica inversa tra reddito e “spese necessarie” La quota di “spese necessarie” sulla spesa totale è un indicatore del tenore di vita Il costo ombra è l’incremento di reddito necessario per mantenere lo stesso tenore di vita prima e dopo l’arrivo di un figlio Una regolarità empirica Torniamo ai dati: 2011 Spesa media mensile famigliare: (CO) Coppia (fino a 64 anni) : 2.716 € (CF) Coppia con 1 figlio : 2.960 € % alimentare= 17% % alimentare= 19% Quanto dovrebbe spendere CF per avere lo stesso tenore di vita di CO ? Cioè di quanto dovrebbe aumentare la spesa di CF per portare il peso delle spese alimentari al 14% ? Risposta: 2960 : X = 17 : 19 cioè X=(2.960x19) / 17 = 3.308 € CF non modificherebbe il suo tenore di vita se spendesse 3.308 €, cioè 592 € in più di CO o il 20% in più 592 € mensili è il costo-ombra cercato, cioè il costo del figlio! A questo si fa fronte con maggiore spesa (+244 €) e riduzione del tenore di vita (-348 €) NATURALMENTE STESSI RISULTATI SUL PRO-CAPITE Qualche complicazione La legge di Engel descrive una relazione tra quota di spesa “necessaria e reddito. Ma , naturalmente, la quota di spesa necessaria non è solo infuenzata dl reddito, contano anche le abitudini, il titolo di studio, la zona di residenza, l’età della coppia e del figlio…… Ci sono fattori di disturbo, che disturbano la relazione col reddito che rimane la chiave per il calcolo del costo-ombra Come si fa? Si esplicitano questi fattori nella relazione e si misura la loro influenza, in modo da depurare l’elasticità consumo reddito dalle componenti che riguardano il tenore di vita 1. Modello (ad esempio modello di selezione alla Heckmann) 2. Propensity scores 3. …….. Esempio: Confronto tra la quota di spesa alimentare sulla spesa totale per 2 gruppi di famiglie Coppie senza figli e Coppie con un figlio da 0 a 6 anni Le caratteristiche (le X) dei gruppi di famiglie Composizione per genere della persona di riferimento Composizione per circoscrizione 100 40 90 35 80 30 60 20 % percentuale 70 25 50 40 15 30 10 20 5 10 0 0 NW NE Centro no figli Sud-isole Uomo 1 figlio Donna no figli Composizione per età della persona di riferimento 1 figlio Composizione per titolo di studio della persona di riferimento 40 60 35 50 30 40 20 % % 25 30 15 20 10 10 5 0 25-29 30-34 35-39 no figli 1 figlio 40-44 45-49 0 post-laurea laurea no figli 1 figlio Diploma Continua differenza …. Composizione per numero di stanze della casa 40 35 Test differenza tra proporzioni 30 % 25 20 15 10 5 0 fino a 2 3 stanze 4 stanze no figli 5 stanze 6 stanze e più 1 figlio NW NE Centro Sud-isole test 1,879 1,884 1,496 4,750 sig 0,100 0,100 0,137 0,021 test post-laurea 2,700 laurea 1,153 Diploma 0,802 sig 0,057 0,184 0,253 Uomo Donna 3,582 3,582 0,035 0,035 25-29 30-34 35-39 40-44 45-49 1,782 1,963 2,845 1,825 4,077 0,108 0,094 0,052 0,105 0,028 fino a 2 3,761 3 stanze 0,962 4 stanze 0,895 5 stanze 1,797 6 stanze e più 0,620 0,032 0,219 0,233 0,107 0,299 L’effetto delle cratteristiche (le X) sulla quota di spesa Composizione per genere della persona di riferimento Percentuale spese "necessarie" per circoscrizione 30% 35% 25% 30% 20% % percentuale 25% 20% 15% 15% 10% 10% 5% 5% 0% Uomo Donna 0% NW NE Centro no figli no figli Sud-isole 1 figlio 1 figlio Perc. spese "necessarie" per età della persona di riferimento perc. spese "necessarie" per titolo di studio 30% 30% 25% 25% 20% 20% % 35% % 35% 15% 15% 10% 10% 5% 5% 0% 0% 25-29 30-34 35-39 no figli 1 figlio 40-44 45-49 post-laurea laurea no figli 1 figlio Diploma Continua effetto….. perc. Spese "necessarie" per numero di stanze abitazione 40% 35% Test differenza tra medie 30% t % 25% 20% 15% 10% m1 m2 12 n1 5% 22 n2 0% fino a 2 3 stanze 4 stanze no figli 5 stanze 6 stanze e più 1 figlio test-t sig NW -3,513 0,000 NE -0,856 0,392 Centro -1,895 0,059 Sud-isole -3,091 0,002 Uomo Donna -4,945 -4,945 0,000 0,000 25-29 30-34 35-39 40-44 45-49 -2,847 -4,151 -4,064 -1,644 0,308 0,005 0,000 0,000 0,101 0,759 post-laurea laurea Diploma test-t sig -2,143 0,033 -4,463 0,000 -2,960 0,003 fino a 2 -3,651 3 stanze -3,319 4 stanze -2,690 5 stanze -3,847 6 stanze e più -1,695 0,000 0,001 0,007 0,000 0,091 QUINDI: i due gruppi differiscono significativamente per alcune caratteristiche (X) e queste stesse caratteristiche sono correlata con variabile obiettivo (Y) Passo 1. stima del PS mediante logit: Variabili da inserire nel modello logit per il calcolo del propensity score: Circoscrizione, Genere, Età, Titolo di studio, n.di stanze Infatti: 1. Hanno proporzioni diverse nei due gruppi, cioè modificano la probabilità di inclusione 2. Sono correlate con la QUOTA di spese necessarie Il confronto tra i due gruppi è distorto e va “corretto”, almeno per queste variabili I risultati della stima Classification Table variab B S.E. circo NW NE Centro -0,412 -0,467 -0,485 0,134 0,139 0,149 Uomo 0,413 0,153 Età15_1 25-29 30-34 35-39 40-44 cl_titstu1 postlaurea Diploma Stanze Fino a 2 3 stanze 4 stanze 5 stanze 6 e oltre 0,569 0,935 1,030 0,616 -0,314 0,013 -0,730 -0,174 -0,047 0,114 -0,801 0,266 0,221 0,221 0,233 0,158 0,111 0,245 0,172 0,162 0,175 0,308 Wald 17,18 9,50 11,37 10,64 Sig. Exp(B) 0,0006 0,0021 0,0007 0,0011 0,662 0,627 0,616 7,27 0,0070 1,511 29,02 4,57 17,82 21,61 6,97 0,0000 0,0326 0,0000 0,0000 0,0083 5,02 0,0814 3,94 0,0472 0,01 0,9062 14,69 8,87 1,03 0,08 0,42 6,77 0,0054 0,0029 0,3100 0,7744 0,5162 0,0092 Predicted 0 Observed 0 499 1 343 Overall Percentage The cut value is ,500 Perc. Correct 1 367 466 57,6 57,6 57,6 1,766 2,546 2,800 1,851 0,731 1,013 0,482 0,840 0,955 1,121 0,449 Forte sovrapposizione, per noi buon segno, possiamo confrontare unità omogenee I valori “interessanti” sono quelli “off diagonal” Passo 2 stima (dal modello) del PS (probabilità di inclusione) (Prime n famiglie) id 3816 10953 23903 17211 16745 1241 6612 1326 5756 24081 10346 372 11442 22755 21652 20806 19486 11472 9251 15602 22431 17213 17851 1248 285 6590 prop_score 0,13654 0,13019 0,15493 0,14661 0,19279 0,17987 0,17987 0,12673 0,12673 0,16937 0,19241 0,17794 0,17794 0,17794 0,16396 0,18716 0,21828 0,28708 0,22644 0,21040 0,20905 0,29535 0,21696 0,21713 0,29165 0,29165 peso 7,32 7,68 6,45 6,82 5,19 5,56 5,56 7,89 7,89 5,90 5,20 5,62 5,62 5,62 6,10 5,34 4,58 3,48 4,42 4,75 4,78 3,39 4,61 4,61 3,43 3,43 decili della distribuzione del propensity 45% 40% 35% percentuale 30% 25% no filgi 1 figlio 20% 15% 10% 5% 0% 1 2 3 4 decile 5 6 distribuzione del propensity score 45% 40% 35% 30% 25% no filgi 1 figlio 20% 15% 10% 5% 0% 0 1 2 3 4 decili 5 6 7 8 Ricordiamo che il metodo di calcolo del costo è Calcolare la spesa TOTALE “teorica” che una famiglia con figli dovrebbe sostenere per fare in modo che la sua spesa “NECESSARIA” sia una quota della spesa totale pari a quella delle famiglie senza figli. Siano W = ammontare della spesa “necessaria” S = Spesa totale w = W/S = quota di spesa di spesa necessaria S*= Spesa totale teorica SE = scala di equivalenza C = Costo totale Co = Costo “ombra” n (pedice) fam. Senza figli f (pedice) fam con figli Avremo Wf S* S* SE wn Sn C S * Sn Co C ( S f S n ) Metodi di confronto: Media semplice delle differenze di spesa nei decili di probabilità Media ponderata delle differenze di spesa nei decili di probabilità Matching tra ciascuna famiglia con figli e la media del decile di appartenenza Matching tra ciascuna famiglia con figli e la famiglia senza figli con propensity più simile (nearest) costo spesa spesa spesa costo D ombr Costo effettiva SF effettiva 1F teorica S.E. totale spesa a senza propensity 2862 2879 3255 1,13 393 16 376 media semplice decili 2916 2743 3373 1,23 457 -173 630 media ponderata decili 2871 2837 3253 1,15 382 -34 416 match decili 2890 2831 3251 1,15 362 -58 420 match nearest 2874 2831 3156 1,11 281 -43 325 frequenza di utilizzo di famiglie senza figli nell'abbinamento 40% 37% 35% % sul totale di famiglie abbinate 30% 25% 20% casi 17% 13% 15% 10% 7% 5% 7% 4% 5% 1% 2% 3% 1% 1% 11 12 0,4% 0,4% 0,4% 1% 13 14 15 16 0% 1 2 3 4 5 6 7 8 9 n. di abbinamenti 10 Numero di abbinamenti secondo la differenza di propensity 40% 35% % su totale abbinamenti 30% 25% 20% casi 15% 10% 5% 0% 0 fino a 0,1 0,1-0,2 differenza 0,2-0,3 oltre 0,3 Possibili diversi altri metodi: Caliper (calibro) Simile a nearest neibourgh, ma non oltre una certa differenza di punteggio Senza ripetizione: Nearest neibourgh, ma ogni famiglia senza figli considerata una sola volta Matching stocastico Famiglia senza figli estratta casualmente, ad esempio dall’urna formata dalle famiglie di un stesso decile Matching stocastico con distanza: Probabilità di estrazione modificata in base alla dissomiglianza tra famiglie di solito misurata con distanza di Mahalanobis Altri….