Modelli di Microsimulazione Matteo Richiardi (Università Politecnica delle Marche and Collegio Carlo Alberto – LABOR) Corso per il personale della Direzione centrale preposta alla rilevazione, elaborazione e validazione dei dati statistici per il coordinamento statistico attuariale Collegio Carlo Alberto – LABORatorio R. Revelli 18 ottobre 2007 indice I modelli di previsione 1. Modelli di cella 2. Modelli di coorte 3. Modelli econometrici I modelli di microsimulazione 1. Microsimulazione statica 2. Microsimulazione dinamica 3. Sviluppo storico 4. Elementi base 5. Stima e validazione tassi di occupazione – 2 fotogrammi tassi di occupazione – il film tassi di occupazione – i processi sottostant Modelli di previsione modelli di microsimulazione modelli cell-based modelli di coorte approccio micro modelli con tipi rappresentativi modelli microeconometrici modelli macroeconometrici modelli CGE approccio macro modelli cell-based estrapolazioni di medie di celle, tenendo conto di previsioni esterne (es. proiezioni demografiche) sulll’evoluzione della composizione delle diverse celle nella popolazione modelli cell-based “constant” scenario i tassi di participazione per coorti quinquennali e genere rimangono constanti al livello del 2000 Un esempio – oss. 2004 95 85 75 % 2004 (true) 65 55 45 35 20 21 22 23 24 age Hp: oss. 2003-2004 95 85 75 % 2004 (true) 2003 (true) 65 55 45 35 20 21 22 23 24 age Proiezione di trend (dati aggregati) Proiezione di trend (dati aggregati) 100 95 90 85 2004 (true) 80 2003 (true) 2008 (molt. trend) 70 2008 (add. trend) % 75 65 60 55 50 20 21 22 23 24 age Hp: tassi di entry ed exit costanti (micro dati) Hp: tassi di entry ed exit costanti (micro dati) Hp: tassi di entry ed exit costanti (micro dati) 100 95 90 2004 (true) 85 2003 (true) 80 % 2008 (molt. trend) 75 2008 (add. trend) 70 2008 (cohort mdl.) 65 60 55 50 20 21 22 23 24 age Il vero processo con effetti di coorte Il vero processo con effetti di coorte 100 95 90 2004 (true) 85 2003 (true) 80 2008 (molt. trend) 2008 (add. trend) 70 2008 (cohort mdl.) % 75 2008 (true) 65 60 55 50 20 21 22 23 24 age morale della storia … … diffidare di chi promette di stimare effetti di coorte a partire da una base dati con scarsa componente longitudinale !!! modelli macroeconometrici stima nei dati aggregati della domanda e dell’offerta, nonché dei ritardi di aggiustamento dell’equilibrio a seguito di shock esogeni / specifiche politiche modelli microeconometrici stima del comportamento individuale, eventualmente condizionale a specifiche politiche, nei dati reali si considera generalmente un numero molto limitato di eventi microsimulazione Simulazione dell’evoluzione delle storie (stati, comportamenti) di unità individuali (persone, famiglie, imprese …) in specifici contesti (di mercato, istituzionali …) Interesse di policy: analisi degli effetti aggregati e distributivi di politiche / scenari, per mezzo della simulazione della loro implementazione su di un campione rappresentativo di individui evidence-based policy making L’evidenza è nei dati reali, viene manipolata dal modello di microsimulazione, produce altra evidenza nei dati artificiali evidence-based policy making Quali sono le conseguenze di uno specifico scenario? Quali politiche possono essere attuate? Chi ci guadagnerà e chi ci perderà? Quanto costa implementare queste politiche? Quali incentivi / disincentivi creeranno? Come si modificheranno i comportamenti individuali? applicazioni Sistema fiscale (tasse e trasferimenti) Pensioni Previsioni di bilancio Pianificazione urbana Gestione del traffico Gestione delle risorse naturali … caratteristiche Analisi distributiva Possibilità di scelta ex-post del livello di analisi desiderato, purché la numerosità sia sufficiente Interazione di diversi livelli: - micro (caratteristiche individuali) - macro (evoluzione demografica, trend nel mk del lavoro …) - istituzionale (leggi, norme, convenzioni …) Microsimulazione statica l’obiettivo è ricostuire la distribuzione fY(Y|X,P) di una variabile endogena Y, condizionale alle variabili esogene X e ai parametri istituzionali P 2 soli periodi: popolazione iniziale e popolazione finale (“1st round effects”) no cambiamenti nei comportamenti, o nella composizione della popolazione es. tax & benefit: il modello contiene tutte le regole per il calcolo delle tasse e dei benefici e calcola il reddito disponibile di tutti gli individui nella Microsimulazione statica modelli statici sono talvolta utilizzati per proiezioni di breve periodo in questo caso la popolazione iniziale viene fatta evolvere attraverso il cosiddetto static ageing, una riponderazione delle unità individuali per tenere conto del cambiamento nella composizione della popolazione, così come previsto da proiezioni esterne al modello se l’analisi viene svolta a differenti livelli (es. individui e famiglie) pesi diversi possono essere EUROMOD microsimulazione statica tax-benefit multi-paese, che copre i 15 paesi UE pre-2004 (in corso di estensione) reddito disponibile = = A. stipendi e salari + B. redditi da lavoro autonomo + C. redditi da proprietà + D. altri redditi + E. pensioni + F. benefici monetari (assegni familiari, assistenza sociale…) EUROMOD Microsimulazione dinamica 2 elementi dinamici: 1. (alcune) variabili X2 sono considerate endogene rispetto ad (alcune) politiche P2 fX,Y(Y,X2|X1,P) = fY|X(Y|X1,X2,P1) fX(X2|P2) es. cambiamenti nell’offerta di lavoro in risposta a cambiamenti nel sistema fiscale 2. Le probabilità di transizione dipendono da variabili ritardate: X2 include Yt-j produce un panel di storie simulate Microsimulazione dinamica Moduli più comuni: cambiamenti demografici (fertilità, migrazione…) formazione e dissoluzione di unità famigliari scelte di istruzione determinazione del livello di salute determinazione dello status occupazionale determinazione del reddito /reddito disponibile determinazione dei risparmi e della ricchezza scelte di pensionamento storia Guy Orcutt (1957), “A new type of socio-economic system”: se esiste una relazione non lineare tra gli input (Xi) e gli output (Yi), il valore aggregato di Y dipende da tutta la distribuzione degli input, e non solo dal valore aggregato (o medio) di X “In microsimulation modeling there is no need to make assumptions about the average economic man. Although unpractical, we can in principle model every man.” (Klevmarken, 2001) storia Anni ’70: sviluppo di modelli di microsimulazione (dinamica) su larga scala: DYNASIM (Orcutt) CORSIM (Caldwell) richiedevano però risorse troppo ingenti in termini di hw, sw, data, in particolare rispetto alla mancanza di microdati del tempo Anni ’80: ripiegamento su modelli (statici) più compatti: modelli contabili con poche o nulle retroazioni in termini di cambiamento nei comportamenti, che si concentrano sugli effetti di storia Anni ’90: “rinascita” dei modelli dinamici, causata dalla diminuzione dei costi di calcolo e dalla maggiore disponibilità di dati Esperienze di cooperazione e trasferimento di conoscenza: - EUROMOD, sviluppato da un consorzio di ricercatori di 15 paesi - “migrazione” di CORSIM in Canada e Svezia diffusione principi di fondo approccio micro analisi di equilibrio parziale stima microeconometrica dei diversi moduli che compongono la microsimulazione (dinamica) feedback assenti o limitati tra i diversi moduli elementi base popolazione iniziale regole di transizione (contabili, di comportamento), deterministiche o probabilistiche popolazione simulata dati necessari 1. popolazione iniziale (cross-section) 2. stima delle equazioni di comportamento non necessariamente coincidono, ma tutte le variabili utilizzate in 2. devono essere presenti in 1. se la specificazione dei modelli di comportamento prevede effetti di coorte, 1.e 2. non coincidono le stime possono essere effettuate su - cross-section - collezione di cross-section - panel data Probabilità di transizione quando sono stimate nei dati, possono essere utilizzate “grezze” (Montecarlo simulation) o “aggiustate” per allineare le distribuzioni risultanti a previsioni esterne (alignment). Quest’ultima procedura è equivalente a stimare dei differenziali della probabilità di transizione Algoritmi per ogni periodo deve essere specificata la sequenza di applicazione delle diverse probabilità di transizione (ordine degli eventi) questo ordine determina la successione dell’esecuzione dei diversi moduli ciascun modulo può contemplare più eventi questi eventi possono essere diversi a seconda degli individui Stima Modelli statici: niente da stimare Modelli dinamici: stima congiunta vs. separata dei diversi moduli. La stima separata è giustificata solo se vi è mancanza di correlazione tra i diversi moduli Calcolo degli intervalli di confidenza: la variabilità dipende da (i) estrazione dei numeri casuali, (ii) campionamento della popolazione iniziale, (iii) imprecisione delle stime Bootstrapping Validazione In-sample: verifica del potere predittivo del modello nel descrivere i dati su cui è stato stimato Out-of-sample: i dati reali disponibili vengono partizionati in 2: una parte (es. 2/3 del periodo) viene utilizzata per la stima e la rimanente (es. 1/3 del periodo) viene riservata per il test dei risultati grazie !