Modelli di Microsimulazione Matteo Richiardi (Università Politecnica delle Marche and Collegio Carlo Alberto – LABOR) Corso per il personale della Direzione centrale preposta alla rilevazione, elaborazione e validazione dei dati statistici per il coordinamento statistico attuariale Collegio Carlo Alberto – LABORatorio R. Revelli 10-11 maggio 2007 indice 1. Introduzione 2. Sviluppo storico 3. Metodologie alternative 4. Elementi base 5. Microsimulazione statica 6. Microsimulazione dinamica 7. Stima e validazione introduzione 1/5 definizione Simulazione dell’evoluzione delle storie (stati, comportamenti) di unità individuali (persone, famiglie, imprese …) in specifici contesti (di mercato, istituzionali …) Interesse di policy: analisi degli effetti aggregati e distributivi di politiche / scenari, per mezzo della simulazione della loro implementazione su di un campione rappresentativo di individui introduzione 3/5 evidence-based policy making L’evidenza è nei dati reali, viene manipolata dal modello di microsimulazione, produce altra evidenza nei dati artificiali introduzione 2/5 evidence-based policy making Quali sono le conseguenze di uno specifico scenario? Quali politiche possono essere attuate? Chi ci guadagnerà e chi ci perderà? Quanto costa implementare queste politiche? Quali incentivi / disincentivi creeranno? Come si modificheranno i comportamenti individuali? introduzione 4/5 applicazioni Sistema fiscale (tasse e trasferimenti) Pensioni Previsioni di bilancio Pianificazione urbana Gestione del traffico Gestione delle risorse naturali … introduzione 5/5 caratteristiche Analisi distributiva Possibilità di scelta ex-post del livello di analisi desiderato, purché la numerosità sia sufficiente Interazione di diversi livelli: - micro (caratteristiche individuali) - macro (evoluzione demografica, trend nel mk del lavoro …) - istituzionale (leggi, norme, convenzioni …) storia 1/4 storia Guy Orcutt (1957), “A new type of socio-economic system”: se esiste una relazione non lineare tra gli input (Xi) e gli output (Yi), il valore aggregato di Y dipende da tutta la distribuzione degli input, e non solo dal valore aggregato (o medio) di X “In microsimulation modeling there is no need to make assumptions about the average economic man. Although unpractical, we can in principle model every man.” (Klevmarken, 2001) storia 2/4 storia Anni ’70: sviluppo di modelli di microsimulazione (dinamica) su larga scala: DYNASIM (Orcutt) CORSIM (Caldwell) richiedevano però risorse troppo ingenti in termini di hw, sw, data, in particolare rispetto alla mancanza di microdati del tempo Anni ’80: ripiegamento su modelli (statici) più compatti: modelli contabili con poche o nulle retroazioni in termini di cambiamento nei comportamenti, che si concentrano sugli effetti di storia 3/4 storia Anni ’90: “rinascita” dei modelli dinamici, causata dalla diminuzione dei costi di calcolo e dalla maggiore disponibilità di dati Esperienze di cooperazione e trasferimento di conoscenza: - EUROMOD, sviluppato da un consorzio di ricercatori di 15 paesi - “migrazione” di CORSIM in Canada e Svezia storia 4/4 diffusione metodologie alternative 1/7 metodologie alternative modelli cell-based modelli con agenti rappresentativi approccio micro modelli microeconometrici modelli CGE modelli macroeconometrici approccio macro metodologie alternative 2/7 modelli cell-based estrapolazioni di medie di celle, tenendo conto di previsioni esterne (es. proiezioni demografiche) sulll’evoluzione della composizione delle diverse celle nella popolazione “constant” scenario i tassi di participazione per coorti quinquennali e genere rimangono constanti al livello del 2000 metodologie alternative 3/7 modelli con agenti rappresentativi valutazione dell’effetto di politiche su di alcune figuretipo (es. con specifici profili di carriera). Nessun tentativo di fornire indicazioni sulla composizione delle figure-tipo nella popolazione, che potrebbe cambiare a seguito della politica metodologie alternative 4/7 modelli microeconometrici stima del comportamento individuale, eventualmente condizionale a specifiche politiche, nei dati reali si considera generalmente un numero molto limitato di eventi metodologie alternative 5/7 modelli di equilibrio generale computazionale guardano contemporaneamente a coorti e settori “rappresentativi”, e risolvono l’equilibrio generale intertemporale sotto ipotesi di piena razionalità, informazione perfetta, comportamenti massimizzanti ipotesi restrittive valenza essenzialmente teorica mancanza di contenuto empirico (tentativi di calibrazione) e validazione metodologie alternative 6/7 modelli macroeconometrici stima nei dati aggregati della domanda e dell’offerta, nonché dei ritardi di aggiustamento dell’equilibrio a seguito di shock esogeni / specifiche politiche metodologie alternative 7/7 modelli di microsimulazione approccio micro analisi di equilibrio parziale stima microeconometrica dei diversi moduli che compongono la microsimulazione feedback assenti o limitati tra i diversi moduli elementi base 1/4 elementi base popolazione iniziale regole di transizione (contabili, di comportamento), deterministiche o probabilistiche popolazione simulata elementi base 2/4 dati necessari 1. popolazione iniziale (cross-section) 2. stima delle equazioni di comportamento non necessariamente coincidono, ma tutte le variabili utilizzate in 2. devono essere presenti in 1. se la specificazione dei modelli di comportamento prevede effetti di coorte, 1.e 2. non coincidono le stime possono essere effettuate su - cross-section - collezione di cross-section - panel data elementi base 3/4 Probabilità di transizione quando sono stimate nei dati, possono essere utilizzate “grezze” (Montecarlo simulation) o “aggiustate” per allineare le distribuzioni risultanti a previsioni esterne (alignment). Quest’ultima procedura è equivalente a stimare dei differenziali della probabilità di transizione elementi base 4/4 Algoritmi per ogni periodo deve essere specificata la sequenza di applicazione delle diverse probabilità di transizione (ordine degli eventi) questo ordine determina la successione dell’esecuzione dei diversi moduli ciascun modulo può contemplare più eventi questi eventi possono essere diversi a seconda degli individui microsimulazione statica 1/4 Microsimulazione statica l’obiettivo è ricostuire la distribuzione fY(Y|X,P) di una variabile endogena Y, condizionale alle variabili esogene X e ai parametri istituzionali P 2 soli periodi: popolazione iniziale e popolazione finale (“1st round effects”) no cambiamenti nei comportamenti, o nella composizione della popolazione es. tax & benefit: il modello contiene tutte le regole per il calcolo delle tasse e dei benefici e calcola il reddito disponibile di tutti gli individui nella microsimulazione statica 2/4 Microsimulazione statica modelli statici sono talvolta utilizzati per proiezioni di breve periodo in questo caso la popolazione iniziale viene fatta evolvere attraverso il cosiddetto static ageing, una riponderazione delle unità individuali per tenere conto del cambiamento nella composizione della popolazione, così come previsto da proiezioni esterne al modello se l’analisi viene svolta a differenti livelli (es. individui e famiglie) pesi diversi possono essere microsimulazione statica 3/4 EUROMOD microsimulazione statica tax-benefit multi-paese, che copre i 15 paesi UE pre-2004 (in corso di estensione) reddito disponibile = = A. stipendi e salari + B. redditi da lavoro autonomo + C. redditi da proprietà + D. altri redditi + E. pensioni + F. benefici monetari (assegni familiari, assistenza sociale…) microsimulazione statica 4/4 EUROMOD microsimulazione dinamica 1/2 Microsimulazione dinamica 2 elementi dinamici: 1. (alcune) variabili X2 sono considerate endogene rispetto ad (alcune) politiche P2 fX,Y(Y,X2|X1,P) = fY|X(Y|X1,X2,P1) fX(X2|P2) es. cambiamenti nell’offerta di lavoro in risposta a cambiamenti nel sistema fiscale 2. Le probabilità di transizione dipendono da variabili ritardate: X2 include Yt-j produce un panel di storie simulate microsimulazione dinamica 2/2 Microsimulazione dinamica Moduli più comuni: cambiamenti demografici (fertilità, migrazione…) formazione e dissoluzione di unità famigliari scelte di istruzione determinazione del livello di salute determinazione dello status occupazionale determinazione del reddito /reddito disponibile determinazione dei risparmi e della ricchezza scelte di pensionamento stima e validazione 1/2 Stima Modelli statici: niente da stimare Modelli dinamici: stima congiunta vs. separata dei diversi moduli. La stima separata è giustificata solo se vi è mancanza di correlazione tra i diversi moduli Calcolo degli intervalli di confidenza: la variabilità dipende da (i) estrazione dei numeri casuali, (ii) campionamento della popolazione iniziale, (iii) imprecisione delle stime Bootstrapping stima e validazione 2/2 Validazione In-sample: verifica del potere predittivo del modello nel descrivere i dati su cui è stato stimato Out-of-sample: i dati reali disponibili vengono partizionati in 2: una parte (es. 2/3 del periodo) viene utilizzata per la stima e la rimanente (es. 1/3 del periodo) viene riservata per il test dei risultati grazie !