Versione preliminare: 05-II-2001. Si prega di non citare. Pietro A. Vagliasindi,* Francesca Moschetti,° Marzia Romanelli^ e Carlo Bianchi° LA MICROSIMULAZIONE DELLE RIFORME PREVIDENZIALI E FISCALI ITALIANE: UNA NOTA SULLA VALIDAZIONE DELLE DINAMICHE NAZIONALI E REGIONALI.** Partendo dall’indagine della Banca d’Italia sui bilanci delle famiglie, in questo lavoro si costruisce un campione di famiglie da utilizzare nella microsimulazione dinamica per valutare riforme previdenziali e fiscali e si valida l’evoluzione delle variabili demografiche (matrimoni, nascite, etc.), economiche (redditi) e fiscali (gettito Irpef) risultante dal modello MIRD (Micro-Italy-Regional-Dynamics), in corso di sviluppo congiuntamente nelle Università di Parma e Pisa. Al fine di valutare possibilità e limiti del modello in oggetto si esamina la sua struttura, le manipolazioni interne dei dati (alla base dell’elaborazione dei risultati) e l’evoluzione demografico-socio-economica di individui e unità familiari, e se ne validano input ed output con riferimento a dati e stime fornite dall’Istat e dall’IRP (l’Istituto di Ricerche sulla Popolazione del CNR). L’analisi consente quindi di valutare l’affidabilità di questo modello: i) nel prevedere futuri andamenti demografici ed economici, nel breve e nel lungo periodo, ii) nel rilevare le differenze nelle dinamiche demografiche e socio-economiche a livello regionale e nazionale e iii) nell’anticipare gli effetti delle politiche fiscali. 1. Introduzione. In Italia, l’evoluzione della struttura demografica e l’incremento del rapporto tra pensionati e lavoratori, può determinare forti tensioni nel sistema dei conti pubblici e nel comparto previdenziale nel breve e lungo periodo.1 Simulare l’evoluzione delle strutture familiari, dei redditi (a seconda dei settori di appartenenza)2 e dei futuri trattamenti pensionistici è quindi particolarmente importante per analizzare l’effetto di politiche fiscali e previdenziali. In particolare modo, è fondamentale costruire e validare modelli di microsimulazione dinamica atti a considerare attentamente gli effetti delle politiche sulla distribuzione individuale e familiare dei redditi e della ricchezza.3 La microsimulazione a popolazione dinamica (dynamic ageing) è una tecnica di modellizzazione che *Istituto di Economia e Finanza, Facoltà Giurisprudenza, Università di Parma. E-mail: [email protected]. ° Dipartimento di Scienze Economiche - Facoltà di Economia – Università di Pisa. ^ Sant'Anna School of Advanced Studies - Economics and Management – Pisa.. ** Nonostante le forti interazioni tra gli autori, il lavoro è frutto di contributi individuali; Vagliasindi è responsabile dell’appendice C e delle sezioni 1 e 4.b; Moschetti delle appendici F, A, D, G e della sezione 2a, 3b e 4a, Romanelli dell’appendice E e della sezione 2b, Bianchi dell’appendice B e delle sezioni 3a e 5. Si è grati a Luigi Cannari, Emanuele Baldacci, Giuseppe Bruno, Fernando Di Nicola, Ivan Faiella, Luca Inglese, Paolo Masella e Gaetano Proto per supporto e suggerimenti. 1 Preoccupazioni per la diminuzione delle entrate (daglii occupati) e l’aumento di trasferimenti per gli anziani (una tra le classi votanti più numerose) sono state manifestate da più parti (Banca d’Italia, Confindustria, FMI, OCSE, Tesoro). 2 La nostra distinzione (tra lavoratori dipendenti - privati e pubblici - ed autonomi) è la stessa adottata dall’Istat, cfr. Baldacci Inglese (1999). Oltre ai diversi settori, vanno considerate tre categorie soggette (secondo la generazione di appartenenza) alle regole del passato “retributivo”, alla transizione “regime misto” ed al nuovo regime “contributivo”. 3 In pratica tale strumento consente di: (i) studiare l'evoluzione di diseguaglianza e povertà, (ii) valutare conseguenze infra ed inter-generazionali e (iii) considerare possibili modifiche comportamentali al mutare del sistema di incentivi. 1 deriva scenari futuri modificando le caratteristiche demografiche, socio-economiche con processi decisionali stocastici individuali.4 Per individui e famiglie si replicano i processi decisionali, riproducenti il funzionamento del sistema socio-economico, in base ad un modello comportamentale definito, come mostrato in fig. 1. Fig. 1 Uno schema di microsimulazione dinamica t° t°+1 t* …… I punti di partenza del modello regionale MIRD sono il modello di microsimulazione dinamico sviluppato per l’Italia da Cannari e Nicoletti Altimari (1998) ed il modello MID (Micro-Italy-Dynamics), che cercava di estendere le potenzialità della microsimulazione incorporando analisi comportamentali in relazione alle scelte individuali quali il modello dell’option value di Stock-Wise (1990). L’obiettivo è verificare in termini metodologici e pratici, capacità e limiti dei modelli di microsimulazione dinamica per l'analisi di riforme fiscali e previdenziali. Il lavoro è organizzato come segue. Nella sezione 2 descriveremo la struttura del modello che andremo a validare, i suoi singoli moduli, le loro interrelazioni e le ipotesi di base da noi adottate. La terza sezione sarà dedicata alla convalida ed all'analisi dell’input di partenza. Essa descrive i problemi di distorsione campionaria rispetto all’universo di riferimento (dovuta a comportamenti di under-reporting e self-selection degli intervistati) e la procedura seguita per allineare il campione alla popolazione italiana (fonte ISTAT) - i.e. per correggere la struttura demografica le caratteristiche degli occupati (professione e titolo di studio) e le informazioni sui redditi. Successivamente, nella sezione 4, valideremo il modello considerando l’evoluzione dei fenomeni e i vari moduli (e.g. demografico, dei redditi da lavoro dipendente, dell’imposizione personale) nel loro complesso. La convalida dei fenomeni demografici considera un lungo orizzonte temporale (dal 1996 al 2044) usando i dati ISTAT e le autorevoli previsioni dell’IRP. Un orizzonte più breve (dal 1996 al 1999) è invece utilizzato per validare i fenomeni socio-economici. La sezione 5 concluderà il lavoro con alcune considerazioni finali sul significato dei nostri esercizi e con una analisi delle politiche fiscali e previdenziali basata sulla microsimulazione. 4 Cfr. Orcutt (1957), Orcutt Greenberger Korbel Rivlin (1961), Orcutt Merz Quinke (1986). 2 2. Il modello di microsimulazione a popolazione dinamica MIRD. Il modello MIRD considera dettagliatamente le diverse realtà geografiche Italiane (Nord, Centro, Sud e Isole) ed è organizzato per moduli con unità di tempo pari all’anno solare. Servendosi di un programma scritto in linguaggio FORTRAN95 e composto di circa 6.000 linee di codice, il modello simula 50 anni (1996/2045) in poco più di un’ora su di un PC (Pentium III), analizzando i fenomeni demografici (sez. 2.a.) e i fenomeni socio-economici relativi a lavoratori e pensionati (sez. 2.b.).5 2.a. Il modello e il trattamento dei fenomeni demografici. Il database iniziale è frutto di un'elaborazione sui dati Banca d’Italia dell’indagine “I Bilanci delle famiglie italiane del 1995”. Esso considera famiglie che differiscono per numero di componenti e relative caratteristiche (età, sesso, istruzione, processi di generazione redditi, etc.), consentendo una valutazione articolata: (i) dei percorsi delle riforme e delle politiche fiscali e previdenziali, (ii) della redistribuzione tra famiglie, generazioni, etc.. I modelli a popolazione dinamica si caratterizzano per una struttura complessa che viene generalmente scomposta in parti, denominate moduli, ognuno dei quali ha il compito di simulare un aspetto determinato del sistema demografico- socio- economico. Il modulo demografico è articolato in sottosezioni: mortalità, matrimonio, divorzio, single, natalità. La fase iniziale consiste nella determinazione dei decessi; in seguito gli individui che risultano ancora vivi sono soggetti alla possibilità (in base al calcolo di diversi tassi di transizione)6 di sposarsi, divorziare o uscire dal nucleo familiare d’origine. L’ultimo passo consiste nella simulazione delle nascite. Il modello scorre sequenzialmente le persone e attribuisce ad ognuna una probabilità teorica di morte in funzione del sesso, dell’età e dell’area geografica (Appendice A, tav. A1). Se la persona rimane in vita la sua età aumenta, in caso contrario esce dal database e, se sposata, lo stato civile del coniuge viene modificato, se capofamiglia, il vecchio coniuge (o in mancanza il familiare più anziano) diviene il nuovo capofamiglia ereditandone i beni; infine il numero di componenti della famiglia di appartenenza diminuisce di una unità. 5 Il modello si ispira ai lavori di Nelissen (1994) e di Cannari-Nicoletti Altimari (1998) e si affianca ai modelli dinamici esistenti quali DESTINIE (INSEE, 1999), DYNAMOD (Antcliff, Grusskin, Harding e Kapuscinski, 1996). I moduli di base sono tre: 1) il modulo demografico; 2) il modulo “lavoro e redditi”; 3) il modulo della sicurezza sociale così come previsto dalla nostra legislazione. Sull'applicazione della microsimulazione alla politica fiscale vedi anche Toso (1996). 6 In genere per ogni soggetto il calcolatore genera la probabilità di incorrere in un dato evento (un numero casuale, distribuito nell’intervallo fra 0 e 1). Se il numero casuale estratto risulta minore o uguale alla probabilità di transizione corrispondente agli attributi del soggetto (e.g. età, sesso, area geografica), l’evento si avvera. 3 Per semplicità, matrimonio, natalità e divorzio dipendono solo dall’età degli individui coinvolti, pur essendo fenomeni complessi condizionati anche da caratteristiche quali livello d'istruzione, status economico, etc e da vari fattori sociali (cultura, religione, tradizioni, …). Il matrimonio è simulato in due fasi: (1) sono selezionati i candidati, di età compresa tra i 17 e i 48 anni, in base alle probabilità della tavola A2 (Appendice A), (2) ogni candidata incontra i candidati e si sposa in base alle probabilità della tavola A3 (Appendice A). Se in base a queste probabilità nessun candidato è prescelto, la scelta cade sul candidato migliore (per il quale lo scarto tra numero casuale estratto e probabilità teorica è minimo). Si incrementa quindi il numero delle famiglie, si modificano i dati delle famiglie d’origine dei coniugi (cancellandole se rimaste prive di componenti), lo stato civile degli sposi e, se è il caso, si assegnano alla nuova famiglia i figli nati in precedenti matrimoni ed tutti gli eventuali minori presenti. La nascita dei bambini, all’interno del matrimonio, dipende dall’età della madre, dall’area geografica e dal numero di figli esistenti (tavola A4, Appendice A). I nuovi nati entrano nel campione e modificano le caratteristiche delle famiglie interessate. Ogni coniuge può divorziare con le probabilità riportate in tavola A5 (Appendice A). I figli ed i 2/3 della ricchezza familiare (metà in assenza di figli) sono assegnati alla madre con probabilità del 92%,7e si modificano opportunamente i dati delle famiglie. Celibi e nubili, tra 28 e 35 anni escono dal nucleo familiare d’origine con probabilità pari al 20% delle loro probabilità di matrimonio. 2.b. Lavoro, redditi, sicurezza sociale e i comportamenti individuali. Il modulo “lavoro e redditi” si articola in due sottosezioni: la prima simula l'ingresso nel mondo del lavoro; la seconda aggiorna i redditi di chi è occupato e stima un reddito iniziale per chi entra nel mondo del lavoro o per quelle famiglie formate si in conseguenza degli eventi demografici ma che hanno reddito zero. La professione è attribuita stocasticamente date le probabilità di essere lavoratori dipendenti (privati o pubblici) piuttosto che autonomi (tavola D1, Appendice D), ricavate dalle rispettive quote di lavoratori. Il titolo di studio (annistudio) è attribuito quando si entra nel mondo del lavoro, con un procedimento analogo al precedente; per età inferiori a 24 anni è simulata solo la possibilità di diplomarsi e per età superiore ai 24 anni anche la probabilità di laurearsi. Le varie probabilità (tavola D2) derivano dai dati ISTAT sulle forze di lavoro del 1999 e Banca d’Italia. Le ore medie lavorate OREMD (e i rispettivi scarti quadratici medi STDERR), funzione del settore e dell’area geografica (tavola D3, Appendice D), sono attribuite ai nuovi lavoratori in base alla funzione: 7 Al fine di favorire una maggiore comparabilità le probabilità sono quelle di Cannari e Nicoletti Altimari (1998). 4 ORE = (età, setoccup, areageog) + STDERR(età, setoccup, areageog) . rd dove rd indica un numero casuale con distribuzione normale standard e introduce un elemento stocastico evitando appiattimenti nel calcolo dei redditi. La stima econometrica dei redditi ha specificazione log-lineare e, partendo da dati cross section, considera una struttura , differenziata per età, sesso, settore occupazionale e area geografica.8 La previsione, al tempo t, avviene sostituendo i valori assunti dalle caratteristiche di ogni individuo i nella seguente equazione dove sono inclusi, oltre ai coefficienti stimati, anche i residui di stima ui*. ŷ i = e ( X b + u* ) i i Utilizzando il metodo dei minimi quadrati, la somma dei residui della regressione è uguale a zero: n ∑u * i con: ui* = ln(yi) – ln( ŷ i ), =0 i =1 dove ln(yi) e ln( i) sono il valore osservato e stimato del logaritmo del reddito dell’i-esimo individuo. Tuttavia, ignorare i residui nella previsione dei redditi significa inserire una distorsione, essendo:9 n ∑ (y i - ŷ i ) ≠ 0 i =1 Abbiamo infine inserito nel processo di stima dei redditi l'influenza dell'andamento della crescita reale del reddito pro capite g (pari a 1,0%), partendo dall’anno base t o, nel nostro caso il ’95, ipotizzando: ŷ it = ŷ i (1 + g) t – t o Infine, il modulo “sicurezza sociale” determina età di pensionamento e benefici pensionistici, dando ai soggetti la possibilità di posporre il pensionamento ad un periodo successivo grazie ad una funzione di reazione individuale basata sul modello option value (OV) di Stock e Wise (1990). Il lavoratore, infatti, sulla base delle informazioni disponibili, calcola i valori attesi dell’utilità di andare in pensione oggi od in futuro: la loro differenza costituisce il valore dell’opzione (OV) di posporre il pensionamento (nel modulo all'anno successivo). Se OV è positiva il pensionamento è rimandato altrimenti (OV negativa) il lavoratore va immediatamente in pensione. Il valore in t di andare in pensione dipende dai flussi di retribuzioni Ys e pensioni Bs(t):10 Vt(t) = r −1 S s= t s= r ∑ (1 + r ) t− s U y (Ys ) + ∑ (1 + r ) t− s U b ( Bs (t)) . 8 Cfr. Andreassen, Fredriksen e Ljones, 1993. Per un approfondimento si rimanda all'Appendice E. Supponendo che in futuro l'andamento delle retribuzioni nel meridione si avvicini al Centro, abbiamo utilizzato anche in tale area i coefficienti del Centro. 9 Per quegli individui non ancora occupati al momento iniziale della simulazione, tale valore è estratto casualmente da una distribuzione normale con scarto quadratico medio pari a quello dei residui della regressione. 10 In pratica, la specificazione dell’utilità indiretta da reddito lavorativo e da pensione sono rispettivamente Uy (Ys) = Ys + ωs ed Ub(Bs(t)) = Bs(t) + ξs (dove ωs e ξs sono variabili casuali con media nulla). 5 Il beneficio differenziale OVt(t) della posticipazione del pensionamento al tempo t+1 è ottenuto come: OVt(t+1) = Et Vt (t+1) - Et Vt ( t ). Per OVt(t+1) ≤ 0 l'individuo va in pensione; l'OV è stimato ogni anno fino all’età massima di pensionamento (e.g. 65 anni).11 Nel calcolo di OV sono ovviamente prese in considerazione norme e sistemi di calcolo differenti (retributivo, misto o contributivo in base alle caratteristiche anagrafiche e contributive dei soggetti) in tema di benefici e requisiti delle tre gestioni principali di appartenenza dei lavoratori. 3. I microdati di partenza e la convalida dell’input del modello. L'affidabilità di un modello di micro-simulazione dinamica e l’attendibilità delle sue previsioni sono innegabilmente connesse alla sua convalida (validazione), ossia alla compatibilità dell'evoluzione dei fenomeni socio-economici previsti dal modello con i loro andamenti effettivi.12 A tal fine nel seguito verificheremo la rispondenza dei principali aggregati di base, servendoci dei dati rilevati dall'ISTAT (dalla Banca d'Italia e delle più autorevoli previsioni disponibili) e di criteri di applicazione generale. 3.a. Convalida dei microdati e indagini campionarie. Data la loro complessità intrinseca e le relative implicazioni in termini di convalida, i modelli dinamici si avvalgono generalmente di strutture modulari e richiedono il lavoro di più persone che come nel nostro caso sviluppino i singoli moduli. Infatti, per una seria convalida del modello è utile: (i) considerare isolatamente i singoli moduli di cui si compone il modello per correggere eventuali discrepanze, forzandoli a riprodurre i valori storici; (ii) esaminare congiuntamente i diversi moduli per validare i risultati simultanei del modello.13 Naturalmente, esistono tecniche di validazione relative agli input (microdati campionari), alle procedure ed agli output del modello, operanti sulla base di controlli sia 11 Per ricostruire la storia retributiva e contributiva dei lavoratori del nostro database, necessaria per il calcolo delle pensioni, abbiamo utilizzato le seguenti ipotesi semplificatrici: 1) un tasso di sconto reale futuro uguale per tutti a 2.5%, 2) un tasso reale di crescita per capite futuro di 1%, 3) assenza di silenti (individui che sospendono temporaneamente il pagamento dei contributi), 4) percezione della pensione e degli altri redditi a fine anno, 5) indicizzazione della pensione al tasso d'inflazione 1.8% (ex L.41/86, art.24, commi 4 e 5): totale (al 100%) se inferiore al doppio del valore della pensione sociale (pari a 6.500.000 nel ‘99), al 90% se compresa fra il doppio e il triplo di tale valore ed altrimenti al 75%. 12 Ciò spiega perché i modelli di microsimulazione dinamica usino sovente dati di partenza piuttosto lontani nel tempo. 13 Rifacendosi a Caldwell (1993) possiamo individuare tre tipologie di validazione: in-sample (basata sui microdati usati per la stima del modello ), out of sample (avvalendosi di dati alternativi dello stesso tipo) e out of type (servendosi di microdati di tipo diverso) applicabili al caso (i) e la validazione multiple module relativa al caso (ii). 6 interni (verificando l’attendibiltà dei microdati con test statistici) che esterni (confrontando variabili aggregate o distribuzioni di frequenze simulate con quelle ufficiali o previste con altri metodi).14 Solo dopo questa convalida dei microdati e dei moduli (ad es. per calibrare le tavole di probabilità in Appendice A), è possibile procedere alla validazione del modello nel suo complesso, confrontando i valori simulati con i dati storici ufficiali.15 Tra i vari input (ed output) del modello da validare, è importante considerare le variabili di base che più interagiscono con le politiche fiscali, quali l’evoluzione della struttura demografica, le caratteristiche degli occupati (titolo di studio e professione), i redditi da lavoro dipendente e il gettito IRPEF. Prima di iniziare la convalida degli inputs del modello è utile discutere brevemente i problemi delle variabili oggetto delle indagini campionarie Banca d’Italia sui bilanci delle famiglie. Come risulta dalla sezione successiva, nell’indagine di Banca d’Italia le stime del reddito,16 delle attività finanziarie e delle abitazioni possedute sono inferiori ai valori aggregati della contabilità nazionale e finanziaria e ai dati del Censimento. Le ore mediamente lavorate nel corso della settimana risultano maggiori del corrispondente valore di fonte ISTAT; le posizioni lavorative secondarie sono inferiori a quelle dell’Anagrafe Tributaria, a loro volta inferiori a quelle di Contabilità Nazionale. Queste differenze dipendono più che da errori di misurazione dalla reticenza degli individui a partecipare all’indagine ed a parlare della propria vita. Cannari e D’Alessio (1992) calcolano la distorsione dovuta a fenomeni di self selection stimando la probabilità effettiva di inclusione nel campione. Il reddito aggregato del 1987 aumenta del 5% ma resta una forte discrepanza rispetto alle rilevazioni ISTAT, dovuta a fenomeni di evasione fiscale stimata da Cannari e Violi (1991) superiore al 20%. Cannari e D’Alessio (1993) mostrano come capofamiglia autonomi, o anziani, o con basso livello di istruzione sottostimino maggiormente le attività finanziarie. Il fenomeno è più elevato per buoni del tesoro, azioni e titoli privati, minore per i depositi bancari, riflettendo forse differenze sociali e culturali dei detentori dei vari tipi di attività. Rispetto alle seconde case, Cannari e D’Alessio (1990) mostrano come su sei case in affitto solo una viene dichiarata e che all’aumentare del numero di case diminuisce la percentuale di famiglie disposte a dichiararne il possesso. In media, tale correzione può aumentare il reddito familiare del 4%. La forte sottostima dei secondi lavori è difficile da correggere 14 Cfr. Redmond, Sutherland e Wilson (1999). L’alternativa di validare gli output della simulazione in base alle indagini successive avrebbe potuto portare a conclusioni errate essendo i risultati troppo legati alle eventuali distorsioni campionarie esistenti nelle due indagini. 16 Brandolini e Cannari (1992) evidenziano come: il rapporto tra reddito familiare disponibile dell’indagine di Banca d’Italia e quello di contabilità nazionale nel periodo 1987-1989 sia pari a circa al 75%. 15 7 dipendendo - secondo Cannari e Gavosto (1995) - da cause molteplici: la minore propensione a collaborare avendo meno tempo disponibile, la dimenticanza di attività saltuarie, e la percezione di diverse attività come equivalenti ad un’unica attività. Analogo discorso vale per la sovrastima delle ore mediamente lavorate nel corso della settimana (nell’attività principale o unica) che può dipendere anche dal non considerare periodi di ferie o malattia. 3.b. Convalida dell’input del modello. Quantomeno nel breve periodo, la capacità di un modello di simulazione di rappresentare la realtà dipende crucialmente dalla rappresentatività del campione iniziale usato rispetto alla popolazione di riferimento. È quindi opportuno rendere i microdati il più vicino possibile all’universo di riferimento. Tale controllo può essere effettuato, per l’Italia, considerando le stime ISTAT delle variabili prescelte; la struttura per età della popolazione, il livello d’istruzione e il settore occupazionale (vista la loro influenza sul reddito).17 La struttura per età della popolazione è probabilmente la variabile più importante poiché influenza tutti i fenomeni simulati, partendo dalla demografia per giungere fino alle politiche di bilancio.18 Sotto quest’aspetto, il campione con i pesi originali approssima abbastanza bene la struttura demografica, data la somiglianza dei dati di partenza (fig. 2) con quelli effettivi (linea continua).19 Fig. 2 Struttura demografica italiana per classi di età (nel ‘95) + 90 età femmine maschi 80-84 70-74 60-64 50-54 40-44 30-34 20-24 10-14 0-4 -0.05 -0.04 -0.03 -0.02 -0.01 0.01 0.02 0.03 0.04 0.05 17 Le indagini ISTAT sono ritenute meno distorte, essendo obbligatorie. In particolare si è fatto riferimento alla composizione della popolazione per sesso, età e area geografica ed all’indagine sulle forze di lavoro per la composizione degli occupati (dipendenti e indipendenti), il settore di attività (agricoltura, industria, altri settori) e il livello di istruzione. 18 È evidente che i fenomeni di natura demografica e socio-economica sono profondamente influenzati dalla struttura per età della popolazione: natalità, mortalità, offerta di lavoro, consumi e risparmi. Una popolazione giovane, ha una bassa mortalità, un’alta natalità ed una ridotta spesa pensionistica, mentre l'inverso ha luogo con una popolazione anziana. 8 Dalla figura 2 emerge tuttavia una sottostima nelle prime e soprattutto nelle ultime classi d’età, situazione questa confermata anche dagli indici di struttura riportati in tavola 1. Tavola 1: Indici di struttura Italia 40,30 16,80 Età media Indice vecchiaia ISTAT Nord Centro 42,20 41,90 18,20 18,50 Sud 37,30 14,30 Italia 38,90 16,45 BANCA d’ITALIA Nord Centro 39,90 39,80 17,70 15,90 Sud 37,20 15,23 Molto più gravi sono le differenze nella ripartizione occupazionale della popolazione, che sottostima gli autonomi, data la loro maggiore reticenza a partecipare all’indagine probabilmente per motivi fiscali. Tavola 2: Ripartizione degli occupati Italia 71,0% 28,8% Dipendenti Autonomi ISTAT Nord Centro 36,9% 14,3% 14,6% 5,8% Sud 20,0% 8,4% Italia 74,8% 24,9% BANCA d’ITALIA Nord Centro 39,2% 14,6% 12,6% 4,8% Sud 21,0% 7,5% Emerge inoltre una rilevante sottostima dei pensionati. A livello nazionale, nel campione, la percentuale dei pensionati sugli occupati è del 67% a fronte del 78% (dato ISTAT).20 I microdati sono stati allineati all’universo ricalcolando i pesi delle famiglie in base ad una stratificazione che tiene conto della composizione demografica, del livello d’istruzione, della posizione professionale, del sesso e dell’area geografica. Date le frequenze relative degli individui (con caratteristiche x = classe d'età, y = sesso, z = area geografica) rispetto alle tre variabili età (e), istruzione (s) e professione (l), sono stati e s l calcolati i rapporti Ii, Ii, Ii, (ISTAT su Banca d’Italia). 21 Si è quindi proceduto a calcolare tali indici a livello e s l familiare If, If, If, (facendone una media), a moltiplicarli per il peso attribuito a ciascuna famiglia da Banca d’Italia wf ed a normalizzarli, in modo tale che la loro somma fosse unitaria. Dalla media dei tre pesi normalizzati otteniamo il nuovo peso familiare Wf.22 Espandendo il campione mediante l'utilizzo di tali pesi, otteniamo un database di 104.017 famiglie e di 271.208 individui (vedi Appendice B). Le tavole 1bis, 3 e 4 mostrano i valori relativi al campione con i nuovi pesi, consentendo un confronto tra 19 Le barre orizzontali indicano le frequenze relative del campione, la curva continua quelle della popolazione; nella parte destra del grafico sono riportati i maschi, mentre in quella sinistra le femmine. 20 Cannari e D’Alessio (1992) osservavano una propensione a collaborare all’indagine decrescente al crescere dell’età del capofamiglia. 21 Si è proceduto alla stima dei pesi considerando 19 classi d’età - 18 di ampiezza quinquennale (da 0-4 a 85-89) più un’ultima classe aperta (dai 90 anni in poi) - 7 diversi livelli di istruzione: (nessun titolo o licenza elementare, licenza media, qualifica triennale, diploma quinquennale, diploma universitario, laurea, dottorato); 6 diverse posizioni professionali (dipendenti ed autonomi nei settori: agricolo, industria, altre attività). 22 Reiterando la procedura possiamo migliorare l’allineamento del campione alle distribuzioni delle variabili di base. 9 dati Istat, campione Bankitalia e microdati di partenza della simulazione. Tavola 1bis : Indici di struttura Età media Indice vecchiaia Italia 40,30 16,80 ISTAT Nord Centro 42,20 41,90 18,20 18,50 Sud 37,30 Italia 40,90 14,30 19,03 BANCA d’ITALIA Nord Centro 42,90 42,10 20,75 Sud 37,89 20,43 16,15 Come risulta dalla tavola 3, le percentuali dei lavoratori si avvicinano alle stime ISTAT e la percentuale dei pensionati sugli occupati aumenta a 78,9% (da 67%)allineandosi al valore ISTAT del 78%. Tavola 3: Confronto percentuali lavoratori dipendenti e autonomi. Femmine Maschi Agricoltura Industria Altro Agricoltura Industria ITALIA SETTENTRIONALE ISTAT Dipendenti 0,40 11,57 9,54 0,19 4,92 Autonomi 1,38 2,82 6,03 0,75 0,55 CAMPIONE RIPONDERATO Dipendenti 0,36 11,81 10,13 0,18 5,35 Autonomi 0,99 2,59 5,53 0,23 0,64 BANCA d’ITALIA Dipendenti 0,31 12,25 10,01 0,18 5,56 Autonomi 0,88 2,56 5,13 0,24 0,63 ITALIA CENTRALE ISTAT Dipendenti 0,21 3,35 5,19 0,08 1,23 Autonomi 0,45 1,00 2,52 0,28 0,21 CAMPIONE RIPONDERATO Dipendenti 0,15 3,52 4,96 0,04 1,27 Autonomi 0,20 1,03 2,41 0,18 0,28 BANCA d’ITALIA Dipendenti 0,15 3,67 4,86 0,07 1,36 Autonomi 0,17 1,11 2,17 0,14 0,29 ITALIA MERIDIONALE ISTAT Dipendenti 1,10 4,67 8,10 0,73 0,72 Autonomi 1,23 1,24 3,83 0,62 0,14 CAMPIONE RIPONDERATO Dipendenti 0,90 4,45 8,18 0,66 0,75 Autonomi 1,00 1,18 3,57 0,39 0,22 BANCA d’ITALIA Dipendenti 1,18 4,08 8,72 0,71 0,67 Autonomi 0,78 1,12 3,22 0,40 0,32 Altro Totale 10,18 3,09 36,81 14,62 10,95 3,31 38,77 13,30 10,98 3,25 39,30 12,68 4,21 1,34 14,27 5,81 4,57 1,02 14,50 5,19 4,55 0,97 14,66 4,85 4,74 1,32 20,07 8,39 5,26 1,54 20,29 7,90 5,58 1,69 20,93 7,54 La tavola 4 mostra i miglioramenti nella rappresentazione del livello di istruzione per area geografica e per sesso ottenuti con la riponderazione di pesi. 10 Tavola 4: Confronto percentuali istruzione (titolo di studio). Licenza elementare. Licenza media Diploma (3 anni) Diploma Università (5 anni) Diploma ITALIA SETTENTRIONALE ISTAT Femmine 9,5 7,3 1,7 4,2 0,1 Maschi 6 8 1,3 4,7 0,1 TOT 16,1 15,3 2,9 8,9 0,2 CAMPIONE RIPONDERATO Femmine 9,7 6,5 1,4 5,2 0,1 Maschi 5,9 6,9 1,5 5,5 0,1 TOT 15,6 13,4 2,9 10,7 0,2 BANCA D’ITALIA Femmine 9,1 6,7 1,4 5,5 0,1 Maschi 5,8 7,1 1,6 5,8 0,1 TOT 14,9 13,8 3 11,3 0,2 ITALIA CENTRALE ISTAT Femmine 4 2,9 0,5 2,3 0 Maschi 2,7 3,2 0,4 2,3 0 TOT 6,7 6,1 0,8 4,6 0,1 CAMPIONE RIPONDERATO Femmine 4,1 2,6 0,3 2,9 0 Maschi 2,5 2,9 0,4 2,8 0 TOT 6,6 5,5 0,7 5,7 0 BANCA D’ITALIA Femmine 3,7 2,7 0,3 3 0 Maschi 2,4 3 0,4 2,8 0 TOT 6,1 5,7 5,8 0,1 0,1 ITALIA MERIDIONALE ISTAT Femmine 7,4 5,7 0,5 3,5 0,1 Maschi 5,2 6,5 0,4 3,6 0,1 TOT 12,7 1,22 0,9 7,1 0,1 CAMPIONE RIPONDERATO Femmine 8,6 4,4 0,3 3,8 0 Maschi 5,1 5,7 0,5 3,8 0 TOT 13,7 1,01 0,7 7,5 0,1 BANCA D’ITALIA Femmine 8,4 4,7 0,3 4 0 Maschi 5,1 5,9 0,5 4 0 TOT 13,5 10,6 0,8 8 0,1 Laurea Dottorato Specializzaz. 1 1,3 2,3 0 0,1 0,1 1 1,5 2,5 0 0,1 0,1 1,1 1,5 2,5 0 0,1 0,1 0,5 0,7 1,2 0 0 0 0,5 0,6 1,1 0 0 0 0,5 0,6 1,1 0 0 0 0,7 0,9 1,6 0 0 0 0,8 0,9 1,7 0 0 0 0,9 1 1,9 0 0 0 4. Le variabili socio-economiche di base e la convalida del modello. Nel seguito, convalideremo (in sezione 4.a) i risultati demografici dal 1996 al 2044. Il confronto è effettuato fino al 1999 con la popolazione residente riportata nell’Annuario Statistico Italiano ISTAT e quindi, fino al 2045, con le proiezioni dell’IRP. Questa scelta è dovuta al fatto che, come già osservato precedentemente, il nostro modello non include un modulo migrazione e quindi non si possono utilizzare le 11 previsioni ISTAT che sono al lordo della migrazione.23 Successivamente nella sezione 4.b convalideremo i risultati relativi al mondo del lavoro [posizione professionale (dipendenti ed autonomi), titolo di studio, retribuzione lorde annue] dal 1996 al 1999, confrontando i risultati della simulazione con le statistiche ISTAT (Rilevazione sulle Forze di Lavoro e Aggregati di Contabilità Nazionale).24 4.a. La convalida dei fenomeni demografici. Nell'analisi abbiamo considerato indicatori demografici, come i quozienti di natalità nt e mortalità mt,25 indici di dissomiglianza, indicatori specifici per il confronto di distribuzioni di frequenze e il coefficiente di correlazione tra le frequenze simulate e le frequenze IRP. Nt nt = ⋅ 1000 ; 0,5 ⋅ ( P t + Pt + 1 ) N + N t +1 + ... + N t + 4 n t − (t + 4 ) = t ⋅ 1000 ; Pt + Pt + 1 + ... + Pt + 4 Dt ⋅ 1000 ; 0,5 ⋅ ( P t + Pt + 1 ) Dt + Dt +1 + ... + Dt + 4 = ⋅ 1000 . Pt + Pt +1 + ... + Pt + 4 mt = mt − ( t+ 4) L’età media è stata calcolata attribuendo al valore centrale della classe l’intera frequenza.26 X = 1 ∑ ( x + 2 n ) ⋅ Px, x x ∑ Px, x+ n +n . x Gli indici di dissomiglianza sono funzioni simmetriche e crescenti del valore assoluto degli scarti come gli indici assoluti e relativi di dissomiglianza di ordine r espressi dalle seguenti formule:27 23 Tuttavia, mentre nel nostro modello le probabilità teoriche del verificarsi dei vari eventi demografici (Appendice A) sono mantenute costanti nell’ambito dell’intero arco temporale, l’IRP ha elaborato tre diversi scenari, ipotizzando pima un graduale incremento della vita media nei prossimi venti anni sino al quinquennio 2014-2018, e poi la sua costanza su livelli diversi da regione a regione (in media 78,6 anni per gli uomini e 85 anni per le donne). La fecondità è: (i) costante sul valore registrato nel 1994 in ciascuna delle 20 regioni; (ii) decrescente fino a 0,9 (o crescente fino a 1,8) figli per donna raggiunto nel quinquennio 2004-2008. Lo scenario scelto per il confronto è il primo, nonostante la differenza nella mortalità alteri in parte la confrontabilità dei risultati. 24 La rilevazione campionaria sulle Forze di Lavoro è condotta con cadenza trimestrale a partire dal 1959. Ogni anno viene censito l’1,4 % della popolazione complessiva nazionale. L’indagine costituisce la principale fonte statistica sul mercato del lavoro italiano. Da essa vengono derivate le stime ufficiali a livello aggregato degli occupati e delle persone in cerca di lavoro. L’evoluzione dei principali indicatori del mercato del lavoro può essere studiata in modo disaggregato a livello territoriale, settoriale e per le principali caratteristiche socio-demografiche della popolazione. Il sistema dei conti economici nazionali descrive in termini quantitativi l’attività economica e finanziaria di un Paese. Lo scopo della Contabilità Nazionale, rivolgendosi alla costruzione degli aggregati di consumi, redditi, produzione, etc, è, quindi, molto più ampio dell’impiego che qui ne viene fatto, concentrandosi sulle retribuzioni lorde dei lavoratori dipendenti. 25 Gli indici sono calcolati annualmente nel breve periodo (n t; mt) e con cadenza quinquennale nel lungo (n t-(t+4); mt-(t+4)), indicando con Nt le nascite, con Dt i decessi, con Pt la popolazione al 1 gennaio. Cfr. Livi Bacci (1997), pagg. 40-45. 26 Con x indichiamo il limite inferiore della classe d’età, con n l’ampiezza della classe e con Px,x+n la numerosità della classe. Cfr. Livi Bacci (1997), pagg. 75-76. 27 Cfr. Leti (1983), pagg. 525-554. Gli indici usati nel nostro studio sono gli indici relativi di dissomiglianza del primo ordine calcolati sia sulle frequenze non cumulate che sulle frequenze cumulate. 12 k = Zr ∑ r f Ai− f r Bi , zr = r i =1 Z 'r k−1 = r r ∑ F Ai − F Bi , z 'r = i= 1 r 1 k ∑ f 2 i=1 1 k −1 r Ai− f date le distribuzioni di frequenza f Ai e f Bi r k −1 ∑ F Ai − F Bi . Bi date le frequenze cumulate FAi e FBi i =1 Dissomiglianza nel breve periodo (periodo 1995-1999). Nella tavola 6 sono riportate le frequenze relative ripartite per area geografica28 risultanti dal nostro campione e da fonte ISTAT e il loro corrispondente scarto, risultanti dal nostro campione e da fonte ISTAT. Le frequenze del 1995 mettono in luce la situazione di partenza e gli effetti delle distorsioni del campione sull’andamento futuro del campione. In particolare si nota (i) una sottostima - più accentuata al Nord e al Sud - delle prime classi d’età (0-4, 5-9), che tende ad aggiustarsi nel corso dei 4 anni successivi ed (ii) una leggera sovrastima dell’ultima classe d’età al Nord e al Sud che si mantiene invece costante. Il grado di dissomiglianza delle due distribuzioni (tavola 5) è stato stimato da (Ä1) indicatore della differenza media registrata nelle varie classi d’età ogni anno, i cui valori si aggirano intorno al 7, 8‰ (con una punta massima al Nord nel 1997 di 30‰). I risultati sono soddisfacenti come confermano i bassi indici di dissomiglianza (massimi al Nord nel 1997: z1 = 0,104 e z’ 1 = 0,052).29 Tavola 5: Indicatori di dissomiglianza per area geografiche Ä1: Diff. media z1: Ind. sem. rel. diss. z’1: Ind. sem rel. diss. cum. 1995 0,007 0,023 0,013 Ä1: Diff. media z1: Ind. sem. rel. diss. z’1: Ind. sem rel. diss. cum. 1995 0,007 0,023 0,009 Ä1: Diff. media z1: Ind. sem. rel. diss. z’1: Ind. sem rel. diss. cum. 1995 0,007 0,022 0,007 NORD 1996 0,007 0,024 0,012 CENTRO 1996 0,008 0,028 0,008 SUD 1996 0,006 0,020 0,012 1997 0,030 0,104 0,052 1998 0,009 0,033 0,010 1999 0,008 0,028 0,012 1997 0,010 0,035 0,010 1998 0,009 0,031 0,009 1999 0,009 0,033 0,009 1997 0,007 0,025 0,011 1998 0,005 0,017 0,009 1999 0,005 0,018 0,007 Le classi d’età su cui gli indici sono stati calcolati sono le 7 classi della tavola 6 28 29 Non si confronta l’età media, fornendo l’ISTAT informazioni per classi d’età molto ampie (in alcuni casi ventennali). Gli indicatori di dissomiglianza del II ordine non sono riportati confermando i risultati degli indicatori semplici. 13 Tavola 6. Confronto struttura per età della popolazione ripartita per aree geografiche. MIRD ISTAT MIRD-ISTAT MIRD ISTAT MIRD-ISTAT MIRD ISTAT MIRD-ISTAT MIRD ISTAT MIRD-ISTAT MIRD ISTAT MIRD-ISTAT 0-4 0,036 0,041 -0,005 0,037 0,041 -0,004 0,036 0,041 -0,004 0,037 0,042 -0,004 0,041 0,042 -0,002 5-9 0,038 0,040 -0,002 0,039 0,040 -0,001 0,041 0,041 0,000 0,040 0,041 -0,001 0,038 0,042 -0,004 MIRD 1995 ISTAT MIRD-ISTAT MIRD 1996 ISTAT MIRD-ISTAT MIRD 1997 ISTAT MIRD-ISTAT MIRD 1998 ISTAT MIRD-ISTAT MIRD 1999 ISTAT MIRD-ISTAT 0-4 0,041 0,038 0,002 0,041 0,042 -0,001 0,040 0,042 -0,002 0,041 0,042 0,000 0,043 0,042 0,002 5-9 0,045 0,040 0,005 0,042 0,043 -0,001 0,043 0,044 -0,001 0,042 0,044 -0,002 0,041 0,044 -0,003 MIRD ISTAT MIRD-ISTAT MIRD ISTAT MIRD-ISTAT MIRD ISTAT MIRD-ISTAT MIRD ISTAT MIRD-ISTAT MIRD ISTAT MIRD-ISTAT 0-4 0,051 0,057 -0,006 0,053 0,059 -0,006 0,052 0,057 -0,005 0,052 0,054 -0,002 0,054 0,054 0,000 5-9 0,060 0,059 0,002 0,059 0,061 -0,002 0,058 0,062 -0,003 0,057 0,061 -0,004 0,056 0,060 -0,004 1995 1996 1997 1998 1999 1995 1996 1997 1998 1999 NORD 10-14 0,043 0,043 0,000 0,042 0,042 0,000 0,042 0,041 0,001 0,043 0,041 0,002 0,042 0,041 0,001 CENTRO 10-14 0,045 0,043 0,002 0,047 0,045 0,002 0,048 0,045 0,003 0,046 0,044 0,002 0,046 0,044 0,002 SUD 10-14 0,069 0,063 0,006 0,064 0,065 0,000 0,063 0,063 -0,001 0,063 0,064 -0,001 0,059 0,063 -0,004 15-24 0,121 0,125 -0,003 0,115 0,120 -0,006 0,108 0,116 -0,008 0,102 0,108 -0,005 0,098 0,103 -0,005 25-44 0,289 0,302 -0,013 0,292 0,306 -0,014 0,295 0,393 -0,098 0,296 0,312 -0,016 0,297 0,314 -0,017 45-64 0,265 0,267 -0,001 0,266 0,266 0,000 0,264 0,335 -0,071 0,265 0,254 0,011 0,267 0,266 0,001 +65 0,208 0,183 0,025 0,210 0,186 0,024 0,214 0,188 0,025 0,216 0,190 0,026 0,219 0,193 0,026 15-24 0,136 0,121 0,015 0,131 0,124 0,007 0,126 0,119 0,006 0,118 0,113 0,005 0,110 0,108 0,001 25-44 0,271 0,286 -0,014 0,273 0,299 -0,025 0,276 0,302 -0,026 0,280 0,304 -0,024 0,286 0,306 -0,020 45-64 0,258 0,264 -0,006 0,261 0,259 0,002 0,252 0,259 -0,007 0,256 0,260 -0,004 0,250 0,260 -0,010 +65 0,204 0,208 -0,004 0,205 0,188 0,017 0,216 0,190 0,026 0,217 0,193 0,024 0,223 0,195 0,028 15-24 0,155 0,154 0,001 0,152 0,153 -0,001 0,153 0,149 0,005 0,147 0,147 0,000 0,145 0,143 0,003 25-44 0,283 0,296 -0,013 0,288 0,297 -0,009 0,286 0,300 -0,013 0,289 0,299 -0,010 0,292 0,301 -0,009 45-64 0,220 0,226 -0,006 0,219 0,220 -0,001 0,219 0,222 -0,003 0,223 0,223 0,000 0,224 0,226 -0,001 +65 0,161 0,145 0,016 0,165 0,145 0,020 0,168 0,148 0,020 0,168 0,152 0,016 0,170 0,155 0,015 Dissomiglianza nel medio-lungo periodo (fino al 2044). Nel lungo periodo il confronto si basa, oltre che sugli indici calcolati in precedenza, anche sull’età media. 14 I risultati, riportati nelle tavole 6bis e 7, mostrano un forte invecchiamento della popolazione, un fenomeno più marcato al Nord ed al Centro (+11 e +9 anni MIRD, +12 e +11 IRP) piuttosto che al Sud (+8 MIRD, +9 IRP). Il confronto mostra inoltre come gli incrementi dell’età media MIRD tendano ad uniformarsi a quelli IRP dopo il 2024. Tavola 5bis : Indicatori di dissomiglianza per area geografiche Ä1:Diff. media z1: Ind. sem. rel. diss. z’1: Ind. sem. rel. cum. 1999 0,010 0,021 0,004 2004 0,012 0,023 0,005 Ä1:Diff. media z1: Ind. sem. rel. diss. z’1: Ind. sem. rel. cum. 1999 0,007 0,014 0,003 2004 0,006 0,012 0,002 Ä1:Diff. media z1: Ind. sem. rel. diss. z’1: Ind. sem. rel. cum. 1999 0,009 0,019 0,005 2004 0,008 0,017 0,004 NORD 2009 2014 0,006 0,005 0,012 0,010 0,003 0,002 CENTRO 2009 2014 0,002 0,003 0,003 0,005 0,001 0,001 SUD 2009 2014 0,012 0,013 0,023 0,026 0,005 0,005 2019 0,008 0,016 0,002 2024 0,012 0,024 0,003 2029 0,016 0,032 0,005 2034 0,011 0,023 0,003 2039 0,008 0,015 0,002 2044 0,009 0,019 0,003 2019 0,006 0,012 0,002 2024 0,013 0,026 0,004 2029 0,021 0,041 0,007 2034 0,017 0,035 0,006 2039 0,012 0,025 0,005 2044 0,011 0,023 0,004 2019 0,011 0,022 0,005 2024 0,011 0,022 0,004 2029 0,010 0,020 0,004 2034 0,011 0,023 0,004 2039 0,008 0,017 0,003 2044 0,007 0,014 0,003 Le classi d’età su cui gli indici sono stati calcolati sono 4 e sono 0-4, 5-19, 20-59, +60. Tavola 7: Età media e suo incremento nel quinquennio per area geografica 1999 2004 2009 2014 2019 2024 2029 2034 2039 2044 MIRD 44,24 45,60 46,91 48,32 49,68 50,94 52,05 53,12 54,15 55,08 NORD IRP tMIRD 43,11 44,62 3,06 46,23 2,86 47,96 3,01 49,58 2,82 50,98 2,53 52,17 2,18 53,21 2,06 54,13 1,94 54,93 1,73 tIRP 3,50 3,61 3,74 3,38 2,82 2,33 1,99 1,73 1,48 ETA’ MEDIA CENTRO MIRD IRP tMIRD 43,35 42,68 44,55 44,09 2,77 45,66 45,57 2,49 46,77 47,11 2,43 47,93 48,56 2,48 49,01 49,83 2,25 49,96 50,93 1,94 50,81 51,90 1,70 51,65 52,77 1,64 52,46 53,51 1,57 tIRP 3,30 3,36 3,38 3,08 2,62 2,21 1,90 1,68 1,40 MIRD 39,05 40,11 41,13 42,13 43,16 44,15 45,13 45,99 46,73 47,29 SUD IRP tMIRD 37,77 38,87 2,70 40,05 2,55 41,30 2,44 42,51 2,44 43,59 2,29 44,54 2,23 45,40 1,90 46,17 1,59 46,82 1,21 tIRP 2,91 3,04 3,12 2,93 2,54 2,18 1,93 1,70 1,41 L’età media è calcolata su classi d’età quinquennali, attribuendo la frequenza al valore centrale della classe. Quozienti di natalità e di mortalità nel breve periodo. Dall’analisi della struttura demografica del campione iniziale (vedi tavola 1) era emerso un peso maggiore delle classi d’età anziane (sopra i 65 anni). Questa distorsione, presente nei microdati iniziali, tende a mantenersi nell’intero periodo di riferimento. Ciò giustifica dei quozienti di mortalità MIRD più elevati rispetto a quelli ISTAT. Una minore difformità risulta invece tra i quozienti di natalità. 15 Tavola 8: Quozienti di natalità e mortalità per regione nel breve periodo NORD 1996 1997 MIRD ISTAT MIRD ISTAT 8,88 8,29 8,22 8,54 11,07 10,51 11,80 10,56 CENTRO 1996 1997 MIRD ISTAT MIRD ISTAT 9,50 8,26 8,81 8,36 11,15 10,09 11,12 10,39 SUD 1996 1997 MIRD ISTAT MIRD ISTAT 11,37 11,20 11,27 10,97 8,99 8,52 9,11 8,61 Anno Fonte dei risultati Quoziente di Natalità (x1000) Quoziente di mortalità (x1000) Anno Fonte dei risultati Quoziente di Natalità (x1000) Quoziente di mortalità (x1000) Anno Fonte dei risultati Quoziente di Natalità (x1000) Quoziente di mortalità (x1000) 1998 1999 MIRD ISTAT MIRD ISTAT 7,96 8,57 7,71 8,48 12,22 10,75 11,95 10,69 1998 1999 MIRD ISTAT MIRD ISTAT 8,66 8,28 8,46 8,45 11,22 10,58 11,91 10,37 1998 1999 MIRD ISTAT MIRD ISTAT 11,26 10,60 11,02 10,15 9,47 8,83 10,01 8,45 Quozienti di natalità e di mortalità nel medio-lungo periodo. Maggiori differenze si registrano nei quozienti di mortalità nel lungo periodo. Tuttavia l’IRP ipotizza una mortalità decrescente fino al quinquennio 2014-2018 mentre i parametri MIRD sono costanti. Ovviamente tale differenza nelle ipotesi influenza sensibilmente i risultati. Tavola 8bis : Quozienti di natalità e mortalità per regione nel lungo periodo NORD n CENTRO 1999-2003 2004-2008 2009-2013 2014-2018 2019-2023 2024-2028 2029-2033 2034-2038 2039-2043 MIRD IRP MIR D 7,35 7,62 12,69 5,97 6,60 14,56 4,93 5,59 15,74 4,31 5,07 17,18 4,36 4,99 18,11 4,52 5,04 19,72 4,42 4,94 20,57 4,15 4,65 21,85 3,66 4,32 23,76 m n SUD IRP MIRD IRP MIR D 10,96 8,18 8,15 12,18 11,44 7,10 7,19 14,01 12,19 6,08 6,23 15,34 13,52 5,30 5,69 16,27 15,15 5,24 5,57 16,87 16,64 5,72 5,59 17,85 18,10 5,71 5,48 18,66 19,59 5,20 5,20 20,03 21,14 4,83 4,89 21,24 m n IRP 10,64 11,23 12,02 13,22 14,58 15,81 17,06 18,40 19,94 m MIR IRP MIR IRP D D 10,67 12,31 10,28 8,21 9,85 11,35 11,25 8,42 9,06 10,31 12,15 8,88 8,33 9,62 12,75 9,50 8,21 9,36 13,15 10,34 8,29 9,28 13,70 11,06 8,19 9,11 14,29 11,82 7,97 8,80 15,69 12,73 7,67 8,49 17,03 13,78 Il trend delle varie classi d’eta nel lungo periodo Nel lungo periodo, si è utilizzato il coefficiente di determinazione R2 per evidenziare la rispondenza delle frequenze relative della simulazione per ogni classe d’età a quelle IRP per ogni area geografica.30 I risultati riportati nella tavola 9 sono molto vicini all’unità. 30 In particolare si è ipotizzata una relazione lineare tra variabile dipendente Y (IRP) e variabile indipendente X (MIRD), utilizzando per la stima il metodo dei minimi quadrati. Infatti, il coefficiente di determinazione è pari al quadrato del coefficiente di correlazione tra X ed Y. Il suo campo di variazione è pertanto 0 ed 1: è pari a 0 quando non si riscontra correlazione lineare tra X ed Y, è pari ad 1 quando c’è correlazione perfetta. 16 Tavola 9: Andamento del R2 per classi d’età CLASSE d'ETA' 0-4 5-19 20-59 +60 +80 R2 NORD 0,9912 0,9941 0,9504 0,9866 0,9773 CENTRO 0,9702 0,9871 0,9254 0,9802 0,8971 SUD 0,9909 0,9403 0,9229 0,9926 0,9076 In appendice F confrontiamo l’andamento simulato delle classi d’età e quello previsto dall’IRP. I grafici mostrano come la classe d’età più anziana (gli ultra ottantenni) sia sovrastimata fino al 2013 e poi sottostimata, data l’ipotesi di mortalità costante del MIRD. Nell’Italia settentrionale, il trend decrescente delle prime classi d’età 0-4, 5-9 dell’IRP è confermato dal MIRD, che però sottostima sistematicamente il loro peso. Nell’Italia centrale il MIRD corrisponde meglio nell’andamento e nei livelli all’IRP. Nell’Italia meridionale infine il trend decrescente delle prime classi d’età è meno accentuato visto la maggiore natalità e l’iniziale sottostima del MIRD tende a ridursi nel tempo. 4.b. La convalida dei dati relativi a lavoro e redditi Nel seguito valideremo l’andamento delle quote degli occupati per posizione professionale, titolo di studio e area geografica, nella seconda metà degli anni ‘90. Posizione professionale e il titolo di studio Il modello attribuisce ad ogni individuo che trova occupazione una posizione professionale (dipendente privato, pubblico e autonomo) e un titolo di studio (laureato, diplomato etc.). In figura G1 (Appendice G) confrontiamo l’andamento simulato della professione degli occupati per area geografica con quello stimato dall’ISTAT. Osservando la situazione di partenza del settore occupazionale è evidente la sottostima dei lavoratori autonomi e la sovrastima dei dipendenti; questa distorsione non può essere compensata nel breve periodo. Mentre per l’ISTAT i lavoratori dipendenti sono circa il 71% degli occupati (al Sud 70%), nel modello abbiamo percentuali più alte di 3, 4 punti. Considerazioni analoghe valgono per l’evoluzione simulata del titolo di studio in figura G2 (Appendice G) posta a confronto con quella stimata dall’ISTAT, che mostra un aumento progressivo della percentuale di laureati; tendenza che potrebbe essere meglio colta dal modello aumentando nel tempo la probabilità di laurearsi, o partendo da percentuali superiori, relative alle nuove generazioni di lavoratori. La stima dei redditi Stimare il reddito aggregato, partendo da informazioni campionarie, pone problemi di: 17 1. riporto all’universo dei totali campionari (sia moltiplicando le medie su base familiare per il numero totale di famiglie residenti, sia moltiplicando le medie su base individuale per il numero di individui residenti, ipotizzando tassi di risposta uniformi su tutta la popolazione); 2. aggiustamento dei totali per la popolazione istituzionale (da noi trascurato essendo questa soltanto lo 0,81% della popolazione totale residente dal Censimento del 1991); 3. comparabilità dei risultati (esistendo differenze insanabili dovute a definizioni e metodi di calcolo delle voci che entrano nella stima dell'aggregato ed essendo gli aggregati di Contabilità Nazionale affetti da errori di misurazione, e.g. quantificazione del sommerso). 31 Nell'ambito dei redditi la nostra attenzione si è concentrata sulla stima delle retribuzioni lorde dei lavoratori dipendenti, al netto dei contributi sociali (Tavola 10). Il totale campionario è stato riportato all’universo moltiplicando il reddito complessivo dei lavoratori dipendenti, quale risulta dal campione, per il rapporto tra i lavoratori dipendenti, stimati dall’ISTAT e quelli simulati dal MIRD: TotDip ISTAT Y = ∑ yDip ⋅ Dip TotDip MIRD Tavola 10: Retribuzioni lorde dei lavoratori dipendenti (miliardi di lire correnti) 1996 561,728 561,743 ISTAT MIRD 1997 585,411 582,8543 1998 606,433 607,458 1999 629,456 630,068 Le differenze tra le nostre stime e gli aggregati ISTAT sembrano trascurabili. Infatti, la regressione dei redditi da lavoro dipendente aveva l’R2 più elevato e l’allineamento dei redditi nel 1995 ai valori ISTAT (vedi Appendice C) sembra aver eliminato i problemi di self-selection. L’imposta personale sul reddito Il gettito campionario ricavato dall’imposta personale sul reddito è stato riportato all’universo su base familiare, ovvero: TotFam ISTAT IRPEF = ∑ Irpef i ⋅ i TotFam MIRD Tavola 11: Andamento del gettito IRPEF (miliardi di lire correnti) Banca d’Italia MIRD 1996 167,923 171,766 1997 182,601 179,152 1998 200,221 204,471 1999 221,833 216,988 L'importo del gettito IRPEF è quello elaborato da Banca d'Italia in base ai dati della Relazione generale sulla situazione economica del Paese e nel Rendiconto generale dell'amministrazione dello Stato. Anche in questo caso le differenze con le stime campionarie sono circa il 2%. Tali differenze possono essere considerate minime se si tiene conto dell’impossibilità di ricostruire esattamente la composizione dei 31 Per una puntuale discussione di tali problematiche si rimanda a Atkinson Micklewright (1983). 18 redditi del nucleo familiare, di stimare le detrazioni per familiari a carico, le deduzioni e le detrazioni. 5. Conclusioni In questa nota, dopo aver presentato il modello di microsimulazione dinamica MIRD, formulato per previsione e controllo di dinamiche regionali, si è proceduto alla convalida di input e output demografici (matrimoni, nascite, etc.), economici (redditi) e fiscali (gettito Irpef) generati dal modello rispetto a rilevazioni e stime fornite da ISTAT, IRP e Banca d’Italia. Validando i microdati di partenza ed affinando la specificazione del modello, disponiamo ora di uno strumento affidabile e rapido in grado di simulare l'evoluzione della distribuzione della ricchezza lavorativa e pensionistica e di evidenziare le conseguenze redistributive delle politiche fiscali.32 Con riferimento alla realtà italiana, l'analisi ha infatti consentito di convalidare: a) gli andamenti socio-economici e demografici, di breve (dal ‘96 al ‘99) e di lungo periodo (2045), b) le differenti dinamiche demografiche e socio-economiche per area geografica e c) gli effetti delle politiche fiscali limitatamente all’IRPEF dal 1996 al 1999. Data la complessità intrinseca nel modello, mirante a riprodurre il funzionamento reale del sistema demografico-socio-economico e la sua costruzione e convalida hanno richiesto la collaborazione di più persone con diverse professionalità e specifiche conoscenze economico-quantitative, tributarie e informatiche, oltre alla preziosa disponibilità di studiosi di Banca d’Italia, ISTAT, SECIT cui si è molto grati.33 Sviluppo e convalida del MIRD hanno occupato parecchio lavoro ed hanno messo in luce modalità alternative di rappresentare le abilità di problem- solving individuali e dei processi decisionali alla base delle “funzioni di reazione” individuali alle politiche fiscali. Resta da proseguire il lavoro incorporando e validando tali funzioni comportamentali, in primis il modulo che endogenizza la scelta dell’età di pensionamento, (in base all’option value) per verificare l’affidabilità del modello nel prevedere mutamenti comportamentali lungo il percorso della riforma. I risultati positivi del presente lavoro ci incoraggiano ad affrontare con successive ricerche le sfide poste dal problema di incorporare e verificare “funzioni di reazione” individuali (e.g. nei processi di 32 Il volume edito da Citro e Hanushek (1991) raccoglie i risultati del panel, organizzato negli USA dalla National Academy of Science, sui modelli di micrisimulazione. Tra i suggerimenti del panel, particolare rilevanza ed enfasi è stata data alla fase di convalida dei modelli includendo (vedi Cohen et al. 1991) esplicite raccomandazioni in ricerca sui metodi di convalida e sul modo con cui informare l’utilizzatore del modello (decision-maker) dell’incertezza associata ai risultati di simulazione. 33 Wolfson (2000) osserva che nell’ultima decade le raccomandazioni del panel sono state disattese, forse anche a causa degli alti costi coinvolti in esperimenti di convalida del modello. 19 creazione e distribuzione della ricchezza, nel mercato del lavoro e nella famiglia nonché in relazione alle componenti fiscali e contributive) ed il fenomeno immigrazione. 7. Bibliografia. Anderson, J. M. e Wertheimer II, R., (1983), Connecting the DYNASIM microsimulation modeln and the ICF macroeconomic-demographic model, Final report to the Brookings Institution Project on Retirement and Aging, Washington D.C.: icf Inc. and The Urban Institute. Andreassen, L.,Fredriksen, D. e Ljones, O., (1993), The future burden of pubblic pension benefits: a microsimulation study, Paper presented at the Conference on microsimulation and Public Policy, international Association for Research on Income and Wealth, Australian Bureau of Statistics and National Center for Social and Economic Modelling, December 1993, Canberra, Australia. Antcliff, S., Grusskin, A., Harding, A. e Kapuscinski, C., (1996), Development of DYNAMOD: 1993 and 1994, Dynamic Modelling Working Paper, No.1, National Center for Social and Economic Modelling, University of Canberra, Australia. Atkinson A.B., Micklewright J. (1983), On the reliability of income data in the family Expenditure Survey 19701977, Journal Royal Statistical Society, 146, Part 1, pp.33-61. Banca d'Italia, (2000), Assemblea Generale Ordinaria dei Partecipanti tenuta in Roma, Anno 1999 Banca d’Italia, (1995), La riforma del sistema pensionistico, Bollettino Economico (in Note), No.25, Ottobre 1995, Roma, Banca d’Italia. Banca d’Italia, (1997), I bilanci delle famiglie italiane nell’anno 1995, Supplemento al bollettino statistico, 14, Roma, Banca d’Italia. Brandolini, A. e L. Cannari, (1994), Methodological Appendix: The Bank of Italy’s Survey of Household Income and Wealth, in Ando, Guiso, Visco ed. (1994), pp.369-386 Brandolini, A., (1999), The distribution of Personal Income in the Post-war Italy: Source Description, Data Quality, and the Time Pattern of Income Inequality, Temi di discussione 350. Banca d’Italia. Bianchi C., D. Guidi, A. Niccodemi, P. A. Vagliasindi, Microsimulation and Income Redistribution: Some Experiments for the Italian Case. International workshop: Syntethic Biographies: State of The Art and Developments, San Miniato, Italy, 6-9 June 1999. Caldwell, S. B., (1993), Content, validation and uses of CORSIM 2.0, a dynamic microanalytic model of the United States, Paper presented at the Conference on microsimulation and Public Policy, international Association for Research on Income and Wealth, Australian Bureau of Statistics and National Center for Social and Economic Modelling, December 1993, Canberra, Australia. Caldwell, S. B., (1993), Content, validation and uses of CORSIM 2.0, a dynamic microanalytic model of the United States, presented at the Conference on Microsimulation and Public Policy, International Association for Research on Income and Wealth, Australian Bureau of Statistics and National Center for Social and Economic Modelling, December 1993, Canberra, Australia. Cannari, L. e G. D’Alessio, (1990), Housing Assets In Dagum C. Zenga M. ed., The Bank Of Italy’s Survey Of household Indome And Wealth, in Income And Wealth Distribution, Inequality And Poverty. Cannari, L e R. Violi, (1991), Under-reporting del reddito nell’indagine sui bilanci delle famiglie condotta dalla Banca d’Italia, documento presentato al convegno “Personal Income Distribution, Inequality and Poverty”, siena, 28-30 settembre, 1991. Cannari, L. e G. D’Alessio, (1992), Mancate interviste e distorsione degli stimatori, Temi di discussione 172. Banca d’Italia. Cannari, L. and G. D’Alessio, (1993), Non-reporting and Under-reporting Behavior in the Bank of Italy’s Survey of Household Income and Wealth, in Proceedings of the ISI 49th session, Firenze, ISI, pp. 395-412. Cannari, L. e A. Gavosto, (1995), L’indagine della Banca d’Italia sui bilanci delle famiglie: una descrizione dei dati sul mercao del lavoro, Economia & Lavoro, Vol. 28, No.1, pp. 63-79. Cannari, L. e Nicoletti Altimari, S., (1998), A microsimulation model of the Italian household’s sector, in Le previsioni della spesa per pensioni, ISTAT, Annuali di statistica, Serie 10, Volume 16, pp.103-134. Citro, C.F. and E.A. Hanushek Eds, (1991), Improving Information for Social Policy Decisions: The Use of Microsi,uation Modeling, Vol I, Review and Recommandations, Panel to Evaluate Microsimulation Models for Social Welfare Programs, National Research Council, National Academy Press, Washington D.C Cohen, M., L.Billard, D.M.Betson, and E.P. Erickson, (1991), “A Validation Experiment with TRIM2”, in Citro, C.F. and E.A. Hanushek Eds, (1991) 20 Gupta, A. and V. Kapur Eds, (2000), Microsimulation in Government Policy and Forecasting, North-Holland, Amsterdam INSEE, (1999), Le modele de mocrosimulation dynamique, Série des documents de travail de la Direction des Etudes et Synthèses Économiques, No. G9913. IRP, Golini A., De Simoni A., Citoni F. (a cura di), Tre scenari del possibile sviluppo della popolazione delle regioni italiane al 2044 (base 1994), Roma 1995 ISTAT, (1996), “Tavole di mortalità della popolazione per regione 1989-1993”. Collana Informazioni n°8. ISTAT, (1996-2000), Forze di lavoro. Supplemento all’Annuario statistico italiano ISTAT, (1997), La fecondità nelle regioni italiane. Analisi per coorti. Anni 1952-1993, Collana Informazioni n°.35. ISTAT, (1997), Previsioni della popolazione residente per sesso, età e regione: Base: 1.1.1996. Roma, Collana Informazioni, n°34. ISTAT, (1999) Popolazione per sesso, età e stato civile nelle provincie e nei comuni. Nuove stime per gli anni 1993-1996. Informazioni n°20. ISTAT, (1999), Matrimoni, separazioni e divorzi. Anno 1996, Annuario, n°9. ISTAT, (2000), Annuario statistico italiano 2000 ISTAT, (2000), Il valore della lira dal 1861 al 1999. Informazioni n°24, Settore Prezzi Livi Bacci M., (1995), Introduzione alla demografia. Loescher editore Marenzi A., Pozzi F.,(1991), L’analisi degli impatti distributivi del prelievo fiscale tramite modelli di microsimulazione, in Bernardi L. ed., Analisi e modelli per la gestione della finanza pubblica, Bologna, Il Mulino, pp.263-302. Naylor, T. H., Balintfy, J. L., Burdick, D. S. e Kong, C., (1968), Computer simulation techniques, New York, Jhon Wiley & Sons, Inc. Naylor T.H., (1971), Computer Simulation Experiments with Models of Economic Systems, New York, John Wiley & Sons, Inc. pp.153-163 Nelissen J.H.M., (1994), Income Redistribution and Social Security, an application of microsimulation, London, Chapman & Hall. Nelissen J.H.M., (1999), Pension claims in the future: the impact of labor participation, Center Applied Research, Tilburg University. Nicoletti Altimari, S., (1999), Microsimulation model of demographic and development and households’ economic behaviour, University of Pennsylvania, Ph. D. Thesis Orcutt, G. H., (1957), A new type of socio-economic system, Review of Economics and Statistica, 58, pp. 773797. Orcutt, G. H., Merz, J. e Quinke, H., (1986), Microanalytic simulation models to support social and financial policy, New York: North Holland. Orcutt, G. H., Greenberger, M., Korbel, J. e Rivlin, A., (1961), Microanalysis of Socioeconomic Systems: a simulation study, New York, Harper & Row. Peracchi, F., (1999), Specificazione e stima di modelli microeconomici di pensionamento, lavoro preparato per la Riunione scientifica del gruppo MURST su “Fattori economico-demografici e futuro dello stato sociale in Italia”, Messina. Pudney S., Sutherland H., (1994), How reliable are microsimulatio results? An analysis of the role of sampling error in a U.K. tax-benefit model. Journal of Public Economics 53 (1994) 327-365. Redmond G., Sutherland H., Wilson M.,(1999), The arithmetic of tax and social security reform. A user’s guide to microsimulation methods and analysis. Cambridge University Press. Stock, J. H. e Wise, D. A., (1990), Pensions, the option value of work, and retirement, in Econometrica, Vol. 58, No. 5, pp. 1151-1180. Toso, S. (1996), Modelli di microsimulazione dinamici e analisi di lungo periodo delle politiche fiscali, in Muraro, G. e Rey, M. (a cura di), Ineguaglianza e redistribuzione, Milano, Franco Angeli, pp. 209-231. Wolfson, M. (2000), “ Socio-Economic Microsimulation and Public Policy: Retrospect and Prospect”, in Gupta, A. and V. Kapur Eds, (2000) 21 Appendice A: Le tavole delle probabilità di transizione demografiche I modelli di microsimulazione dinamica modificano la struttura del campione iniziale aggiornando di anno in anno le variabili del campione mediante la procedura dynamic aging. Questa tecnica probabilistica di simulazione degli eventi si avvale del metodo Monte Carlo. 34 La simulazione degli eventi demografici (morte, matrimonio, divorzio, uscita dal nucleo familiare d’origine e natalità) richiede la conoscenza delle relative probabilità teoriche per area geografica, in funzione dell’età e del sesso. La tavola A1 riporta le probabilità di morire q~i j nell’area geografica j-esima, all’età i-esima, costruite a partire dalle tavole di mortalità elaborate dall’ISTAT su base regionale q hij per il 1993, tenendo in conto l’ampiezza demografica Phi delle corrispondenti regioni, ovvero: 35. k q~i j = ∑ h k q hij ⋅ k P hi ∑ k Phi h La tavola A2 descrive le probabilità di essere scelti quali candidati al matrimonio (fase 1 del sottomodulo matrimonio) e le probabilità di incorrere nell’evento divorzio, differenziate rispetto all’età, al sesso e all’area geografica di appartenenza dei candidati. Queste probabilità sono state calcolate considerando i rapporti tra il numero degli eventi (matrimoni o divorzi) secondo le variabili suddette e il numero degli individui esposti al rischio dell’evento stesso (celibi o nubili, divorziati o divorziate, vedovi o vedove per l’evento matrimonio, coniugati per il divorzio – dati ISTAT 1996). j k ni = S ij j k Pi k Dij k di = j k Pi j k n = prob. matrimonio d = prob. divorzio k = maschio, femmina j = area geografica S = matrimoni D = divorzi P = popolazione i = classe d’età Nella tavola A3 sono indicate le probabilità dell’evento matrimonio, condizionate all’età dei potenziali coniugi (con classe di età dei candidati).36 La tavola A4 indica la probabilità di avere un figlio, data l’età, la regione di appartenenza della madre e l’ordine di nascita dei figli. Le probabilità iniziali sono state ricostruite dalle tavole ISTAT sui tassi di fecondità per età e regione del 1993 corrette opportunamente per le donne sposate: TFT n = ∑ i TFTi DTOT ∗ n DS Nella simulazione poi, queste probabilità sono state aggiornate in linea con le proiezioni ISTAT (1997) in modo da replicare il numero di nuovi nati. 34 Tale metodo consente di determinare il verificarsi di un evento per ogni soggetto confrontando le probabilità teoriche del verificarsi dell’evento con un numero casuale generato dal calcolatore: se questo è inferiore o uguale alla probabilità teorica, l’evento si avvera, altrimenti il procedimento viene ripetuto l’anno successivo. 35 Il fatto che l’anno di riferimento di questi dati sia antecedente al nostro periodo di riferimento non comporta particolari alterazioni del quadro demografico. Infatti, tali fenomeni (come la mortalità e la fecondità) subiscono cambiamenti solo in archi temporali molto lunghi. 36 Cfr.Cannari, Nicoletti-Altimari (1999). 22 Tavola A1: Probabilità teorica di morte. NORD età 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52 M ,00706 ,00040 ,00032 ,00026 ,00021 ,00019 ,00018 ,00017 ,00017 ,00017 ,00018 ,00017 ,00021 ,00023 ,00036 ,00058 ,00083 ,00101 ,00112 ,00113 ,00115 ,00120 ,00124 ,00125 ,00128 ,00135 ,00143 ,00156 ,00164 ,00168 ,00165 ,00163 ,00160 ,00157 ,00154 ,00154 ,00152 ,00157 ,00164 ,00170 ,00180 ,00196 ,00211 ,00231 ,00256 ,00282 ,00317 ,00358 ,00398 ,00439 ,00481 ,00528 ,00583 F ,00561 ,00040 ,00031 ,00025 ,00019 ,00015 ,00013 ,00013 ,00011 ,00012 ,00013 ,00012 ,00013 ,00015 ,00017 ,00022 ,00025 ,00029 ,00032 ,00034 ,00019 ,00019 ,00020 ,00022 ,00024 ,00029 ,00032 ,00055 ,00056 ,00058 ,00060 ,00060 ,00040 ,00043 ,00054 ,00054 ,00068 ,00083 ,00098 ,00106 ,00100 ,00107 ,00116 ,00128 ,00141 ,00158 ,00176 ,00196 ,00218 ,00240 ,00254 ,00275 ,00294 CENTRO M ,00828 ,00042 ,00032 ,00026 ,00023 ,00021 ,00021 ,00020 ,00018 ,00018 ,00016 ,00016 ,00017 ,00021 ,00033 ,00053 ,00073 ,00085 ,00090 ,00090 ,00092 ,00098 ,00100 ,00101 ,00100 ,00100 ,00103 ,00108 ,00114 ,00123 ,00132 ,00136 ,00141 ,00141 ,00139 ,00138 ,00137 ,00140 ,00146 ,00155 ,00165 ,00177 ,00189 ,00204 ,00217 ,00242 ,00271 ,00305 ,00344 ,00385 ,00416 ,00460 ,00508 F ,00665 ,00042 ,00029 ,00022 ,00015 ,00016 ,00014 ,00014 ,00012 ,00011 ,00013 ,00013 ,00016 ,00017 ,00020 ,00020 ,00021 ,00024 ,00032 ,00029 ,00029 ,00029 ,00030 ,00032 ,00032 ,00034 ,00039 ,00040 ,00043 ,00046 ,00048 ,00051 ,00054 ,00058 ,00060 ,00064 ,00065 ,00069 ,00073 ,00080 ,00085 ,00092 ,00102 ,00113 ,00128 ,00142 ,00159 ,00173 ,00189 ,00199 ,00210 ,00227 ,00250 SUD M ,01057 ,00051 ,00036 ,00027 ,00022 ,00020 ,00021 ,00022 ,00021 ,00021 ,00019 ,00019 ,00023 ,00031 ,00040 ,00051 ,00064 ,00074 ,00084 ,00093 ,00098 ,00103 ,00107 ,00108 ,00113 ,00119 ,00121 ,00122 ,00127 ,00130 ,00136 ,00142 ,00142 ,00141 ,00141 ,00138 ,00142 ,00146 ,00153 ,00159 ,00172 ,00187 ,00211 ,00230 ,00250 ,00270 ,00302 ,00339 ,00381 ,00417 ,00450 ,00489 ,00544 F ,00849 ,00049 ,00033 ,00024 ,00019 ,00017 ,00016 ,00014 ,00013 ,00013 ,00013 ,00013 ,00015 ,00017 ,00020 ,00022 ,00023 ,00024 ,00026 ,00025 ,00026 ,00026 ,00026 ,00027 ,00029 ,00030 ,00031 ,00032 ,00035 ,00040 ,00044 ,00049 ,00052 ,00055 ,00057 ,00059 ,00062 ,00069 ,00078 ,00087 ,00095 ,00103 ,00110 ,00119 ,00129 ,00146 ,00165 ,00183 ,00199 ,00213 ,00227 ,00252 ,00283 NORD età M 53 ,00657 54 ,00738 55 ,00836 56 ,00939 57 ,01054 58 ,01185 59 ,01325 60 ,01466 61 ,01615 62 ,01778 63 ,01953 64 ,02144 65 ,02353 66 ,02568 67 ,02778 68 ,02999 69 ,03248 70 ,03514 71 ,03835 72 ,04203 73 ,04619 74 ,05060 75 ,05520 76 ,05963 77 ,06454 78 ,07055 79 ,07807 80 ,08630 81 ,09527 82 ,10432 83 ,11484 84 ,12527 85 ,13681 86 ,14931 87 ,16272 88 ,17677 89 ,19111 90 ,20566 91 ,22049 92 ,23724 93 ,25497 94 ,27371 95 ,29346 96 ,31424 97 ,33605 98 ,35889 99 ,38275 100 ,40759 101 ,43139 102 ,46006 103 ,48758 104 ,51584 105 1,0000 F ,00318 ,00351 ,00383 ,00420 ,00459 ,00498 ,00538 ,00564 ,00599 ,00651 ,00723 ,00798 ,00875 ,00963 ,01074 ,01198 ,01340 ,01456 ,01628 ,01834 ,02053 ,02304 ,02319 ,02588 ,02923 ,03326 ,03791 ,04498 ,05129 ,05819 ,06602 ,07452 ,06675 ,07504 ,08412 ,09396 ,10451 ,16844 ,18656 ,20658 ,22836 ,25198 ,27751 ,30499 ,33447 ,36592 ,39930 ,43453 ,47147 ,50994 ,54965 ,59033 1,0000 CENTRO M ,00557 ,00620 ,00699 ,00787 ,00887 ,00981 ,01093 ,01216 ,01355 ,01514 ,01674 ,01850 ,02047 ,02258 ,02465 ,02674 ,02892 ,03169 ,03481 ,03827 ,04183 ,04534 ,04946 ,05464 ,06034 ,06664 ,07347 ,08080 ,09055 ,10139 ,11219 ,12433 ,13611 ,14809 ,15997 ,17223 ,18550 ,19867 ,21661 ,23326 ,25092 ,26959 ,28929 ,31003 ,33184 ,35470 ,37860 ,40351 ,42941 ,45623 ,48393 ,51241 1,0000 F ,00281 ,00310 ,00341 ,00372 ,00404 ,00439 ,00486 ,00531 ,00600 ,00660 ,00734 ,00801 ,00893 ,00988 ,01084 ,01202 ,01341 ,01507 ,01708 ,01944 ,02179 ,02446 ,02740 ,03115 ,03548 ,04022 ,04584 ,05239 ,06026 ,06914 ,07903 ,08920 ,10080 ,11296 ,12556 ,13896 ,15383 ,17061 ,19211 ,21243 ,23451 ,25840 ,28419 ,31190 ,34157 ,37316 ,40664 ,44190 ,47880 ,51714 ,55664 ,59700 1,0000 SUD M ,00610 ,00685 ,00761 ,00848 ,00934 ,01040 ,01148 ,01273 ,01417 ,01581 ,01759 ,01944 ,02130 ,02309 ,02520 ,02731 ,02989 ,03285 ,03615 ,03990 ,04391 ,04785 ,05186 ,05663 ,06209 ,06881 ,07617 ,08411 ,09291 ,10262 ,11288 ,12496 ,13714 ,14939 ,16062 ,17194 ,18460 ,19953 ,21815 ,23483 ,25251 ,27119 ,29090 ,31165 ,33346 ,35629 ,38017 ,40505 ,43090 ,45765 ,48527 ,51367 1,0000 F ,00312 ,00342 ,00371 ,00411 ,00451 ,00502 ,00553 ,00614 ,00674 ,00754 ,00833 ,00930 ,01038 ,01149 ,01282 ,01440 ,01631 ,01837 ,02068 ,02307 ,02585 ,02890 ,03265 ,03656 ,04138 ,04717 ,05377 ,06131 ,06971 ,07880 ,08842 ,09916 ,11161 ,12564 ,13747 ,14971 ,16418 ,18238 ,20587 ,22688 ,24962 ,27414 ,30049 ,32870 ,35877 ,39066 ,42430 ,45957 ,49631 ,53429 ,57321 ,61276 1,0000 23 Appendice B: La costruzione dell’input del MIRD Partendo da dati aventi pesi diversi (w i ), nasce l’esigenza di dare a tutte le unità (famiglie ed individui) peso unitario. A tal fine possiamo ricercare il peso minimo w*m i n e calcolare i pesi degli altri dati w*i prendendo la parte intera del rapporto fra il loro peso ed il peso minimo: w*m i n = min(wi ) ∀ i w*i = int(wi / w*m i n + 0,5) 37 ∀ i Questa procedura conserva la rappresentatività del campione iniziale, poiché tutte le famiglie sono presenti, ma ha lo svantaggio di accrescere molto la numerosità del campione. Da 23.294 individui e 8.135 famiglie si passa ad a 271.208 individui e 104.016 famiglie.38 Volendo disporre di un campione di dimensioni più contenute, possiamo rapportare i pesi di ogni famiglia al numero di famiglie residenti in Italia ottenendo: W i = int(w*i ⋅ 19600000 / 8135 ) Per ogni famiglia i si procede quindi all’estrazione di un numero casuale x i da una distribuzione binomiale con parametri W i e p, con p costante. Il numero casuale xi viene estratto da una distribuzione binomiale secondo la procedura indicata da Naylor (1968): tale procedura si basa sulla riproduzione di n (nel nostro esempio n=Wi ) esperimenti di Bernoulli, indipendenti tra loro e con probabilità di successo p costante. Fissato p e conoscendo n, il processo incomincia con la generazione di n numeri casuali r i da una distribuzione uniforme. La variabile x i , posta in principio uguale a 0, viene incrementata se il numero casuale estratto r i è inferiore o uguale al parametro p, altrimenti rimane invariata. Dopo che sono stati generati n numeri casuali, il valore di x n è uguale alla variabile binomiale cercata e al numero di volte che la famiglia deve essere replicata.39 Nel nostro caso ponendo p=0,006 si è ottenuto un campione di 36.259 individui e 13.831 famiglie. Ovviamente, all’aumentare di p, aumenta la probabilità di inclusione di ogni famiglia e la dimensione campionaria riducendosi il numero di famiglie che non vengono replicate. Così facendo si è ridotta la dimensione campionaria da 271.208 individui del campione espanso a 36.259, tuttavia si sono perse le informazioni delle famiglie che, nel campionamento, hanno peso uguale a zero. Una soluzione intermedia, che concilia dimensione campionaria contenuta ed eterogeneità delle informazioni fornite, può essere trovata imponendo nel campione finale la presenza di tutte le famiglie e diminuendo la probabilità p a 0,004, per ottenere il numero di ulteriori replicazioni di ogni famiglia, ottenendo un campione di 41.941 individui e 15.068 famiglie. 37 Lo 0,5 permette di approssimare i rapporti al numero intero più vicino. Solo l’impiego di un calcolatore potente permette di superare tale inconveniente mantenendo i tempi di esecuzione del programma sufficientemente contenuti. Del resto nelle simulazioni condotte in un lungo arco di tempo, la numerosità del campione sintetico scende a 175.470 individui nel 2044, vista la bassa natalità. Usando campioni, già in partenza piccoli, si rischia, nel lungo periodo, di compromettere il verificarsi di eventi come il matrimonio che necessitano comunque di un certo numero di candidati maschi e femmine. Occorre ricordare che il matrimonio è un evento che, nel modello di microsimulazione elaborato, in virtù delle ipotesi fatte, può avvenire soltanto tra individui della stessa area geografica restringendo ulteriormente la rosa dei possibili candidati. 39 Tale procedura è utilizzata anche da Cannari e Nicoletti Altimari (1998). 38 27 Appendice C: Il trattamento fiscale dei dati sul reddito Nell’indagine di Banca d’Italia il reddito disponibile REDDISP (al netto delle imposte e comprensivo degli assegni familiari) è distinto per categoria: reddito da lavoro, da pensione, trasferimenti (borse di studio, assegni alimentari) e redditi da capitale. Per risalire al reddito imponibile lordo REDIMP (non comprensivo dei contributi) bisogna sottrarre prima gli assegni familiari ANF e quindi aggiungere l’IRPEF, secondo le seguenti equazioni:40 REDNET=REDDISP-ANF(REDIMP) REDIMP=REDNET+IRPEF(REDIMP) Essendo gli assegni funzione del reddito imponibile, si genera un procedimento circolare. Il problema viene superato attribuendo gli assegni in funzione del “reddito netto”, calcolando i limiti in funzione del reddito netto una volta stimata l’aliquota media IRPEF. Per semplicità, sono state stimate due tabelle dei limiti a seconda che il reddito familiare sia concentrato nelle mani del capofamiglia (nella misura del 83,3%) o equiripartito tra i coniugi.41 Noti gli assegni familiari e quindi REDNET si risale all’imponibile in funzione del reddito netto. Possiamo sostituire j −1 j− 1 i =1 i =1 IRPEF= ∑ t i ( I i + 1 − I i ) + t j ( REDIMP − I j ) − DETR = t j REDIMP+ ∑ t j (I i +1 − I i ) − t j I j − DETR in REDIMP=REDNET+IRPEF ricavando il reddito imponibile con dei passaggi algebrici REDIMP = 1 REDNET + 1 − t j j−1 ∑ ti (I i i=1 +1 − I i ) − t j I j − DETR .42 Se gli assegni calcolati in funzione del netto non sono uguali a quelli corrispondenti al reddito imponibile s’inizia una procedura iterativa che converge rapidamente, eliminando eventuali approssimazioni derivanti dal calcolo degli assegni in funzione dei redditi netti. Per ottenere il reddito lordo distinto per categorie reddituali (lavoro dipendente, autonomo, etc.), si è supposto che l'IRPEF incida su ogni categoria nella stessa misura, ove l’alternativa del calcolo delle buste paga portava a risultati poco differenti. Dato che il reddito aggregato risultante sottostima del 20% il valore di Contabilità Nazionale, i redditi campionari dei lavoratori dipendenti sono incrementati del 20% per riportarli all’universo, 43 ipotizzando tassi di risposta dei lavoratori dipendenti uniformi.44 40 La procedura seguita è quella utilizzata nel modello “ITAXMOD” dell’ISPE. In pratica se la quota di reddito del capofamiglia è superiore al 66,6% si considera la tabella “concentrata”, calcolata ipotizzando che il reddito sia percepito per l’83,3% dal capofamiglia e per il 17% da un altro componente, se la percentuale è inferiore al 66% si utilizza la tabella “non concentrata”, calcolata ipotizzando che il reddito sia percepito da due componenti in eguale misura. 42 Ii rappresenta il limite inferiore dello scaglione i-esimo, ti indica l’aliquota applicata all’i-esimo scaglione e DETR indica la somma delle detrazioni d’imposta spettanti al soggetto in esame. 43 Aggiustando le stime approssimando i dati di Contabilità Nazionale, si perde la corrispondenza tra reddito lordo stimato e reddito disponibile dichiarato dagli intervistati (assegni al nucleo familiare ed IRPEF). Tuttavia, se i redditi lordi sono usati per verificare l'impatto di politiche fiscali e pensionistiche sembra ragionevole aggiustare i redditi stimati. 44 Per Cannari e D’Alessio (1992) la propensione a collaborare all'indagine è funzione inversa del reddito. La sottostima dei redditi da lavoro dipendente potrebbe quindi dipendere da una sottostima dei lavoratori con redditi maggiori. Per quanto riguarda i redditi degli autonomi, il discorso è complicato dal problema evasione. Secondo Marenzi Pozzi (1991), i lavoratori autonomi dichiarare al fisco circa il 40% del reddito (con una percentuale è maggiore nei primi decili). Nel lavoro, si è quindi ipotizzata un’evasione pari al 40% dei redditi lordi. 41 28 Appendice D: Istruzione e posizione professionale Un processo Monte Carlo a distribuzione uniforme estrae i soggetti che troveranno un’occupazione., che utilizza la seguente tavola di probabilità in funzione del sesso e dell’area geografica per assegnare loro il settore. Tavola D1 : Probabilità della posizione professionale Sesso/Area geografica Dip./occupati Dip.privati/Dip. Maschi/Nord 0,677899 0,797523 Maschi/Centro 0,684791 0,799553 Maschi/Sud 0,684552 0,756381 Femmine/Nord 0,777226 0,785745 Femmine/Centro 0,757133 0,570206 Femmine/Sud 0,746666 0,404161 Le quote dei dipendenti sul totale degli occupati sono di fonte ISTAT (Forze di lavoro. Media 1996). Le quote dei dipendenti privati sul totale dei dipendenti sono calcolate sul campione di Banca d'Italia riponderato. Il grado di istruzione è attribuito con un processo Monte Carlo a distribuzione uniforme, che utilizza le probabilità teoriche della seguente tavola in funzione del sesso e dell’area geografica. Sopra ai 24 anni, viene simulata, prima la probabilità che il soggetto sia laureato piuttosto che diplomato. Una volta escluso che il soggetto si sia laureato, si simula la possibilità che ottenere il diploma piuttosto che sola licenza media inferiore. Solo quest’ultimo procedimento è eseguito sotto i 24 anni. Tavola D2: Probabilità del titolo di studio Sesso/Area geografica Diplomati/Occ. Laureati/Occ. Maschi/Nord 0,3755 0,1000 Maschi/Centro 0,3784 0,1177 Maschi/Sud 0,3033 0,1013 Femmine/Nord 0,4543 0,1169 Femmine/Centro 0,4547 0,1522 Femmine/Sud 0,4175 0,1824 Le quote dei titoli di studio sono calcolate in base all’Indagine sulle Forze di lavoro. Media 1999. Le proporzioni sono state calcolate equiparando dottorato, laurea e laurea breve, diploma tre anni e diploma cinque. Per non sottostimare gli occupati con elevato titolo di studio, si è utilizzato il 1999, vista la crescita negli anni del titolo di studio degli occupati,. Le ore settimanali medie sono assegnate da un processo Monte Carlo a distribuzione uniforme con le probabilità teoriche della seguente tavola in funzione dell’età e del settore di appartenenza. 29 Appendice E: La stima dei redditi In questa Appendice riconsidereremo la stima (ordinary least squares) dei redditi per i 3 settori: log y i = X i b + u i I segni dei coefficienti sono quelli attesi (positivi tranne il quadrato dell'età, per cogliere l’andamento prima crescente e poi decrescente delle retribuzioni durante la carriera lavorativa) salvo per alcuni lavoratori meridionali, dove data l’eterogeneità nella composizione della popolazione i dati non sembrano rappresentare una carriera media. Il più basso valore di R2 per gli autonomi è imputabile all’elevata eterogeneità dei dati ed all’occultamento dei redditi. Tavola E1: Stima coefficienti regressione (D=dip privati, DP= pubblici, A=lav autonomi) REGRESSORI m1 (maschio nord) m2 (maschio centro) m3 (maschio sud) f1 (femmina nord) f2 (femmina centro) f3 (femmina sud) Età*m1 Età*m2 Età*m3 Età*f1 Età*f2 Età*f3 Età2*m1 Età2*m2 Età2*m3 Età2*f1 Età2*f2 Età2*f3 Annistudio*m1 Annistudio*m2 Annistudio*m3 Annistudio*f1 Annistudio*f2 Annistudio*f3 Oresettimanali*m1 Oresettimanali*m2 Oresettimanali*m3 Oresettimanali*f1 Oresettimanali*f2 Oresettimanali*f3 β j (D) t -Stud 6,8585 123,6723 7,0889 74,3641 8,0835 106,3761 6,8534 101,0520 6,8332 52,1712 8,9119 62,8520 0,0949 34,5848 0,0833 17,5198 0,0375 10,3249 0,0662 19,4536 0,0588 8,3477 -0,0604 -7,3898 -0,0010 -27,5616 -0,0007 -11,6379 -0,0002 -3,9024 -0,0007 -14,1720 -0,0005 -5,3481 0,0009 8,0981 0,0618 48,5236 0,0524 21,7901 0,1064 57,8454 0,0490 25,4526 0,0512 15,9770 0,1078 36,0394 0,0176 26,3600 0,0115 13,0160 -0,0103 -17,0315 0,0294 47,5620 0,0259 28,4222 0,0063 7,6018 2 RD= 0,4231 Oss D =43.497 β j (DP) t-Stud 6,8699 50,9708 6,8142 47,0694 7,3945 64,4952 8,0595 72,4802 5,7277 29,8402 7,1304 51,7577 0,1000 15,8214 0,1012 16,1238 0,0522 10,7055 0,0311 5,6498 0,1041 11,6677 0,0444 7,0242 -0,0010 -13,2249 -0,0010 -14,1007 -0,0004 -8,1932 -0,0002 -2,4037 -0,0009 -8,1062 -0,0003 -4,0372 0,0503 30,5806 0,0420 20,8985 0,0640 38,9054 0,0412 20,9213 0,0604 20,6123 0,0668 28,1253 0,0140 14,4338 0,0184 18,0587 0,0186 21,5681 0,0197 24,4187 0,0259 17,7512 0,0254 26,5417 2 RDP= 0,3042 Oss DP =23.529 β j(A) t-Stud 7,1001 59,0645 7,5600 39,5982 7,3060 53,7930 8,7294 54,4046 6,3192 18,5964 7,9530 27,3297 0,0951 17,3631 0,0613 6,9177 0,0478 7,3049 0,0005 0,0796 0,1200 8,1758 0,0100 0,7403 -0,0009 -14,3067 -0,0004 -4,3753 -0,0004 -5,9125 0,0001 1,4438 -0,0013 -7,9331 -0,0001 -0,5660 0,0569 23,1440 0,0657 16,3187 0,0777 24,3443 0,0517 13,1109 0,0350 5,0853 0,0924 16,6982 0,0026 7,0872 0,0003 0,4191 0,0114 24,3878 0,0026 4,2941 0,0084 7,8775 0,0026 3,6055 2 RA= 0,2453 Oss A =21.606 31 Appendice F: Evoluzione delle classi d’età e previsioni IRP Fig.D1: Andamento nell’Italia Settentrionale per classi d’età. (Valori percentuali) % 0.045 % 0.13 MIRD 0.035 MIRD IRP IRP 0.11 0.025 0.09 0-4 ANNI 5-19 ANNI 0.015 1999 2004 2009 2014 2019 2024 2029 2034 0.07 Anno 2044 2039 1999 2004 2009 2014 2019 2024 2029 2034 Anno 2044 2039 % 0.5 % 0.6 60 ANNI E PIU' 0.45 MIRD 0.56 IRP 0.4 0.52 0.35 0.48 MIRD 0.3 0.44 20-59 ANNI 0.4 1999 2004 IRP 0.25 2009 2014 2019 2024 2029 2034 Anno 2044 2039 0.2 1999 2004 2009 2014 2019 2024 2029 2034 Anno 2044 2039 % 0.16 0.14 80 ANNI E PIU' 0.12 0.1 0.08 MIRD 0.06 IRP 0.04 1999 2004 2009 2014 2019 2024 2029 2034 2039 Anno 2044 Fig.D2: Andamento nell’Italia Centrale per classi d’età. (Valori percentuali) % 0.14 % 0.045 MIRD 0.04 IRP 0.035 IRP 0.12 0.11 0.03 0.025 MIRD 0.13 0.1 0-4 ANNI 0.02 1999 2004 2009 2014 2019 2024 2029 2034 2039 Anno 2044 5-19 ANNI 0.09 1999 2004 2009 2014 2019 2024 2029 2034 2039 Anno 2044 32 % % 0.6 0.5 60 ANNI E PIU' MIRD 0.55 IRP 0.4 0.5 MIRD 0.3 IRP 0.45 20-59 ANNI 0.4 1999 2004 2009 2014 2019 2024 2029 2034 0.2 Anno 2044 2039 1999 2004 2009 2014 2019 2024 2029 2034 Anno 2044 2039 % 0.14 0.12 0.1 0.08 0.06 MIRD 0.04 IRP 80 ANNI E PIU' 0.02 1999 2004 2009 2014 2019 2024 2029 2034 Anno 2044 2039 Fig.D3: Andamento nell’Italia Meridionale per classi d’età. (Valori percentuali) % % 0.07 MIRD 0.06 MIRD 0.18 IRP IRP 0.05 0.14 0.04 5-19 ANNI 0-4 ANNI 0.03 1999 % 2004 2009 2014 2019 2024 2029 2034 2039 Anno 2044 0.1 1999 2004 2009 2014 2019 2024 2029 2034 2039 Anno 2044 % 0.4 0.6 MIRD 0.35 60 ANNI E PIU' 0.56 IRP 0.3 0.52 0.25 0.48 0.44 0.2 20-59 ANNI 0.4 1999 2004 2009 MIRD 2014 2019 2024 2029 2034 2039 Anno 2044 IRP 0.15 1999 2004 2009 2014 2019 2024 2029 2034 2039 Anno 2044 % 0.1 80 ANNI E PIU' 0.08 0.06 MIRD 0.04 IRP 0.02 1999 2004 2009 2014 2019 2024 2029 2034 2039 Anno 2044 33 Appendice G: Evoluzione professionale ed istruzione Fig. G1: Andamento della posizione professionale degli occupati per area geografica % 100 80 60 40 20 0 DIPENDENTI-NORD 1995 % 100 80 60 40 20 0 1996 ISTAT 1997 1996 MIRD 1999Anno 1998 INDIPENDENTI-NORD MIRD 1999Anno 1998 ISTAT 1997 MIRD 1999Anno 1998 DIPENDENTI-SUD 1995 % 1997 DIPENDENTI-CENTRO 1995 % 100 80 60 40 20 0 1996 ISTAT ISTAT MIRD 50 40 30 20 10 0 1995 % 1996 1997 1999Anno 1998 INDIPENDENTI-CENTRO ISTAT MIRD 50 40 30 20 10 0 1995 % 1996 1997 1999Anno 1998 INDIPENDENTI-SUD ISTAT MIRD 50 40 30 20 10 0 1995 1996 1997 1998 1999Anno 34 Fig. G2: Andamento dell'istruzione negli occupati per area geografica % 16 LAUREA-NORD ISTAT MIRD % 16 12 12 8 8 4 4 0 1995 % 16 1996 1997 LAUREA-SUD 1998 ISTAT Anno 1999 0 MIRD % 50 LAUREA-CENTRO 1995 1996 1997 ISTAT 1998 DIPLOMA-NORD ISTAT 1995 1998 MIRD Anno 1999 MIRD 40 12 30 8 20 4 10 0 1995 1996 1997 % DIPLOMA-CENT RO 50 1998 IST A T Anno 1999 0 MIRD % 50 40 40 30 30 20 20 10 10 0 1995 1996 1997 % LICENZA MEDIA-NORD 60 50 40 30 20 10 0 1995 1996 1997 % 60 50 40 30 20 10 0 LICENZA MEDIA-SUD 1995 1996 1997 1998 IST A T 1998 IST A T 1998 Anno 1999 1996 1997 DIPLOMA-SUD ISTAT 0 1995 1996 1997 1998 Anno 1999 MIRD Anno 1999 MIRD % LICENZA MEDIA-CENTRO IST A T MIRD 60 50 40 30 20 10 0 Anno Anno 1995 1996 1997 1998 1999 1999 MIRD Anno 1999 35