XXX CONFERENZA ITALIANA DI SCIENZE REGIONALI COMPARABILITÀ DELL’OUTPUT CENSUARIO A LIVELLO EUROPEO: DALL’ESPERIENZA DELLA PRECEDENTE TORNATA DEI CENSIMENTI DEMOGRAFICI ALLA DEFINIZIONE DEGLI HYPERCUBES PER LA PROSSIMA Silvia DARDANELLI*, Alessandro SASSO* e Mariangela VERRASCINA* * Istituto Nazionale di Statistica, Via Adolfo Ravà 150, 00142 Roma SOMMARIO In occasione dei censimenti della popolazione e delle abitazioni del 2010-11, notevoli sono gli sforzi compiuti in ambito internazionale al fine di definire un programma armonizzato di diffusione dei dati. L’obiettivo del presente lavoro è quello di mostrare come, a partire dall’esperienza della passata tornata censuaria, si è arrivati alla definizione di variabili, classificazioni e piano di diffusione europei per la prossima. L’analisi degli aspetti metodologici, operativi e organizzativi dell’ultima rilevazione e la valutazione degli approcci adottati, delle criticità incontrate e delle innovazioni introdotte dai paesi costituisce la base per la pianificazione dei futuri censimenti ed ha portato ad una rigorosa descrizione delle classificazioni e alla precisa individuazione degli ipercubi, ovvero il piano degli incroci che ciascun Paese Membro dovrà rendere disponibile ad Eurostat entro 27 mesi dall’anno del censimento. Il programma unico di diffusione dei dati censuari a livello europeo permetterà di produrre un output confrontabile, tempestivo e di elevata qualità. Si prospetta un lavoro importante per i singoli Stati che dovranno valutare la congruità del proprio piano di rilevazione con quanto richiesto da Eurostat anche se, con un approccio output oriented, è lasciata libertà nella scelta delle tecniche e dei metodi utilizzati per la rilevazione censuaria. 1 1 ITRODUZIOE Il censimento della popolazione rappresenta un elemento fondamentale di un sistema statistico nazionale; svolge, infatti, un ruolo centrale nel sistema delle statistiche ufficiali, fornendo un conteggio affidabile della popolazione a livello nazionale e ai livelli territoriali più piccoli. La rilevazione censuaria permette di produrre dati accurati sulla struttura della popolazione per età e per sesso a livello nazionale e a livello locale, ma permette anche di produrre la distribuzione della popolazione secondo le caratteristiche demografiche, sociali ed economiche. Temi, questi ultimi, per i quali molti paesi si basano esclusivamente su dati del censimento, in particolare per le statistiche per piccole aree. I Censimenti tradizionali si fondano su quattro elementi essenziali: l’enumerazione individuale, l’universalità all’interno di un determinato territorio, la simultaneità e la periodicità definita; a questi si aggiunge anche la produzione dei dati per piccole aree. Lo strumento tradizionalmente utilizzato per la raccolta delle informazioni è il questionario. L’obiettivo del presente lavoro è quello di mostrare come, a partire dall’esperienza della tornata censuaria del 2000, si sia arrivati alla definizione di variabili, classificazioni e piano di diffusione per il censimento del 2010-2011. Si comincia con l’analisi e il confronto dei diversi approcci e delle pratiche adottate dai paesi membri dell’UNECE (United ations economic Commission for Europe) tenendo conto delle Recommendations for the 2000 Censuses of Population and Housing in the ECE Region sviluppate per la tornata del 2000. L’analisi dell’esperienza precedente, ha, infatti, rappresentato uno strumento utile per la pianificazione dei censimenti, insieme alle nuove Conference of European Statisticians (CES) Recommendations for the 2010 Censuses of Population and Housing, fornendo agli Istituti nazionali di statistica orientamento e assistenza nella programmazione e nella realizzazione dei prossimi censimenti. Dopo aver descritto gli aspetti metodologici, operativi e organizzativi e le innovazioni adottate per il censimento della popolazione e delle abitazioni del 2001 (paragrafo 2), si analizzano le problematiche connesse al piano di diffusione richiesto da Eurostat per il 2011 e ai contenuti informativi (paragrafo 3). Vengono poi presentate le novità previste per il prossimo censimento per quanto riguarda le Raccomandazioni UNECE, il Regolamento Europeo, le classificazioni e le specifiche tecniche e il piano di diffusione predisposti a livello internazionale (paragrafo 4). Segue un’esposizione della strategia censuaria che si sta impostando in Italia per la prossima tornata (paragrafo 5) ed infine (paragrafo 6) alcune considerazioni di sintesi. 2 2 ASPETTI METODOLOGICI, OPERATIVI E ORGAIZZATIVI E IOVAZIOI ADOTTATE PER IL CESIMETO DEL 2000-01 L’analisi degli aspetti metodologici, operativi e organizzativi del passato censimento costituisce la base per la pianificazione dei futuri censimenti, attraverso la valutazione degli approcci adottati, delle criticità incontrate e delle innovazioni introdotte dai paesi. Tale analisi si basa su materiale raccolto dalla divisione statistica della UNECE per la preparazione delle CES Recommendations e su materiale aggiuntivo fornito da Eurostat. Nel 2004 è stata condotta un’indagine tra i paesi UNECE per raccogliere informazioni sulle pratiche seguite nei censimenti del 2000-01, basandosi su una ricerca simile condotta da Eurostat nel 2003. Dei 55 paesi membri dell’UNECE, 43 più l’Australia hanno risposto al questionario. Obiettivo è stato quello di valutare il grado di conformità delle pratiche seguite dai paesi con le Recommendations for the 2000. Nel 2000-01, alcuni paesi nella regione UNECE sono passati dal censimento tradizionale, basato sulla enumerazione sul campo, ad approcci alternativi, che talvolta hanno permesso una riduzione dei costi del censimento ed un miglioramento dell’efficienza. Sono state introdotte molte innovazioni, con un numero significativo di paesi che hanno adottato il data entry ottico o altre nuove tecnologie. Per quanto riguarda la compilazione dei questionari di rilevazione c’è stato, per alcuni paesi, il passaggio dalla compilazione effettuata da rilevatori/intervistatori all’auto-compilazione, in cui i modelli sono compilati direttamente dai rispondenti. In alcuni casi il cambiamento è stato necessario per superare problemi organizzativi o per l’opposizione dell’opinione pubblica al censimento tradizionale percepito come troppo intrusivo nella vita privata delle persone. La consegna e il ritiro dei modelli sono stati tradizionalmente effettuati dai rilevatori, ma nell’ultimo decennio, la consegna e/o la raccolta “per posta” è stata adottata in diversi paesi. Per nove di questi (tra cui Spagna e Italia), i questionari sono stati distribuiti e raccolti da rilevatori, ma compilati dai rispondenti. In altri cinque i rispondenti hanno compilato i modelli, consegnati e raccolti in diversi modi: negli Stati Uniti il servizio postale è stato utilizzato sia per inviare che per raccogliere i questionari (mail-out, mail-back); in Canada, Francia e Regno Unito sono stati distribuiti da rilevatori e raccolti per posta (solo mail-back); a Malta, i modelli sono stati inviati per posta (solo mail-out) e raccolti da rilevatori. In Belgio e Svizzera i modelli di censimento sono stati inviati e raccolti per posta, e i rilevatori sono stati impegnati solo successivamente per la raccolta dei modelli non restituiti. Alcuni paesi hanno, inoltre, adottato ulteriori metodi di compilazione oltre a quello principale. La compilazione tramite internet è stata offerta come possibilità in cinque paesi: Australia, Belgio, Spagna, Svizzera e Stati Uniti, ma solo una minoranza della popolazione ha scelto Internet come opzione. Negli Stati Uniti, i call-center hanno utilizzato un web-based CATI 3 (Computer Assisted Telephone Interview) per lo svolgimento di interviste telefoniche e per la compilazione di alcuni questionari non restituiti. La maggior parte dei paesi ha proposto un solo tipo di modello di rilevazione per contare l’intera popolazione. In tre paesi (Canada, Stati Uniti e Israele) sono stati predisposti due tipi di questionario. Una short form, con un numero molto limitato di domande, è stata compilata dalla maggioranza delle famiglie (80 per cento in Canada e Israele, circa il 83 per cento negli Stati Uniti). Una long form, con quesiti su molte caratteristiche demografiche e sociali è stata completata dalle restanti famiglie (20 per cento in Canada e Israele, circa 17 per cento negli Stati Uniti). Talvolta sono state utilizzate informazioni contenute nei registri. In alcuni paesi, tali informazioni sono state pre-stampate sui questionari di censimento, dando la possibilità ai rispondenti di controllare i dati riportati ed eventualmente correggerli (Spagna, Svizzera e Belgio); in altri paesi determinate informazioni sono state desunte dai registri e utilizzate a fini censuari ma non sono state pre-stampate sui questionari (Lettonia e Slovenia), che sono serviti solo per raccogliere le restanti informazioni. Per i Censimenti della popolazione del 2000-01 sono state generalmente effettuate attività di valutazione della rilevazione. Le modalità includevano: indagine post-censuaria di qualità, indagine post-censuaria di copertura, analisi demografiche, re-intervista sul campo e confronto con altre fonti di dati. Ha prevalso una combinazione delle attività di valutazione: sia l’indagine di copertura che quella di qualità, insieme ad analisi demografiche e alla comparazione con i dati esterni. Le evoluzioni nella tecnologia hanno permesso cambiamenti nel modo in cui sono condotti i censimenti. Quello del 2000-01 ha visto l’adozione di una serie di nuove tecnologie in un certo numero di paesi. Tra queste, la scansione in sostituzione della registrazione manuale dei dati, le mappe digitali e il sistema di informazione geografica (GIS) in sostituzione della cartografia dei tradizionali censimenti. L’inserimento dei dati è l’area in cui le nuove tecnologie hanno svolto il ruolo più significativo. La maggior parte dei paesi è passata da sistemi di immissione manuale dei dati a sistemi ottici basati sul riconoscimento ottico dei segni (optical mark recognition – OMR) e sul riconoscimento dei caratteri (optical character recognition – OCR). L’Italia ha anche utilizzato un sistema di monitoraggio (MTCens) basato su Internet per aiutare i vari soggetti coinvolti a gestire le operazioni censuarie. Nella maggior parte dei paesi, la preparazione e la conduzione di un censimento richiede una base giuridica, che disciplina questioni come: la ripartizione dei fondi per le operazioni di censimento, l’obbligo dei cittadini a fornire informazioni, i rapporti tra l’ente responsabile per il censimento e le altre amministrazioni pubbliche coinvolte nelle operazioni censuarie, il possibile uso dei registri per produrre dati di censimento o di sostegno alle operazioni sul campo, la riservatezza dei dati. In un crescente numero di paesi sono state approvate 4 specifiche leggi sulla protezione dei dati e, in alcuni casi, tali leggi comprendono anche le disposizioni necessarie per le esigenze dei censimenti. Pubblicità e campagne di informazione, infine, svolgono un ruolo importante nel garantire il successo del censimento, specialmente nei casi in cui si richiede ai cittadini di partecipare attivamente alle attività censuarie come rispondenti e, eventualmente, come lavoratori temporanei. In generale, la campagna pubblicitaria è volta a promuovere la sensibilizzazione del pubblico, creando percezioni positive, e ad incoraggiare la partecipazione al censimento della popolazione, in particolare, di speciali gruppi. La campagna di informazione, invece, si concentra sulle operazioni di censimento, sulla compilazione e sulla raccolta dei questionari. I principali obiettivi sono: informare il rispondente sul censimento e sulla riservatezza della risposta; migliorare la qualità delle informazioni fornite, spiegando, per esempio, come rispondere al questionario nel caso di auto-compilazione; chiarire il quadro giuridico, con particolare attenzione all’obbligo di risposta, laddove previsto, e indicare i diversi strumenti utilizzati durante la fase di raccolta dei dati. 3 TEMI DEL CESIMETO 2000-01 3.1 Introduzione Le UECE Recommendations del 2000 includevano un elenco di caratteristiche da rilevare al censimento, relative a persone, gruppi di persone (famiglie o nuclei familiari), alloggi o edifici contenenti abitazioni. Queste caratteristiche sono state suddivise in core topics e noncore topics. Per i primi, quelli di interesse basilare per i paesi, è stato consigliato l’inserimento nella tornata dei Censimenti della popolazione e delle abitazioni del 2000 (a meno che i dati non fossero disponibili da altre fonti), per i non-core, invece, ogni paese è stato libero di includere questi topics nel piano di rilevazione e/o diffusione sulla base delle necessità e delle esigenze informative del proprio territorio. L’elenco di core topics e non-core topics includeva alcune variabili dette derived. I derived topics erano quelli per i quali si potevano ottenere informazioni da altre variabili, e quindi non erano oggetto di rilevazione diretta. Ne sono esempi le informazioni desunte dalle risposte fornite da una persona a due o più domande, o dalle risposte a una particolare domanda da due o più persone. Le Recommendations for the 2000 censuses of population and housing in the ECE region comprendevano anche un elenco delle principali tabulazioni che si raccomandava di includere nei risultati pubblicati. 3.2 Il Table Program di Eurostat per il 2000-01 e le sue criticità 5 Il core tabulation programme era destinato a fornire indicazioni sui principali tipi di dati censuari in grado di soddisfare esigenze informative nazionali e internazionali, e a fornire un orientamento generale sul contenuto delle tavole incluse nel programma di tabulazione raccomandato. Le 24 tavole comprese nel piano di diffusione erano limitate alle caratteristiche fondamentali della popolazione (in termini di individui, famiglie, nuclei ed abitazioni) ed alle loro classificazioni di base. Eurostat ha poi ulteriormente ampliato l’elenco fino a 42 tabelle dettagliate (Community Programme of Population and Housing Censuses in 2001) che includevano anche le 24 dell’UNECE. Nell’ambito del Table Programme for the Community Programme of Population and Housing Censuses in 2001, Eurostat ha richiesto ai singoli paesi europei la fornitura di un set di 40 tavole statistiche, a livello nazionale, provinciale e comunale. Sono state successivamente richieste due tavole al dettaglio territoriale di urban areas1 (aree urbane). Il Table Programme definiva l’insieme dei dati censuari che Eurostat ha richiesto e collezionato dai singoli paesi e conteneva in particolare: - 28 tavole con dati a livello nazionale: • 5 sulle caratteristiche demografiche della popolazione (popolazione residente per sesso, classe d’età, stato civile, posizione in famiglia o in convivenza, paese di cittadinanza, paese di nascita, luogo di dimora abituale un anno prima del censimento); • 10 sulle caratteristiche economiche (popolazione residente per sesso e classe d’età, condizione professionale e attività economica; occupati per professione ed attività • economica, posizione nella professione, ore abitualmente lavorate); 2 sull’istruzione (popolazione residente per sesso, classe d’età e grado di istruzione); • 7 sulle famiglie e sui nuclei (popolazione residente in famiglia per sesso, età, cittadinanza, ampiezza della famiglia; nuclei per tipologia, numero di figli, caratteristiche economiche dei componenti; famiglie per tipo e ampiezza, composizione • per cittadinanza, titolo di godimento dell’unità abitativa); 4 sugli alloggi e sulle abitazioni (alloggi per tipo di proprietà, tipologia ed epoca di costruzione dell’edificio; abitazioni occupate per tipo di proprietà, numero di stanze e numero di occupanti); - 9 tavole a livello provinciale (NUTS 3) con contenuti analoghi alle tavole nazionali; - 3 tavole con dati a livello comunale (LAU 2) contenenti le principali caratteristiche della popolazione, delle famiglie e degli alloggi; gli occupati per sesso e luogo di lavoro; - 2 tavole a livello di aree urbane sulle principali caratteristiche della popolazione, delle famiglie e degli alloggi. 1 Il concetto di area urbana non coincide con quello di comune (LAU 2 per la classificazione utilizzata da Eurostat) né con quello di area subcomunale, ma prescinde dai confini comunali. Le aree urbane sono state individuate all’interno dei confini regionali; si tratta di aree definite secondo precisi criteri dalle Basi territoriali come aggregazioni di sezioni di censimento. 6 Insieme al Table Program, Eurostat ha inviato i layout delle tabulazioni richieste e le Guidelines, contenenti importanti indicazioni sulla popolazione oggetto di conteggio e sulle classificazioni previste in ogni singola tavola. In Italia, in primo luogo è stata effettuata l’analisi dei requisiti sulla base dei layout e Guidelines inviati da Eurostat, al fine di identificare chiaramente l’oggetto delle singole tavole e valutarne la fattibilità e la possibilità di derivare le variabili e gli indicatori richiesti dai dati rilevati al censimento 2001. Le Guidelines sono state di fondamentale importanza ai fini della comprensione del contenuto delle singole tavole, in termini di unità d’analisi e classificazioni, ed ai fini della definizione delle regole di calcolo e delle specifiche per la loro predisposizione. Le tavole richieste da Eurostat contenevano dati secondo classificazioni piuttosto dettagliate ed articolate, che, in quasi tutti i casi, differivano notevolmente dalle classificazioni utilizzate nella diffusione censuaria italiana. È stato dunque necessario definire e calcolare nuove classificazioni attraverso trasformazioni di quelle già esistenti oppure tramite una loro completa ridefinizione a partire dalle variabili di rilevazione o da opportune derivate. A questo riguardo, le maggiori difficoltà sono state incontrate per le tipologie familiari e per le classificazioni relative al ruolo degli individui all’interno della famiglia e del nucleo familiare. Prima di procedere con l’invio dei dati ad Eurostat si è passati ad una fase di controllo che ha riguardato la coerenza tra le singole tavole ma soprattutto la coerenza con gli altri dati censuari diffusi in Italia attraverso il datawarehouse DaWinci, i volumi cartacei ed i comunicati stampa. La fornitura delle tavole richieste ad Eurostat ha seguito il processo di produzione dei dati censuari ed in particolare le diverse diffusioni tematiche avvenute in Italia. L’invio dei dati a Eurostat è avvenuto, quindi, nel corso del tempo e, seguendo la disponibilità dei dati censuari, sono state fornite in primo luogo le tavole riguardanti le caratteristiche demografiche della popolazione e, di seguito, quelle riguardanti le caratteristiche economiche, l’istruzione, le famiglie ed i nuclei familiari ed infine gli alloggi e le abitazioni. Il set di tavole previsto nel Table Program è stato fornito ad Eurostat, per posta elettronica, tra aprile del 2004 e luglio 2005. Un primo problema è stato dunque quello della tempestività nella fornitura dei dati; infatti, secondo quanto previsto nell’accordo sottoscritto dai paesi membri per i censimenti del 200001 (Gentlemen’s agreement), la trasmissione dei dati ad Eurostat doveva avvenire entro e non oltre il 30 giugno 2003. Per il censimento italiano la fornitura dei dati secondo le specifiche richieste ha incontrato difficoltà legate sia ad aspetti definitori che classificatori. In alcuni casi le informazioni non erano state rilevate (ad esempio le abitazioni per uso secondario o stagionale) e in altri le informazioni erano state rilevate in maniera differente, tale da non consentire una completa ricostruzione delle classificazioni richieste (gli homeless definiti come popolazione in famiglia e non considerati separatamente). Molto spesso è stato oneroso 7 sia in termini di tempo che di risorse, ricostruire ex novo le classificazioni richieste da Eurostat in quanto differenti da quelle utilizzate in ambito nazionale. 3.3 Caratteristiche relative alla popolazione e alle abitazioni e loro criticità al 2000-01 Di seguito si riportano alcuni casi di variabili di importanza fondamentale nel censimento che hanno creato maggiori problemi sul piano della comparabilità internazionale, ovvero che hanno reso difficoltoso il confronto dei risultati tra i vari paesi a causa di differenti interpretazioni della definizione, o a causa della normativa vigente, o ancora per i diversi metodi di rilevazione o di classificazione. Luogo di dimora abituale: la definizione del luogo di dimora abituale è uno degli aspetti più importanti e critici in un censimento dato che questa definizione, e il modo in cui essa è applicata, influenza direttamente i risultati censuari in termini di totale della popolazione dimorante abitualmente, sia a livello nazionale che a livelli territoriali inferiori. Le criticità legate a questo aspetto sono aumentate negli ultimi anni, a causa del numero crescente di persone che hanno più domicili e della cresciuta mobilità della popolazione. Dei 44 paesi, la maggioranza (40 paesi, 91 per cento) ha adottato nel 2000 una definizione del luogo di dimora abituale basata sul concetto raccomandato (“La dimora abituale di una persona dovrebbe essere quella in cui egli/ella trascorre la maggior parte del suo quotidiano riposo notturno”). Nelle Raccomandazioni veniva suggerito ai paesi di impartire speciali istruzioni (nel questionario di censimento o ai rilevatori) per il trattamento di particolari gruppi di persone al fine di minimizzare il rischio di doppi conteggi o sottocopertura. Questi gruppi includevano coloro che potevano avere difficoltà nell’indicare il luogo di dimora abituale, per esempio studenti che vivono in residenze scolastiche o universitarie per una parte dell’anno e altrove durante le vacanze, persone che vivono lontano dalle loro case durante la settimana per lavoro e vi fanno ritorno nel fine settimana, persone in servizio militare obbligatorio, nomadi, persone senza fissa dimora e senza tetto, vagabondi, figli di genitori separati/divorziati che vivono analoghi periodi di tempo con ciascuno dei due genitori. Altri gruppi di popolazione a rischio di sottocopertura sono: giovani di età compresa tra 15 e 30, in particolare di sesso maschile, le persone che vivono da sole, persone “mobili” - di solito giovani adulti - che hanno più di un domicilio per lavoro o per studio, le persone temporaneamente assenti dal loro luogo di dimora abituale e gli immigrati. La popolazione totale al censimento: l’adesione alle definizioni fornite a livello internazionale su chi dovrebbe e chi non deve essere incluso nel conteggio totale della popolazione è fondamentale. Ci sono diversi concetti della popolazione totale che possono essere utilizzati. I due concetti più comuni sono stati: 8 a) La popolazione residente (chiamata anche popolazione de jure), che è il numero totale di persone con dimora abituale nel territorio, alla data del censimento, indipendentemente dalla loro effettiva presenza o assenza temporanea; b) La popolazione presente (chiamata anche popolazione de facto), che è la popolazione presente sul territorio, alla data del censimento. La scelta tra l’approccio de jure o de facto ha importanti implicazioni per l’organizzazione della fase di enumerazione. Inoltre, i risultati censuari in termini di popolazione de jure sarà direttamente influenzato dalla definizione del luogo di dimora abituale adottata e applicata durante il censimento. Quasi tutti i paesi hanno incluso nel conteggio del totale della popolazione residente anche le persone temporaneamente assenti. Non ci sono differenze tra i paesi che hanno condotto censimenti tradizionali e quelli che hanno condotto i censimenti da registro o misti, anche se, da un punto di vista operativo, il secondo gruppo ha incontrato potenzialmente più problemi nel verificare l’effettiva assenza delle persone. La maggior parte dei paesi (89 per cento) ha fornito dati per la popolazione residente totale, in conformità alle Raccomandazioni del 2000. In aggiunta, un numero significativo di paesi ha anche fornito altri conteggi di popolazione. Il Regno Unito ha prodotto la popolazione giornaliera (daytime). Un concetto analogo è stato adottato in Italia, che ha calcolato la popolazione che “utilizza” il territorio, ottenuta aggiungendo alla popolazione residente quella non residente che “utilizza” il territorio per la maggior parte dell’anno, e sottraendo la popolazione residente che non “utilizza” il territorio di residenza per la maggior parte dell’anno. Migrazioni internazionali: le migrazioni internazionali svolgono un ruolo importante nel definire la struttura demografica e socio-economica di molti paesi industrializzati. Differenti definizioni sono state utilizzate nell’ultimo censimento, anche a causa di un quadro globale carente, in particolare per l’identificazione dello stock degli immigrati e di altre persone con origini straniere. Le Raccomandazioni UNECE includevano due variabili fondamentali che consentivano l’identificazione dei “nati all’estero” (paese/luogo di nascita) e dei “cittadini stranieri” (paese di cittadinanza). Variabili aggiuntive fornivano informazioni sui modelli temporali e geografici degli immigrati: Luogo di dimora abituale un anno prima del censimento, Durata della presenza, Precedente luogo di dimora abituale e Anno di immigrazione nel paese. Le UECE Recommendations del 2000 hanno definito il luogo di nascita come il luogo di residenza della madre al momento della nascita. Solo 19 paesi però hanno seguito questa definizione, mentre tutti gli altri si sono concentrati sul luogo/paese di nascita effettivo (cioè in cui si è verificato l’evento), generalmente per la necessità di coerenza con i precedenti censimenti o con altre indagini statistiche, ma anche per le esigenze dei rispondenti e degli 9 utenti. La mancanza di coerenza delle definizioni utilizzate tra paesi ha reso tali dati difficili da utilizzare per i confronti internazionali. Migrazioni interne: lo stock di migrazione interna e le informazioni sui modelli temporali e geografici dei movimenti interni sono raccolti con le stesse variabili elencate per le migrazioni internazionali. L’anno di immigrazione è stato sostituito con Anno di arrivo nel luogo di attuale dimora abituale. Nel caso delle migrazioni interne, il rispetto della definizione del luogo di dimora abituale ha influito sulla possibilità di confronto dei dati censuari. Per quanto la maggior parte dei paesi (84 per cento) ha rispettato la definizione consigliata del luogo di dimora abituale, le istruzioni per il trattamento di specifici gruppi sono state varie tra i paesi e non sempre conformi alle Raccomandazioni. Ciò ha reso complessi i confronti dei dati delle migrazioni interne. Il trattamento degli studenti che non vivono con i genitori fornisce un esempio di complicazioni che possono derivare dall’uso di diverse definizioni. Solo 31 paesi hanno rilasciato istruzioni specifiche su come trattare tale gruppo. Una parte di questi paesi ha considerato gli studenti come residenti al loro indirizzo della famiglia, mentre un’altra parte li ha considerati come dimoranti abitualmente presso le residenze scolastiche o universitarie in cui vivevano per una parte dell’anno. Caratteristiche demografiche: tra le caratteristiche demografiche (sesso, età, stato civile) quella maggiormente problematica è lo stato civile legale. Le informazioni sono state raccolte in 23 paesi utilizzando la definizione e la classificazione raccomandate, e in 12 paesi con un’altra classificazione. Alcuni paesi hanno utilizzato una classificazione mista che comprendeva alcune modalità sullo stato civile legale e altre sullo stato civile di fatto. Tra i 23 paesi che hanno utilizzato la classificazione raccomandata dello stato civile legale, alcuni, tra cui l’Italia, hanno fornito ulteriori informazioni che riguardavano particolari categorie di persone separate: ad esempio i “legalmente separati”, i “separati ma ancora legalmente sposati” o semplicemente i “separati”. In molti paesi è non chiaro in che modo questi gruppi sono stati trattati, e questo può potenzialmente incidere sulla comparabilità dei risultati tra i vari paesi. Caratteristiche relative a famiglie e nuclei: la rapida trasformazione degli stili di vita e l’emergere di nuove tipologie di famiglie hanno reso necessaria l’introduzione di nuovi concetti e classificazioni nei censimenti del 2000-01. Tra le tendenze di rilievo, per esempio, l’aumento delle convivenze, un numero più elevato di famiglie monogenitore a seguito di divorzio, l’incremento delle famiglie ricostituite e una maggiore proporzione di persone che vivono da sole in giovane età. Le Raccomandazioni UNECE per la tornata censuaria del 2000 nel settore delle famiglie hanno registrato grandi cambiamenti rispetto alle precedenti. Un’importante novità è relativa alle unioni consensuali che sono state incluse in modo sistematico nelle nuove Raccomandazioni. Altri cambiamenti hanno riguardato la distinzione tra famiglie (private households) e convivenze (institutional households), il concetto di figlio e il concetto di famiglia ricostituita. 10 In generale, la maggior parte dei paesi ha adottato le nuove definizioni introdotte nelle Raccomandazioni UNECE, anche se molti non hanno utilizzato il nuovo dettaglio classificatorio nel loro piano di diffusione. Tuttavia, sono state riscontrate varie differenze rispetto alle Raccomandazioni che hanno avuto implicazioni sia sulla produzione dei dati censuari su questi argomenti sia sulla loro comparabilità tra i paesi della regione UNECE. Per quanto riguarda la definizione di famiglia, le Raccomandazioni hanno considerato due concetti alternativi: l’housekeeping concept2 e l’household-dwelling concept. Il primo concetto assume che il numero di famiglie può non coincidere con il numero di unità abitative. L’household-dwelling concept, considera tutte le persone che vivono in una determinata unità abitativa come membri della stessa famiglia; vi è quindi una sola famiglia per alloggio occupato Il questionario UNECE ha chiesto ai singoli paesi quale dei due concetti fosse stato utilizzato; 26 hanno adottato la definizione housekeeping, 15 hanno assunto l’altra definizione e un solo paese le ha utilizzate entrambe. La maggior parte dei paesi che si sono basati sull’approccio household-dwelling non sono stati in grado di fornire informazioni sul numero di famiglie secondo l’housekeeping definition, come richiesto nelle Raccomandazioni UNECE. Ciò è fonte di preoccupazione anche per il futuro, dal momento che questo gruppo comprendeva tutti i paesi con censimento basato sui registri, gruppo destinato probabilmente a crescere. Infine, 15 paesi hanno riferito di aver raccolto informazioni su altri tipi di households, oltre che le famiglie e le convivenze, molto spesso i senza tetto (homeless). Per quanto riguarda i nuclei familiari, l’83 per cento dei paesi ha utilizzato una definizione conforme alle Raccomandazioni: l’insieme di due o più persone che vivono nella stessa famiglia come marito e moglie, come partner conviventi, o come genitore e figlio; in questo modo un nucleo comprende una coppia senza figli o una coppia con uno o più figli, oppure un genitore solo con uno o più figli. Un’importante differenza, registrata per il Canada ed il Regno Unito, è che anche un nonno (o nonni) che vive (vivono) con uno o più nipoti, ma senza i genitori di questi ultimi, sono considerati come un nucleo familiare (skip generation family). Sono stati riscontrati notevoli problemi per quanto riguarda la produzione di informazioni sui nuclei familiari ricostituiti. Solo 17 paesi sono stati in grado di identificare le famiglie ricostituite utilizzando i dati del censimento. I problemi nell’individuazione delle famiglie ricostituite derivano da quelli riscontrati sulla variabile “posizione nel nucleo” relativamente al ruolo di figlio di uno solo dei due partner. Solo 15 paesi sono stati in grado di distinguere se 2 Secondo l’housekeeping concept una famiglia può essere “composta da un solo individuo, cioè una persona che vive da sola in un’unità abitativa separata o che occupa, come inquilino, una o più stanze separate di un alloggio ma non è legato a nessuna delle altre persone che occupano l’unità abitativa a costituire parte di una famiglia con più persone come sotto definita”; oppure “composta da più persone, cioè un gruppo di due o più individui che vivono assieme, occupando tutta o parte di un unità abitativa e provvedendo al cibo ed altre cose essenziali per vivere. I componenti del gruppo possono mettere in comune i loro redditi in misura più o meno ampia. 11 un bambino è figlio di entrambi i partner, o, in alternativa, è uno stepchild, figlio nato da una precedente relazione di uno dei due partner. Una possibile spiegazione per la relativa scarsità di informazioni sulle famiglie ricostituite in tutti i paesi è il fatto che molti hanno ricostruito le strutture familiari mediante la relazione di ogni membro della famiglia rispetto alla persona di riferimento della stessa, ma non attraverso la relazione con gli altri membri della famiglia. Uno dei principali ostacoli è l’identificazione dei bambini che non sono figli naturali di entrambi i partner. La relazione rispetto alla persona di riferimento della famiglia ha rappresentato la variabile di base per individuare le famiglie ed i nuclei familiari e per ricostruire le informazioni sul loro ruolo o posizione degli individui all’interno degli stessi. È stato raccomandato che tale informazione fosse rilevata per tutte le persone che vivevano in famiglia, lasciando ai paesi la scelta tra diversi criteri per determinare la persona di riferimento. 42 paesi hanno raccolto informazioni sulla relazione con la persona di riferimento della famiglia e quasi tutti hanno considerato i tradizionali ruoli in famiglia, come coniuge, padre, madre, o figlio, ma anche i partner in unione consensuale. In alcuni casi (19 paesi, tra cui l’Italia) sono state citate altre relazioni con la persona di riferimento: nonno/nipote, fratello/sorella, e cognato/a. Sono state fornite informazioni sulla relazione anche rispetto ad altre persone oltre che la persona di riferimento della famiglia: 16 paesi hanno registrato la relazione con uno o entrambi i genitori e 11 con gli altri membri della famiglia. Caratteristiche economiche: nella tornata censuaria del 2000, i paesi hanno usato diverse strategie per la progettazione del percorso di domande in grado di identificare gli occupati, i disoccupati e la popolazione inattiva. Possono essere identificati tre approcci principali con diversi punti di partenza per distinguere le persone occupate, le disoccupate e le inattive: il primo approccio si basa sul concetto di condizione professionale dichiarata (“Qual è la sua condizione professionale?”), il punto di accesso del secondo approccio è basato sul concetto di lavoro (“Ha lavorato durante l’ultima settimana?”), per il terzo approccio il punto di ingresso è il concetto di fonte di sostentamento (“Quali sono le sue fonti di sussistenza?”). La maggior parte (32 paesi) ha utilizzato il primo o il secondo approccio, in particolare 17 paesi il primo approccio, e 15 il secondo. Con il primo approccio i paesi hanno raccolto meno informazioni dettagliate sulla disoccupazione (molti di loro non hanno chiesto la natura, la durata e i motivi della disoccupazione, la ricerca di un lavoro) ma hanno posto ulteriori domande, solo per coloro che erano stati identificati come occupati, in merito alla loro attuale/ultima occupazione (posizione nella professione, professione e settore di attività economica). Per raccogliere informazioni in materia di occupazione, le Raccomandazioni UNECE consigliavano ai paesi di applicare una soglia di età e il “one-hour criterion” (criterio di un’ora). La soglia dei 15 anni di età suggerita nelle Raccomandazioni per la compilazione dall’attività economica è stata seguita da quasi il 60 per cento dei paesi. I paesi che non hanno 12 applicato alcun limite di età sono quelli che hanno utilizzato l’approccio sulle fonti di sostentamento. Le informazioni relative alla professione, alla posizione nella professione e al settore di attività economica sono state inserite nei questionari da molti paesi, ma non è stato possibile valutare in che misura sono state utilizzate le classificazioni proposte a livello internazionale (ISCO-88, NACE). Caratteristiche relative all’istruzione: anche se le informazioni sul livello di istruzione sono disponibili da altre fonti (indagini campionarie, dati amministrativi), nella maggior parte dei paesi si basano sui dati censuari, in particolare per le piccole aree. 35 paesi hanno incluso il tema dell’istruzione nei questionari di censimento, utilizzando diverse modalità di rilevazione. Alcuni hanno chiesto il più alto livello completato (come consigliato), altri tutti i livelli di istruzione completati. Le classificazioni di rilevazione riflettono la diversità dei sistemi di istruzione nei paesi. Esse sono, in alcuni casi, molto dettagliate (distinguendo diversi gradi all’interno del livello primario, secondario e terziario) e in altri molto generali. Il limite di età per il conseguimento del titolo varia notevolmente tra i paesi della regione UNECE, solo pochi hanno seguito le Raccomandazioni. La maggior parte dei paesi ha incluso la frequenza scolastica nei questionari di censimento. Le Recommendations invitavano a tenere separato il concetto di frequenza (attendance) da quello di iscrizione (enrolment). Tuttavia, non è stato possibile determinare se tutti i paesi hanno effettivamente misurato tali differenze. I paesi hanno utilizzato molti modi per studiare tema dell’istruzione. In qualche misura, la diversità di approccio può essere giustificata dal fatto che le UECE Recommendations sono state piuttosto generali sul tema, in quanto solo il livello di istruzione è stato considerato come core topic. Inoltre è chiaro che le differenze nei sistemi di istruzione hanno vincolato i paesi a porre domande utili a descrivere la situazione nazionale. Le caratteristiche delle abitazioni: tutti i paesi UNECE che hanno condotto il censimento della popolazione nella tornata del 2000 hanno raccolto informazioni anche sugli alloggi. Pochi paesi, come Canada ed Ucraina, si sono concentrati su un numero limitato di informazioni, mentre la maggioranza ha rilevato un buon numero di variabili core e non-core tra quelle presenti nelle Raccomandazioni. I 46 paesi che hanno reso disponibili i dati sugli alloggi possono essere classificati a seconda della metodologia di rilevazione utilizzata. Nella maggior parte dei casi si è trattato del metodo tradizionale, cioè tramite l’utilizzo di un questionario, in 23 paesi con l’intervistatore mentre in 18 con l’auto-compilazione. Alcuni hanno impiegato un approccio combinato tra dati da registri e questionari e solo Danimarca e Finlandia si sono affidate interamente a dati da registri. Le variabili core più rilevate, relativamente alle caratteristiche generali degli alloggi, sono state: Tipo di proprietà (44), Numero di stanze (44) e Ubicazione dell’alloggio (42). Lo Stato di occupazione delle abitazioni non è stato rilevato da 21 paesi, un numero relativamente alto che può essere, in parte, spiegato dalla difficoltà di distinguere tra abitazioni occupate da almeno una persona dimorante abitualmente, abitazioni stagionali o secondarie e abitazioni 13 vuote. L’Italia, ad esempio, per le abitazioni non occupate da persone dimoranti abitualmente non ha rilevato la destinazione d’uso stagionale o secondaria. Le variabili core sulle dotazioni e servizi delle abitazioni più presenti sono nell’ordine: Tipo di impianto di riscaldamento, Disponibilità di vasche da bagno e/o impianti doccia, Disponibilità di servizi igienici e Sistema di alimentazione idrica (tra il 67 e l’83 per cento dei paesi). Il Tipo di cucina è stata rilevata dalla metà dei paesi (tra questi anche l’Italia). Le caratteristiche degli edifici ad uso abitativo si riferivano alle abitazioni in essi contenute; così, ad esempio la variabile core Tipo di edificio classifica le abitazioni per tipo di edificio (e non gli edifici per tipologia). Il 76 per cento dei paesi ha rilevato l’Epoca di costruzione (che classifica sempre le abitazioni per epoca di costruzione), mentre per il Tipo di edificio, osservato da 27 paesi, si sono riscontrate difficoltà nell’applicare la classificazione delle paesi. In conclusione, la maggior parte dei paesi nella regione UNECE ha rispettato le Raccomandazioni, attraverso la raccolta di informazioni riguardanti i core topics, e molti noncore topics, in molti casi però utilizzando definizioni e classificazioni non conformi a quelle raccomandate e che hanno reso difficoltoso il confronto dei dati tra gli Stati Membri. 4 LE OVITA’ PER IL CESIMETO 2010-11 4.1 Le nuove Raccomandazioni internazionali In vista della prossima tornata censuaria, analogamente al 2001, la Commissione Economica per l’Europa delle Nazioni Unite (UNECE) in cooperazione con l’Ufficio Statistico della Comunità Europea (Eurostat) ha redatto le Recommendations for the 2010 Censuses of Population and Housing, che sono state formalmente adottate a giugno 2006, in occasione della Conferenza degli Statistici Europei. Anche in questo caso, le Raccomandazioni internazionali forniscono consigli per la determinazione dei contenuti informativi dei censimenti demografici in termini di variabili da rilevare, definizioni e classificazioni. Contengono, infatti, indicazioni per una definizione chiara dei concetti, per una sincronizzazione delle operazioni di rilevazione e di quelle per la produzione dei dati censuari, al fine di garantire la comparabilità degli output nei diversi paesi. Le variabili presentate nelle Raccomandazioni sono suddivise in core topics (da inserire nel piano di rilevazione obbligatoriamente) e non-core topics (opzionali). La sezione dedicata alla Popolazione (Population topics) è suddivisa in diverse aree tematiche che riguardano: Popolazione da contare, Caratteristiche geografiche, Caratteristiche demografiche, Caratteristiche economiche, Caratteristiche sull’istruzione, Migrazioni interne e internazionali, Caratteristiche delle households e dei nuclei familiari, Caratteristiche etnoculturali, Disabilità e Agricoltura. La sezione dedicata agli Alloggi (Housing topics) è 14 costituita da un’unica area tematica sulle caratteristiche relative agli alloggi e agli edifici ad uso abitativo. Ciò che contraddistingue le Raccomandazioni UNECE del 2010 rispetto alla precedente versione è un approccio di tipo “output oriented”: viene accuratamente definito ciò che ciascun paese deve fornire in termini di dati, lasciando però la libertà di scegliere la metodologia ritenuta più opportuna. La prima parte delle Raccomandazioni è dedicata ai possibili approcci metodologici per la raccolta dei dati: censimento tradizionale, censimento basato sui registri, varie combinazioni di censimento tradizionale, censimento basato su registri e indagini campionarie, oppure indagini appropriate con campioni a rotazione (rolling census). Infatti, negli ultimi anni diversi paesi hanno adottato metodi di conduzione dei censimenti alternativi a quello convenzionale (basato sulla rilevazione sul campo, esaustiva e periodica), orientandosi verso lo sfruttamento dei dati amministrativi a fini statistici e verso l’utilizzo di tecniche campionarie per la rilevazione sul campo. 4.2 Il Regolamento Quadro europeo A differenza dei censimenti del 2001, per i quali i Paesi Membri avevano sottoscritto un Gentlemen’s Agreement, la Commissione Europea ha deciso, per la tornata censuaria del 2010-2011, di procedere con la redazione di un Framework Regulation, Regolamento Quadro del Parlamento Europeo e del Consiglio relativo ai censimenti della popolazione e delle abitazioni3. Il Regolamento Quadro nasce dall’esigenza di garantire la conformità con le Raccomandazioni internazionali, armonizzare i contenuti, sincronizzare i tempi e assicurare maggiore qualità e comparabilità dei dati prodotti nei diversi paesi. Esso è contraddistinto dallo stesso approccio che caratterizza le nuove Raccomandazioni UNECE, volto a garantire l’uniformità dell’output delle rilevazioni censuarie, indipendentemente dalle tecniche e dai metodi utilizzati. Il Framework Regulation pone le basi per la definizione di un programma armonizzato di diffusione dei dati censuari a livello europeo, elencando in allegato i Topics to be covered in the Population and Housing census. Si tratta dei topics identificati come core nell’ambito delle Recommendations 2010 e riguardano caratteristiche demografiche, sociali ed economiche delle persone, ma anche aspetti legati alle famiglie, ai nuclei familiari ed agli alloggi. Il Regolamento specifica, inoltre, quali di questi topics sono obbligatori fino al livello di dettaglio geografico LAU2 (comunale per l’Italia) e quali solo fino al livello NUTS2 (regionale). L’obiettivo prioritario è quello di garantire la coerenza nel contenuto dei topics, sia riguardo agli aspetti definitori che a quelli classificatori, al fine di rendere possibili le comparazioni tra gli Stati Membri. In questo contesto si inserisce il lavoro che la Task Force 3 Il Regolamento è stato adottato a maggioranza dal Parlamento Europeo a febbraio, approvato a luglio 2008 e pubblicato nella Gazzetta Ufficiale dell’Unione europea ad agosto 2008. 15 on the Implementation of Population and Housing Censuses in the UE, in collaborazione con Eurostat, sta svolgendo per la definizione degli Implementing Regulations (regolamenti di attuazione) nell’Unione Europea. I lavori della Task Force, composta da sette paesi tra cui l’Italia, ancora non si sono conclusi. Sono in fase di stesura definitiva i documenti relativi ai dati e ai metadati da trasmettere ad Eurostat, ovvero i documenti sulle classificazioni e le relative specifiche tecniche (breakdowns and technical specifications) delle variabili core, sui metadati, sul piano di incroci a più dimensioni (hypercubes) e sul quality report. 4.3 Le classificazioni (breakdowns) e le specifiche tecniche (technical specifications) Le modalità dei breakdowns sono state definite dalla Task Force di Eurostat sulla base delle classificazioni consigliate a livello internazionale e specificate all’interno delle Raccomandazioni UNECE. Per ogni topic sono stati sviluppati uno o più breakdowns che si adattano a diffusioni per diversi livelli di dettaglio geografico (nazionale e regionale oppure provinciale e comunale) ed informativo (più o meno fine). L’unica eccezione è rappresentata da due variabili che, pur rappresentando dei core topics, non prevedono alcuna classificazione: “Total population” e “Relationships between household members”. Per questo motivo, i due topics suddetti non sono inclusi (nel senso che non costituiscono variabili di incrocio) in nessuno degli ipercubi previsti nel programma di diffusione/tabulazione proposto da Eurostat. Per alcune caratteristiche (ad esempio sesso, stato civile) è prevista un’unica classificazione che si applica a qualsiasi livello di dettaglio territoriale di diffusione. Altri topics sono presentati con due o tre classificazioni che differiscono per numero di modalità; l’uso dell’una piuttosto che dell’altra varia a seconda dell’incrocio in cui le variabili vengono proposte. Sulla base della loro dimensione, le classificazioni si distinguono in: High breakdowns (H), Medium breakdowns (M) e Low breakdowns (L), diminuendo progressivamente il numero di modalità. Vi è uno stretto legame tra classificazioni e ipercubi, nel senso che i primi sono stati pensati proprio in funzione del loro utilizzo all’interno del piano di diffusione proposto da Eurostat; pertanto le analisi sui breakdowns sono andate di pari passo con quelle sugli ipercubi. Le classificazioni più ampie ed articolate sono applicate, di norma, ai dati presentati per i livelli territoriali di minore dettaglio (nazionali e regionali); tuttavia la scelta del dettaglio classificatorio dipende anche dal numero di variabili coinvolte nelle tavole da diffondere. Se uno stesso topic prevede più di un tipo di classificazione (H, M, L), vale il criterio generale per cui quelle di minore ampiezza devono essere completamente derivabili da quelle di maggiore dimensione. Così, ad esempio, con riferimento alla variabile “Età”, le classi previste nelle classificazioni medium costituiscono semplicemente aggregazioni delle modalità della classificazione per singolo anno di età (H); analogamente le categorie del tipo L sono ottenute dalla somma delle categorie del tipo M. Il criterio in questione, oltre a garantire la coerenza 16 formale, semplifica la ricostruzione delle diverse classificazioni applicate a differenti incroci di diffusione. Tutti i breakdowns sono di tipo gerarchico, il livello gerarchicamente più alto contiene in maniera esaustiva le modalità corrispondenti al livello direttamente inferiore. Inoltre, con riferimento all’ampiezza, esistono alcuni breakdowns la cui dimensione varia da paese a paese e quindi è specifica per ciascuno di essi (country/area specific breakdowns). Si tratta di casi in cui le modalità di classificazione riguardano aree geografiche; queste corrispondono o alle aree territoriali LAU2 e NUTS3, differenti per tipo e numero4, oppure a luoghi che possono variare a seconda del paese di riferimento censuario (ad esempio le modalità relative allo stato estero di nascita). Alcune modalità dei breakdowns sono considerate opzionali; la loro inclusione dipende dalla scelta del singolo paese, secondo le sue specifiche esigenze conoscitive oppure secondo la legislazione vigente al momento della rilevazione censuaria. È il caso, ad esempio, di alcuni topics (stato civile, posizione degli individui nella famiglia e nel nucleo familiare), in cui sono previste modalità di classificazione ad hoc per i partner in unione registrata, distinte da quelle relative ai coniugati o alle persone in unione consensuale. Tali modalità non sono obbligatorie in quanto, allo stato attuale, non in tutti i paesi le unioni tra due persone possono essere legalmente registrate. Il lavoro di definizione dei breakdowns, giunto ormai quasi a termine, è stato piuttosto lungo ed impegnativo. I Paesi Membri della Task Force sono stati innanzi tutto impegnati in una fase di studio delle Raccomandazioni UNECE al fine di approfondire il significato dei singoli core topics, sia in relazione agli aspetti definitori che in termini di classificazioni consigliate. Gli interventi della Task Force hanno riguardato in particolare l’inserimento di nuove classificazioni, l’eliminazione o la riduzione di quelle esistenti e la modifica di alcune modalità delle stesse. Alcune classificazioni, inizialmente previste e poi eliminate, non saranno utilizzate nel programma di incroci/tabulazioni e conseguentemente non saranno incluse nell’Implementing Regulation che sarà predisposto sui breakdowns. Al fine di garantire l’omogeneità di concetti e definizioni adottate nell’ambito dei censimenti europei, la Task Force ha deciso di introdurre esplicitamente nel regolamento anche le technical specifications. Sono di due tipi: un primo gruppo riguarda gli aspetti definitori delle variabili e viene inserito prima delle classificazioni; il secondo gruppo riguarda le modalità di rilevazione delle variabili incluse nel piano degli incroci/tabulazioni e viene inseriti dopo le classificazioni coinvolte. Anche la predisposizione dei breakdowns, come la definizione delle variabili, ha risentito dell’analisi effettuata sulle problematiche emerse nel passato censimento a livello europeo. Così, particolare attenzione è stata posta proprio sulle variabili che maggiormente avevano 4 Il numero specifico di aree territoriali LAU2 e NUTS3 di ciascun paese determina l’ampiezza della classificazione. Ad esempio, in Italia le aree LAU2 corrispondono ai comuni e sono pari a 8101. 17 creato problemi e per le quali si era registrata una discrepanza tra quanto definito e quanto prodotto o ancora per le quali era emersa una difficoltà di comparazione dei dati. 4.4 Gli ipercubi (Hypercubes) Gli ipercubi rappresentano il piano di diffusione dei dati censuari per il 2011, ovvero il piano degli incroci che ciascun Paese Membro dovrà rendere disponibile ad Eurostat entro 27 mesi dalla fine dell’anno di riferimento della rilevazione censuaria (1° aprile 2014). Punto di partenza per la definizione del programma di diffusione è stato il documento delle Nazioni Unite “Proposed Set of Recommended Tabulations for the United ations”5. In varie occasioni, i gruppi tecnici di lavoro sulle tavole di diffusione del censimento avevano raccomandato vivamente che la serie di tavole proposte dall’United ations Statistical Division fosse coerente con quella proposta dalla Conference of European Statisticians. Infatti, le differenze nel programma di diffusione per la tornata censuaria del 2000 avevano comportato un doppio lavoro per gli Istituti Nazionali di Statistica (INS): la produzione di due serie diverse di tavole. Inoltre, benché gli incroci contenuti nel Proposed Set of Recommended Tabulations for the U fossero piuttosto ampi, era necessario progettare tavole aggiuntive di sintesi e di pubblicazione, secondo una struttura piramidale, cioè da un livello dettagliato ad uno aggregato sia in termini di classificazione che di territorio. Perciò, la Task Force ha avviato lo sviluppo di un programma di tavole per i censimenti del 2011 nei paesi dell’Unione Europea nel rispetto delle classificazioni e delle variabili contenute nelle Recommendations for the 2010. Compito di Eurostat e della Task Force è stato, in particolare, quello di definire più insiemi di incroci tra variabili, orientati alle esigenze degli utenti e compatibili con il programma di diffusione delle Nazioni Unite (ONU, 2008). Data la complessità dei compiti assegnati, la Task Force ha deciso di focalizzare l’attenzione solo sulle variabili obbligatorie (core topics), le uniche riportate nell’allegato al Framework Regulation, lasciando su base volontaria la predisposizione di tavole aventi per oggetto i non-core topics in relazione ai quali gli INS non sono soggetti a vincoli di fornitura ad Eurostat. L’obiettivo della diffusione dei risultati censuari nell’Unione Europea dovrebbe essere quello di consentire all’utente un facile accesso ad una vasta gamma di incroci comparabili tra tutti gli Stati membri. Naturalmente, il livello di dettaglio classificatorio e territoriale potrebbe comportare problemi connessi alla riservatezza dei dati e, nei casi in cui il censimento tradizionale è affiancato o sostituito da indagini campionarie, problemi di significatività statistica. 5 Una versione draft era contenuta nel volume “Principles and Recommendations for Population and Housing Censuses Revision 2” (settembre 2006). La versione definitiva è nel volume “Principles and Recommendations for Population and Housing Censuses Revision 2” (United Nations, New York, 2008), a cura di Statistics Division, Department of Economic and Social Affairs. 18 Il piano di diffusione prevede incroci a diversi livelli territoriali: un primo gruppo comprende tutti gli ipercubi che dovranno essere resi disponibili a livello territoriale LAU2 (comune) e NUTS3 (provincia); un secondo gli ipercubi da assicurare a livello NUTS2 (regione). La dimensione di un ipercubo è data dal prodotto del numero di modalità previste per ciascuna variabile. La Task Force ha investito molto lavoro per “ridurre” gli ipercubi, con l’obiettivo di rendere gli incroci gestibili e, allo stesso tempo di limitare (ad un livello accettabile) la perdita di informazioni. Gli ipercubi presentati nella versione più recente del programma di diffusione sono molto più piccoli di quelli progettati inizialmente. L’obiettivo della riduzione è anche quello di produrre ipercubi il cui contenuto è sicuro per la diffusione. Il numero di celle (relative a incroci tra modalità di diverse variabili), infatti, deve essere limitato anche in considerazione del fatto che potrebbero comparire celle con un numero molto ridotto di osservazioni con possibili ripercussioni sulla riservatezza e sulla significatività statistica (se con dati provenienti da campionamento). A livello LAU2 e NUTS3 nessun ipercubo contiene più di 2.020 celle. A livello di NUTS2, nessun cubo supera le 50.000 celle e circa la metà dei cubi ora ha meno di 10.000 celle. Al momento sono previsti un set di 19 ipercubi per il livello territoriale LAU2 e NUTS3, un set di 105 ipercubi contenenti maggiori informazioni a livello NUTS2 e 3 ipercubi a livello nazionale. La maggiore ricchezza informativa del secondo set di ipercubi è dovuta all’introduzione delle variabili previste per la diffusione al solo dettaglio regionale. Naturalmente, come già descritto, l’ampiezza della classificazione utilizzata per ciascuna variabile all’interno di ciascun ipercubo determina il peso che la variabile ha al suo interno. L’argomento dell’ipercubo è legato alle variabili contenute con il maggior dettaglio classificatorio. E in base alle variabili incluse in un ipercubo varia la popolazione oggetto di conteggio per quell’ipercubo (enumeration base). Gli ipercubi sono raggruppati in base ad uno stesso tema che si vuol indagare in modo più approfondito, e che determina l’inserimento o l’esclusione di una variabile dall’ipercubo. Ad esempio, alcuni ipercubi hanno come tema “singole età” pertanto tutti gli ipercubi del blocco conterranno variabili per le quali verranno forniti i dati per singolo anno di età; un blocco consistente di ipercubi ha come tema l’“occupazione”; un altro blocco consistente ha come tema le “migrazioni”. Il set di ipercubi previsto a livello comunale è così costituito: - 13 sulle caratteristiche demografiche della popolazione, con enumeration base la popolazione residente totale classificata per: sesso, età, luogo di nascita, stato civile, paese di cittadinanza, luogo di dimora abituale un anno prima del censimento, - posizione in famiglia o in convivenza; 3 contano le famiglie, i nuclei e le persone che vivono in nuclei classificati per posizione nel nucleo, tipologia e ampiezza della famiglia e tipologia e ampiezza del nucleo; 19 - 2 ipercubi contano le abitazioni occupate da almeno una persona dimorante abitualmente per numero di occupanti, superficie e/o numero di stanze dell’unità - abitativa, abitazioni per epoca di costruzione e densità abitativa; 1 sugli alloggi classificati per tipo di alloggio e numero di occupanti. Gli ipercubi da produrre a livello regionale sono così suddivisi: - 18 con enumeration base la popolazione residente totale e contenenti le variabili relative alle caratteristiche demografiche della popolazione (luogo di dimora abituale, sesso, età, stato civile, luogo di nascita, paese di cittadinanza, luogo di dimora abituale un anno prima del censimento, locality, posizione in famiglia o in convivenza, anno di arrivo nel paese); - 28 con enumeration base la popolazione residente totale e contenenti le variabili relative alle caratteristiche sia demografiche che economiche della popolazione (condizione professionale o non professionale, professione, settore di attività economica); - 5 con enumeration base la popolazione residente totale e contenenti le variabili relative alle caratteristiche demografiche e sull’istruzione della popolazione (livello di istruzione); - 9 con enumeration base gli occupati e contenenti le variabili relative alle caratteristiche demografiche, economiche e lavorative (luogo di lavoro, posizione nella professione); - 13 con enumeration base le famiglie, i nuclei e le persone che vivono in nucleo e conteggiano famiglie, nuclei e persone che vivono in nucleo classificate per caratteristiche demografiche, economiche, sull’istruzione, posizione nel nucleo, - tipologia e ampiezza del nucleo, tipologia e ampiezza della famiglia; 16 con enumeration base gli occupati al loro luogo di lavoro: questi ipercubi cambiano il punto di osservazione, in questo caso vengono infatti conteggiati gli occupati nel loro luogo di lavoro classificati per luogo di dimora abituale e per le caratteristiche demografiche, economiche e sull’istruzione; - 5 con enumeration base la popolazione residente e contenenti le variabili relative alle caratteristiche demografiche, economiche e alla situazione abitativa; - 2 con enumeration base gli occupati che vivono in nuclei e contenenti le variabili - relative alle caratteristiche demografiche, economiche e alla tipologia di nucleo; 7 ipercubi con enumeration base le abitazioni occupate da almeno una persona dimorante abitualmente dove si incrociano le variabili relative alle caratteristiche ed ai servizi delle abitazioni (superficie e/o numero di stanze dell’unità abitativa, sistema di alimentazione idrica, servizi igienici, vasche da bagno e/o impianti doccia, tipo di impianto di riscaldamento, abitazioni per epoca di costruzione e densità abitativa); 20 - 1 ipercubo con enumeration base le abitazioni non occupate da persone dimoranti abitualmente che incrocia le abitazioni per tipo di edificio e lo stato di occupazione - dell’abitazione; 1 su alloggi classificati per tipo di alloggio e numero di occupanti. Sono previsti infine 3 ipercubi a livello nazionale che hanno come oggetto la popolazione residente totale e che incrociano le sole variabili demografiche: sesso, età, luogo di nascita, paese di cittadinanza, luogo di dimora abituale un anno prima del censimento. Nella fase attuale di predisposizione dei breakdowns e degli ipercubi, la Task Force ha introdotto anche un altro livello territoriale di classificazione, corrispondente, in Italia, al dettaglio provinciale. Questo nuovo dettaglio territoriale, in precedenza contenuto in quello comunale, permette di dare maggiore flessibilità nel caso in cui si presentassero, per alcuni incroci, problemi di riservatezza. Potrebbe, infatti, accadere che ipercubi previsti al momento a livello comunale presentino molte, troppe celle con basse frequenze e in questi casi, per evitare problemi di confidenzialità, potrebbe essere necessario fornire i dati solo a livello provinciale. È allo studio lo strumento che dovrà essere utilizzato per la trasmissione dei dati e dei metadati ad Eurostat. È nato, quindi, il Census Hub Project che prevede la sperimentazione di SDMX (Statistical Data and Metadata eXchange)6 come modalità di trasmissione e diffusione di dati e metadati. Il punto centrale è rappresentato dalla fornitura di dati ad Eurostat tramite il sistema SDMX. L’idea è quella di avere un unico punto di ingresso (Eurostat) al quale arrivano le richieste di dati degli utenti; l’utente dovrebbe procedere agevolmente, guidato da interfacce, verso la selezione delle variabili di interesse. Il contenuto di queste interfacce sarà determinato dagli ipercubi in via di definizione. L’estrazione viene effettuata da un database che si trova presso i singoli Istituti Nazionali di Statistica. L’estrazione dei dati a cura degli Stati membri dovrebbe essere rinviata ad Eurostat, assemblata e, infine, distribuita all’utente. Il sistema di diffusione proposto farebbe sì che i singoli Istituti di Statistica rimangano “proprietari” dei loro dati di censimento, e siano i responsabili per le procedure connesse alla riservatezza dei dati. 5 LA UOVA STRATEGIA PER IL CESIMETO ITALIAO DEL 2011 Come descritto nei precedenti paragrafi, esistono molteplici ragioni per proporre innovazioni rispetto alle modalità con cui le rilevazioni censuarie sono state tradizionalmente condotte. Gli obiettivi sono quelli di ridurre i tempi di diffusione dei risultati, di migliorare la qualità dei dati, e di incrementare l’efficienza delle operazioni sul campo riducendo sia il carico di lavoro dei soggetti coinvolti che il disturbo statistico degli individui chiamati a rispondere. 6 http://www.sdmx.org. 21 L’approccio “output oriented” che caratterizza le nuove Raccomandazioni UNECE impone l’analisi delle metodologie alternative al censimento tradizionale che prevedono l’utilizzo di tecniche campionarie o di archivi amministrativi a supporto delle rilevazioni censuarie. Il ruolo e l’utilizzo dei censimenti, infatti, si sono evoluti nel tempo per adattarsi ai cambiamenti che investono le società, per rispondere alle nuove esigenze di utilizzatori e rispondenti e per incrementare l’efficienza delle rilevazioni censuarie a beneficio dell’intero sistema statistico (Abbatini et al., 2007). In Italia, le principali soluzioni proposte per il 2011 vanno sia verso l’utilizzo di fonti amministrative che verso l’introduzione di tecniche campionarie. Tali soluzioni sono volte a ridurre il numero di rilevatori impiegati sul territorio (front-office), orientando maggiormente le risorse degli uffici di censimento comunali (UCC) su attività di coordinamento e controllo (back-office). Si prevede pertanto l’impiego di liste anagrafiche comunali (LAC) che guideranno la rilevazione permettendo, per la prima volta, la distribuzione dei questionari per posta. Per i rispondenti ci saranno possibilità differenziate di restituzione: spedizione per posta, compilazione via web, riconsegna presso centri di raccolta sul territorio. La multicanalità permetterà, da un lato, un aumento dei tassi di restituzione spontanea, dall’altro, un minore impiego dei rilevatori sul campo che effettueranno un recupero “mirato” delle mancate risposte, ovvero dei questionari non restituiti. La nuova strategia prevede anche l’impiego di nuovi strumenti territoriali volti a migliorare il riferimento geografico delle unità di rilevazione. Verranno definite, nei comuni di maggiore ampiezza demografica, delle nuove unità territoriali sub-comunali, le “aree di censimento” (insiemi di sezioni di censimento contigue della dimensione di circa 15.000 abitanti) che, utilizzate come unità territoriali di riferimento per la rilevazione campionaria, permetteranno di ridurre il carico sui rispondenti garantendo, allo stesso tempo, la produzione di dati rappresentativi a livello sub-comunale. Inoltre, si procederà alla costruzione di archivi di numeri civici e alla loro geocodifica alle sezioni di censimento (associazione ad ogni numero civico del codice della sezione di censimento di appartenenza). Tra le soluzioni proposte è prevista la possibilità di rilevare esaustivamente solo le informazioni demografiche e riservare ad un campione di famiglie la rilevazione di tutte le altre variabili di natura socio-economica tradizionalmente acquisite in occasione del censimento. La proposta è quella di affiancare all’usuale enumerazione totale del censimento, effettuata tramite un questionario in forma ridotta (short form) in cui si chiede poco a tutti, un campione di famiglie cui somministrare un questionario più esteso (long form) che chiede di più a pochi. Tale soluzione mostra vantaggi sia in termini operativi, per la riduzione dei tempi di acquisizione ed elaborazione dei dati, sia in termini di qualità, per la possibilità di maggior controllo a beneficio di una riduzione dell’errore di misura. La scelta di introdurre il campionamento nel censimento italiano è avvalorata anche dall’analisi delle esperienze estere (Abbatini et al., 2007) dalla quale emergono realtà di paesi 22 (Canada, Usa, Francia, Germania, Israele, Olanda) in cui, adottando approcci non tradizionali per il censimento, si producono stime per le variabili non strettamente demografiche. La somministrazione di questionari long form a campioni di famiglie dovrebbe interessare tutti i comuni al di sopra dei 20.000 abitanti7 (alle famiglie non campionate viene sottoposto il questionario short form); per quelli sotto tale soglia demografica è invece prevista la rilevazione totale attraverso questionari solo di tipo long form. I risultati sperimentali mettono in evidenza quale strategia più efficiente quella che prevede l’adozione di un campionamento casuale semplice di famiglie da lista e l’uso di stimatori calibrati. È allo studio anche un disegno del questionario di rilevazione short form caratterizzato, oltre che dalle variabili strettamente demografiche, anche da poche informazioni di carattere socioeconomico (ad un minimo livello di classificazione) rimandando una maggiore ricchezza informativa al questionario long form, ovvero la possibilità di passare da una short ad una medium form. Questo tipo di approccio permetterebbe di disporre di informazioni socioeconomiche anche a livello di sezione di censimento, seppur con un minimo livello di dettaglio classificatorio; e, come conseguenza, permetterebbe di determinare stime con elevati livelli di accuratezza per il fatto che si avrebbe una maggiore informazione ausiliaria (rilevata esaustivamente sulla popolazione) utilizzabile sia per l’impiego di metodi di stima diretti che per piccole aree. La progettazione dei modelli di censimento, è stata influenzata da quanto prescritto a livello europeo; tutte le domande che permettono di produrre le informazioni richieste da Eurostat a livello comunale sono inserite nella versione short del modello di rilevazione, ovvero al questionario che verrà somministrato a tutta la popolazione. Propedeutica alla rilevazione del 2011, l’indagine pilota prevista per il 2009 permetterà di testare la nuova rilevazione, sia in termini di contenuti, sia in termini di organizzazione e di innovazioni possibili. 6 COSIDERAZIOI DI SITESI Il Regolamento del Parlamento Europeo e del Consiglio dell’Unione Europea rappresenta una forte innovazione rispetto al passato. I vincoli connessi alla fornitura dei dati validati entro 27 mesi dalla fine dell’anno di riferimento della rilevazione, peraltro articolati così come previsto nel piano di diffusione predisposto da Eurostat, impongono ai Paesi Membri un’attenta e sollecita riflessione non solo sulla progettazione dei contenuti informativi ma anche sull’intero processo di produzione dei risultati definitivi. Di fatto, non si può prescindere dall’obiettivo della tempestività sancito a livello internazionale. L’opportunità di selezionare fonti di dati e metodologie alternative al censimento “tradizionale” non esonera i Paesi Membri dal rispetto, nella massima misura possibile, delle caratteristiche essenziali dei censimenti riportate sia nelle Raccomandazioni UNECE che nel 7 Si sta valutando la possibilità di estendere la strategia campionaria anche ai comuni tra 5.000 e 20.000 abitanti. 23 Framework Regulation. La rigorosa descrizione delle classificazioni e la precisa individuazione degli ipercubi che saranno oggetto degli Implementing Regulations, comporta un lavoro importante per i singoli Stati che dovranno valutare, passo dopo passo, la congruità del proprio piano di rilevazione con i target di Eurostat in termini di definizioni e incroci di variabili a prestabiliti dettagli classificatori e territoriali. Se in passato la formula del Gentlmen’s Agreement aveva talvolta causato il mancato raggiungimento di obiettivi strategici legati alla puntualità nell’invio dei dati e alla confrontabilità delle informazioni raccolte nelle diverse realtà europee, a partire dalla prossima tornata censuaria dovrà essere garantita non solo l’uniformità dell’output e la trasmissione nei tempi attesi ad Eurostat, ma anche il rispetto di raccomandazioni metodologiche volte ad assicurare la qualità dei dati e dei metadati prodotti. I censimenti della popolazione e delle abitazioni rappresentano da sempre una sfida per tutti gli Istituti di Statistica che investono, di regola ogni dieci anni, ingenti quantità di risorse umane e finanziare per conseguire comunque un patrimonio informativo che nessun tipo di indagine campionaria può assicurare. Pertanto, se da un lato le autorità dell’Unione Europea, proponendo un Regolamento denso di prescrizioni, hanno aggravato l’onere dei Paesi Membri, dall’altro la certezza di un output confrontabile, tempestivo e di elevata qualità certificata non potrà che rendere ancora più stimolante la progettazione di un evento i cui esiti dovrebbero garantire la disponibilità di dati territoriali aggiornati e affidabili. 7 Bibliografia Abbatini D., Cassata L., Martire F., Reale A., Ruocco G., Zindato D. (2007) La progettazione dei censimenti generali 2010-2011. Analisi comparativa di esperienze censuarie estere e valutazione di applicabilità di metodi e tecniche ai censimenti italiani, ISTAT, Dati e prodotti, Pubblicazioni scientifiche, Documenti n. 9/2007 (http://www.istat.it/dati/pubbsci/documenti/Documenti/doc_2007/2007_9.pdf). Carbonetti G., Dardanelli S., Fiorello E., Mastroluca S., Verrascina M. (2008) Ipotesi di innovazione per il Censimento della popolazione del 2011: una valutazione degli effetti su un possibile piano di diffusione, Atti della XXIX Conferenza Italiana di Scienze Regionali, Bari 24-26 Settembre 2008. Crescenzi F. (2009) Nuove strategie per il censimento della popolazione, SISMagazine, http://www.sis-statistica.it/magazine/spip.php?article137 Dardanelli S., Mastroluca S., Sasso A., Verrascina M. (2008) La progettazione dei censimenti generali 2010–2011. Novità di regolamentazione internazionale per il 15° Censimento generale della popolazione e delle abitazioni, ISTAT, Dati e prodotti, Pubblicazioni scientifiche, Documenti n. 1/2009. 24 Ferruzza A., Mastroluca S., Zindato D. (2007) I censimenti esteri: modelli a confronto alla luce dei regolamenti internazionali, Conferenza azionale di Statistica: “Censimenti generali 2010-2011. Criticità e innovazioni”. CNR, Roma, Novembre 2007. Fortini M., Gallo G., Paluzzi E., Reale A., Silvestrini A. (2007) La progettazione dei censimenti generali 2010-2011. 3 – Criticità di processo e di prodotto nel 14° Censimento generale della popolazione e delle abitazioni: aspetti rilevanti per la progettazione del 15° Censimento, ISTAT, Dati e prodotti, Pubblicazioni scientifiche, Documenti n. 10 (http://www.istat.it/dati/pubbsci/documenti/Documenti/doc_2007/2007_10.pdf). Istat. 14° Censimento della popolazione: dati definitivi. http://dawinci.istat.it/MD/. UNECE (2006) CES Recommendations for the 2010 Censuses of Population and Housing”, prepared in cooperation with the Statistical Office of European Communities (Eurostat), New York and Geneva. ECE/CES/STAT/NONE/2006/4 UNECE (1998) UNECE and the Statistical Office of the European Communities. Recommendations for the 2000 Censuses of Population and Housing in the Ece Region. Statistical Standards and Studies No. 49. New York and Geneva. United Nations Publication. UNECE (2008) Measuring population and housing. Practices of UECE countries in the 2000 round of censuses New York and Geneva. United Nations Statistics Division, Department of Economic and Social Affairs (2008) Principles and Recommendations for Population and Housing Censuses Revision 2 New York. 25 ABSTRACT On the occasion of the 2010-11 population and housing censuses, considerable efforts have been made in the international field in order to develop a harmonized programme of data dissemination. The objective of this work is to show how, starting from the 2000 round, it has come to the definition of topics, breakdowns and dissemination tables for the 2010 census round. The analysis of methodological, operational and organizational issues of the past experience and the evaluation of approaches, critical issues encountered and innovations introduced by the countries are the basis for planning future censuses. The studies carried out have led to a rigorous description of breakdowns and the precise identification of the hypercubes, the dissemination design each Member State shall make available to Eurostat within 27 months from the year of the survey. The unique dissemination programme of census data at European level will produce a comparable, timely and of high quality output. This is likely an important work for each country since it should assess the adequacy of its survey plan with Eurostat requirements, even though, with an output oriented approach, countries are free in the choice of techniques and methods used for the census survey. 26