Genova 22/24 settembre 2015 BASE DATI TERRITORIALI E GEOCODIFICA NUMERI CIVICI Fabio Crescenzi, Istat Verso un nuovo uso di indagini e dati di fonte amministrativa 2011: Primo round di modernizzazione del censimento Campionamento Short/Long forms Risposta multicanale e Sistema di gestione online (SGR) SIM: Formidabile integrazione di dati di fonte amministrativa Censimento 2011 Oltre il 2011 . Dati censuari disponibili ogni anno da un sitema di dati mantenuti continuamente aggiornati Indagine decennale Secondo round di modernizatione del censimento Indagini sociali integrate in un unico sistema di indagini Massimizzare l’uso delle fonti disponibili sia amministrative che statistiche Correggere la sovra e sottocopertura di conteggio e procedere al completamento informativo delle informazioni sociodemografiche Dati censuari ogni anno Fattori di successo Sistema di registri • Metodi statistici di stima da fonti multiple • Coordinamento delle indagini • Modernizzazione dei processi produttivi • Fattori di cambiamento • Costi • Crescita della domanda • Burden delle indagini Obiettivi C e D Obiettivo C Conteggio della popolazione residente e produzione di dati sulla struttura demografica di popolazione e famiglie; Obiettivo D Produzione di dati socio-economici Sistema di registri continuamente aggiornato a supporto della qualità dei dati censuari Individui e famiglie Attività Territorio Imprese • Registri di base collegati a livello di unità elementari. • Aggiornamento continuo da fonti amministrative e sistema integrato di indagini. • Metodi di controllo e correzione della qualità. Le sfide Metodologiche Conteggio della popolazione da fonti multiple. (Es.Generalizzazioni del metodo cattura ricattura) Stima dei dati socio economici da fonti multiple Coordinamento delle indagini esistenti Misura della qualità dei dati ottenuti dalla integrazione di fonti multiple Trattamento delle differenze dovute alle incoerenze delle definizioni dei riferimenti spaziotemporali Che stiamo facendo? Progetti in corso • ARCOLAIO: metodi per la qualità dei dati di fonte amministrativa a fini statistici • ARCHIMEDE: Micro e macro dati da fonti amministrative e statistiche integrati per l’utenza finale • ARCHETIPO: Metodi per la produzione continua di dati censuari • ANNCSU: Archivio Nazionale di strade e numeri civici linkedopendata www.datiopen.istat.it Basi territoriali Variabili censuarie SPARQL DATASET ENDPOINT ONTOLOGIE • La piattaforma LOD consente di accedere e navigare dati in formato open • Costruiti sulla base di tecnologie standard del web semantico • I LOD, interrogabili direttamente da qualsiasi applicazione Che stiamo facendo? Rilevazioni sperimentali 150 Comuni 160,000 Famiglie Per testare: • La capacità predittiva dei modelli statistici • L’architettura informatica per l’integrazione di dati di fonti molteplici • La sincronizzazione dei dati raccolti dal web, da apps per smartphone, tablets, ecc. Secondo l’approccio «Use of your own device» Rilevazioni sperimentali: primi risultati Un grande test 150 Comuni 160,000 Famiglie • Obiettivo C: Cattura ricattura in un campione di sezioni di censimento • Completato dal 99% dei comuni • Obiettivo D: Rilevazione campionaria per la raccolta di dati socio economici (85.000 famiglie) • Circa 50% di risposta Sfide di contesto Il decreto sviluppo di fine 2012 ha stabilito il passaggio al censimento permanente e all’anagrafe unica nazionale (ANPR) Le anagrafi devono essere revisionate sulla base dei risultati censuari. Fino ad ora ogni 10 anni. Come cambia la revisione con il censimento permanente? I dati raccolti con finalità statistica, inclusi quelli di fonte amministrativa, non possono essere usati a scopi amministrativi … Sfide culturali. Molti rispondenti sono sorpresi di dover partecipare ad indagini di tipo censuario in anni non tradizionalmente censuari. Utenti molto specializzati richiedono dato a livello di grande dettaglio geografico (sezioni di censimento, griglia 1Km2, …) In conclusione: i punti chiave Grande cooperazione internazionale sulle metodologie basate sulla integrazione di fonti molteplici Modernizatione dei processi statistici dell’Istituto e del Sistema Statistico Nazionale