Il Catasto Georeferenziato delle Aziende della Toscana a cura di: Maurizio Trevisani Cinzia Licciardello Camillo Berti Il catasto delle aziende georeferenziato del SIRA Lo shape-file del catasto aziende del SIRA è stato ricavato operando una georeferenziazione indiretta dei dati ottenuti dalla Regione Toscana (Settore Statistica), relativi al Registro Imprese. Tali dati si riferiscono alle 504.476 unità locali (comprensive anche delle sedi legali, ove in Toscana), esistenti alla data del 31 dicembre 2003. Annualmente è possibile operare la stessa procedura di georeferenziazione sui dati che via via si rendono disponibili. Per ciascuna unità locale sono presenti, nella banca dati, tra le altre informazioni, in campi distinti, il comune di appartenenza, la località, il tipo di via (via, viale, piazza, corso, lungomare, ecc.), il toponimo ed il numero civico. Il processo di attribuzione di una coppia di coordinate a ciascuna unità locale ha previsto la predisposizione di una serie di archivi di supporto, di seguito elencati e sommariamente descritti. • • • • Archivio dei Comuni: è stata predisposta una tabella che per ciascuno dei comuni italiani riporta una serie di informazioni (il codice ISTAT di comune, provincia e regione, nome e sigla di provincia e regione, nome del comune, codice del comune per il Ministero delle Finanze, più diverse altre, tra cui le coordinate del centroide del comune, ricavate dai limiti amministrativi dell’Italia predisposti da ISTAT sulla base dei dati del censimento 1991): le coordinate del centroide del comune sono state associate alle diverse unità locali del catasto sulla base del comune di appartenenza. Archivio delle Località Abitate: è stata predisposta una tabella che recepisce la toponomastica delle località abitate derivante dai censimenti 1971, 1981 e 1991 dell’ISTAT, e quella proveniente dalla cartografia in scala 1:25.000 dell’IGM. Ciascuna località presenta, oltre al toponimo ed ai codici ISTAT di provincia e comune, anche le coordinate del centroide della località dei censimenti ISTAT, ovvero le coordinate di posizionamento del toponimo sulla cartografia IGM. Le coordinate delle località sono state associate alle diverse unità locali del catasto sulla base del riconoscimento del relativo toponimo. Archivio dello stradario ISTAT’91 derivato dai percorsi dei rilevatori del censimento 1991: in occasione del censimento venne predisposto da ISTAT un archivio delle tratte di strade (comune, sezione di censimento, nome della strada, numero civico di partenza, numero civico di arrivo) per consentire ai rilevatori di attribuire il corretto codice di sezione di censimento sul fascicolo che veniva consegnato alle famiglie. In pratica, tale archivio metteva in relazione con ciascuna sezione di censimento le porzioni di strade che ne definivano il contorno. A ciascuna tratta di strada, intesa come toponimo stradale e intervallo di numeri civici, sono state attribuite le coordinate della sezione di censimento di cui partecipa a comporre il contorno. Le coordinate di tali tratte di strade sono state associate alle diverse unità locali del catasto sulla base del riconoscimento dell’indirizzo e dell’appartenenza del numero civico all’intervallo di civici. Archivio dei baricentri delle strade (stradgrp): a partire dall’archivio dello stradario, descritto al punto precedente, è stato ricavato un nuovo archivio, operando un raggruppamento sulla base dell’indirizzo, e calcolando il baricentro (o media spaziale, cioè media delle coordinate) delle diverse sezioni di censimento che condividono quella strada nei loro perimetri. In pratica, una strada che risulti appartenere a sei sezioni di censimento, sulla sua destra, ed a altre 5 sezioni di censimento, sulla sua sinistra, erediterà come baricentro la media delle coordinate X ed Y delle diverse sezioni di censimento che la riguardano. In pratica tale baricentro è associato a ciascun indirizzo, senza alcun riferimento ai numeri civici, e configurandosi quindi come coordinate medie della strada (o piazza, viale, ecc.). Le coordinate di tali strade (il baricentro delle sezioni di censimento interessate da quella strada) sono state associate alle diverse unità locali del catasto sulla base del riconoscimento dell’indirizzo. Viceversa, nel caso in cui più strade siano comprese • • interamente all’interno della stessa sezione di censimento, ad esse risulterà associato lo stessa coppia di coordinate corrispondente al baricentro della sezione di censimento. Archivio dei numeri civici: a partire dalla Carta Tecnica Regionale numerica in scala 1:2.000 sono stati estratti i dati relativi alle strade (layer 101) ed ai numeri civici (layer 130). Sono poi state ricostruite le associazioni tra i civici e le strade (al civico non risulta attribuito un indirizzo, bensì un codice identificativo della strada cui appartiene), avendo preventivamente riconosciuto, tramite apposite elaborazioni GIS il comune di appartenenza di ciascun numero civico. In tal modo ciascun numero civico presenta un indirizzo, un comune di appartenenza, una scritta (data dalla composizione del numero civico e di eventuali esponenti (es.: /A, /5, /R, ecc.)), e chiaramente una coppia di coordinate1. Si è quindi operato un preventivo confronto con gli indirizzi, associando alle unità locali l’identificativo univoco della entità dell’archivio delle strade dei civici (vedi punto successivo). Dopodiché sono stati confrontati i diversi numeri civici con il civico della unità locale, aventi uguale identificativo dell’indirizzo, preventivamente riconosciuto. A tutte le unità locali per cui, nelle due fasi, sono stati riconosciuti sia l’indirizzo che il numero civico, sono state attribuite le coordinate del civico. Evidentemente tale riconoscimento ed assegnazione è stata possibile solo nell’ambito di quei territori e comuni per cui era disponibile la Carta Tecnica Regionale in scala 1:2.000 (capitolato livello 3, per cui è appunto prevista la acquisizione di strade e numeri civici). Archivio delle strade dei numeri civici (strade_civ_n): è stato realizzato un archivio delle strade, cui sono state associate le coordinate del baricentro dei diversi civici appartenenti a ciascuna strada. In pratica ogni strada riporta come coordinate la media di quelle dei civici che le appartengono. Per le diverse unità locali sono stati quindi operate elaborazioni finalizzate a riconoscere l’indirizzo di ciascuna unità locale nell’archivio delle strade dei numeri civici, associando alle unità locali le coordinate del baricentro. In pratica per ciascuna unità locale sono stati operati i confronti con l’archivio dei Comuni (e quindi associate le coordinate del centroide del comune), poi con quello delle località abitate (e quindi associate le coordinate del centroide della località abitata ed il relativo identificativo univoco), poi con l’archivio dei baricentri delle strade (stradgrp) del censimento 1991 (e quindi associate le coordinate del baricentro della strada ed il relativo identificativo univoco), poi, previo il riconoscimento dell’appartenenza del numero civico della unità locale all’opportuno intervallo associato (Archivio dello stradario ISTAT’91), per quell’indirizzo, alle sezioni di censimento che condividono quella strada come confine, sono state associate le coordinate del centroide della sezione di censimento ed il relativo identificativo univoco. Successivamente sono stati operati i confronti con l’archivio delle strade dei numeri civici (strade_civ_n), associando coordinate ed identificativo univoco della strada riconosciuta come coincidente con quella dell’indirizzo della unità locale. Infine, tra tutti i numeri civici dell’archivio dei numeri civici, sono stati individuati quelli coincidenti (a parità di indirizzo, riconosciuto nel passo precedente) con i civici delle diverse unità locali. In pratica, ogni unità locale si può trovare in diverse possibili casistiche, che le vedono associati identificativo e coordinate ricavate dal confronto dei diversi archivi, e quindi con differenti gradi di dettaglio spaziale. 1 In realtà ogni numero civico è rappresentato come una coppia di punti, che individuano un segmento, un cui estremo corrisponde al numero civico, e l’altro ricade all’interno del poligono che descrive l’area stradale, cui è associato l’indirizzo. Nella predisposizione dell’archivio dei numeri civici è stato eliminato tale secondo estremo, trasformando quindi gli originali segmenti in punti, calcolandone il baricentro (media delle coordinate) Dal semplice riconoscimento del Comune (e quindi con l’associazione delle relative coordinate, che evidentemente danno una localizzazione molto grossolana2), all’ulteriore riconoscimento della località (che consente quindi una migliore localizzazione della unità locale3), al riconoscimento dell’indirizzo sulla base dell’archivio delle strade ricavate dai dati del censimento ’91 (che riguarda l’intera regione, ma in cui mancano diverse strade, nate solo negli anni successivi al 1991), consentendo una migliore definizione nella localizzazione, e l’associazione dell’identificativo univoco attribuito a ciascuna strada. Successivamente sono stati confrontati i numeri civici con gli intervalli associati a ciascun indirizzo, facendo riferimento allo stradario del censimento 1991, e associando alla unità locale identificativo e coordinate della sezione di censimento del cui contorno fa parte la strada (individuata al passo precedente) per quell’intervallo di civici riconosciuti nel corso delle elaborazioni. Infine è stato possibile effettuare (limitatamente alle porzioni di territorio per cui sono disponibili i dati di Carta Tecnica Regionale in scala 1:2.000) le stesse operazioni di confronto con l’archivio delle strade da CTR. Associati, dopo il riconoscimento, alla unità locale il codice identificativo e le coordinate dei baricentri delle strade, si è poi proceduto all’ultimo passo del processo. Si sono confrontati i numeri civici delle unità locali con l’archivio dei numeri civici da CTR, e dove è stato possibile sono stati quindi associati identificativo e coordinate del numero civico. Per ciascuna unità locale sono quindi presenti più codici identificativi e coordinate, relativamente ai diversi archivi con cui era stato operato con successo il confronto. Con una elaborazione finale sono stati associati a ciascuna unità locale le coordinate più dettagliate disponibili, ed un codice che espliciti il livello di dettaglio raggiunto. Insomma, le procedure di georeferenziazione indiretta, sulla base di civici, stradario ISTAT, località abitate IGM e ISTAT e comuni, hanno consentito di associare (previo gli opportuni riconoscimenti) alle unità locali, localizzazioni sempre più precise. Nella tabella seguente si ha un quadro della qualità delle localizzazioni ricostruite per le diverse province. TIPO_GEOREF Totale <> 045 046 047 048 049 050 051 052 053 100 MS LU PT FI LI PI AR SI GR PO Civico 233695 8871 21695 16537 87509 19685 24310 8407 9109 7695 29877 Strada_civici 105589 8247 20542 8967 29138 8379 10098 5312 4555 3464 6887 59950 3264 2967 6837 6537 5900 5359 12412 8974 7473 227 2898 186 162 312 250 288 261 604 362 459 14 Località 30033 1940 4214 2135 3069 1597 3657 3376 3190 6412 443 Comune 70667 3177 3499 5900 8851 5439 5542 14690 11031 11394 1142 Sezione_di_censimento Strada_censimento Non_georeferenziato 1644 504474 TIPO_GEOREF METODOLOGIA ATTRIBUZIONE COORDINATE Civico le coordinate sono del numero civico (e dunque c'è stato il riconoscimento del toponimo ed anche del numero civico: occorre considerare che in diversi casi si è scelto di attribuire al civico 123/b le coordinate del civico 123 o del 123/a (se il 123/b non era disponibile). Evidentemente si tratta di un’approssimazione, ma comunque l'errore che comporta nella localizzazione è sicuramente inferiore a quello del semplice riconoscimento della strada, e quindi comporta un miglioramento della localizzazione) le coordinate sono del baricentro dei numeri civici che condividono la stessa strada il cui Strada_civici 2 1644 Occorre considerare che molte unità locali non presentano alcun indirizzo, e solo la indicazione del comune. Alcune unità locali, poi, appartengono a stati esteri, e per quelle non è possibile nemmeno la georeferenziazione sulla base del riconoscimento del comune. 3 Alcune unità locali presentano la sola indicazione della località abitata, senza alcun indirizzo: in tali casi evidentemente non è possibile alcuna georeferenziazione di miglior dettaglio. toponimo è stato riconosciuto (ma in cui, dalla CTR, non risultava quel numero civico, perché magari ricadente in un foglio di carta tecnica non disponibile, o anche per possibili errori di battitura (nell’archivio del Registro Imprese, o negli archivi della CTR)). Sezione_di_censimento le coordinate sono del centroide della sezione di censimento delimitata dalla stessa strada il cui toponimo è stato riconosciuto, e per un range di numeri civici in cui ricade il civico della unità locale Strada_censimento le coordinate sono del baricentro del gruppo di sezioni di censimento che condividono la stessa strada il cui toponimo è stato riconosciuto Località le coordinate sono del centroide della località abitata CTR 10.000, IGM o ISTAT (‘71, ‘81, ‘91). Comune le coordinate sono del centroide del comune Non_georeferenziato La unità locale non presenta nemmeno la identificazione del Comune di appartenenza. Di seguito si riporta una sintetica descrizione delle diverse tabelle utilizzate a supporto delle operazioni di georeferenzazione indiretta del Catasto Aziende. Comuni (Comuni_Italia) L’archivio nasce dall’elenco ufficiale dei Comuni dell’ISTAT: ai diversi comuni italiani sono poi state associate altre informazioni, estrapolate da archivi nazionali (es.: i codici dei comuni ricavati da pubblicazioni del Ministero delle Finanze), o regionali (es.: la appartenenza dei diversi comuni ai vari Ambiti Ottimali per la Gestione dei Rifiuti, ecc.). Il codice fiscale e l’indirizzo del comune sono stati ricavati dalle dichiarazioni MUD presentate dai comuni. Le coordinate dei centroidi (Gauss Boaga Fuso Ovest, sia per i comuni toscani che per quelli di tutta Italia) sono stati ricavati da uno shape-file dei limiti amministrativi di fonte Istat. Località abitate (DB_Toponimi) L’archivio nasce come unione dei toponimi dell’urbanizzato estratti dalla CTR 1:10.000, confrontati con l’elenco dei toponimi dei centri e nuclei ISTAT ai censimenti 1971, 1981 e 1991, e con l’elenco della toponomastica dell’urbanizzato della cartografia IGM in scala 1:25.000. Ove riconosciuto lo stesso toponimo in banche dati differenti, sono stati eliminati quelli IGM o ISTAT. Il flag ha_duplicato segnala quei toponimi che sono presenti, con coordinate significativamente differenti, più volte nell’ambito dello stesso Comune: ad esempio a Pistoia esistono differenti “Case Tesi”. In alcuni casi il toponimo è presente più volte, perché riportato su due fogli adiacenti, e dunque compare su entrambi (in tali casi si è cercato di selezionarne uno, eliminando l’altro). In altre situazioni, effettivamente esistono, anche in zone molto distanti, località con lo stesso nome (es.: Chiesina, o Case Tesi, ecc.), ed in tal caso non è possibile operare una georeferenziazione indiretta riconoscendo quel toponimo, in quanto si avrebbe incertezza su quale dei due o tre toponimi identici utilizzare per associare delle coordinate alla Unità Locale in esame. A tale scopo, quindi, i toponimi che hanno duplicati nel comune non vengono utilizzati durante le elaborazioni per la georeferenziazione indiretta. Stradario Censimento 1991 (stradgrp) Tale archivio deriva dallo stradario ISTAT del Censimento 1991, con i percorsi per i rilevatori censuari. In pratica si è operato un raggruppamento di tutte le sezioni di censimento che a sinistra, o a destra, o sia a sinistra che a destra presentano una specifica strada, associando quindi a quella strada il valor medio (il baricentro) delle coordinate dei centroidi delle sezioni di censimento interessate. Stradario con Sezioni di Censimento 1991 (Stradario_ISTAT) Tale archivio è ricavato dai dati relativi ai percorsi dei rilevatori censuari: dalle tabelle fornite a ciascun rilevatore è estrapolabile il codice della sezione di censimento da riportare sul fascicolo consegnato a ciascuna famiglia, sulla base dell’indirizzo e del numero civico. Frontespizio del Foglio di Famiglia distribuito in occasione del Censimento ISTAT della Popolazione del 1991. Su ciascun frontespizio il rilevatore apponeva il Codice della Sezione di Censimento che competeva a quella particolare abitazione, rilevandola da una tabella assegnatagli dove erano indicati i codici associati alle diverse tratte di strade da visitare. Il frontespizio era composto da due parti: su una era indicato solo il codice ISTAT del Comune ed il numero della Sezione di Censimento, e sull’altra il cognome della famiglia ed il suo indirizzo. Tale seconda parte veniva poi staccata dal fascicolo, ed inoltrata all’Ufficio Anagrafe per verificare che tutte le persone rilavate in occasione del Censimento fossero effettivamente risultanti agli Uffici Comunali. La prima parte, invece, restava associata ai dati contenuti nel questionario, e consentiva di attribuire i dati (relativi alle persone, all’edificio, ecc.) ad una specifica porzione di territorio. A seguito del dataentry delle informazioni contenute nel questionario, tali dati potevano essere georeferenziati indirettamente grazie alla parallela digitalizzazione dei poligoni descriventi le diverse Sezioni di Censimento (che sono spesso coincidenti, in ambito urbano, con gli isolati delimitati da strade, fiumi, ecc.). Presso ISTAT è possibile acquistare i dati relativi ai percorsi dei rilevatori: in pratica, a ciascuna tratta di strada (delimitata da un numero civico di partenza e da un numero civico di arrivo) risulta associato il numero di Sezione di Censimento che il rilevatore doveva apporre sui fascicoli consegnati per la compilazione. Nel caso in esempio, nell’ambito del Comune di Firenze (048017), la tratta di via Guido Banti, numeri Dispari dall’1 al 13, appartiene alla Sezione di Censimento 1227. Sempre ISTAT ha curato la digitalizzazione delle Sezioni di Censimento (per tutta Italia), in scala 1:25.000. In pratica possiamo riferire a ciascuna porzione di territorio, univocamente individuata tramite il Codice Istat del Comune e dal Numero di Sezione di Censimento, i dati statistici elaborati da ISTAT a partire da quanto acquisito dalla elaborazione dei Fogli Famiglia. Ma in realtà, associando ciascuna tratta di strada alla sezione di competenza, mediante lo stradario visto sopra, è possibile implementare strumenti di georeferenziazione indiretta anche di altri dati di fonte diversa. Stradario da CTR 1:2.000 (STRADE_CIV_N) Tale archivio è derivato da quello dei numeri civici (civ), operando una aggregazione di tutti i numeri civici che hanno in comune una stessa strada (tipovia e toponimo) ed attribuendo alla strada la media (il baricentro) delle coordinate dei diversi civici. Viene operato prima il riconoscimento della strada (confrontando per ciascuna unità locale tipovia e toponimo con quelli dell’archivio delle strade (Strade_civ_n), e solo in un secondo momento si opera un confronto tra la scritta de diversi numerici civici corrispondenti a quella strada dell’archivio civ con il numero civico associato alla Unità Locale. Numeri Civici da CTR 1:2.000 (CIV) Questo archivio deriva dai dati della CTR 1:2.000. I dati relativi ai numeri civici sono presenti nei files della cartografia numerica con appositi codici, e sono associati mediante apposite codifiche univoche ai dati relativi alle strade (ed al nome della strada): mediante apposite elaborazioni sono innanzitutto stati riassemblati i dati della strada con quelli dei suoi numeri civici, effetuate poi delle elaborazioni per scartare tutta una serie di errori non riscontrati nel corso dei collaudi dei dati della CTR, per poi giungere ad un archivio (che viene di volta in volta ulteriormente implementato a seguito della disponibilità di nuovi fogli di cartografia regionale in scala 1:2.000). Si riportano di seguito alcune immagini dell’archivio georefernziato delle Unità Locali del Catasto Aziende: i diversi colori dei puntini sono associati a differenti codici di attività economica. Figura 1 Toscana Figura 2 Area Metropolitana FI-PO-PT + Empoli Figura 3 Firenze Figura 4 Centro storico di Firenze A ciascun puntino sono associate alcune informazioni relative alla azienda ed alla unità locale, come da schema: