XXXIII CONFERENZA ITALIANA DI SCIENZE REGIONALI
APPLICAZIONE DELLA STATISTICA SPAZIALE PER LO STUDIO DELLO SVILUPPO
RURALE
Chiara PICCINI1, Edoardo PIZZOLI2
SOMMARIO
Al fine di migliorare la rappresentazione e la diffusione dell’informazione statistica a livello
territoriale e migliorare l’utilizzo dei dati già disponibili, prodotti dagli uffici statistici
pubblici, in questo lavoro vengono presentati i risultati di un’applicazione geostatistica
(Kriging Ordinario) per la stima e la rappresentazione cartografica di alcuni indicatori
economici di sviluppo rurale sul territorio della provincia di Frosinone. L’applicazione prende
in considerazione dati provenienti dai conti nazionali, dai censimenti e da indagini statistiche
specifiche, verificando in primo luogo la presenza di autocorrelazione spaziale dei dati tramite
analisi variografica e fornendo quindi una cartografia di tipo probabilistico (stima in punti non
campionati ed errore associato). La performance del metodo proposto viene infine confrontata
con un metodo di rappresentazione cartografica di tipo deterministico (Inverse Distance
Weighting).
1
ISTAT, Dipartimento per i conti nazionali e le statistiche economiche, Via Depretis 74b, 00184 Roma, email:
[email protected]
2
Corresponding author. ISTAT, Dipartimento per i conti nazionali e le statistiche economiche, Via Depretis 74b,
00184 Roma, email: [email protected]
1
1
Introduzione
L’informazione statistica ufficiale rappresenta la base fondamentale per le decisioni e la
programmazione delle politiche a diversi livelli amministrativi e territoriali. In questo
contesto, una consistente parte degli utilizzatori ritiene che la territorializzazione di alcuni
caratteri sia assolutamente necessaria per avere un quadro completo ed esaustivo del
fenomeno in esame. La maggior parte dei dati disponibili ha sempre, all’origine, un
riferimento territoriale, ossia “dove” il dato è stato misurato o rilevato. La statistica spaziale è
lo strumento adeguato per simili studi, in quanto tratta i dati tenendo conto esplicitamente
della loro natura spaziale, ossia della posizione in cui i fenomeni sottostanti al dato si sono
manifestati. La statistica spaziale fornisce pertanto dei metodi e delle tecniche che permettono
di studiare la presenza su un determinato spazio geografico di fenomeni di diversa natura.
In particolare, le operazioni di tipo geostatistico sono fondamentalmente dirette alla
caratterizzazione spaziale dei fenomeni e alla loro modellizzazione e stima, e i risultati di tali
operazioni, oltre a rappresentare elementi oggettivi per l’interpretazione e la comprensione dei
fenomeni stessi, trovano impiego nella messa a punto dei sistemi di supporto alle decisioni e
nella progettazione e gestione dei sistemi di monitoraggio.
Nel presente lavoro viene presentata un’applicazione del processo di georeferenziazione e
stima degli indicatori economici mediante interpolazione geostatistica alla Provincia di
Frosinone. La cartografia ottenuta è di tipo probabilistico, ovvero restituisce una stima anche
in aree dove non ci sono osservazioni dirette, nonché l’errore associato alla stima. Per
confronto, le stesse carte sono state costruite anche con un metodo di tipo deterministico.
L’impostazione e i metodi proposti possono essere estesi a qualunque area amministrativa,
compatibilmente con la scala supportabile dal software per i dati disponibili.
2
Unità statistiche e rappresentazione spaziale dei dati
Alcuni indicatori di sviluppo, rilevanti ai fini dello sviluppo rurale, sono calcolabili per
diversi livelli territoriali-amministrativi e/o a livello individuale (impresa agro-industriale,
azienda agricola e famiglia agricola). Al fine della rappresentazione spaziale di tali indicatori
vengono considerate quindi due tipologie di unità statistiche: le unità territoriali e le microunità economiche. Le unità territoriali sono intese come porzioni del territorio geografico; tra
queste, per le finalità del presente lavoro vengono considerate le aree amministrative minime
italiane (i Comuni). La loro rappresentazione spaziale si effettua per poligoni, ma risulta
spesso discontinua ed eccessivamente semplificata, in quanto le porzioni minime di territorio
considerate si ipotizzano uniformi, in termini di valori della variabile osservata.
Le micro-unità economiche sono invece intese come le unità elementari secondo la
rappresentazione del Sistema Europeo dei Conti (SEC). Nell’ambito di queste si analizzano:
2
1. le unità di produzione: a) unità istituzionali Società non finanziarie (imprese agroindustriali); b) unità di attività economica (UAE) locali appartenenti alle unità
istituzionali (le aziende agricole);
2. le unità di produzione e consumo: unità istituzionali Famiglie (gruppo socioprofessionale delle famiglie agricole).
La ricostruzione spaziale di una variabile tramite stima si effettua a partire da un limitato
numero di osservazioni della variabile stessa; nel nostro caso le osservazioni sono costituite
dalle micro-unità economiche considerate. Per ottenere la rappresentazione spaziale della
variabile è necessario interpolare i suoi valori in punti non osservati. A questo scopo, esistono
diverse tecniche di interpolazione, tutte basate sull’ipotesi di continuità spaziale dei fenomeni
oggetto di studio. E’ necessario, cioè, che l’evoluzione spaziale attesa sia graduale e si
sviluppi in modo che, mediamente, più due punti sono vicini fra loro e più i valori delle
variabili in essi osservati si assomigliano. La cartografia stimata è quindi una
rappresentazione “media” del fenomeno studiato; la vicinanza è inoltre un concetto relativo
alla scala di osservazione.
Esistono due tipologie di metodi di interpolazione: deterministici, ovvero basati
sull’applicazione di un algoritmo definito a priori, e probabilistici o geostatistici. Il metodo
deterministico più usato è l’Inverse Distance Weighting (IDW), basato sull’assunzione che la
superficie interpolante sia influenzata in maniera maggiore dai punti più vicini e meno da
quelli più distanti. Consiste in un processo di assegnazione dei valori a punti non direttamente
osservati per mezzo di una media pesata di n valori noti, e il peso di ciascun punto diminuisce
al crescere della distanza. Si tiene conto della distanza dei punti rispetto al punto di interesse
pesando il contributo di ciascun punto con una funzione della distanza stessa (l’inverso).
Questo tipo di interpolatori non prende in considerazione l’autocorrelazione spaziale dei dati,
semplificando a volte eccessivamente la realtà (Isaaks e Srivastava, 1989).
La geostatistica invece può essere usata per caratterizzare il comportamento e la distribuzione
spaziale di una grandezza e, usando questa informazione, è possibile stimare il valore di tale
grandezza anche dove non vi siano osservazioni dirette, minimizzando l’errore di stima
(Webster e Oliver, 2001).
In uno studio geostatistico la caratterizzazione di un fenomeno spaziale costituisce il primo e
più importante passo; consiste essenzialmente nell’evidenziare, in forma qualitativa e
quantitativa, la variabilità del fenomeno in esame. Per questo fine si utilizza il variogramma,
una funzione definita sulla base dei dati disponibili che misura la variabilità della grandezza
studiata in relazione alla distanza. Il variogramma è una funzione della distanza e del relativo
orientamento delle coppie di punti che descrive il grado di correlazione tra tali punti, dato
dalla varianza delle differenze della variabile considerata in una coppia di siti: se due unità
sono tra loro vicine la loro differenza sarà piccola e così pure la sua varianza. Al crescere
della lontananza tra i siti, le differenze diventano più grandi e la varianza assume valori
3
maggiori. Mediando i valori calcolati per le varie coppie di punti su una distanza standard
(lag) si ottiene il variogramma sperimentale, in cui la dipendenza spaziale dei dati è espressa
tipicamente da un incremento della funzione al crescere della distanza. La varianza raggiunge
poi, o si avvicina asintoticamente a, un certo valore costante detto sill, ad una distanza finita
(range) oltre la quale non c’è più autocorrelazione spaziale (Ciotoli e Finoia, 2005). Quando è
presente autocorrelazione spaziale, il fenomeno investigato può essere descritto da un certo
modello teorico di variabilità spaziale. Al variogramma empirico viene quindi adattato un
modello parametrico, che permette di effettuare la stima della variabile in punti non osservati
(Goovaerts, 1997). Oltre a sill e range, il terzo parametro fondamentale che definisce la forma
del modello di variogramma è il nugget, ovvero l’intercetta sull’asse delle ordinate, che
esprime la variabilità a piccola scala.
Il Kriging può essere definito in prima approssimazione come una media mobile pesata, che
permette di effettuare stime non distorte attraverso un predittore lineare ricavato per
interpolazione da un certo numero di osservazioni localizzate nei dintorni del punto non
osservato. E’ simile all’IDW, poiché anch’esso attribuisce un peso alle singole osservazioni
della variabile nell’intorno del punto da interpolare, ma i pesi da attribuire sono espressione,
oltre che della distanza, anche della correlazione spaziale d’insieme dei punti osservati
utilizzati nell’interpolazione, ricavata dalla struttura del variogramma. Uno dei principali
vantaggi è quello di fornire una misura dell’errore commesso nell’interpolazione. Nel
presente lavoro viene utilizzato in particolare il Kriging Ordinario (Ordinary Kriging, OK),
che è il tipo più comunemente usato nelle applicazioni pratiche (Marchetti et al., 2012).
3
I dati disponibili e la loro georeferenziazione
Le fonti dei dati disponibili utilizzate in questo lavoro sono le seguenti:
 Per le unità territoriali: Censimento della popolazione e abitazioni 2001 e
aggiornamenti; indagine delle forze di lavoro (2005). I dati sono riferiti ai Comuni.
 Per le micro-unità: Archivio ASIA-imprese, indagine REA e indagine EU-SILC. I dati
sono riferiti alle unità imprese, aziende agricole e famiglie.
Nel primo caso la codifica di Provincia e Comune delle unità permette una rappresentazione
cartografica “diretta” dei caratteri rilevati sulle unità e degli indicatori sviluppati a partire da
essi, e l’unità di rappresentazione è il territorio del singolo Comune. Nel secondo caso, a
partire dai dati identificativi dell’unità (codice Provincia e Comune, oltre all’indirizzo) è
possibile “indirettamente”, attraverso una fase intermedia di stima, rappresentare le variabili
in modo puntuale ed estenderle sul territorio. Queste operazioni presuppongono l’uso di
strumenti GIS.
In questo secondo caso, il processo di rappresentazione prevede i seguenti passi di trattamento
dei dati disponibili:
4
1) individuazione del livello amministrativo di interesse;
2) normalizzazione degli indirizzi delle unità (controllo qualità del dato);
3) attribuzione di coordinate geografiche alle unità, sulla base degli indirizzi;
4) correzione degli errori più grossolani sulle coordinate delle unità;
5) rappresentazione cartografica dei punti e dei valori puntuali degli indicatori;
6) stima dei valori per i punti non osservati;
7) rappresentazione attraverso isolinee dei valori degli indicatori sul territorio.
Il processo di normalizzazione e georeferenziazione degli indirizzi viene effettuato tramite il
software Egon, che permette di analizzare i dati territoriali e di decodificarli in maniera
univoca per poterli mappare con precisione. A partire da una lista di indirizzi, il software
restituisce infatti le coordinate geografiche dei punti corrispondenti, sia in metri che in gradi.
Alcuni indirizzi, per vari motivi, possono non essere riconosciuti dal software; se il sistema
non trova le coordinate reali, restituisce delle approssimazioni: generalmente le coordinate del
centroide della sezione di censimento, ma in alcuni casi addirittura del centroide del comune.
In questo caso, se si tratta di una esigua minoranza, si procede alla loro correzione
individuandoli con GoogleTM Earth e trascrivendo le coordinate corrispondenti. Nei casi in cui
vi siano errori di rilevazione o di inserimento negli archivi, gli indirizzi non sono comunque
riconoscibili; il dato viene allora scartato, e non si utilizza per le successive elaborazioni.
4
Le aree rurali e gli indicatori di sviluppo utilizzati
Le aree amministrative possono includere, e nella maggior parte dei casi includono, diverse
tipologie di territorio: urbane, industriali, agricole, forestali, riserve naturali, ecc. Alcune di
queste, secondo la teoria, sono identificabili come rurali, e come tali possono essere oggetto
di una specifica politica di sviluppo. In Europa l'identificazione di queste aree non è definita a
priori, mentre sono definiti gli obiettivi e gli strumenti. Un elemento fortemente
caratterizzante, almeno in Europa, è la presenza delle attività agricole in senso stretto o
attività primarie (coltivazioni, allevamenti, silvicoltura e pesca) e quelle ad esse collegate.
Negli ultimi decenni, però, le campagne europee sono state oggetto di notevoli cambiamenti,
che hanno messo in discussione il concetto di spazio “rurale” ed il ruolo che l’agricoltura
riveste in tali aree.
Diventa fondamentale, pertanto, la definizione e la misura della ruralità, ovvero
l’individuazione e la classificazione del diverso grado di ruralità dei territori. In generale, le
metodologie di classificazione territoriale si prefiggono l’obiettivo di acquisire nuove
conoscenze relative all’individuazione di ambiti territoriali più o meno omogenei per
problematiche e specificità, su cui far convergere in modo efficace gli interventi di politica di
sviluppo territoriale. La letteratura fornisce diverse definizioni dello spazio rurale in base a
5
distinti parametri e caratteristiche quali-quantitative, rispecchiando i notevoli cambiamenti
che hanno interessato l’agricoltura e il mondo rurale (UN, 2012).
Seguendo la definizione delle aree rurali basata essenzialmente sulla densità di popolazione,
la stima del grado di ruralità delle aree amministrative può essere fatta utilizzando diversi
strumenti statistici, a seconda dei dati disponibili; negli anni più recenti predomina
l’approccio di tipo multidimensionale, cioè l’utilizzo di differenti indicatori socio-economici e
fisici. Nel presente lavoro, il grado di ruralità dei Comuni è stato definito costruendo un
indice attraverso l'analisi multivariata (Pizzoli, 2012). Di seguito tale indice comunale viene
rappresentato per le regioni d’Italia:
Figura 1 – Indice rurale-urbano delle Regioni italiane
Ai fini dell’analisi di sviluppo rurale del territorio italiano, sulla base dei dati disponibili, sono
stati selezionati i seguenti indicatori statistici:
6
-
presenza e intensità economica, performance e produttività delle imprese agroindustriali e delle aziende agricole, espresse come numero di giornate lavorate, entità
delle vendite e vendite per giornata lavorata;
- reddito disponibile, totale e pro-capite, delle famiglie agricole.
Gli indicatori selezionati sono sicuramente di pertinenza dello sviluppo rurale, anche se non in
modo esclusivo ed esaustivo del fenomeno. Ai fini della presentazione dei dati e dei metodi
descritti precedentemente, viene considerata come esempio l’area amministrativa della
Provincia di Frosinone.
5
Risultati per la provincia di Frosinone
La provincia di Frosinone, suddivisa in 91 comuni, ha una superficie di 3.244 km²; il numero
degli abitanti (al 30/04/2010) è di 497.776, con una densità abitativa di 153,44 abitanti per
km². Il suo territorio presenta una situazione geografica molto complessa per la sua
eterogeneità: vi sono diverse catene montuose (Ernici, Lepini Ausoni, Aurunci) che segnano
anche i confini amministrativi, ma anche ampie valli come quelle del Sacco e del Liri, aree
densamente popolate e distretti industriali sviluppati.
Per quest’area, la stima del grado di ruralità comunale è la seguente:
Figura 2 – Dettaglio dell’indice rurale-urbano della Provincia di Frosinone
7
Possiamo vedere che sul territorio considerato la presenza di aree ad elevato indice di ruralità
è piuttosto consistente. Per stimare la distribuzione sul territorio delle variabili economiche
considerate, per prima cosa è stata verificata sui due dataset, delle aziende agricole e delle
famiglie agricole, la presenza di autocorrelazione spaziale per mezzo di una analisi
variografica condotta con il software VarioWin 2.21 (Pannatier, 1995).
Generalmente, l’applicazione di metodi geostatistici presuppone che i dati abbiano una
distribuzione normale (Webster e Oliver, 2001); nel nostro caso questa condizione non è
verificata, e la normalizzazione non si ottiene neppure procedendo a una trasformazione dei
dati. Questo costituisce un limite per applicazione di tali metodi, che va tenuto in
considerazione. Per semplicità si assume inoltre che non vi sia anisotropia, quindi che la
forma del variogramma non cambi nelle diverse direzioni. Per quanto riguarda le aziende
agricole, è stato quindi costruito un variogramma omnidirezionale con un lag di 5100 m,
mentre per le famiglie, dove sono disponibili meno punti, si è considerato un lag un po’ più
ampio (5500 m). Consideriamo prima il dataset delle aziende agricole: nella figura 3 sono
riportati i variogrammi per le tre variabili giornate lavorate, vendite e rapporto
vendite/giornate lavorate.
a) giornate lavorate
b) vendite
c) vendite/giornate lavorate
Figura 3 – Variogrammi sperimentali modellizzati – dataset aziende agricole
8
Il variogramma relativo alla variabile giornate lavorate è quello che mostra una struttura di
variazione spaziale più chiara, mentre negli altri due il modello è meno evidente.
L’autocorrelazione spaziale in tutti i casi non è forte; comunque, il modello migliore si ottiene
minimizzando l’indice IGF (Indicative Goodness of Fit; Pannatier, 1996). Si tratta di una
misura standardizzata della differenza tra i valori osservati e quelli stimati, basata sul criterio
dei minimi quadrati. Nella tabella 1 sono riportati i parametri dei modelli adattati ai
variogrammi sperimentali ottenuti, e i corrispondenti valori di IGF. Per quanto appena
esposto, quest’ultimo dovrebbe essere il più possibile vicino allo zero per avere un buon
modello; vediamo che il primo modello, relativo al variogramma della variabile giornate
lavorate, ha un IGF più basso rispetto agli altri due.
Tabella 1 – Parametri dei variogrammi per le aziende agricole
Nugget
Giornate
10800
lavorate
Vendite
1,37.109
Vendite/giornate 15840
lavorate
Struttura
Sferica
Range
7790
Sill
7200
IGF
0,012585
Gaussiana
Gaussiana
34030
28700
6,59.108
11765,6
0,061563
0,059492
L’analisi geostatistica si conclude con la restituzione cartografica dei valori dell’attributo
nell’area indagata. Le elaborazioni cartografiche sono state effettuate per mezzo del software
ESRI ArcGISTM 10. Sono state costruite le mappe relative applicando l’algoritmo di OK; per
confronto, le stesse variabili sono state interpolate nello spazio utilizzando il metodo IDW
(figure 4a, 4b, 4c). I due metodi vengono confrontati sulla base della loro capacità di fornire la
migliore rappresentazione spaziale stimata degli indicatori analizzati.
9
Figura 4a – Carta delle giornate lavorate costruita con OK e IDW
10
Figura 4b – Carta delle vendite costruita con OK e IDW
11
Figura 4c – Carta del rapporto vendite/giornate lavorate costruita con OK e IDW
Possiamo facilmente vedere come le carte costruite con il metodo deterministico (IDW) siano
in genere meno articolate, ovvero la distribuzione delle diverse categorie viene “smussata”;
questo fatto è più evidente dove l’autocorrelazione spaziale è più forte. L’andamento delle
isolinee è comunque molto simile, se non proprio lo stesso.
12
Lo stesso procedimento è stato ripetuto considerando il dataset delle famiglie agricole: nella
figura 5 sono riportati i variogrammi per le variabili reddito totale e reddito pro-capite.
a) reddito totale
b) reddito pro-capite
Figura 5 – Variogrammi sperimentali modellizzati – dataset famiglie agricole
Anche questi variogrammi non presentano un modello teorico di variazione spaziale molto
chiaro. Nella tabella 2 sono riportati i parametri dei modelli adattati e il valore dell’indice
IGF: soprattutto nel caso del reddito totale, quest’ultimo valore non è molto buono, quindi
anche in questo caso abbiamo un’autocorrelazione spaziale piuttosto debole.
Tabella 2 – Parametri dei variogrammi per le famiglie agricole
Reddito totale
Reddito procapite
Nugget
4,51.108
7,43.107
Struttura
Sferica
Sferica
Range
21592
44000
Sill
4,63.107
1,40.107
IGF
0,15044
0,056036
Anche per queste variabili sono state costruite le mappe con i due metodi, OK e IDW,
riportate nelle figure 6a, 6b.
13
Figura 6a – Carta del reddito totale delle famiglie costruita con OK e IDW
14
Figura 6b – Carta del reddito pro-capite delle famiglie costruita con OK e IDW
Anche in questo caso l’andamento delle isolinee è simile, ma la presenza di una
autocorrelazione spaziale debole fa sì che siano più articolate le mappe costruite con IDW;
non è detto però che abbiano un minor livello di errore, come vedremo in seguito.
15
Per valutare la performance dei due metodi, è stata effettuata una cross-validazione, ovvero un
procedimento che elimina di volta in volta dal dataset un valore osservato, stimandolo per
mezzo degli altri dati. L’accuratezza del modello viene valutata calcolando la radice
dell’errore quadratico medio (Root Mean Square Error, RMSE), che indica la discrepanza fra
i valori dei dati osservati e i valori dei dati stimati. Nella tabella 3 sono riportati i valori di
RMSE per le mappe ottenute con i due diversi metodi: possiamo vedere che anche laddove la
struttura di autocorrelazione spaziale è meno evidente, utilizzando il modello trovato per il
variogramma nell’OK si ha un errore complessivo più basso rispetto al metodo deterministico
IDW.
Tabella 3 – Valori di RMSE a confronto per le diverse mappe
Mappa
Giornate lavorate
Vendite
Vendite/giornate lavorate
Reddito totale
Reddito pro-capite
RMSE per OK
131,74
44771
160,53
22378,86
9634,71
RMSE per IDW
134,32
50467
176,37
28656,87
10469,23
Abbiamo detto in precedenza che uno dei principali vantaggi dell’applicazione dell’OK
rispetto all’IDW è quello di fornire una misura dell’errore commesso nell’interpolazione. Di
seguito vengono riportate le mappe dell’errore standard per ciascuna delle variabili
considerate nel presente lavoro:
16
Figura 7 – Mappe dell’errore standard per le variabili considerate interpolate con OK
Possiamo facilmente osservare che l’errore più elevato si commette nelle aree dove sono
scarsi o assenti i punti di osservazione diretta.
17
I metodi utilizzati possono essere applicati a qualsiasi area geografica di interesse in cui siano
disponibili dati di tipo puntuale.
6
Discussione e conclusioni
E’ evidente la complessità della relazione tra aree amministrative (Comuni, in questo caso) a
diverso grado di ruralità e la distribuzione spaziale degli indicatori di sviluppo rurale
considerati. Valori omogenei degli indicatori caratterizzano più Comuni confinanti, mentre
diversi valori caratterizzano porzioni di uno stesso Comune; così come è articolata la
sovrapposizione tra indicatori diversi. La rappresentazione attraverso carte geografiche è sì
uno strumento di statistica descrittiva, ma anche una base per l'analisi delle politiche rivolta a
policy makers che hanno come area di competenza, per i loro intereventi, precise porzioni di
territorio, ovvero le aree definite politicamente per fini amministrativi (in questa
esemplificazione i Comuni). La lettura della sovrapposizione delle aree amministrative e degli
indicatori diventa interessante per il policy maker che deve individuare zone di intervento e di
particolare attenzione nel monitoraggio dei trend di sviluppo.
Stante la necessità di effettuare la ricostruzione spaziale di tali indicatori tramite stima a
partire da un limitato numero di osservazioni, è necessario interpolare i valori in punti non
osservati. Le tecniche di interpolazione sono basate sull’ipotesi di continuità spaziale dei
fenomeni, ipotesi non sempre verificata nel caso di variabili economiche. Ciò nonostante, in
questo lavoro due diversi metodi di interpolazione, uno deterministico (IDW) e uno
probabilistico (OK) sono stati utilizzati con successo, e le loro performance sono state messe
a confronto.
Il metodo IDW risente molto della configurazione dei punti di misura, e inoltre non fornisce
alcuna stima dell’errore commesso nel processo di interpolazione; il metodo OK, nonostante
venga qui applicato su dati non ottimali dal punto di vista della distribuzione di frequenza, in
seguito a cross-validazione restituisce comunque un RMSE più basso rispetto al precedente.
Dimostra quindi di essere un metodo di interpolazione spaziale accurato e flessibile,
adattabile ad un’ampia gamma di tipologie di dati, e fornisce per di più un’attendibile misura
dell’errore di stima attraverso il calcolo dei residui.
I metodi geostatistici sono stati finora utilizzati soprattutto per la spazializzazione di variabili
di tipo ambientale, ma le possibili applicazioni sono molteplici. Sarebbe interessante in
futuro, nel caso degli indicatori economici e sociali di sviluppo rurale, esplorare le possibilità
di utilizzo di altri tipi di Kriging, p.es. il Kriging a variabile indicatrice, che permette di
valutare la probabilità di superamento di una soglia prefissata.
18
7
Bibliografia
Ciotoli G., Finoia M.G. (2005), Dalla Statistica alla Geostatistica. Introduzione all’analisi
dei dati geologici e ambientali, Aracne editrice, Roma.
Goovaerts P. (1997), Geostatistics for natural resource evaluation, Oxford University Press,
New York.
Isaaks E.H., Srivastava R.M. (1989), An Introduction to Applied Geostatistics. Oxford
University Press, New York.
Marchetti A., Piccini C., Francaviglia R., Mabit L. (2012), Spatial Distribution of Soil
Organic Matter Using Geostatistics: A Key Indicator to Assess Soil Degradation Status in
Central Italy, Pedosphere, 22(2): 230-242.
Pannatier Y. (1995), Software VarioWin 2.2. Institute of Mineralogy, University of Lausanne,
Switzerland. http://www-sst.unil.ch/research/variowin/index.html.
Pannatier Y. (1996), Variowin, Software for Spatial Data Analysis in 2D. Springer Verlag,
Berlin.
Pizzoli E. (2012), Rural development indicators for regions with different degrees of
“rurality”: a statistical study. XIèmes Journées de Méthodologie Statistique de l’Insee, 2426 January 2012. http://http://jms.insee.fr/files/documents/2012/939_4-JMS2012_S242_PIZZOLI-ACTE.PDF.
UN (2012), The Wye Group Handbook - Statistics on rural development and agricultural
household
income.
Second
Edition,
FAO,
Rome.
http://www.fao.org/fileadmin/templates/ess/pages/rural/wye_city_group/wyehandbook.ht
ml.
Webster R., Oliver M.A. (2001), Geostatistics for Environmental Scientists. Wiley,
Chichester.
19
ABSTRACT
Official statistical information represents the basis for decision and policy making. Most of
the users consider the territorialisation of some characters as necessary to design a complete
and comprehensive framework of the analysed phenomenon. Initially, most of the available
data have a territorial reference, that is “where” they were measured or taken. Spatial statistics
is the optimal tool for this kind of study, since it deals with data taking into account their
spatial nature, that is their position in space. Spatial statistics offers several methods and
techniques which allow to study different phenomena in a geographical space.
In particular, geostatistics is aimed to describe the variation in space of a variable, in order to
model and to estimate such variable in every point of the considered territory. Such results
represent useful tools not only for the knowledge and the comprehension of the involved
phenomena, but also for decision making support and for monitoring systems management.
In order to improve the representation and the dissemination of statistical information at a
territorial level, and to enhance the use of already available data – from public Statistics
Offices – this paper presents the results of a geostatistical application (Ordinary Kriging) for
the estimation and mapping of some rural development indicators. Italian territorial data from
National Accounts, Censuses and specific statistical surveys are considered in this
application. First the presence of spatial autocorrelation was verified by means of
variographic analysis, then probabilistic maps (estimation in non-sampled points and
associated error) were drawn. Comparing these maps with those obtained by a deterministic
mapping method (Inverse Distance Weighting) allowed to assess the performance of the
proposed method.
20
Scarica

scarica il paper - Gruppo Servizio Ambiente