Rivista italiana di Telerilevamento - 2008, 40 (1): 5-11
Studio pilota finalizzato alla costruzione di una libreria
spettrale per specie vegetazionali
Nico Bonora1, Ines Marinosci1, Manuela D’Amen2, Valter Sambucini1,
Michele Munafò1 e Marco Marchetti3
1SINANet,
Servizio Informativo Nazionale Ambientale (APAT), Via Vitaliano Brancati 48 - 00144,
Roma. E-mail: [email protected]
2Laboratorio di Zoologia ed Ecologia Animale, Dipartimento di Biologia, Università degli Studi Roma
Tre, Viale Marconi 446 - 00146 Roma
3Laboratorio di Ecologia e Geomatica Forestale, Dipartimento di Scienze e Tecnologie per l’Ambiente e
il Territorio - STAT, Università degli Studi del Molise, Contrada Fonte Lappone - 86090 Pesche (IS)
Riassunto
Nell’ambito della componente italiana del progetto Image & Corine Land Cover 2000
(I&CLC2000) ci si propose di strutturare un database contenente informazioni sulle firme
spettrali di tematismi di carattere vegetazionale, allo scopo di poter approcciare, oltre alle
consuete tecniche di analisi visiva, anche quelle di classificazione automatica. La strutturazione iniziale del progetto ha previsto sia l’analisi spettrale del tematismo boschi a prevalenza di faggi (classe 3.1.1.5 della legenda CLC2000), sia l’analisi statistica dei risultati.
Per l’identificazione di tale copertura è stato utilizzato il vettoriale relativo alla copertura
CLC2000, mentre per l’analisi spettrale è stata utilizzata la copertura Landsat ETM+ estesa
su tutto il territorio nazionale. L’analisi statistica è stata effettuata tramite test non parametrici (Kruskal-Wallis ANOVA). Questo studio mira all’implementazione del database
tramite l’analisi spettrale dei boschi a prevalenza di castagni (classe 3.1.1.4 della legenda
CLC2000).
Parole chiave: copertura nazionale, analisi statistica, immagini Landsat
Driver study oriented to the vegetation spectral library creation
Abstract
By utilising the Italian component of the Image & Corine Land Cover 2000 project
(I&CLC2000) it has been proposed the creation of a database containing vegetation spectral signature, by using Landsat 7 ETM+ images acquired during the summer of 1999-2001
and covering the whole Italian territory, in order to contribute on the improving of the land
cover/use classification processes. The initial project structure foresees both the spectral
and statistical results analysis of beechwood land cover (CLC2000 3.1.1.5 class). For the
spectral analysis it has been utilised the vector layer retailed from the CLC2000 and applied on the Landsat images. The statistical analysis on the selected areas has been effectuated by non-parametric test (Kruskal-Wallis ANOVA). In order to implement the spectral
dataset of land vegetation component, this study aims at the chestnut analysis (CLC2000
3.1.1.4 class), by using the same methodology previously applied to the beachwood.
Keywords: national cover, statistic analysis, Landsat images
Bonora et al.
Studio pilota finalizzato alla costruzione di una libreria spettrale per specie vegetazionali
Scopo dello studio
Il presente lavoro mira alla costruzione di un database di firme spettrali relativo a zone
boscate sulla base del IV livello gerarchico della copertura CLC2000 it [APAT, 2005; JRC,
2005], al fine di migliorare o al più contribuire ad un maggior dettaglio tematico in un
potenziale processo di classificazione automatica. Poiché la risposta spettrale delle specie
vegetazionali dipende dai cambiamenti fenologici che avvengono con la stagionalità, il
progetto ha anche lo scopo di verificare la variabilità spettrale che caratterizza il territorio
italiano in stagioni ed in anni differenti.
Metodologia
Come già accennato la classe di copertura del suolo identificata per l’implementazione del
database è il tematismo 3.1.1.4 (boschi a prevalenza di castagni) della legenda CLC2000
it. Analogamente a quanto fatto nello studio precedente [D’Amen et al., 2006] relativo alle
faggete, sono state analizzate, tramite l’utilizzo del software Envi 4.3 (RSinc.), 15 scene
Landsat ETM+ che includono tale tematismo: queste immagini hanno una data di acquisizione compresa tra i mesi di Maggio e Settembre tra gli anni 2000-2002. Di ogni immagine sono state analizzate tutte le 7 bande. Per facilitare le operazioni di calcolo, per ogni
immagine è stato creato un resize tramite opportuno mascheramento. La maschera, di tipo
vettoriale, è stata ricavata dalla copertura CLC 2000 it. Tramite l’ausilio di precedenti controlli puntuali sul campo, usati per la validazione dell’affidabilità della copertura CLC2000
it, è stato individuato un insieme di pixel, appartenenti alla copertura a castagni. Questo ha
permesso di poter espandere la selezione ad altri insiemi di pixel presentanti caratteristiche
analoghe. La selezione dei pixel è avvenuta tramite l’utilizzo di regioni di interesse (ROI),
aree identificanti porzioni di immagine sulla base di un poligono tracciato manualmente,
che permettono di procedere ad un’analisi delle sole aree selezionate escludendo la restante
parte dell’immagine. È stato quindi possibile definire, a scala nazionale, la variabilità spettrale del tema considerato. Questo ha permesso di poter procedere ad un’analisi dei valori
minimi, medi, massimi e di deviazione standard delle distribuzioni dei valori dei Digital
Numbers (DN).
Come secondo obiettivo, ci si è proposti di analizzare quelle porzioni di territorio coperte
da più scene, al fine di poter condurre un’analisi multitemporale. Per poter ovviare ad eventuali errori legati ad una nuova selezione di pixel, si è proceduto tramite il riutilizzo delle
ROI precedentemente selezionate in comune a più scene. Questa fase ha comportato più
passaggi per il raggiungimento dello scopo preposto, in quanto le ROI sono associate ad
una determinata scena e non sono esportabili da un immagine all’altra. Per poter riutilizzare
esattamente le stesse aree selezionate si è agito tramite procedure di vettorializzazione che
hanno permesso l’esportazione della selezione. Raggiunto l’obiettivo di poter analizzare
aree comuni a più scene, si sono potute confrontare le distribuzioni dei valori di DN da un
punto di vista statistico, tenendo in considerazione l’anno ed il mese di acquisizione e sia la
condizione climatica al momento dell’acquisizione.
Analisi statistica
Per l’analisi dei castagni sono state analizzate 15 scene, per un totale di 24073 pixel (tra
901 e 1908 pixel per ogni singola scena). Per poter effettuare un’analisi di tipo statistico
[Soliani, 2005], per ogni banda sono stati presi in considerazione i seguenti parametri relativi ad ogni scena utilizzata: il valore minimo (Min), il valore massimo (Max), l’ampiezza
dell’intervallo (Range) ed il valore di DN corrispondente al picco di frequenza dei pixel
(Picco). I valori relativi ai castagni (Tab. 1) sono stati posti a confronto con quelli dei faggi
calcolati precedentemente [D’Amen et al., 2006]. Sono stati effettuati due tipi di confronto
Rivista italiana di Telerilevamento - 2008, 40 (1): 5-11
tra le bande: in primo luogo è stata comparata l’ampiezza degli intervalli di DN ottenuti
nelle diverse scene, mentre, in seguito, dopo aver raggruppato le scene sia in base alla loro
distribuzione geografica (Nord, Centro e Sud), sia in base al mese di acquisizione (fine
maggio-giugno; luglio; agosto e settembre) sono stati confrontati tra i gruppi, per ogni singola banda, i valori Min, Max e Picco di DN e l’ampiezza del Range di DN.
Poiché in entrambi i casi, i valori non seguono una distribuzione normale, i confronti sono
stati effettuati attraverso test non parametrici, in particolare utilizzando il Kruskal-Wallis
ANOVA che analizza le differenze tra più di 2 campioni e rappresenta l’alternativa non
parametrica del test F per l’analisi della varianza ad un criterio di classificazione.
La metodologia del test di Kruskal-Wallis può essere sintetizzata nei seguenti passaggi: a)
si assegna un rango a tutte le osservazioni dei gruppi di dati, considerate come una serie
Tabella 1 - Minimi e massimi, riscontrati nell’analisi dei castagni e dei
faggi, relativi ai valori di DN Min, Max, Range e Picco misurati per
ogni banda.
Banda7
Banda6
Banda5
Banda4
Banda3
Banda2
Banda1
min
max
range
picco
min
max
range
picco
min
max
range
picco
min
max
range
picco
min
max
range
picco
min
max
range
picco
min
max
range
picco
Faggi
Minimo
Massimo
48
66
86
58
9
31
71
53
37
52
49
66
11
26
41
58
26
41
39
57
10
27
30
47
92
122
122
190
72
25
83
56
104
129
29
56
110
132
123
148
6
18
118
138
26
37
60
45
29
15
38
47
Castagni
Minimo
Massimo
15
69
59
84
7
59
48
78
17
52
50
71
11
47
38
63
18
42
36
67
13
32
29
53
52
111
131
177
50
122
90
176
37
78
78
117
27
78
68
107
11
137
127
152
9
124
119
140
18
30
36
64
15
40
29
46
Bonora et al.
Studio pilota finalizzato alla costruzione di una libreria spettrale per specie vegetazionali
unica e, se sono presenti misure uguali, si assegna un rango medio; b) si calcolano le somme dei ranghi di ogni gruppo Ri e quella totale; c) si calcolano le medie dei ranghi di ogni
gruppo; d) si calcola il valore di un indice H [1]:
H = A Σi [Ri2 / ni] - 3(N+1)
[1]
dove la sommatoria è estesa a tutti i k gruppi a confronto e ni è il numero di dati del gruppo
i-esimo, N è il numero totale di osservazioni, A = N(N+1)/12.
Il parametro H si distribuisce approssimativamente come la distribuzione χ2 con (k-1) gradi
di libertà. Quando il valore di H calcolato è superiore a quello riportato, alla probabilità α
prefissata, si rifiuta l’ipotesi nulla e quindi esiste almeno una differenza significativa tra le
medie dei ranghi.
Anche nella statistica non parametrica è possibile ricorrere a confronti multipli per individuare quali sono i gruppi sono significativamente diversi tra loro. In questo caso è stato
utilizzato il test di Tukey applicato ai ranghi [Soliani, 2005]. In tutte le analisi statistiche
effettuate, è stato considerato un limite di confidenza di 0,95 (Tab. 2).
Tabella 2 - Confronto dell’ampiezza dei range delle diverse bande relative ai castagni. I valori in
corsivo neretto sono relativi alle differenze significative, con un intervallo di confidenza del 95%.
banda 1
banda 2
banda 3
banda 4
banda 5
banda 6
banda 1
banda 2
banda 3
banda 4
banda 5
0,9902107
0,7637099
0,00012
0,00012
0,9902107
0,9902107
0,00012
0,00012
0,7637099
0,9902107
0,00012
0,00012
0,00012
0,00012
0,00012
0,00012
0,00012
0,00012
0,000126
0,9999165
0,9397147
0,5597138
0,00012
0,00012
0,1025192
0,425384
0,00012
0,00012
banda 6
banda 7
0,9999165
0,013734
0,9397147
0,1025192
0,5597138
0,425384
0,0049397
0,0049397
Risultati dell’analisi statistica
0,000126
0,00012
0,00012
0,00012
0,00012
banda 7
0,013734
Nel confronto dell’ampiezza dei Range dei DN osservati nelle diverse bande nell’analisi
dei castagni emerge una differenza significativa (F(6, 98) = 85,672 p = 0,0000. One-way
ANOVA). Nella Figura 1 sono riportati i valori medi delle ampiezze dei Range per ogni
banda. La banda verticale indica un intervallo di confidenza del 95%. Come si osserva dalla
Figura 1, le bande 4 e 5 presentano un’ampiezza del Range dei DN significativamente maggiore di tutte le altre (Post-hoc - Tukey HSD test). Infatti, dalla Tabella 2 viene evidenziato
come le differenze significative riguardino quasi esclusivamente le bande 4 e 5. Queste bande non presentano un vero e proprio picco ed un range ben definito, ma una serie continua
di minimi e massimi relativi.
Analogamente a quanto effettuato nel lavoro precedente [D’Amen et al., 2006] è stato
realizzato un confronto tra le scene raggruppate in base alla loro distribuzione geografica
(Nord, Centro e Sud). Le distribuzioni dei valori dei DN (Picco, Min, Max e Range) per tali
aree geografiche, sono confrontati tramite il Kruskal-Wallis test, ed i valori ottenuti sono riportati nella Tabella 3. Da sottolineare che i valori di picco sono geograficamente uniformi
(nel 90 % dei casi non si sono ottenute differenze significative), il che si tradurrebbe in una
buona identificazione del tematismo considerato.
Rivista italiana di Telerilevamento - 2008, 40 (1): 5-11
Figura 1 - Valore medio dell’ampiezza dei Range per le diverse
bande. La barra verticale identifica un intervallo di confidenza del
95%.
Per quanto riguarda lo studio dell’influenza della stagione sulla firma spettrale è stato effettuato un analogo confronto tra le scene raggruppate in base al periodo di acquisizione
(maggio/giugno - luglio - agosto - settembre). Le distribuzioni dei valori dei DN per i parametri Picco, Min, Max e Range in funzione del mese di acquisizione delle scene, sono state
analizzate, analogamente al confronto geografico, tramite il Kruskal-Wallis test (Tab. 4).
Tabella 3 - Differenze significative in base alla distribuzione geografica delle scene. In corsivo neretto
quelli che risultano significativamente diversi (Kruskal-Wallis test).
min
max
range
H (2,14)
p
banda 1
7,50793
0,0234
3,17272
0,2047
banda 2
5,02009
0,0813
3,60951
0,1645
banda 3
7,24938
0,0267
6,87665
0,0321
H (2,14)
p
H (2,14)
picco
p
H (2,14)
p
4,11739
0,1276
3,61915
0,1637
1,18424
0,5532
3,09183
0,2131
0,287693
0,866
4,19117
0,123
banda 6
4,60089
0,1002
5,41881
0,0666
6,54715
0,0379
4,7049
0,0951
banda 7
5,038225
0,0805
1,08817
0,5804
4,031013
0,1333
2,67583
0,2624
Tabella 4 - Differenze significative in base all’influenza della stagionalità. In corsivo neretto quelli
che risultano significativamente diversi (Kruskal-Wallis test).
min
H (3,14)
max
range
p
H (3,14)
p
H (3,14)
picco
p
H (3,14)
p
banda 1
5,91657
0,1157
5,832426
0,1201
0,5087275
0,917
7,28729
0,0633
banda 2
7,82587
0,0498
8,09983
0,044
2,57897
0,4612
8,27714
0,0406
banda 3
7,54536
0,0564
6,68844
0,0825
7,76699
0,0511
5,72107
0,126
banda 6
6,4205
0,0929
6,12884
0,1055
1,18658
0,7562
5,6507
0,1299
banda 7
0,72254
0,8679
6,3041
0,0977
3,1165
0,374
4,27556
0,2332
Bonora et al.
Studio pilota finalizzato alla costruzione di una libreria spettrale per specie vegetazionali
Considerazioni sul confronto faggi-castagni
La Tabella 5 riporta il confronto del valore medio, calcolato per ogni banda, dei valori di
DN Min, Max e Picco calcolato su 15 scene. Dalla tabella emerge, a supporto dell’analisi
statistica condotta, che i valori medi sono molto prossimi tra loro, con differenze che raramente superano i 10 DN, fatta eccezione per il minimo delle bande 4, 5 e 7 e per il massimo
della banda 7. Interessante risulta che, generalmente, i castagni presentano valori di soglia
(Min e Max) e di Picco leggermente più alti rispetto ai faggi, fatta eccezione per il minimo
delle bande 4, 5 e 7, per il massimo della banda 5 e per il picco della banda 7.
La limitata differenza nello spettro tra i tematismi fin’ora considerati potrebbe tradursi nella
concomitanza di faggi e castagni (boschi misti) nella cartografia basata sulla legenda Corine utilizzata per l’identificazione della classe 3.1.1.4 (boschi a prevalenza di castagni).
Un fattore non trascurabile è il trattamento delle immagini utilizzate, eseguito sulle specifiche progettuali del progetto I&CLC2000 per l’identificazione fotointerpretativa di classi di
banda 7
banda 6
banda 5
banda 4
banda 3
banda 2
banda 1
Tabella 5 - Confronto del valore medio dei valori di DN Min,
Max e Picco, per ogni banda, calcolato su 15 scene Landsat
ETM.
10
Min
Max
Picco
castagni
60,64
74,50
67,14
faggi
57,41
72,00
63,40
differenza
3,23
2,50
3,74
castagni
45,43
61,57
52,57
faggi
44,00
59,00
50,05
differenza
1,43
2,57
2,52
castagni
32,71
51,29
39,29
faggi
31,00
46,00
36,91
differenza
1,71
5,29
2,38
castagni
91,71
154,36
126,18
faggi
105,00
147,00
differenza
13,29
7,36
castagni
61,29
109,07
86,09
faggi
76,00
113,00
differenza
14,71
3,93
castagni
127,29
140,50
132,36
faggi
124,00
136,00
129,57
differenza
3,29
4,50
2,79
castagni
26,57
51,86
36,14
faggi
52,00
32,00
40,68
differenza
25,43
19,86
4,54
Rivista italiana di Telerilevamento - 2008, 40 (1): 5-11
uso/copertura del suolo con unità minima cartografabile di 5 ha, che ha contemplato, oltre
ad una correzione atmosferica, georeferenziazione e ortorettifica, il ricampionamento del
pixel a 25 m tramite convoluzione cubica che, di fatto, ha alterato ed appiattito i valori di
DN del pixel.
Considerando però che le aree campione sono ubicate in aree ad elevata omogeneità, si
assume che il ricampionamento dell’immagine abbia inciso in maniera lieve sulla media
del valore, espresso in DN, del gruppo di pixel selezionati. Un altro fattore limitante, che
potrebbe inficiare l’identificazione dei cambiamenti futuri di destinazione di uso del suolo
delle classi considerate, è l’inoperatività del sensore utilizzato in questo lavoro (Landsat
ETM+), che utilizza 6 bande con intervallo 0,45-2,35 µm più un infrarosso 10,4-12,5 µm,
una copertura per scena di 180 x 180 km e costi accessibili. L’alternativa potrebbe trovare
riscontri nell’utilizzo del precedente Landsat 5 TM, nuovamente operativo, coprente la
stessa area ma presentante una minore risoluzione geometrica nel termico, oppure tramite
l’impiego del sensore SPOT 4, che presenta una minore estensione di copertura (60 x 60
km), un numero di bande limitato a 4 e con intervallo più ristretto (0,50-1,75 µm), un angolo di acquisizione maggiore che porta ad una maggiore distorsione ai lati della scena ma
una migliore risoluzione geometrica (20 m).
Bibliografia
APAT (2005) - La realizzazione in Italia del progetto europeo Corine Land Cover 2000
- 61/2005. Roma, pp. 86.
D’Amen M., Bonora N., Sambucini V., Marchetti M., Munafò M. (2006) - Realizzazione ed
analisi di un database di firme spettrali basato sull’utilizzo di classi in base alla legenda
Corine Land Cover 2000. Atti della X Conferenza Nazionale Asita.
JRC (2005) - CORINE Land Cover updating for the year 2000. IMAGE 2000 and CLC2000.
Products and Methods. Printed in Italy, pp. 150
Soliani L. (2005) - Manuale Di Statistica Per La Ricerca E La Professione. Statistica Univariata E Bivariata Parametrica E Non-Parametrica Per Le Discipline Ambientali E Biologiche”.
Manoscritto ricevuto il 27/03/2007, accettato il 8/06/2007.
11
Scarica

Studio pilota finalizzato alla costruzione di una libreria spettrale per