Rivista italiana di Telerilevamento - 2008, 40 (1): 5-11 Studio pilota finalizzato alla costruzione di una libreria spettrale per specie vegetazionali Nico Bonora1, Ines Marinosci1, Manuela D’Amen2, Valter Sambucini1, Michele Munafò1 e Marco Marchetti3 1SINANet, Servizio Informativo Nazionale Ambientale (APAT), Via Vitaliano Brancati 48 - 00144, Roma. E-mail: [email protected] 2Laboratorio di Zoologia ed Ecologia Animale, Dipartimento di Biologia, Università degli Studi Roma Tre, Viale Marconi 446 - 00146 Roma 3Laboratorio di Ecologia e Geomatica Forestale, Dipartimento di Scienze e Tecnologie per l’Ambiente e il Territorio - STAT, Università degli Studi del Molise, Contrada Fonte Lappone - 86090 Pesche (IS) Riassunto Nell’ambito della componente italiana del progetto Image & Corine Land Cover 2000 (I&CLC2000) ci si propose di strutturare un database contenente informazioni sulle firme spettrali di tematismi di carattere vegetazionale, allo scopo di poter approcciare, oltre alle consuete tecniche di analisi visiva, anche quelle di classificazione automatica. La strutturazione iniziale del progetto ha previsto sia l’analisi spettrale del tematismo boschi a prevalenza di faggi (classe 3.1.1.5 della legenda CLC2000), sia l’analisi statistica dei risultati. Per l’identificazione di tale copertura è stato utilizzato il vettoriale relativo alla copertura CLC2000, mentre per l’analisi spettrale è stata utilizzata la copertura Landsat ETM+ estesa su tutto il territorio nazionale. L’analisi statistica è stata effettuata tramite test non parametrici (Kruskal-Wallis ANOVA). Questo studio mira all’implementazione del database tramite l’analisi spettrale dei boschi a prevalenza di castagni (classe 3.1.1.4 della legenda CLC2000). Parole chiave: copertura nazionale, analisi statistica, immagini Landsat Driver study oriented to the vegetation spectral library creation Abstract By utilising the Italian component of the Image & Corine Land Cover 2000 project (I&CLC2000) it has been proposed the creation of a database containing vegetation spectral signature, by using Landsat 7 ETM+ images acquired during the summer of 1999-2001 and covering the whole Italian territory, in order to contribute on the improving of the land cover/use classification processes. The initial project structure foresees both the spectral and statistical results analysis of beechwood land cover (CLC2000 3.1.1.5 class). For the spectral analysis it has been utilised the vector layer retailed from the CLC2000 and applied on the Landsat images. The statistical analysis on the selected areas has been effectuated by non-parametric test (Kruskal-Wallis ANOVA). In order to implement the spectral dataset of land vegetation component, this study aims at the chestnut analysis (CLC2000 3.1.1.4 class), by using the same methodology previously applied to the beachwood. Keywords: national cover, statistic analysis, Landsat images Bonora et al. Studio pilota finalizzato alla costruzione di una libreria spettrale per specie vegetazionali Scopo dello studio Il presente lavoro mira alla costruzione di un database di firme spettrali relativo a zone boscate sulla base del IV livello gerarchico della copertura CLC2000 it [APAT, 2005; JRC, 2005], al fine di migliorare o al più contribuire ad un maggior dettaglio tematico in un potenziale processo di classificazione automatica. Poiché la risposta spettrale delle specie vegetazionali dipende dai cambiamenti fenologici che avvengono con la stagionalità, il progetto ha anche lo scopo di verificare la variabilità spettrale che caratterizza il territorio italiano in stagioni ed in anni differenti. Metodologia Come già accennato la classe di copertura del suolo identificata per l’implementazione del database è il tematismo 3.1.1.4 (boschi a prevalenza di castagni) della legenda CLC2000 it. Analogamente a quanto fatto nello studio precedente [D’Amen et al., 2006] relativo alle faggete, sono state analizzate, tramite l’utilizzo del software Envi 4.3 (RSinc.), 15 scene Landsat ETM+ che includono tale tematismo: queste immagini hanno una data di acquisizione compresa tra i mesi di Maggio e Settembre tra gli anni 2000-2002. Di ogni immagine sono state analizzate tutte le 7 bande. Per facilitare le operazioni di calcolo, per ogni immagine è stato creato un resize tramite opportuno mascheramento. La maschera, di tipo vettoriale, è stata ricavata dalla copertura CLC 2000 it. Tramite l’ausilio di precedenti controlli puntuali sul campo, usati per la validazione dell’affidabilità della copertura CLC2000 it, è stato individuato un insieme di pixel, appartenenti alla copertura a castagni. Questo ha permesso di poter espandere la selezione ad altri insiemi di pixel presentanti caratteristiche analoghe. La selezione dei pixel è avvenuta tramite l’utilizzo di regioni di interesse (ROI), aree identificanti porzioni di immagine sulla base di un poligono tracciato manualmente, che permettono di procedere ad un’analisi delle sole aree selezionate escludendo la restante parte dell’immagine. È stato quindi possibile definire, a scala nazionale, la variabilità spettrale del tema considerato. Questo ha permesso di poter procedere ad un’analisi dei valori minimi, medi, massimi e di deviazione standard delle distribuzioni dei valori dei Digital Numbers (DN). Come secondo obiettivo, ci si è proposti di analizzare quelle porzioni di territorio coperte da più scene, al fine di poter condurre un’analisi multitemporale. Per poter ovviare ad eventuali errori legati ad una nuova selezione di pixel, si è proceduto tramite il riutilizzo delle ROI precedentemente selezionate in comune a più scene. Questa fase ha comportato più passaggi per il raggiungimento dello scopo preposto, in quanto le ROI sono associate ad una determinata scena e non sono esportabili da un immagine all’altra. Per poter riutilizzare esattamente le stesse aree selezionate si è agito tramite procedure di vettorializzazione che hanno permesso l’esportazione della selezione. Raggiunto l’obiettivo di poter analizzare aree comuni a più scene, si sono potute confrontare le distribuzioni dei valori di DN da un punto di vista statistico, tenendo in considerazione l’anno ed il mese di acquisizione e sia la condizione climatica al momento dell’acquisizione. Analisi statistica Per l’analisi dei castagni sono state analizzate 15 scene, per un totale di 24073 pixel (tra 901 e 1908 pixel per ogni singola scena). Per poter effettuare un’analisi di tipo statistico [Soliani, 2005], per ogni banda sono stati presi in considerazione i seguenti parametri relativi ad ogni scena utilizzata: il valore minimo (Min), il valore massimo (Max), l’ampiezza dell’intervallo (Range) ed il valore di DN corrispondente al picco di frequenza dei pixel (Picco). I valori relativi ai castagni (Tab. 1) sono stati posti a confronto con quelli dei faggi calcolati precedentemente [D’Amen et al., 2006]. Sono stati effettuati due tipi di confronto Rivista italiana di Telerilevamento - 2008, 40 (1): 5-11 tra le bande: in primo luogo è stata comparata l’ampiezza degli intervalli di DN ottenuti nelle diverse scene, mentre, in seguito, dopo aver raggruppato le scene sia in base alla loro distribuzione geografica (Nord, Centro e Sud), sia in base al mese di acquisizione (fine maggio-giugno; luglio; agosto e settembre) sono stati confrontati tra i gruppi, per ogni singola banda, i valori Min, Max e Picco di DN e l’ampiezza del Range di DN. Poiché in entrambi i casi, i valori non seguono una distribuzione normale, i confronti sono stati effettuati attraverso test non parametrici, in particolare utilizzando il Kruskal-Wallis ANOVA che analizza le differenze tra più di 2 campioni e rappresenta l’alternativa non parametrica del test F per l’analisi della varianza ad un criterio di classificazione. La metodologia del test di Kruskal-Wallis può essere sintetizzata nei seguenti passaggi: a) si assegna un rango a tutte le osservazioni dei gruppi di dati, considerate come una serie Tabella 1 - Minimi e massimi, riscontrati nell’analisi dei castagni e dei faggi, relativi ai valori di DN Min, Max, Range e Picco misurati per ogni banda. Banda7 Banda6 Banda5 Banda4 Banda3 Banda2 Banda1 min max range picco min max range picco min max range picco min max range picco min max range picco min max range picco min max range picco Faggi Minimo Massimo 48 66 86 58 9 31 71 53 37 52 49 66 11 26 41 58 26 41 39 57 10 27 30 47 92 122 122 190 72 25 83 56 104 129 29 56 110 132 123 148 6 18 118 138 26 37 60 45 29 15 38 47 Castagni Minimo Massimo 15 69 59 84 7 59 48 78 17 52 50 71 11 47 38 63 18 42 36 67 13 32 29 53 52 111 131 177 50 122 90 176 37 78 78 117 27 78 68 107 11 137 127 152 9 124 119 140 18 30 36 64 15 40 29 46 Bonora et al. Studio pilota finalizzato alla costruzione di una libreria spettrale per specie vegetazionali unica e, se sono presenti misure uguali, si assegna un rango medio; b) si calcolano le somme dei ranghi di ogni gruppo Ri e quella totale; c) si calcolano le medie dei ranghi di ogni gruppo; d) si calcola il valore di un indice H [1]: H = A Σi [Ri2 / ni] - 3(N+1) [1] dove la sommatoria è estesa a tutti i k gruppi a confronto e ni è il numero di dati del gruppo i-esimo, N è il numero totale di osservazioni, A = N(N+1)/12. Il parametro H si distribuisce approssimativamente come la distribuzione χ2 con (k-1) gradi di libertà. Quando il valore di H calcolato è superiore a quello riportato, alla probabilità α prefissata, si rifiuta l’ipotesi nulla e quindi esiste almeno una differenza significativa tra le medie dei ranghi. Anche nella statistica non parametrica è possibile ricorrere a confronti multipli per individuare quali sono i gruppi sono significativamente diversi tra loro. In questo caso è stato utilizzato il test di Tukey applicato ai ranghi [Soliani, 2005]. In tutte le analisi statistiche effettuate, è stato considerato un limite di confidenza di 0,95 (Tab. 2). Tabella 2 - Confronto dell’ampiezza dei range delle diverse bande relative ai castagni. I valori in corsivo neretto sono relativi alle differenze significative, con un intervallo di confidenza del 95%. banda 1 banda 2 banda 3 banda 4 banda 5 banda 6 banda 1 banda 2 banda 3 banda 4 banda 5 0,9902107 0,7637099 0,00012 0,00012 0,9902107 0,9902107 0,00012 0,00012 0,7637099 0,9902107 0,00012 0,00012 0,00012 0,00012 0,00012 0,00012 0,00012 0,00012 0,000126 0,9999165 0,9397147 0,5597138 0,00012 0,00012 0,1025192 0,425384 0,00012 0,00012 banda 6 banda 7 0,9999165 0,013734 0,9397147 0,1025192 0,5597138 0,425384 0,0049397 0,0049397 Risultati dell’analisi statistica 0,000126 0,00012 0,00012 0,00012 0,00012 banda 7 0,013734 Nel confronto dell’ampiezza dei Range dei DN osservati nelle diverse bande nell’analisi dei castagni emerge una differenza significativa (F(6, 98) = 85,672 p = 0,0000. One-way ANOVA). Nella Figura 1 sono riportati i valori medi delle ampiezze dei Range per ogni banda. La banda verticale indica un intervallo di confidenza del 95%. Come si osserva dalla Figura 1, le bande 4 e 5 presentano un’ampiezza del Range dei DN significativamente maggiore di tutte le altre (Post-hoc - Tukey HSD test). Infatti, dalla Tabella 2 viene evidenziato come le differenze significative riguardino quasi esclusivamente le bande 4 e 5. Queste bande non presentano un vero e proprio picco ed un range ben definito, ma una serie continua di minimi e massimi relativi. Analogamente a quanto effettuato nel lavoro precedente [D’Amen et al., 2006] è stato realizzato un confronto tra le scene raggruppate in base alla loro distribuzione geografica (Nord, Centro e Sud). Le distribuzioni dei valori dei DN (Picco, Min, Max e Range) per tali aree geografiche, sono confrontati tramite il Kruskal-Wallis test, ed i valori ottenuti sono riportati nella Tabella 3. Da sottolineare che i valori di picco sono geograficamente uniformi (nel 90 % dei casi non si sono ottenute differenze significative), il che si tradurrebbe in una buona identificazione del tematismo considerato. Rivista italiana di Telerilevamento - 2008, 40 (1): 5-11 Figura 1 - Valore medio dell’ampiezza dei Range per le diverse bande. La barra verticale identifica un intervallo di confidenza del 95%. Per quanto riguarda lo studio dell’influenza della stagione sulla firma spettrale è stato effettuato un analogo confronto tra le scene raggruppate in base al periodo di acquisizione (maggio/giugno - luglio - agosto - settembre). Le distribuzioni dei valori dei DN per i parametri Picco, Min, Max e Range in funzione del mese di acquisizione delle scene, sono state analizzate, analogamente al confronto geografico, tramite il Kruskal-Wallis test (Tab. 4). Tabella 3 - Differenze significative in base alla distribuzione geografica delle scene. In corsivo neretto quelli che risultano significativamente diversi (Kruskal-Wallis test). min max range H (2,14) p banda 1 7,50793 0,0234 3,17272 0,2047 banda 2 5,02009 0,0813 3,60951 0,1645 banda 3 7,24938 0,0267 6,87665 0,0321 H (2,14) p H (2,14) picco p H (2,14) p 4,11739 0,1276 3,61915 0,1637 1,18424 0,5532 3,09183 0,2131 0,287693 0,866 4,19117 0,123 banda 6 4,60089 0,1002 5,41881 0,0666 6,54715 0,0379 4,7049 0,0951 banda 7 5,038225 0,0805 1,08817 0,5804 4,031013 0,1333 2,67583 0,2624 Tabella 4 - Differenze significative in base all’influenza della stagionalità. In corsivo neretto quelli che risultano significativamente diversi (Kruskal-Wallis test). min H (3,14) max range p H (3,14) p H (3,14) picco p H (3,14) p banda 1 5,91657 0,1157 5,832426 0,1201 0,5087275 0,917 7,28729 0,0633 banda 2 7,82587 0,0498 8,09983 0,044 2,57897 0,4612 8,27714 0,0406 banda 3 7,54536 0,0564 6,68844 0,0825 7,76699 0,0511 5,72107 0,126 banda 6 6,4205 0,0929 6,12884 0,1055 1,18658 0,7562 5,6507 0,1299 banda 7 0,72254 0,8679 6,3041 0,0977 3,1165 0,374 4,27556 0,2332 Bonora et al. Studio pilota finalizzato alla costruzione di una libreria spettrale per specie vegetazionali Considerazioni sul confronto faggi-castagni La Tabella 5 riporta il confronto del valore medio, calcolato per ogni banda, dei valori di DN Min, Max e Picco calcolato su 15 scene. Dalla tabella emerge, a supporto dell’analisi statistica condotta, che i valori medi sono molto prossimi tra loro, con differenze che raramente superano i 10 DN, fatta eccezione per il minimo delle bande 4, 5 e 7 e per il massimo della banda 7. Interessante risulta che, generalmente, i castagni presentano valori di soglia (Min e Max) e di Picco leggermente più alti rispetto ai faggi, fatta eccezione per il minimo delle bande 4, 5 e 7, per il massimo della banda 5 e per il picco della banda 7. La limitata differenza nello spettro tra i tematismi fin’ora considerati potrebbe tradursi nella concomitanza di faggi e castagni (boschi misti) nella cartografia basata sulla legenda Corine utilizzata per l’identificazione della classe 3.1.1.4 (boschi a prevalenza di castagni). Un fattore non trascurabile è il trattamento delle immagini utilizzate, eseguito sulle specifiche progettuali del progetto I&CLC2000 per l’identificazione fotointerpretativa di classi di banda 7 banda 6 banda 5 banda 4 banda 3 banda 2 banda 1 Tabella 5 - Confronto del valore medio dei valori di DN Min, Max e Picco, per ogni banda, calcolato su 15 scene Landsat ETM. 10 Min Max Picco castagni 60,64 74,50 67,14 faggi 57,41 72,00 63,40 differenza 3,23 2,50 3,74 castagni 45,43 61,57 52,57 faggi 44,00 59,00 50,05 differenza 1,43 2,57 2,52 castagni 32,71 51,29 39,29 faggi 31,00 46,00 36,91 differenza 1,71 5,29 2,38 castagni 91,71 154,36 126,18 faggi 105,00 147,00 differenza 13,29 7,36 castagni 61,29 109,07 86,09 faggi 76,00 113,00 differenza 14,71 3,93 castagni 127,29 140,50 132,36 faggi 124,00 136,00 129,57 differenza 3,29 4,50 2,79 castagni 26,57 51,86 36,14 faggi 52,00 32,00 40,68 differenza 25,43 19,86 4,54 Rivista italiana di Telerilevamento - 2008, 40 (1): 5-11 uso/copertura del suolo con unità minima cartografabile di 5 ha, che ha contemplato, oltre ad una correzione atmosferica, georeferenziazione e ortorettifica, il ricampionamento del pixel a 25 m tramite convoluzione cubica che, di fatto, ha alterato ed appiattito i valori di DN del pixel. Considerando però che le aree campione sono ubicate in aree ad elevata omogeneità, si assume che il ricampionamento dell’immagine abbia inciso in maniera lieve sulla media del valore, espresso in DN, del gruppo di pixel selezionati. Un altro fattore limitante, che potrebbe inficiare l’identificazione dei cambiamenti futuri di destinazione di uso del suolo delle classi considerate, è l’inoperatività del sensore utilizzato in questo lavoro (Landsat ETM+), che utilizza 6 bande con intervallo 0,45-2,35 µm più un infrarosso 10,4-12,5 µm, una copertura per scena di 180 x 180 km e costi accessibili. L’alternativa potrebbe trovare riscontri nell’utilizzo del precedente Landsat 5 TM, nuovamente operativo, coprente la stessa area ma presentante una minore risoluzione geometrica nel termico, oppure tramite l’impiego del sensore SPOT 4, che presenta una minore estensione di copertura (60 x 60 km), un numero di bande limitato a 4 e con intervallo più ristretto (0,50-1,75 µm), un angolo di acquisizione maggiore che porta ad una maggiore distorsione ai lati della scena ma una migliore risoluzione geometrica (20 m). Bibliografia APAT (2005) - La realizzazione in Italia del progetto europeo Corine Land Cover 2000 - 61/2005. Roma, pp. 86. D’Amen M., Bonora N., Sambucini V., Marchetti M., Munafò M. (2006) - Realizzazione ed analisi di un database di firme spettrali basato sull’utilizzo di classi in base alla legenda Corine Land Cover 2000. Atti della X Conferenza Nazionale Asita. JRC (2005) - CORINE Land Cover updating for the year 2000. IMAGE 2000 and CLC2000. Products and Methods. Printed in Italy, pp. 150 Soliani L. (2005) - Manuale Di Statistica Per La Ricerca E La Professione. Statistica Univariata E Bivariata Parametrica E Non-Parametrica Per Le Discipline Ambientali E Biologiche”. Manoscritto ricevuto il 27/03/2007, accettato il 8/06/2007. 11