INDICE ELENCO DEGLI AUTORI PREMESSA PREFAZIONE 1. LA QUALITA’ NEL MONITORAGGIO DI VARIABILI METEOCLIMATICHE 1 G. La Loggia, L.V. Noto, F. Viola 1.1 1.2 1.3 1.4 1.5 1.6 1.7 2. INTRODUZIONE I FATTORI CHE INFLUISCONO SULLA QUALITÀ DEL DATO CONTROLLO DI QUALITÀ MONITORAGGIO DELLA QUALITÀ OMOGENEITÀ DEI DATI E METADATI 1.5.1 Causa di disomogeneità 1.5.2 Metadati GESTIONE DELLA QUALITÀ BIBLIOGRAFIA RETI PER IL MONITORAGGIO METEOCLIMATICO 1 3 5 6 6 6 6 20 21 22 I. Nalbantis, G. Tsakiris G. La Loggia, L.V. Noto, F. Viola, G. Iiritano, T. Caloiero 2.1 2.2 2.3 2.4 2.5 2.6 3. INTRODUZIONE FINALITA’ DI UNA RETE DI MONITORAGGIO CRITERI DI PROGETTAZIONE DI UNA RETE 2.3.1 Metodologia A 2.3.2 Metodologia B 2.3.3 Metodologia C 2.3.4 Metodologia D 2.3.5 Metodologia E METODOLOGIA PROPOSTA DAL GRUPPO DEL NTUA 2.4.1 Conclusioni dai lavori precedenti 2.4.2 Adattamento della metodologia esistente CONSIDERAZIONI CONCLUSIVE BIBLIOGRAFIA 22 25 26 28 31 34 37 41 44 44 46 48 48 DATABASE RELAZIONALE PER L’ARCHIVIAZIONE DEI DATI METEOCLIMATICI 51 E.M. Castrogiovanni, S. Arcuri, L. De Felice, G. Iiritano, R. Maletta, G. Mendicino, A. Senatore 3.1 INTRODUZIONE 51 ii 3.2 3.3 3.4 3.5 3.6 3.7 4. 3.1.1 Database e sistemi informativi 3.1.2 Un database per l’archiviazione dei dati meteo-climatici 3.1.3 obiettivi 3.1.4 Software, hardware e risorse umane 3.1.5 Attività preliminari DESCRIZIONE DELLA BASE DATI STRUTTURATA 3.2.1 Struttura concettuale 3.2.2 Diagramma entità-relazioni CONTENUTO DELLA BASE DATI 3.3.1 Elementi geografici 3.3.2 Codifica delle caratteristiche strumentali 3.3.3 Serie storiche omogenee 3.3.4 Dati giornalieri 3.3.5 Elementi informativi su aspetti gestionali della rete 3.3.6 Portabilità e compatibilità 3.3.7 Casi particolari DATABASE TERRITORIALI: LE APPLICAZIONI GIS 3.4.1 Introduzione 3.4.2 Gli obiettivi 3.4.3 L’approccio seguito 3.4.4 Descrizione del web-gis 3.4.5 Il sistema integrato a scala regionale L’INTERFACCIA WEB-GIS CONDIDERAZIONI CONCLUSIVE BIBLIOGRAFIA PROCEDURE DI CONTROLLO DI QUALITA’ DEI DATI PROVENIENTI DALLA RETE IDROMETEOROLOGICA 51 52 53 54 54 55 56 57 61 62 63 63 64 64 66 67 68 68 68 69 69 71 73 76 77 79 G. Rossi, A. Cancelliere, B. Bonaccorso, G. Sciuto, A. Campisano, V. Pavan, S. Marchesi, A. Selvini, R.Tomozeiu, M. Di Lorenzo 4.1 4.2 4.3 4.4 INTRODUZIONE 80 VALIDAZIONE DEI DATI MENSILI DI PIOGGIA E TEMPERATURA (PROCEDURA DICA-UNICT) 81 4.2.1 Procedura di controllo 81 4.2.2 Controllo dei dati di temperatura media mensile 86 4.2.3 Controllo dei dati di precipitazione mensile 88 PROCEDURE OPERATIVE PER LA VALIDAZIONE DI DATI GIORNALIERI DI TEMPERATURA E PRECIPITAZIONE (PROCEDURA ARPA-EMILIA ROMAGNA) 89 4.3.1 Controllo di qualità della temperatura massima e minima 90 4.3.2 Controllo di qualità della precipitazione 96 VALIDAZIONE DEI DATI GIORNALIERI DI TEMPERATURA E PRECIPITAZIONE (PROCEDURA DICA-UNICT) 99 4.4.1 Controllo di qualità della temperatura massima e minima 99 4.4.2 Controllo di qualità della precipitazione 106 iii 4.4.3 4.5 4.6 5. Analisi dell’affidabilità della procedura di validazione dei dati giornalieri 111 CONSIDERAZIONI CONCLUSIVE 114 BIBLIOGRAFIA 116 PROCEDURE DI CARATTERIZZAZIONE DEI DATI STORICI 117 G. La Loggia, L.V. Noto, F. Viola, M.T. Noto 5.1 5.2 5.3 5.4 5.5 5.6 5.7 6. INTRODUZIONE CONTROLLI DI OMOGENEITA’ BASATI SULLO STORICO (METADATI) CONTROLLI DI OMOGENEITA’ BASATI SU METODI MATEMATICI LA STIMA DEI DATI CLIMATICI MANCANTI PER LA RICOSTRUZIONE DELLE SERIE STORICHE CRITERI PER LA SELEZIONE DI UNA RETE DI QUALITA’ 5.5.1 Attribuzione dell’etichetta di qualità alla singola stazione di misura della generica grandezza idro-meteorologica 5.5.2 Attribuzione dell’etichetta di qualità alla rete di misura della generica grandezza idro-meteorologica CRITERI PER L’ASSEGNAZIONE DI UN GIUDIZIO DI QUALITA’ ALLA RETE PER IL MONITORAGGIO DELLA SICCITA’ 5.6.1 Rete per il monitoraggio della siccità di qualità sufficiente 5.6.2 Rete per il monitoraggio della siccità di qualità buona 5.6.3 Rrete per il monitoraggio della siccità di qualità ottima BIBLIOGRAFIA 117 118 119 121 129 130 135 138 138 138 138 139 ASPETTI DI QUALITA’ PER L’OTTENIMENTO DI MAPPE DI TEMPERATURA SUPERFICIALE DEL SUOLO (LST) DA DATI TELERILEVATI DA SATELLITE 141 P. F. Pellegrini, G. Adembri, M. Tommasini, M. Innocenti, G. Poli 6.1 6.2 6.3 6.4 INTRODUZIONE 141 NORMATIVA DI RIFERIMENTO E PRINCIPI DI QUALITÀ PER LA GESTIONE DEI DATI DA SATELLITE 142 6.2.1 Normativa di riferimento 142 6.2.2 Principi di qualità applicati ai dati telerilevati da satellite per l’ottenimento della lst 145 PROCEDURE DI QUALITÀ PER LA RICEZIONE ED ELABORAZIONE DEI DATI AVHRR/NOAA 149 6.3.1 Controllo della geolocazione dei dati 150 6.3.2 Estrazione dei count e calcolo dei coefficienti di calibrazione per un’area geografica 155 6.3.3 Calibrazione radiometrica dei dati 155 IMPOSTAZIONI PER IL CONFRONTO DEI PRODOTTI OTTENUTI DA SATELLITE CON MISURE VERITÀ A TERRA 157 iv 6.5 6.6 PROCEDURE DI ARCHIVIAZIONE E INTERSCAMBIABILITÀ DEI DATI 6.5.1 Archivio elettronico della stazione ricezione satelliti del pin prato 6.5.2 FormatoHRPT dei dati NOAA acquisiti alla stazione ricezione satelliti del PIN - Prato 6.5.3 Formati standard di memorizzazione su file (HDF eGEOtiff) BIBLIOGRAFIA 160 161 163 164 166 APPENDICE A1 SELEZIONE DI UNA RETE PER IL MONITORAGGIO DELLA SICCITA’ NELL’ISOLA DI CRETA 169 I. Nalbantis, G. Tsakiris A2 A1.1 AREA DI STUDIO A1.2 DATA COLLECTION E PRE-PROCESSING A1.3 RISULTATI 169 170 171 APPLICAZIONE DELLA PROCEDURA DICA-UniCT DI VALIDAZIONE DEI DATI TERMOMETRICI MENSILI A 43 STAZIONI DELLA SICILIA 175 G. Rossi, A. Cancelliere, A. Campisano A3 APPLICAZIONE DELLA PROCEDURA (DICA-UniCT) DI VALIDAZIONE DEI DATI PLUVIOMETRICI MENSILI A 43 STAZIONI DELLA SICILIA 185 G. Rossi, A. Cancelliere, A. Campisano A4 ESEMPIO DI APPLICAZIONE DELLA PROCEDURA DELLA ARPA-EMILIA ROMAGNA PER IL CONTROLLO DELLA QUALITA’ DEI DATI TERMOMETRICI GIORNALIERI DI ALCUNE STAZIONI DELLA RETE DELL’EMILIA ROMAGNA 193 V. Pavan, S. Marchesi, A. Selvini, R.Tomozeiu, M. Di Lorenzo A4.1 IMPATTO DEL CONTROLLO DI QUALITÀ SUI DATI DA STAZIONE A5 194 ESEMPIO DI APPLICAZIONE DELLA PROCEDURA DELLA ARPA-EMILIA ROMAGNA PER IL CONTROLLO DELLA QUALITA’ DEI DATI PLUVIOMETRICI GIORNALIERI DI ALCUNE STAZIONI DELLA RETE DELL’EMILIA ROMAGNA 201 V. Pavan, S. Marchesi, A. Selvini, R.Tomozeiu, M. Di Lorenzo v A6 ESEMPIO DI APPLICAZIONE DELLA PROCEDURA DI VALIDAZIONE AUTOMATICA (DICA-UniCT) AI DATI DI TEMPERATURA MASSIMA E MINIMA GIORNALIERI 205 G. Rossi, A. Cancelliere, B. Bonaccorso, G. Sciuto A6.1 GENERALITÀ 205 A6.2 COSTRUZIONE FASCE DI CONFIDENZA BASATE SUI DATI DELLA STAZIONE IN ESAME 207 A6.3 COSTRUZIONE FASCE DI CONFIDENZA BASATE SUI DATI DELLE STAZIONI DI RIFERIMENTO 213 A7 ESEMPIO DI APPLICAZIONE DELLA PROCEDURA DI VALIDAZIONE AUTOMATICA (DICA-UniCT) AI DATI PLUVIOMETRICI GIORNALIERI 217 G. Rossi, A. Cancelliere, B. Bonaccorso, G. Sciuto A8 SELEZIONE DI UNA RETE PER IL MONITORAGGIO DELLA SICCITA’ NELLA REGIONE SICILIANA 221 M.T. Noto A9 A8.1 ANALISI STORICA PER LA VERIFICA E/O RICOSTRUZIONE DEI METADATI A8.2 ASSEGNAZIONE ETICHETTA DI QUALITÀ ALLA STAZIONE DI MISURA DELLA SINGOLA GRANDEZZA A8.3 ASSEGNAZIONE ETICHETTA DI QUALITÀ ALLA RETE SELEZIONATA A8.4 ASSEGNAZIONE ETICHETTA DI QUALITÀ SISTEMA DI MONITORAGGIO MESSO A PUNTO BIBLIOGRAFIA 234 234 LA RICOSTRUZIONE DEI DEFLUSSI ATTRAVERSO IL BILANCIO IDRICO DEGLI INVASI: RISULTATI OTTENUTI PER I LAGHI DELLA SARDEGNA 235 222 227 233 A. Abis, G. M. Sechi A9.1 INTRODUZIONE A9.2 IL BILANCIO IDRICO DEGLI INVASI ARTIFICIALI A9.3 RICOSTRUZIONE DEI DEFLUSSI AFFLUENTI NEI SERBATOI ARTIFICIALI IN SARDEGNA A9.4 SINTESI DEI RISULTATI OTTENUTI BIBLIOGRAFIA 235 236 239 246 251 vi vii ELENCO DEGLI AUTORI Giulia ADEMBRI Stazione Ricezione Satelliti - PIN Servizi Didattici e Scientifici per l’Università di Firenze, Piazza Ciardi, 25, 59100 Prato and Dipartimento di Ingegneria Elettronica e delle Telecomunicazioni, Università di Firenze, via S. Marta, 3, 50139 [email protected] Salvatore ARCURI Regione Calabria – Centro Funzionale– Dip. Presidenza – Settore Prot. Civile [email protected] Brunella BONACCORSO Dipartimento di Ingegneria Civile e Ambientale, Università di Catania, viale A. Doria 6, 95125 Catania, Italia [email protected] Tommaso CALOIERO Regione Calabria – Centro Funzionale – Dip. Presidenza – Settore Prot. Civile; [email protected] Alberto CAMPISANO Dipartimento di Ingegneria Civile e Ambientale, Università di Catania, viale A. Doria 6, 95125 Catania, Italia [email protected] Antonino CANCELLIERE Dipartimento di Ingegneria Civile e Ambientale, Università di Catania, viale A. Doria 6, 95125 Catania, Italia [email protected] Enzo Marco CASTROGIOVANNI Regione Siciliana – Agenzia Regionale per i Rifiuti e le Acque – Settore Osservatorio delle Acque, via Bonsignore 1, 90135 Palermo, Italia [email protected] Michele DI LORENZO Servizio Idrometeorologico Emilia Romagna, Agenzia Regionale per la protezione dell’Ambiente, viale Silvani 6, 40122 Bologna, Italia [email protected] Luca DE FELICE Regione Calabria – Centro Funzionale – Dip. Presidenza – Settore Prot. Civile, Viale Europa n. 35, Località Germaneto – Catanzaro [email protected] Giuseppe IIRITANO Regione Calabria – Centro Funzionale – Dip. Presidenza – Settore Prot. Civile, Viale Europa n. 35, Località Germaneto – Catanzaro [email protected] Monica INNOCENTI Stazione Ricezione Satelliti - PIN Servizi Didattici e Scientifici per l’Università di Firenze, Piazza Ciardi, 25, 59100 Prato and Dipartimento di Ingegneria Elettronica e delle Telecomunicazioni, Università di Firenze, via S. Marta, 3, 50139 [email protected] Goffredo LA LOGGIA Dipartimento di idraulica ed applicazioni ambientali, Università degli studi di Palermo, viale delle Scienze, 90135, Palermo, Italia [email protected] Roberta MALETTA Dipartimento di Difesa del Suolo “V. Marone” - Università della Calabria, via P. Bucci 41b, 87036 Arcavacata di Rende, Cosenza, Italia [email protected] Stefano MARCHESI Servizio Idrometeorologico Emilia Romagna, Agenzia Regionale per la protezione dell’Ambiente, viale Silvani 6, 40122 Bologna, Italia [email protected] Giuseppe MENDICINO Dipartimento di Difesa del Suolo “V. Marone” - Università della Calabria, via P. Bucci 41b, 87036 Arcavacata di Rende, Cosenza, Italia [email protected] Ioannis NALBANTIS Laboratory of Reclamation Works and Water Resources Management, National Technical University of Athens [email protected] viii Leonardo Valerio NOTO Dipartimento di idraulica ed applicazioni ambientali, Università degli studi di Palermo, viale delle Scienze, 90135, Palermo, Italia [email protected] Maria Teresa NOTO Regione Siciliana – Agenzia Regionale per i Rifiuti e le Acque – Settore Osservatorio delle Acque, via Bonsignore 1, 90135 Palermo, Italia [email protected] Valentina PAVAN Servizio Idrometeorologico Emilia Romagna, Agenzia Regionale per la protezione dell’Ambiente, viale Silvani 6, 40122 Bologna, Italia [email protected] Pier Franco PELLEGRINI Stazione Ricezione Satelliti - PIN Servizi Didattici e Scientifici per l’Università di Firenze, Piazza Ciardi, 25, 59100 Prato and Dipartimento di Ingegneria Elettronica e delle Telecomunicazioni, Università di Firenze, via S. Marta, 3, 50139 [email protected] Gabriele POLI Stazione Ricezione Satelliti - PIN Servizi Didattici e Scientifici per l’Università di Firenze, Piazza Ciardi, 25, 59100 Prato and Dipartimento di Ingegneria Elettronica e delle Telecomunicazioni, Università di Firenze, via S. Marta, 3, 50139 [email protected] Giuseppe ROSSI Dipartimento di Ingegneria Civile e Ambientale, Università di Catania, viale A. Doria 6, 95125 Catania, Italia [email protected] Andrea SELVINI Servizio Idrometeorologico Emilia Romagna, Agenzia Regionale per la protezione dell’Ambiente, viale Silvani 6, 40122 Bologna, Italia [email protected] Alfonso SENATORE Dipartimento di Difesa del Suolo “V. Marone” - Università della Calabria, via P. Bucci 41b, 87036 Arcavacata di Rende, Cosenza, Italia [email protected] Guido SCIUTO Dipartimento di Ingegneria Civile e Ambientale, Università di Catania, viale A. Doria 6, 95125 Catania, Italia [email protected] Maurizio TOMMASINI Stazione Ricezione Satelliti - PIN Servizi Didattici e Scientifici per l’Università di Firenze, Piazza Ciardi, 25, 59100 Prato and Dipartimento di Ingegneria Elettronica e delle Telecomunicazioni, Università di Firenze, via S. Marta, 3, 50139 [email protected] Rodica TOMOZEIU Servizio Idrometeorologico Emilia Romagna, Agenzia Regionale per la protezione dell’Ambiente, viale Silvani 6, 40122 Bologna, Italia [email protected] George TSAKIRIS Laboratory of Reclamation Works and Water Resources Management, National Technical University of Athens, 9, Iroon Polytechniou str., 157 80, Atene, Grecia [email protected] Francesco VIOLA Dipartimento di idraulica ed applicazioni ambientali, Università degli studi di Palermo, viale delle Scienze, 90135, Palermo, Italia [email protected] 9 x PREFAZIONE L’ Ufficio Idrografico della Regione Sicilia, oggi Osservatorio delle Acque (legge regionale n. 19 del 22 dicembre 2005, art.7), ha operato, sin dalla sua istituzione, per l'attività conoscitiva dei parametri idrologici caratterizzanti il ciclo dell’acqua ed, in particolare, per la vigilanza sulle grandezze idrologiche al fine di prevenire situazioni di rischio e pericolo in occasione di eventi e situazioni eccezionali, sia riguardo ai fenomeni di piena, sia riguardo al depauperamento delle risorse idriche superficiali e profonde anche in relazione ai fenomeni conseguenti alle siccità. Negli ultimi decenni, anche in relazione ai cambiamenti climatici che interessano l’area del Mediterraneo Occidentale, si è sviluppata un’azione di monitoraggio sempre più efficace per la conoscenza del ciclo idrologico, ciò al fine di porre in essere ogni iniziativa per la mitigazione degli effetti negativi legati alla siccità. Ciò ha indotto l’Ufficio a promuovere diversi progetti di iniziativa comunitaria tra cui SEDEMED e SEDEMED II, attraverso i quali ha portato avanti studi e ricerche, in sinergia con le istituzioni scientifiche (quali le Università), inerenti i fenomeni estremi quali siccità e desertificazione, svolgendo, tra l’altro, un ruolo di coordinamento degli Enti operanti negli stessi settori. Il progetto SEDEMED II costituisce un approfondimento di ricerca operativa per strutturare ed avviare, all’interno dell’Ufficio, un sistema per la valutazione, prevenzione e mitigazione del fenomeno della siccità su scale spaziali che vanno dall’intera area MEDOCC fino a quella di bacino nonché di piccole isole le cui risorse di approvvigionamento sono limitate e lontane . Il volume “Progetto, organizzazione e gestione in qualità di un Sistema di monitoraggio idrometereologico” riporta i risultati illustrati in occasione del Workshop conclusivo del progetto tenutosi a Palermo nel settembre 2006. In particolare, il volume compendia le caratteristiche di una rete di monitoraggio, gli scopi, le qualità ed i criteri di progetto di una rete nuova o l’adeguamento di una rete esistente. Si conclude con le procedure concernenti la convalida ed il controllo dei dati giornalieri e mensili di pioggia e temperatura, nonché le procedure per la determinazione del livello di qualità del sistema di monitoraggio. Particolare ringraziamento rivolgo a tutti coloro che con grande impegno hanno partecipato all’attuazione del progetto ed al raggiungimento di risultati certamente positivi, consentendo la pubblicazione del volume, utile, a mio avviso, a tutti coloro che operano per il monitoraggio e la gestione delle risorse idriche nonché per ogni azione di contrasto e di lotta alla siccità ed alla desertificazione Il Direttore dell’Osservatorio delle Acque Ing. Giuseppe Geraci xi 1. LA QUALITA’ NEL METEOCLIMATICHE MONITORAGGIO DI VARIABILI G. LA LOGGIA, L.V. NOTO, F. VIOLA Dipartimento di Idraulica ed Applicazioni Ambientali, Università degli Studi di Palermo Abstract: Si vogliono qui definire procedure che conducano alla rilevazione e all’acquisizione di dati meteorologici di qualità. La maggior parte dei criteri qui descritti fanno ovviamente riferimento agli standard del WMO. Il problema della qualità viene affrontato secondo tre fasi tra loro fortemente interconnesse e cioè il controllo, il monitoraggio e la gestione. Verranno descritti i fattori che influiscono sulla qualità del dato durante tutta la vita delle stazioni di monitoraggio, dalla progettazione all’esercizio ponendo grande attenzione sia sul trattamento dei dati sia sulla manutenzione della rete. Viene dato ampio rilievo al tema dei metadati, strumento necessario affinché la storia del singolo dato meteorologico sia documentabile e si possa procedere quindi alla condivisione delle informazioni tra diverse organizzazioni. Key words: qualità, controllo, monitoraggio, gestione, manutenzione, metadati. 1.1 INTRODUZIONE L’acquisizione e la distribuzione di dati meteorologici di buona qualità è praticamente impossibile senza un sistema di gestione della qualità. I sistemi caratterizzati da alti livelli di qualità operano senza soluzione di continuità a tutti i livelli del sistema di osservazione: dalla pianificazione della rete di acquisizione, all’installazione delle stazioni, fino alla trasmissione e all’archiviazione del dato, e all’addestramento del personale. Questi sistemi includono acquisizioni e distribuzioni del dato a diverse scale temporali (dal tempo reale alla scala annuale) utilizzando continui processi di feedback. Naturalmente le risorse economiche che devono essere destinate all’effettiva gestione della qualità dovrebbero essere una significativa percentuale dei costi di impianto del sistema di acquisizione dati. Senza la parte relativa alla qualità, qualsiasi dato possa essere acquisito e fornito dal gestore della rete diventa altamente incerto e la sua utilità a qualsiasi fine può diminuire drasticamente. Per queste ragioni è necessario che ogni ente/ufficio che operi nel campo dell’acquisizione, archiviazione e distribuzione di dati meteorologici e/o idrologici 2 G. La Loggia, L. V. Noto, F. Viola si doti di regole che testimonino la qualità del dato e delle operazioni necessarie ad acquisirlo e ad archiviarlo. Parlando di qualità del dato meteorologico il WMO distingue le procedure inerenti la qualità in tre fasi: 1. Controllo della qualità 2. Monitoraggio della qualità 3. Gestione della qualità Il controllo della qualità è la più conosciuta componente di un sistema di gestione di qualità e costituisce la parte minima. Essa consiste essenzialmente dell’esame dei dati nelle stazioni e nei centri in cui i dati confluiscono per evidenziare eventuali errori e correggerli o eliminarli. Un buon sistema di controllo della qualità dovrebbe includere anche delle procedure che permettano di risalire alle sorgenti degli errori che si possono presentare per evitare che tali problemi si possano ripresentare. Il controllo della qualità può essere applicato on-line e offline (controllo ritardato). Il controllo on-line deve essere eseguito presso la stazione di acquisizione e/o presso il centro di acquisizione e analisi del dato. Quello off-line può essere eseguito solo nei centri di acquisizione e analisi del dato ricostruendo un database corretto. Il controllo on-line deve essere adottato per la correzione della rete in telemisura mentre il controllo off-line è un controllo che potrà essere impiegato per un riesame critico delle banche dati esistenti insieme all’anagrafica delle stazioni (metadati) per fornire una sorta di classificazione della qualità e dell’attendibilità del dato storico. Il monitoraggio della qualità rappresenta un’attività da eseguire non in tempo reale e che permette l’analisi del sistema di osservazione e dell’intera rete per evidenziare eventuali deficienze sistematiche della stessa rete. Essa dovrebbe essere tipicamente effettuata dall’ufficio che gestisce e che ha responsabilità della rete e del sistema e che può prescrivere cambiamenti alle attrezzature e nelle procedure. La gestione della qualità in generale include le prime due fasi e include anche tutti quei fattori che possono influenzare la qualità del dato come strumentazione, posizione, manutenzione, ispezioni, data processing e addestramento. Questa fase è di solito sotto la responsabilità del gestore della rete di acquisizione. La qualità nel monitoraggio di variabili meteoclimatiche 1.2 3 I FATTORI CHE INFLUISCONO SULLA QUALITÀ DEL DATO La vita di una rete meteorologica coinvolge differenti fasi, la prima delle quali in ordine temporale è la progettazione da effettuare contestualmente alle richieste degli utenti finali. Successivamente viene richiesta la selezione e l’installazione degli strumenti di misura. Una volta installata la rete si pone il problema della calibrazione e, durante il funzionamento, grande attenzione va dedicata alla continua manutenzione degli strumenti. Un aspetto non trascurabile nella vita di una rete è poi l’attività di formazione del personale a questa addetto. Per ottenere dati di prefissata e adeguata qualità ognuna delle fasi innanzi accennata deve essere opportunamente eseguita. Esigenze degli utenti: la qualità di un sistema di misurazione può essere valutata dal confronto delle esigenze degli utenti e dalla capacità dei sistemi di realizzarle. Caratteristiche funzionali e tecniche: la traduzione dei requisiti espressi in caratteristiche tecniche sono dei compiti molto importanti e complessi. Richiedono una conoscenza profonda delle esigenze degli utenti, della tecnologia di misurazione meteorologica, dei metodi di osservazione, delle regolazioni ed infrastrutture tecniche/amministrative relative di condizione di funzionamento. Selezione degli strumenti: gli strumenti dovrebbero essere selezionati con attenzione considerando le richieste in termini di esattezza, range di funzionamento e la risoluzione. Prove di accettazione: prima dell’installazione e dell’accettazione, è necessario accertarsi che lo strumento soddisfi le specifiche originali. Le prestazioni degli strumenti e la loro sensibilità dovrebbero essere pubblicate dai fornitori ed a volte sono certificate dalle autorità di calibrazione. Compatibilità: problemi di compatibilità di dati possono presentarsi quando strumenti con differenti caratteristiche tecniche sono utilizzati per lo stesso tipo delle misure. Ciò può accadere per esempio quando si passa da misure manuali a misure automatizzate. Ubicazione ed esposizione: la densità delle stazioni meteorologiche dipende dalla scala spazio-temporale dei fenomeni meteorologici osservati e generalmente è specificata dagli utenti o è fissata dai regolamenti del WMO. Errori strumentali: una selezione adeguata degli strumenti è una condizione necessaria ma non sufficiente per la buona qualità dei dati. Non c'è nessuna tecnica di misurazione perfetta e tutti gli strumenti producono vari errori, sistematici e casuali. 4 G. La Loggia, L. V. Noto, F. Viola Acquisizione dei dati: la qualità di dati è non solo una funzione della qualità degli strumenti e della loro corretta ubicazione ed esposizione ma inoltre dipende dalle tecniche e dai metodi impiegati per ottenere i dati e per convertirli in dati rappresentativi. Elaborazione dei dati: gli errori possono essere introdotti dalle tecniche di conversione o dalle procedure di calcolo applicate per convertire i dati del sensore in dati meteorologici inseriti in un database. Gli errori inoltre si presentano durante la codificazione o la trascrizione dei messaggi meteorologici, in particolare se ciò è fatto da un osservatore. Controllo di qualità in tempo reale: queste procedure sono specifiche per ogni tipo di misura, ma includono i controlli grossolani per i valori plausibili, i tassi di cambiamento ed i confronti con altre misure. Controllo delle prestazioni: poiché le procedure in tempo reale di controllo di qualità presentano le loro limitazioni ed alcuni errori possono restare inosservati, come ad esempio le deviazioni di lunga durata nei sensori e gli errori nella trasmissione di dati, il controllo di prestazioni al livello di rete è necessario venga effettuato nei centri meteorologici. Prove e calibrazione: durante il funzionamento, le prestazioni e le caratteristiche strumentali degli strumenti meteorologici cambiano per parecchi motivi, come ad esempio l’invecchiamento dei componenti hardware, la manutenzione, la variazione dell'esposizione, ecc. Questi possono causare cambiamenti improvvisi nella calibrazione. Di conseguenza, gli strumenti hanno bisogno dei controlli e di calibrature normali per fornire dei dati certi. Manutenzione: la manutenzione può essere correttiva (quando vengono a mancare delle parti), preventiva (pulizia o lubrificazione) o adattabile (in risposta a variazioni di requisiti o all'obsolescenza). La qualità dei dati forniti da uno strumento è influenzata considerevolmente dalla qualità della relativa manutenzione. Formazione ed istruzione: la qualità di dati dipende inoltre dall’abilità del personale tecnico incaricato delle attività di prova, di calibrazione e di manutenzione e degli osservatori che fanno le osservazioni. Metadati: un sistema di qualità richiede la disponibilità delle informazioni dettagliate sul sistema d'osservazione in se ed in particolare su tutti i cambiamenti che si presentano durante il periodo del relativo funzionamento. Tali informazioni sui dati, conosciute come metadati, permettono al responsabile di un sistema d'osservazione di intraprendere le azioni preventive, correttive ed adattabili più appropriate per effettuare o migliorare la qualità di dati. In seguito si argomenterà dettagliatamente a riguardo dei metadati. La qualità nel monitoraggio di variabili meteoclimatiche 1.3 5 CONTROLLO DI QUALITÀ Il WMO (1981) prescrive che alcune procedure di controllo di qualità debbano essere applicate a tutti i dati meteorologici qualora si pensi ad uno scambio internazionale di tali grandezze. Il WMO distingue i controlli di qualità per le stazioni manuali e per quelle automatiche. Procedure del controllo della qualità (QC) sono applicate per rilevare e identificare gli errori fatti nel processo di registrazione, manipolazione, formattazione, trasmissione e archiviazione dei dati. La conoscenza delle procedure applicate permetterà di valutare la validità delle osservazioni migliorando l'utilizzo dei dati. Le operazioni più comuni che si possono eseguire on line sono appresso elencate e brevemente descritte: − − − − Controllo di errore grossolano: vengono utilizzati in genere dei filtri logici per rilevare e segnalare valori ovviamente erronei come ad esempio valori anomali, generati dallo spostamento della virgola decimale, valori di precipitazione negativa, ecc. Prove di tolleranza: servono a segnalare quei valori considerati esterni ai propri limiti superiori ed inferiori, definiti dalle caratteristiche climatiche del sito. Controllo di consistenza interno: serve a indicare se i dati hanno subito ispezione per coerenza tra elementi associati all'interno di ogni registrazione (per esempio, temperatura massima < temperatura minima); ecc. Coerenza temporale: si possono eseguire prove per rilevare se i valori osservati sono coerenti con la quantità di cambiamento che potrebbe essere atteso in un elemento in un dato intervallo e valutare il cambiamento di segno da un’osservazione alla successiva. Effettuate le misure, le registrazioni, e la trasmissione dei dati all’ente, debbono eseguirsi i controlli detti off-line tra i quali i controlli sulla: − − Coerenza spaziale: possono eseguirsi delle prove per determinare se ogni osservazione è coerente con quella presa contemporaneamente in stazioni vicine interessate da influenze climatiche simili. Omogeneità: la verifica dell’omogeneità è eseguita per assicurare che le fluttuazioni dei dati nel tempo siano dovute soltanto a cause climatiche. L'omogeneità temporale di una registrazione di dati climatici è essenziale in particolare quando i dati sono utilizzati per convalidare modelli climatici, studi sul cambiamento del clima e il suo impatto socioeconomico. 6 G. La Loggia, L. V. Noto, F. Viola 1.4 MONITORAGGIO DELLA QUALITÀ La gestione di una rete è fortemente rafforzata dal misurarne la qualità a cadenza tipicamente giornaliera o mensile. L’obiettivo di un monitoraggio continuo della qualità è quello di revisionare costantemente la qualità delle stazioni di campo e di ognuno dei sistemi di osservazione. Esistono differenti aspetti nel monitoraggio della qualità, tutti volti all’identificazione di errori sistematici e all’indicazione di azioni correttive. Il monitoraggio della qualità è un compito assai oneroso dal punto di vista del tempo da dedicarvi, perciò chi gestisce le reti dovrebbe allocarvi adeguate risorse. 1.5 OMOGENEITÀ DEI DATI E METADATI In passato le reti di osservazione erano costruite per supportare le previsioni meteo e quindi i controlli di qualità erano concentrati principalmente sull’individuazione degli outliers, ma raramente comprendevano dei controlli sull’omogeneità dei dati. Il recente interesse negli studi dei cambiamenti climatici, ha invece reso necessari tali controlli, per effettuare i quali risultano, inoltre, essenziali delle informazioni - metadati – sui dati stessi. 1.5.1 CAUSA DI DISOMOGENEITÀ Le disomogeneità nei sistemi di osservazione si presentano come discontinuità brusche, o come cambiamenti graduali. Le discontinuità brusche sono principalmente dovute a un cambio di strumentazione, o ad una ricollocazione della stazione. Le discontinuità ad effetto graduale possono essere dovute a cambiamenti nei dintorni della stazione, quali l’urbanizzazione, o da modifiche progressive delle caratteristiche dello strumento. 1.5.2 METADATI È fondamentale avere informazioni sulle disomogeneità che si verificano, in quanto la conoscenza del tipo e del momento in cui si sono realizzate permette ai climatologi di intervenire statisticamente sui dati. Le informazioni di questo tipo sono comunemente presenti nei metadati. Quando è misurato un parametro meteorologico come ad esempio la piovosità o la temperatura di una regione, sia che i dati siano utili immediatamente sia che vengano utilizzati in futuro, nasce l’esigenza di documentare anche dove e come la La qualità nel monitoraggio di variabili meteoclimatiche 7 misura è stata eseguita. Tale insieme di informazioni costituisce nel suo complesso la documentazione di una stazione e anch’essa in campo meteo-climatico viene sovente definita con il termine di metadato. La parola metadata nasce dall’unione della parola greca "meta" (oltre) e il "datum" latino (un fatto dato). Poiché il metadato dovrebbe rappresentare come, dove, quando e per chi le informazioni sono state raccolte, è lecito ritenere metadato anche la registrazione di tutti i cambiamenti che una stazione ha subito durante la sua vita, costruendo quella che è chiamata la storia della stazione. Informazioni aggiuntive sulle osservazioni, come ad esempio il tipo di strumento o l’esposizione, possono fornire maggiori potenzialità sull'interpretazione delle misure osservate. Talvolta quando gli strumenti vengono sostituiti, le osservazioni mostrano un aumento o una diminuzione improvvisa nel valore misurato. Tale salto è un esempio di una inomogeneità. Affinché una serie storica di lunga durata sia considerata omogenea, tutte le variazioni nei valori devono essere causate esclusivamente da fenomeni atmosferici. Dei buoni metadati sono quindi necessari per assicurare all'utente finale che nei dati non sussista alcun dubbio sulle condizioni in cui sono stati registrati, raccolti e trasmessi, al fine di potere estrarre conclusioni esatte dalla loro analisi. La conoscenza della data e dell’ora esatta della sostituzione di un termometro e la conoscenza delle caratteristiche tecniche dello strumento nuovo e di quello vecchio, aiuteranno sicuramente a rimuovere l'impronta artificiale dovuta a questo cambiamento per quella particolare registrazione. Alta qualità dei dati e datasets di lunga durata omogenei sono necessari per valutare ogni argomento che abbia un collegamento con il clima. I metadati hanno un ruolo chiave nel processo di gestione dei dati, infatti, la conoscenza della storia della stazione fornisce una maggiore fiducia sui dati da essa misurati per potere assicurare che le uniche variazioni presenti su una serie storica climatica sono soltanto causate dalla variabilità e dal cambiamento effettivo del clima. Gli utenti dei dati meteorologici che operano su campi applicativi specialistici come l’agrometeorologia, l’ingegneria idraulica e l’aeronautica, traggono beneficio anche dall’esistenza di buoni metadati. Questi professionisti hanno infatti la necessità di estrarre la massima precisione dalle osservazioni e potere confrontare spesso dati misurati in vari luoghi ed in tempi differenti. Una conoscenza completa delle condizioni di misura li aiuterà a ottenere questo obiettivo. Il WMO ha fissato uno standard per la realizzazione di metadati di stazioni meteo-climatiche sullo stesso principio della norma ISO 19015 (da distinguere con i metadati relativi ai dati misurati) individuando un core elements obbligatorio ed uno costituito da informazioni opzionali che possono ricostruire con univocità la storia della stazione. Le classi di informazione vengono distinte in: 8 G. La Loggia, L. V. Noto, F. Viola − − − − − − − Identificativi di stazione e dati geografici Ambiente locale Strumentazione Procedure operative di osservazione Elaborazione dei dati Informazioni storiche generali della rete Deposito ed accesso ai metadati. Tali sezioni vengono divise in sottosezioni le quali individuano tutti i parametri capaci di individuare ogni elemento rappresentativo della stazione. 1.5.2.1 Identificativi di stazione e dati geografici I dati devono essere sempre associati ad un luogo. La prima cosa su cui l'utente deve essere informato è dove è localizzato tale punto nel territorio. Per fare ciò, è necessario che la stazione sia identificata da un nome e un codice e che sia localizzata in una regione geografica. È importante identificare chiaramente anche quando la stazione ha iniziato a produrre dati e da chi è stata gestita. Riferire con attenzione queste informazioni e tutti gli eventuali cambiamenti che la stazione ha subito è il requisito minimo dei metadata. Identificativi di stazione − − − − Nome: di solito i nomi delle stazioni sono associati alla città o alla località dove sono raccolti i dati. Se una città ha più stazioni, è importante estendere il nome, (per esempio Palermo centro, Palermo Orto Botanico) per non lasciare alcun dubbio. Alias: le stazioni possono essere talvolta riconosciute per più di un nome. Questo può succedere quando, ad esempio, la città o il luogo dove la stazione è situata ha cambiato nome per varie ragioni ed è quindi utile identificare nel metadata i vari nomi (o alias) che una stazione può avere. WMO Code o station number: in tutto il mondo, il WMO identifica le stazioni meteorologiche che appartengono al circuito del WMO con un codice di 5 cifre. Il codice WMO identifica universalmente una singola stazione di registrazione, benché possa essere riposizionata durante la sua storia. Le prime due cifre identificano la regione del mondo ed il paese dove la stazione è situata. Station number o codice in altre reti: Numero o codice di stazione in altre reti: per varie ragioni, non tutte le stazioni meteorologiche nel mondo hanno un codice assegnato WMO. A molte altre stazioni è dato un codice nazionale o locale che non ha nulla a che fare con la rete internazionale; tale codice identifica comunque la stazione nel contesto della rete cui La qualità nel monitoraggio di variabili meteoclimatiche − − − 9 appartiene. E’ quindi utile tenere anche in debito conto il numero di codice della rete locale. Data Apertura/Chiusura: identifica quando la stazione inizia il suo periodo di operatività e di chiusura Tipo di stazione: se sinottica, aeronautica, agrometeorologica, ecc. Station information contact: riferisce su chi deve essere contattato per avere ulteriori informazioni sulla stazione. I metadati infatti dovrebbero fornire dettagli su dove ottenere ulteriori informazioni sulla stazione (nome, indirizzo, telefono, fax e posta elettronica) e identificare la persona responsabile delle misure in caso di una stazione funzionante o per l'archiviazione dei dati in caso di stazioni non più operative. È utile avere registrazione completa temporale di tutti i responsabili che si sono succeduti ed il periodo di gestione. Dati geografici I dati climatici devono sempre essere associati ad una posizione geografica per potere essere utilizzati. I parametri fondamentali per una esatta conoscenza territoriale sono: − − − Latitudine e longitudine: preferibilmente con precisione sufficiente perché la stazione possa essere localizzata con un errore di alcune centinaia di metri, per esempio in unità di 0.001 gradi di latitudine. Quota sul livello medio del mare: la quota della superficie terrestre nel punto della stazione sul livello di mare deve essere riferita con una precisione di alcuni metri o ancora più precisa. Riposizionamenti: quando uno qualunque dei parametri di localizzazione è cambiato, a causa dello spostamento dell'intera stazione o soltanto di qualche singolo sensore, anche a breve distanza, è molto importante riferire nel metadata i nuovi parametri di posizione ed il momento esatto del cambiamento. 1.5.2.2 Ambiente locale Le coordinate e l'elevazione non sono informazioni sufficienti a documentare una stazione meteorologica. I dati sono influenzati da fattori ambientali che agiscono a differenti scale: − a livello di mesoscala (da 1 km a 30 km) il clima è influenzato dalla prossimità e dalla dimensione di grandi superfici di acqua, dalla presenza di aree urbanizzate e aree montane; 10 G. La Loggia, L. V. Noto, F. Viola − − a livello di toposcala (a scala "locale"da 300 m a 2 km) le osservazioni sono influenzate dalla pendenza del terreno dalla presenza di foreste, e dalla presenza di alberi, dalle colture e altre asperità presenti nel suolo; a livello di microscala (meno di 300 m) la temperatura minima è influenzata dalle gelate del suolo, mentre lo scambio di energia in superficie è influenzata dall’umidità e dalla conduttività termica della Terra e la quantità di radiazione trasmessa dipende dall’orizzonte libero da ostacoli. I requisiti di base per documentazione ambientale di una stazione sono: − − Mappatura aggiornata in qualsiasi formato della regione a livello di mesoscala a ~ 1:100.000; Mappatura a livello di toposcala (~ 1: 5000), aggiornata ogni anno, come specificato dal WMO Technical Commission for Instrument and Methods of Observation (WMO, 1996); Figura 1.1 – Esempio di mappa a livello di toposcala con inserita una fotografia del sito di osservazione. − − − Mappatura dell’orizzonte radiante, aggiornata ogni anno (vedi figura 1.1); Le fotografie, prese a 360° intorno al punto di misura; Una mappa a livello di microscala dell’intorno della stazione, aggiornata La qualità nel monitoraggio di variabili meteoclimatiche 11 quando i singoli strumenti sono riposizionati o si verificano altri cambiamenti significativi. La sezione relativa alla strumentazione sotto riportata elenca ulteriori informazioni necessarie a livello di microscala. 1.5.2.3 Strumenti di misura Tipi di strumenti È molto importante documentare il genere di strumento con il quale vengono eseguite le misurazioni. Buoni metadati dovrebbero registrare i seguenti attributi: − − − − − nome del produttore modello dello strumento, con dimensioni ed identificazione tipo di uscita e sensibilità eventuale tipo di trasduttore eventuale tempo di risposta. L'identificazione del modello è insufficiente, perché gli opuscoli dei produttori sono spesso incompleti. La parte dei metadati relativa agli strumenti può essere documentata adeguatamente da un tecnico durante l’installazione della stazione e a seguito di richiesta di aggiornamento in caso di cambiamento o di sostituzione di strumenti. A seconda di ogni elemento meteorologico, sono molto importanti aggiungere altre informazioni sugli strumenti: − − per temperatura e umidità: schermo (tipo e dimensione) e la ventilazione Precipitazione: diametro dell’orlo del bicchiere, altezza dell’orlo da terra, presenza di deposito in eccedenza, presenza di uno schermo o altre caratteristiche che possano modificare il flusso del vento, la presenza di riscaldamento o altro processo significativo per la precipitazione solida I cambiamenti degli strumenti possono avere un grande impatto sui dati. Quando c'è un cambiamento di strumentazione è cruciale annotare nel relativo metadato la data esatta della sostituzione, perché queste modifiche hanno un impatto sull'omogeneità di dati. Capannelle strumentali e supporti degli strumenti I cambiamenti dei supporti degli strumenti possono anche causare un notevole impatto sull'omogeneità di dati e quindi è necessario che siano descritti con attenzione. Alcuni aspetti relativi sul supporto degli strumenti dovrebbero essere resi disponibili nel metadata includendo: − − Altezza sopra la superficie del terreno Descrizione del rifugio 12 G. La Loggia, L. V. Noto, F. Viola − Grado di interferenza, causata da altri strumenti o oggetti, come una sorgente di calore artificiale o un ventilatore. Come per le sezioni precedenti, le immagini possono aiutare ad identificare possibili problemi. Nel caso di numerosi strumenti montati su un singolo supporto, un'immagine dell'insieme potrebbe completare il metadato. Registrazione e trasmissione dei dati Quando un elemento meteorologico è misurato con uno strumento, i dati devono essere registrati e solitamente trasmessi alla sala di gestione dei dati per controllo e l’archiviazione. La conoscenza delle procedure di gestione, controllo ed archiviazione dei dati può aiutare l'utente ad identificare i limiti potenziali dei dati e/o gli eventuali problemi. I metadati dovrebbero includere: − − Tipo di registrazione: informazioni su l’unità di misura e la risoluzione di scala, l’intervallo di variazione minima registrabile, il tempo di risposta e/o il tempo di campionamento, e, se presente, il range temporale del calcolo della media. Trasmissione del segnale: tipo di segnale, tipo e posizione di una qualunque unità di modifica, lunghezza e tipo di cavi (se applicabile). 1.5.2.4 Procedure operative di osservazione Le procedure operative sugli algoritmi di conversione dei dati variano continuamente sia nel passato che nel presente. Questi cambiamenti possono causare effetti indesiderabili in una serie di dati temporali climatologici riducendone la qualità, determinando interruzioni e invalidandone l’omogeneità. L’elenco degli attributi da includere nel metadato sono riportati di seguito. Osservatore Per una stazione data, è importante sapere se l'osservatore è sempre la stessa persona o se nel tempo si sono succedute diverse persone o ancora non esiste in particolare un osservatore nella stazione. Di solito nell'ultimo caso anche l'affidabilità della stazione diminuisce quando viene meno la presenza costante di un osservatore. Elementi osservati Le stazioni meteorologiche dovrebbero tenere un elenco degli elementi meteorologici che hanno osservato e misurato direttamente e di quelli che invece hanno calcolato indirettamente dalle osservazioni dirette. Tempi di osservazione Un’altra informazione cruciale da documentare nel metadato è il tempo di La qualità nel monitoraggio di variabili meteoclimatiche 13 osservazione. I tempi e il numero di osservazioni variano da stazione a stazione e durante gli anni anche nella stessa particolare stazione. Tali cambiamenti possono determinare una interruzione nell'omogeneità di una serie temporale di dati climatici. E’ quindi di vitale importanza documentare chiaramente il periodo di osservazione riportando, quando possibile, i motivi delle mancate osservazioni Manutenzione di routine Un altro argomento da documentare nei metadata è relativo alle informazioni sulla manutenzione di routine della stazione. La verifica della precisione degli strumenti, la sostituzione di sensori malfunzionanti, la manutenzione del locale che contiene gli strumenti dovrebbe essere documentato come di seguito riferito: − − − Strumenti di controllo: Devono essere riportate le date delle ispezioni ed il risultato dei controlli di routine sugli strumenti per assicurare che la loro manutenzione e il loro corretto funzionamento sia regolare in ogni stazione. Sostituzione dei sensori: un programma di manutenzione include una periodica sostituzione di sensori o parti di essi presenti negli strumenti. La data della sostituzione e quant’altro disponibile dovrebbe essere riportato in questa sezione del metadata della stazione. Gestione del luogo di osservazione: mantenere il posto di osservazione in buon ordine richiede operazioni come taglio dell’erba, pulizia delle superfici dei sensori esposti alle intemperie, ecc. Tutte queste operazioni dovrebbero essere documentate registrando sempre il giorno in cui sono stati eseguiti questi lavori. Correzioni eseguite dall’osservatore Numerosi elementi sono corretti in situ dall’osservatore, come ad esempio la riduzione a livello del mare della pressione barometrica misurata o altro. Tutti i valori strumentali originali prima di qualsiasi correzione fatta dall'osservatore dovrebbe essere archiviata. 1.5.2.5 Elaborazione dei dati È molto importante tenere informazioni su come i dati sono stati trattati, convalidati e trasmessi all'ufficio regionale o alla centrale da ogni singola stazione. La conoscenza dell'elaborazione dei dati, delle procedure di controllo della qualità e dell'omogeneizzazione, le prove applicate ai dati sono vitali per assicurare sia la precisione delle osservazioni misurate sia la validità della serie temporale risultante. Un completo e accurato metadato dovrebbe documentare come minimo le informazioni sull’unità usata, gli speciali codici utilizzati, le correzioni fatte ai dati, le procedure applicate per il controllo della qualità, le modifiche ai dati fatte 14 G. La Loggia, L. V. Noto, F. Viola per correggere l’omogeneità del dato, il dato stimato e inserito dopo l’applicazione della procedura di interpolazione selezionata. Unità di misura Tenere e fornire informazioni sull’unità di misura impiegata è parte essenziale di un metadato e dovrebbe essere effettuato per ogni stazione. Le unità impiegate per quantificare un elemento misurato possono variare nel tempo e possono essere diverse da nazione a nazione (per esempio, la temperatura è stata ed è espressa in Celsius, in Kelvin, Fahrenheit o livelli Reamur, secondo il paese o il periodo storico). La confusione con le unità può causare errori sull’interpretazione dei dati. Codici speciali Di solito le stazioni meteorologiche includono codici speciali nei dati, per riferire situazioni speciali, dati mancanti simili, valori errati, tracce di pioggia, mancanza di precipitazione o precipitazione accumulata, ed altro ancora. Nel processo di trasmissione dei dati, questi codici dovrebbero essere correttamente identificati e mantenuti nel database del metadato. Ad esempio, è comune in molti paesi codificare la presenza di tracce di precipitazione con "-3" o altro valore negativo. In assenza di metadati l'utente può rifiutare un valore di pioggia sotto zero producendo una cattiva valutazione dei giorni piovosi. Calcoli I calcoli diversi da quelli resi sul luogo dagli osservatori, come il periodo di determinazione della media (giornaliero, mensile e altro) degli elementi, possono essere eseguiti anche nelle stazioni o presso gli uffici meteorologici regionali e centrali. Controllo di qualità Il primo dato da inserire è un flag binario a risposta si/no per indicare se qualsiasi QC è stato applicato o no. Se la risposta è positiva, è buona pratica documentare il grado di QC applicato ai dati (per esempio, se sottoposto soltanto ad un filtro logico, confronto di coerenza interno in una sequenza di osservazioni, controllo di coerenza spaziale tra stazioni vicine, controllo di coerenza con i suoi valori e i suoi limiti climatologici) fornendo dettagli sulle tecniche impiegate per effettuare: − − − − − Controllo di errore grossolano Prove di tolleranza Controllo di consistenza interno Coerenza temporale Coerenza spaziale. Qualsiasi dettaglio disponibile sulle tecniche esatte applicate sarà un grande La qualità nel monitoraggio di variabili meteoclimatiche 15 aiuto per il futuro utente di dati, così come informazioni sui dati che falliscono le prove e sul periodo per cui le prove sono state eseguite. Va ricordato che quasi tutte le strutture preposte alla osservazione di parametri climatici eseguono verifiche per il controllo della qualità dei dati, ma quasi tutte o non riportano le metodologie utilizzate o vengono riportate in documenti e pubblicazioni spesso non direttamente ricollegabili alle stazioni della rete. Riferire tali informazioni nei metadati delle stazioni garantisce invece una immediata disponibilità di tali informazioni per ogni singola stazione. Adattamenti di omogeneizzazione E’ essenziale sapere se qualche verifica sull’omogeneità dei dati è stata applicata sui dati stessi: − − − − − − − − − − quali elementi sono stati ricercati per l'omogeneità; in quale periodo; su quale scala temporale (quotidiana, mensile, stagionale o annuale); nome e tipo di prova applicata; contare le registrazioni omogenee/disomogenee trovate all'interno di una rete dopo avere applicato la prova; il numero di inomogeneità trovate in una singola serie storica; lunghezza delle sezioni trovate in ogni serie storica e/o i punti di interruzione; variazione annua del numero di inomogeneità in ogni registrazione (numero di casi al mese); dimensione dell'inomogeneità rilevata e i fattori di correzione utilizzati per adattarli; cause dell'inomogeneità rilevata in ogni serie storica: cambiamenti repentini, riposizionamenti, cambiamento di strumenti, cambiamento del tempo dell’osservazione, cambiamento di osservatore, cambio di tempo delle osservazioni; tendenze al riscaldamento/raffreddamento dell’area ove è posta la stazione causate dagli effetti urbani e da variazioni della copertura o uso del suolo. Recupero dei dati Quando le osservazioni sono sottoposte a qualche genere di convalida, prova di controllo di qualità o di omogeneità, una quantità variabile di valori viene eliminata e segnata come mancante, sospetta o non omogenea. Alcuni dati sono rilevati e corretti sul posto prima di essere inviati al centro di elaborazione. I dati modificati dovrebbero essere documentati correttamente. È di vitale importanza sapere se per qualsiasi ragione alcuni dati sono stati modificati rispetto ai loro valori originali o sono stati inseriti dati mancanti. È consigliato riportate nei metadata se qualsiasi 16 G. La Loggia, L. V. Noto, F. Viola procedura di controllo di qualità è stata applicata ai dati o no. In tal caso, sarebbe una buona pratica riportare qualche altra informazione quale: − − − − − la percentuale di dati valutati in una serie storica; la percentuale di dati mancanti utilizzati nel calcolo delle medie mensili; gli algoritmi di calcolo utilizzati per l’interpolazione di dati temporali; gli algoritmi impiegati e le stazioni vicine utilizzate (il numero di stazioni, nomi e posizione dettagliata) per calcoli di interpolazione spaziale; periodo di dati per cui è stato utilizzato un algoritmo di interpolazione. 1.5.2.6 Informazioni generali sulla storia della rete Informazioni generali che riguardano l’intera rete di monitoraggio sembrano spesso essere banali e non sono documentate perché si pensa che siano ovvie. Tuttavia, tali informazioni sono tanto importanti quanto le informazioni delle singole stazioni. Per un metadato storico questo argomento diventa sempre più importante. La storia di alcuni paesi può causare cambi di gestione delle reti di monitoraggio e ciò può essere causa di inomogeneità. Cambio delle capannelle e nell’ambiente circostante Inizialmente i termometri non erano generalmente protetti adeguatamente per minimizzare l'errore dovuto all’irradiazione diretta. Le vecchie stazioni erano senza capannella e/o i termometri erano all’interno di schermi in metallo o altri non adatti. Per ogni rete, è di grande importanza sapere quando i sensori sono stati protetti e quello che è stato utilizzato precedentemente. Un processo simile può essere descritto per i cambiamenti dell’area circostante agli strumenti, che può influire su serie storica lunga in modo significativo. Ad esempio, si è avuta la tendenza a spostare in altezza la posizione dei termometri e pluviometri e ciò è spesso una causa di inomogeneità piuttosto significativa in serie storica. Cambi nel calcolo della media Nel passato non tutte le organizzazioni utilizzavano le medesime ore (ad esempio dalle ore 8 alle ore 8 del giorno successivo o dalle ore 0.00 alle ore 24.00) per la valutazione delle medie giornaliere anche se già nel secolo scorso furono fatti tentativi per unificare le ore di osservazione per rendere le medie giornaliere e mensili le più coerenti possibili. Le ore di osservazione sono state spesso oggetto di cambiamento. Ciò causa un indesiderabile effetto che può ridurre la qualità e l'omogeneità delle registrazioni di dati climatici a lunga scadenza. La qualità nel monitoraggio di variabili meteoclimatiche 17 Cambiamenti urbanistici dell’area o dell’uso del suolo L’espansione urbanistica delle città ha causato una profonda trasformazione delle periferie che da aree verdi sono diventate aree edificate massicciamente con la presenza di più veicoli ed industrie, concentrazioni più elevate di sostanze inquinanti, ecc. Ciò ha determinato un graduale aumento della temperatura comunemente conosciuta come l'"isola di calore urbano". La popolazione crescente e i cambiamenti dell’uso del suolo possono determinare un notevole impatto sulla serie meteorologica. Introduzione delle stazioni climatiche automatiche o nuovi tipi di strumenti Il numero delle AWS (Automatic Weather Stations) cioè le moderne stazioni automatiche climatiche da alcuni anni è in forte aumento in tutto il mondo e tale tendenza continuerà anche nel prossimo futuro. Questo sviluppo delle reti di monitoraggio climatico richiede una attenta documentazione, anche se la stazione è ubicata nella stessa identica posizione. Le misure parallele tra stazioni meccaniche ed automatiche sono molto importanti finché possibile, poiché esse possono direttamente documentare l'effetto dell'introduzione del nuovo sistema. Cambi nelle procedure del controllo di qualità, omogeneizzazione e recupero dei dati. Come visto in precedenza, un metadato completo dovrebbe includere informazioni sui processi di controllo della qualità, sull'omogeneizzazione e sui tentativi di recupero dei dati. Da un punto generale dell’intera rete, è importante riferire i cambiamenti fatti su queste procedure. Modificare le procedure di controllo della qualità da un certo momento in poi può avere un impatto importante sui dati. Ad oggi l'uso crescente di software potente basato su sistemi GIS e/o pacchetti statistici permette una definizione migliore della gamma di validità dei dati. I Metadati in questo caso devono permettere di individuare da quando questi strumenti sono stati utilizzati. Iniziare un’attività per il recupero dei dati è importante perché diminuirà la quantità di dati mancanti, ma avrà anche un impatto sull’uso dei dati stessi. E’ quindi importante annotare quando tale attività viene eseguita e quali dati sono stati recuperati. Così come è importante annotare le variazioni delle procedure per l’omogeneizzazione dei dati. 1.5.2.7 Deposito ed accesso ai metadati Come visto in precedenza i metadati sono di importanza cruciale per interpretare le misure e le osservazioni climatiche. Molte reti di gestione di dati meteoclimatici non posseggono metadati, ma quasi tutte posseggono un patrimonio 18 G. La Loggia, L. V. Noto, F. Viola di conoscenze scritto su documenti cartacei conservati in uno o nell’altro cassetto, posseggono un patrimonio di conoscenze personali basato sull’esperienza e sull’attività storica di alcuni responsabili di stazioni o di reti che da soli possono documentare una notevole quantità di informazioni da inserire nei metadati. Una delle principali attività da incoraggiare all’interno di un servizio tecnico idrometeorologico è quello di realizzare un sistema di gestione dei metadati nel quale tutti possano inserire le proprie conoscenze per incrementarne la quantità di informazioni gradualmente senza che sia necessario uno sforzo immediato comune. Di seguito verranno riepilogati i dati da raccogliere in un ideale metadato di una stazione identificando quelli ritenuti minimi. Benché possa sembrare difficile e laborioso conservare o recuperare i metadati, spesso si tratta esclusivamente di una mancata capacità organizzativa in quanto molti dati (soprattutto i minimi indispensabili) possono essere immediatamente acquisiti con una procedura di acquisizione interna, con schede, interviste o con l’immissione diretta dei dati, che impegnerebbe solo parzialmente il personale. Tra le metodologie più comuni per il recupero e la raccolta dei metadati abbiamo: − − − − − a livello di ufficio meteorologico: l’ufficio di gestione della rete meteorologica è la sorgente principale dei metadati poiché è l'istituzione responsabile dei dati registrati ed archiviati; a livello di stazione: come visto nei paragrafi precedenti, tracciare una mappa e fotografare il posto meteorologico fornisce una grande quantità di informazioni sulle condizioni di registrazione; a livello di dati: i dati stessi sono una sorgente eccellente dei metadati, poiché da essi si possono desumere direttamente i tempi di osservazione l’inizio e la fine della serie registrata, le eventuali interruzioni, ecc; a livello di personale addetto alle osservazioni ed altri esperti: intervistare gli osservatori attuali e quelli precedenti oltre agli esperti locali può aggiungere informazioni utili così come le biblioteche, gli archivi dei quotidiani, ecc; consultare queste sorgenti di informazioni può aiutare a recuperare informazioni storiche per una singola stazione o per un'intera rete che sono stati persi. Essi possono anche fornire dati sulla popolazione, sulla crescita urbana e sugli eventi storici; a livello di produttori degli strumenti: essi possono fornire informazioni più precise su argomenti tecnici relativi alle prestazioni degli strumenti (precisione, accuratezza, ecc). Realizzando un sistema scalare sarà possibile inserire ulteriori dati fino al completamento o quasi di tutto il meta-database che diverrebbe a quel punto un patrimonio di valore indescrivibile della rete di gestione (al pari dei dati meteoclimatici stessi). La qualità nel monitoraggio di variabili meteoclimatiche 19 Tabella 1.1 - Elementi Metadata da conservare per una stazione meteorologica. Gli elementi in grassetto sono richieste minime; altri elementi sono pratiche migliori. CATEGORIA IDENTIFICATIVI DELLA STAZIONE TIPO METADATO Codice locale Codice WMO Nome e alias Attivo/chiuso Data di inizio/data fine attività Tipo di stazione Organizzazione responsabile Stazione manuale/AWS Fuso orario Rete DATI GEOGRAFICI Latitudine Longitudine Elevazione Date di rilocalizzazione Informazioni topografiche Metodo per la determinazione della latitudine e la longitudine Risoluzione e grado di precisione della latitudine e longitudine AMBIENTE LOCALE Uso del suolo locale e land cover Esposizione degli strumenti Tipo di suolo Condizione sul luogo Fotografie Piani di posa Diagrammi di orizzonte Tipo di strumenti Confronti di strumento Data iniziale e finale degli strumenti Condizione di strumenti Strumento in rifugio o su palo esterno Tipo di registrazione Eventuali calibrature e loro risultati Mantenimento speciale/critica Modifiche Altezza di barometro Informazioni sul personale di osservazione Livello formazione del personale osservatore COLLOCAZIONE DELLA STRUMENTAZIONE E MANUTENZIONE PRATICHE DI OSSERVAZIONE BREVE SPIEGAZIONE Identifica chiaramente la stazione e chi ne ha la responsabilità. È molto importante fare riferimento a tutti i vari codici, quando le stazioni fanno parte dei circuiti internazionali come il WMO poiché il codice locale non è noto all'esterno della rete. È anche utile sapere a quale rete una stazione appartiene. Le coordinate geografiche e le date esatte dei riposizionamenti insieme ad altri dettagli topografici. Porre attenzione alla chiara individuazione degli emisferi N/S/E/W per la latitudine e la longitudine e la definizione della parte frazionaria (se in minuti e secondi o millesimi di grado). Documentare l'ambiente locale e l’esposizione degli strumenti: presenza di ostacoli, uso del suolo, incremento demografico, copertura vegetale nel luogo di esposizione ecc. Segnalare le caratteristiche degli strumenti in uso e loro caratteristiche di protezione, esattezza, calibratura e manutenzione; indicare come sono trasmessi i dati. Annotare qualsiasi cambiamento nella strumentazione. Prendere nota su quali elementi sono stati osservati e quando, con attenzione speciale all’applicazione 20 G. La Loggia, L. V. Noto, F. Viola ELABORAZIONE DATI Elenco di elementi osservati Tempi di osservazione Unità di misura utilizzate Istruzioni di osservazione Operazioni di manutenzione di routine Sostituzione degli elementi Correzioni fatte da osservatore Unità di misura Codici speciali Calcoli Algoritmi Applicazione del QC? (si/no) Altri dettagli su QC Omogeneizzazione? (si/no) Altri dettagli sull’omogeneizzazione Tentativi di recupero di dati? (si/no) Altri dettagli sul recupero di dati Trattamento di dati ridondanti EVENTI STORICI Cambiamenti all'ambiente sociale, politico e istituzionale Date di cambio ora solare/legale COMUNICAZIONE Segnalate trasporto/trasmissione dati Corrispondenza generale 1.6 dell’ora legale; descrivete il momento esatto delle operazioni di manutenzione e di qualsiasi correzione fatta ai dati Riferite unità in uso e date fattori di conversione se essi non appartengono al sistema metrico. Indicate codici speciali utilizzati e il loro significato; citate nei metadata qualsiasi emendamento fatto ai dati registrati: calcoli, correzioni, qc, omogeneizzazione e interpolazione di dati. Riferire criteri per dati mancanti, e se più di uno strumento per lo stesso elemento, considerate lo strumento principale. Aggiungete a metadata qualsiasi cambiamento significativo al contesto di stazione che può influire su raccolta di dati La corrispondenza generale come posta elettronica tra operatori e osservatori di stazione può includere informazioni potenzialmente di valore sulla qualità di osservazioni. GESTIONE DELLA QUALITÀ La gestione della qualità deve includere le azioni correttive in risposta a quanto emerso nelle fasi di controllo della qualità e di monitoraggio della qualità. Le linee guida sulla gestione delle reti in termini generali sono dettate dal WMO (1989). Risulta vantaggioso identificare una persona o un ufficio preposto alla gestione della qualità. Le stazioni vanno ispezionate regolarmente, con l’ausilio di una procedura La qualità nel monitoraggio di variabili meteoclimatiche 21 ampiamente documentata. Gli ispettori dovrebbero porre l’attenzione sui seguenti aspetti: − − − prestazioni degli strumenti metodi di osservazione esposizione della stazione. In campo industriale si usano da tempo tecniche di gestione della qualità: queste ultime risultano applicabili altresì in campo meteorologico. L’International Organization for Standardization (ISO) ha sviluppato degli standard per la gestione della qualità, detti ISO 9000. Un altro sistema è noto come sistema di qualità totale (TQM). 1.7 BIBLIOGRAFIA Deming, W. E., 1986: Out of the Crisis: Quality, Productivity and Competitive Position. University of Cambridge Press, Cambridge. International Organization for Standardization, 1994a: Quality Management and Quality Assurance Standards: Guidelines for Selection and Use. ISO 9000.1. International Organization for Standardization, 1994b: Quality Management and Quality System Elements: Guidelines. ISO 9004.1. Miller, P. A. and Momne, L. L., 1993: Real-time Quality Control of Hourly Reports from the Automated Surface Observing System. Eighth Symposium on Meteorological Observations and Instrumentation, American Meteorological Society. World Meteorological Organization, 1981: Manual on the Global Observing System. Volume 1: Global aspects. WMO-No. 544 Geneva. World Meteorological Organization, 1988: Practical experience of the operation of quality evaluation programs for automated observations both on land and over the sea (M. Field and J. Nash). Papers Presented at the WMO Technical Conference on Instruments and Methods of Observation (TECO-88) Leipzig, 16-20 May 1988, Instruments and Observing Methods Report No. 33, 222, Geneva. World Meteorological Organization, 1989: Guide on the Global Observing System. WMO-No. 488, Geneva World Meteorological Organization, 1992: Manual on the Global Data-processing System. WMO-No. 485, Geneva. World Meteorological Organization, 1993a: Guide on the Global Data-Processing System. WMO-No. 305, Geneva. World Meteorological Organization. 1993b: Historical Changes in Radiosonde Instruments and Practices (D.J. Gaffen). Instruments and Observing Methods Report No. 50, 541, Geneva. World Meteorological Organization, 1994: Homogeneity of data and the climate record (K. D. Hadeen and N. E. Guttman). Papers Presented at the WMO Technical Conference on Instruments and Methods of Observation Geneva, 28 February- 2 March 1994, Instruments and Observing Methods Report No. 57, 588, Geneva. 2. RETI PER IL MONITORAGGIO METEOCLIMATICO I. NALBANTIS, G. TSAKIRIS Laboratory of Reclamation Works and Water Resources Management, National Technical University of Athens G. LA LOGGIA, L.V. NOTO, F. VIOLA Dipartimento di Ingegneria Idraulica ed Applicazioni Ambientali, Università degli Studi di Palermo G. IIRITANO, T. CALOIERO Regione Calabria Abstract: Per effettuare correttamente il monitoraggio della siccità bisogna affrontare il problema del progetto delle reti pluviometriche. I risultati di una ricerca bibliografica porgono cinque metodologie di progetto, che sono state esaminate con lo scopo di selezionarne alcune per altre analisi. Le cinque metodologie individuate sono basate sulla teoria dei campi random. La struttura spaziale dei campi di precipitazione è rappresentata attraverso i campi di covarianza. La variabile chiave è sempre la precipitazione media annua (o MAP), la cui precisione nella stima costituisce l’unico criterio di progettazione. Delle metodologie proposte è stata scelta quella introdotta da Lebel et al. (1987) soprattutto perché è basata sul kriging che è un metodo noto e ampiamente testato, ed è stata sviluppata mediante applicazioni in aree vicine al Mediterraneo. Key words: Reti di monitoraggio, precipitazione, campo casuale, geostatistica. 2.1 INTRODUZIONE Le principali grandezze meteoclimatiche presentano variazioni su diverse scale spaziali e temporali e, di conseguenza, possono avere impatti diversi sulle attività umane. La variabilità spazio-temporale non riguarda solo piogge e temperature, ma tutte le grandezze in grado di segnalare eventuali cambiamenti climatici ed utili per lo studio dei fenomeni siccitosi. Per una corretta caratterizzazione del fenomeno siccitoso, ed in particolar modo per poter realizzare un bollettino della siccità, è necessario quindi procedere allo studio di diverse variabili meteo-climatiche nonché al monitoraggio sistematico di tali grandezze. Infatti, solo effettuando un monitoraggio sistematico 24 G. Iiritano, T. Calmiero, G. La Loggia, L.V. Noto, F. Viola, I. Nalbantis, G. Tsakiris è possibile poter identificare i periodi siccitosi nonché le zone maggiormente colpite da fenomeni siccitosi. I problemi legati al monitoraggio e dunque al reperimento delle misure non devono essere mai separati da un programma preliminare di interpretazione e di modellazione del sistema che si vuole gestire. La scelta delle variabili che devono essere misurate e la loro locazione ottimale dipende innanzitutto dallo scopo che deve essere raggiunto, e dal tipo di modello che deve essere utilizzato per sintetizzare o per rappresentare il sistema in esame. Più spesso la validità delle stesse informazioni è determinata dalle condizioni di misura, dall’accuratezza della stessa e dalla variabilità spazio-temporale dei fenomeni da studiare. La descrizione degli indici di siccità, esposta nel secondo volume del progetto, ha evidenziato che le principali variabili coinvolte nella stima delle condizioni siccitose sono le seguenti: 1. precipitazione in tutte le sue forme (pioggia, neve ecc.); 2. evapotraspirazione potenziale. Tra queste variabili, l’evapotraspirazione viene stimata in maniera indiretta mediante la misura di altre variabili, quali temperatura dell’aria, umidità dell’aria, velocità del vento, ecc. La scala temporale di misura delle variabili varia da pochi minuti per i moderni sensori elettronici a un giorno per le tecniche manuali convenzionali. Le scale temporali di interesse per la siccità sono quella mensile, quella stagionale – indipendentemente da come le stagioni siano definite – e quella annuale. Di conseguenza, si è previsto di ricorrere a dati sottoposti a processi di aggregazione temporale. La più bassa scala temporale è di un mese e le variabili idrologiche di interesse sono: 1. la precipitazione totale mensile (mm); 2. l’evapotraspirazione potenziale totale mensile (mm). Quest’ultima viene calcolata con il metodo di Penman o con modelli da esso derivati. Nel caso in cui non si abbia disponibilità dei dati necessari, si può accettare l’utilizzo del metodo di Thornthwaite, il quale fa uso soltanto della temperatura media mensile dell’aria. Di conseguenza, nel peggiore dei casi chi conduce l’analisi dovrà progettare una rete meteorologica per le precipitazioni mensili e per la temperatura mensile dell’aria. Dal momento che la variabilità spaziale della precipitazione generalmente supera quella della temperatura, la variabile chiave per la progettazione di una rete è la precipitazione. Questo è il motivo per cui l’attenzione di questo capitolo è stata limitata al progetto di reti pluviometriche. Reti per il monitoraggio meteoclimatico 2.2 25 FINALITA’ DI UNA RETE DI MONITORAGGIO In genere il progetto di una rete di misura come quella pluviometrica consiste nella determinazione del numero dei siti di campionamento necessari e sufficienti a soddisfare certi obiettivi e nella loro ubicazione sul territorio. Le diverse impostazioni di tale problema sono pertanto da ricondursi ai diversi obiettivi che ci si pone in fase di progettazione. Negli U.S.A., ad esempio, il O.W.D.C. (Office of Water Data Coordination), con riferimento alla progettazione di reti di misura, definisce tre diversi livelli a cui competono tre diversi obiettivi. Il Livello I rappresenta il livello di base, relativo a grandi aree geografiche, per reti estese (in generale a tutto il territorio nazionale) e finalizzate dunque alla valutazione della risorsa idrica, alla sintesi regionale dell’informazione e al controllo globale del rischio associato alle carenze di risorse disponibili. Inoltre si presta ad un utilizzo come informazione di background per la progettazione di reti più fitte o più specifiche; a tale livello compete il valore delle grandezze nel lungo periodo, mensile, stagionale e annuale. Il Livello II è quello relativo alla scala subregionale, per reti finalizzate alla pianificazione delle risorse idriche; le scale di riferimento sono di solito quelle mensili e giornaliere. Il Livello III è il livello locale, associato alle specifiche attività di gestione e pianificazione delle risorse e alla previsione e controllo del rischio idrogeologico; in questo caso la scala temporale di osservazione è molto dettagliata. Si vede dunque come il problema della progettazione delle reti idrometereologiche sia completamente differente a seconda che si vogliano conseguire gli obiettivi del livello I o II o del III livello e che sia difficile definire una rete di misura valida, allo stesso modo, per ogni diverso obiettivo. Quando si deve lavorare al livello III non risulta molto difficile individuare gli obiettivi di un'eventuale ottimizzazione dal punto di vista economico; ciò di solito è dato dal fatto che i benefici marginali prodotti dall'aggiunta di nuovi dati non deve essere mai minore del costo sostenuto per raccogliere tali dati. Questo tipo di approccio è stato seguito da molti autori e si basa sulla premessa che l'informazione è valutabile solo se il suo possesso può causare un cambiamento di azione/decisione, e il suo valore è misurato proprio dal guadagno economico associato al cambiamento dell'azione/decisione. Se bisogna invece progettare una rete che debba conseguire gli obiettivi fissati dal livello I e II, come ad esempio una rete finalizzata allo studio e alla previsione dei fenomeni siccitosi, non è possibile procedere come accennato precedentemente; in questo caso allora il gestore si deve lasciare guidare da quelli che possono essere definiti principi guida: 26 G. Iiritano, T. Calmiero, G. La Loggia, L.V. Noto, F. Viola, I. Nalbantis, G. Tsakiris 1) Una rete che opera con un budget fisso deve essere progettata per minimizzare l'errore di stima della variabile idrologica in gioco. 2) Una rete che opera sulla base di un criterio di accuratezza minima accettabile deve essere progettata per minimizzare i costi (di impianto e di gestione). Dunque qualsiasi formulazione che conduce alla progettazione di questi tipi di rete (livelli I e II) deve includere uno dei due seguenti parametri: una stima dell'errore commesso dal sistema o una misura della quantità di informazione che la rete rende disponibile. Tra le variabili climatiche la precipitazione è normalmente uno dei parametri idrologici più variabili sul territorio, e la sua caratterizzazione è necessaria sia per gli studi riguardanti i bilanci idrici di un territorio sia per la previsione delle piene. Nel primo caso si rende necessario il valore medio di precipitazione a lungo termine durante un certo periodo di tempo. Tale periodo può dipendere principalmente dalla variabilità della pioggia che può essere mensile, stagionale e annuale; dipende cioè dalla scala temporale del fenomeno e dall'utilizzo che deve essere fatto dei dati. Per quanto riguarda la variabilità spaziale, questa può essere studiata attraverso l’interpolazione spaziale delle diverse variabili climatiche (Hartkamp et al. 1999). Tra i diversi metodi di interpolazione quelli maggiormente utilizzati sono l’IDW, la spline, la regressione polinomiale e gli interpolatori geostatistici come il kriging ed il co-kriging (Collins e Bolstad 1996; Hutchinson e Corbett 1995; Phillips et al. 1992). 2.3 CRITERI DI PROGETTAZIONE DI UNA RETE La progettazione di reti pluviometriche (o più in generale di reti meteorologiche) ha costituito per lungo tempo un campo di attiva ricerca. Tale ricerca comprende sia gli aspetti tecnologici che quelli economici. Tradizionalmente le reti meteorologiche sono state multi-funzione. In primo luogo la previsione del tempo ha fatto sì che la progettazione delle reti trovasse impiego in particolari campi quali l’aviazione e l’agricoltura, o nell’informazione pubblica. In secondo luogo gli studi climatici sono da supporto a due finalità: la ricerca e la divulgazione delle informazioni verso un pubblico sempre più ampio. Nei paragrafi precedenti si è giunti alla conclusione che la variabile di interesse è la precipitazione. A questo punto diviene critico il problema di scegliere la scala spaziale. Il punto di partenza è il fatto che la stima delle condizioni di siccità richiede scale spaziali che vanno da pochi km2 a poche centinaia di km2. Quindi la Reti per il monitoraggio meteoclimatico 27 precipitazione media areale (indicata in seguito con MAP) è la variabile chiave cui riferirsi. Come supporto nell’impostazione del problema di progettare una rete pluviometrica, per la determinazione della MAP si definiscono le seguenti grandezze che si ritroveranno nel prosieguo del capitolo, tranne alcune eccezioni: 1. K è il numero di stazioni nella rete, 2. B(K) è il guadagno tratto dal funzionamento della rete, ed è una funzione crescente dalla precisione della MAP, 3. C(K) è il costo della rete (installazione, funzionamento, ecc.), 4. NB(K) è il guadagno netto calcolato come B(K) – C(K) Naturalmente, il problema della progettazione di una rete, come detto in precedenza, si riduce al problema di ottimizzazione: Massimizzare NB(K) (2.1) precisione della MAP ≥ precisione richiesta (2.2) sotto la condizione che In ogni caso questa ottimizzazione risulta impossibile fino a quando: 1. la maggior parte delle reti è progettata – o lo diviene successivamente – come una rete multi-funzione; 2. non può essere stabilita una relazione diretta tra guadagno e precisione della MAP per molte delle finalità che la rete deve soddisfare; 3. qualora quanto previsto dal punto 2 fosse possibile, rimane aperta la questione di come aggregare queste relazioni. Ovviamente, quanto riportato nei punti precedenti preclude la stima dei guadagni netti. Dunque rimane solo la relazione (2.2) e il problema del progetto di una rete si può ridurre a due passi computazionali: 1. la stima della precisione della MAP in una rete di prova; 2. la definizione della precisione della MAP richiesta dall’utenza (a questo punto chi conduce l’analisi effettua le stime di siccità). Il problema della valutazione della precisione della MAP è stato ampiamente affrontato negli ultimi trent’anni del secolo scorso. Di seguito sono riportate alcune metodologie che si basano su una trattazione matematica rigorosa della variabilità spaziale della precipitazione. Inizialmente questi requisiti precludono gli approcci empirici, come quello basato sui poligoni di Thiessen. Tra le metodologie che accolgono questi criteri ne sono state selezionate cinque che verranno ampiamente esaminate nei paragrafi che seguono. Metodologia A: I ricercatori del M.I.T. (Massachusetts Institute of Technology), USA, sono stati i primi a porsi il problema della stima della MAP all’interno di un rigorosa struttura matematica (Bras e Rodriguez-Iturbe, 1976). Senza dubbio 28 G. Iiritano, T. Calmiero, G. La Loggia, L.V. Noto, F. Viola, I. Nalbantis, G. Tsakiris il contributo di questa ricerca è stato un catalizzatore per gli sviluppi successivi. Metodologia B: Sulla base dei risultati ottenuti dalla Metodologia A, i ricercatori dell’Institute of Hydrology, UK (Jones et al., 1979) hanno formulato il problema della progettazione di una rete in un contesto più orientato verso il campo applicativo prima di utilizzare la metodologia sviluppata in un ampio studio finalizzato alla ricostruzione di tutta la rete pluviometrica in Gran Bretagna. Metodologia C: Sulla base dei risultati della ricerca precedente e della potenza dei nuovi strumenti geostatistici, un team di ricercatori del National Polytechnic Institute at Grenoble, Francia (Lebel et al., 1987), ha sviluppato una metodologia per il progetto di reti basata su dati provenienti da bacini sperimentali francesi, utilizzati precedentemente in un’applicazione nell’ambito dell’esperimento a scala globale HAPEX-Sahel nell’Ovest dell’Africa. Metodologia D: Partendo da una solida rassegna bibliografica, Bacchi (1991), dopo aver illustrato i più diffusi criteri per la progettazione di reti di misura delle precipitazioni, ha proposto alcune procedure finalizzate alla progettazione delle stesse reti di misura, e al miglioramento delle loro performance (problema del rinfittimento, dell’eliminazione delle stazioni ridandanti, etc.). Metodologia E: Basandosi su studi precedenti, alcuni ricercatori dell’Università di Lovanio (Belgio), hanno messo a punto una semplice procedura per la stima del MAP utilizzando un approccio di tipo geostatistico. La MAP viene calcolata tramite uno stimatore BLUE (Best Linear Unbiased Estimator) che richiede la determinazione del variogramma del random field bidimensionale della precipitazione. Gli autori hanno proposto, per il variogramma, uno stimatore tempo-variante che prende in considerazione le influenze sulla struttura di correlazione della pioggia sia delle variazioni stagionali, sia dell’intensità dell’evento meteorico, illustrandone l’applicazione a due bacini in Belgio. Le principali caratteristiche di queste cinque metodologie sono riportate nei paragrafi seguenti. 2.3.1 METODOLOGIA A L’idea di base di questa metodologia può essere riassunta nei seguenti punti: 2. il problema del progetto di una rete è posto come un problema di ottimizzazione, con una funzione obiettivo che ricerca un equilibrio tra precisione della MAP e costi della rete; 3. la MAP è stimata in due fasi: nella prima l’integrale esatto della precipitazione sull’area di interesse è approssimato dalla somma dei valori di pioggia puntuale ad un set finito di punti specifici; in secondo luogo, la Reti per il monitoraggio meteoclimatico 4. 5. 6. 7. 29 precipitazione in questi punti è stimata come una funzione lineare delle misure puntuali di pioggia, che contengono anche errori di misura; come evidenziato sopra, la precisione della MAP è rappresentata dall’errore quadratico medio della stima proveniente da tutti i passi della stima; il problema della stima della MAP richiede una misura della variabilità spaziale della precipitazione puntuale; si richiede un modello teorico di covarianza; è stata condotta una ricerca sistematica soltanto su reti ideali. Nel seguito sono state trattate le caratteristiche principali della metodologia, esponendo le trattazioni matematiche strettamente necessarie. Per prima cosa il progetto della rete viene ridotto ad un problema di ottimizzazione del tutto analogo a quello espresso nelle equazioni (2.1) e (2.2). Il guadagno è considerato come l’errore quadratico medio (MSE) della MAP e il costo è trasformato in una quantità commisurata all’MSE mediante un parametro di compensazione della sensitività detto coefficiente di trade-off. La regione di interesse di area A è discretizzata in n celle rettangolari o in una griglia di n punti (i centri delle celle). Si assume che in alcuni di questi punti ci siano delle stazioni (in numero pari a K) . Per ciascuna stazione j la pioggia puntuale misurata è Zj. Non serve un riferimento temporale. In ciascun punto i (i = 1, 2, ..., n) definiamo la precipitazione puntuale reale Yi, e la precipitazione puntuale stimata Xi basata su misure di precipitazione puntuale errate. Si assume un modello lineare, ad esempio: Z j = ∑i =1 hij X i + V j n (2.3) dove Vj è l’errore di misura e hij sono coefficienti (nulli o da determinare). Il valore stimato della MAP, indicato con PE, è ottenuto come: PE = 1 n ∑ Xi n i =1 (2.4) mentre il valore approssimato della MAP, indicato con PA, è dato da: PA = 1 n ∑ Yi n i =1 (2.5) mentre il valore reale della MAP è fornito da: P= 1 Y ( x) dx A ∫A (2.6) 30 G. Iiritano, T. Calmiero, G. La Loggia, L.V. Noto, F. Viola, I. Nalbantis, G. Tsakiris dove x sono le coordinate in due dimensioni. Nel passaggio da P a PE abbiamo commesso due errori; primo l’errore del modello è definito come: e2 = PA − P (2.7) e secondo, la stima dell’errore è data da: e1 = PE − PA (2.8) Una trattazione analitica consente di decomporre l’errore quadratico medio (MSE) della stima della MAP in tre termini: [ ] [ ] MSE = E e12 + E e22 + 2 cov(e1 , e2 ) (2.9) dove i termini 1, 2 e 3 sono numerati in base all’ordine in cui compaiono nell’equazione (2.9). Essi sono definiti come segue: 1. il termine 1 è legato alla stima dell’errore connesso alla stima della pioggia puntuale su tutta la griglia basata sugli errori di misura puntuali; 2. il termine 2 è legato all’errore del modello, e si riferisce alla sostituzione di un integrale continuo nello spazio con una somma finita; 3. il termine 3 è dovuto alla dipendenza lineare tra i due errori suddetti. Studi approfonditi su reti ideali ma realistiche hanno evidenziato che: 1. il termine 1 è in genere prevalente e giustifica la quasi totalità dell’MSE, ad eccezione dei casi che presentano una densità di stazioni molto elevata; 2. i termini 2 e 3 rimangono sempre più piccoli rispetto al termine 1, essendo dello stesso ordine di grandezza e opposti di segno. Le conclusioni appena esposte permettono di ignorare l’errore del modello e stimare la MAP solamente come una combinazione lineare di misure puntuali di precipitazione. In Figura 2.1 abbiamo rappresentato un esempio in cui i tre termini dell’MSE e l’MSE totale sono comparabili per un ampio spettro del numero di stazioni. Osserviamo che il termine 1 tiene conto della quasi totalità dell’MSE. 31 Reti per il monitoraggio meteoclimatico Term 1 -3 2 Term of MSE (10 in ) 0.20 Term 2 0.15 Term 3 0.10 Total 0.05 0.00 -0.05 0 1 2 3 4 5 6 7 8 9 Number of stations Fig. 2.1 - Termini dell’MSE della MAP da una rete di prova con una griglia di 30 punti (Bras and Rodriguez-Iturbe, 1976). La rappresentazione della variabilità spaziale del campo di precipitazione mediante la covarianza conduce ad espressione analitiche molto complesse per i tre termini dell’MSE che non sono qui riportate. 2.3.2 METODOLOGIA B I risultati della Metodologia A sono stati sfruttati dall’Institute of Hydrology (IH), UK, per la formulazione di una metodologia che risultasse più funzionale rispetto alla prima. Molte delle assunzioni fatte rimangono le stesse della Metodologia A, mentre altre sono state modificate per migliorare l’applicabilità. Le assunzioni modificate sono le seguenti: 1. il problema non è posto come un problema di ottimizzazione, dal momento che la precisione della MAP e i costi della rete sono quantità non commisurate. Come riportato nella sezione 2.3, ciò conduce alla sola stima della precisione della MAP; 2. contrariamente alla Metodologia A, la MAP è stimata in una singola fase: la reale precipitazione sull’area di interesse è stimata come una funzione lineare della misura della precipitazione puntuale, che comprende anche gli errori di misura. 32 G. Iiritano, T. Calmiero, G. La Loggia, L.V. Noto, F. Viola, I. Nalbantis, G. Tsakiris Lo spazio bidimensionale è considerato continuo, senza nessuna discretizzazione. Per ciascun punto x di coordinate (x1, x2) l’esatta precipitazione puntuale Y(x) è definita insieme alla misure Z(x) in alcuni punti. Il numero dei punti di misura è K. Il valore esatto della MAP è dato dall’equazione 2.6 e il valore stimato da: PE = ∑i =1 λi Z i K (2.10) dove λi sono coefficienti da determinare. L’errore quadratico medio della MAP stimata è definito come: [ MSE = E (PE − P ) 2 ] (2.11) mentre la distorsione (bias) della stima è data da: Bias = E [PE ] − P (2.12) Si risolve il seguente problema di ottimizzazione minimise MSE s.t. Bias = 0 (2.13) Ciò permette la stima dei parametri λi e µ (moltiplicatori di Lagrange) mediante il sistema di equazioni: Per i = 1,..., K ∑ K j =1 ∑ K j =1 λ j cov(xi − x j ) + μ = 1 cov(x − x i )dx A ∫A (2.14) λj = 1 dove cov(.) è la covarianza del campo di precipitazione reale. Allo stesso tempo l’MSE è ottenuto analiticamente come: MSE = 1 A2 ∫∫ cov(x A i − x j )dxi dx j − 1 K λ j cov(x − x j )dx − μ ∑ ∫ A A j =1 (2.15) Per mantenere l’omogeneità in tutte le metodologie presentate le equazioni precedenti sono state piuttosto semplificate rispetto a quelle date da Jones et al. (1979). La covarianza del campo reale di precipitazione è definita come: 33 Reti per il monitoraggio meteoclimatico cov(x − x′) = ∫ (Y (x) − m(x) )(Y (x′) − m(x′) ) (2.16) A dove x e x’ sono due punti nell’area A, (x – x’) è la distanza euclidea di questi, e m(x) e m(x’) sono i valori medi nei punti di coordinate x e x’. Un’espressione analitica o modello di covarianza è calibrata sulla base dei dati. Gli autori hanno applicato il modello esponenziale potenziato con l’anisotropia: cov(x − x′) = σ 2 (a + (1 − a − ε ) exp(− bv )) ( dove v = ( x1 − x1′ + c1 ( x2 − x′2 )) 2 + c2 ( x2 − x′2 ) 2 ) 1 (2.17) 2 dove σ2 è la varianza, e a, b, c1, c2 ed ε sono parametri. Il problema del progetto di una rete in un’area con una densa rete preesistente è pertanto posto come segue: 1. per prima cosa si seleziona una possibile rete sulla base di un criterio arbitrario: 2. si stima l’MSE della MAP; 3. la stima dell’MSE è confrontata con il valore minimo richiesto; 4. se la rete non risulta soddisfacente, ne viene selezionata un’altra in una maniera predefinita e la procedura ricomincia dal punto 1. Come esempio tra le numerose applicazioni degli autori abbiamo riportato quella fatta per il bacino del Bristol Avon nella Wessex Water Authority, in Gran Bretagna, con un area di 2200 km2, per una scala temporale mensile. La rete preesistente comprendeva 51 stazioni. Sono state valutate varie reti ridotte in base ai due passi seguenti: 1. per un fissato numero di stazioni K è stata fatta una selezione random di stazioni; 2. la radice quadrata dell’errore quadratico medio (RMSE) della stima della MAP è stata calcolata per tutta l’area mediante la metodologia prima esposta. I risultati sono mostrati in figura 2.2 in termini di radice quadrata dell’ errore quadratico medio (RMSE) della MAP, stimato come una funzione del numero di stazioni nella rete. Da questa figura appare chiaro che le reti con più di 20 stazioni non possono aggiungere nessuna informazione nei riguardi della MAP. Inoltre un test con 20 stazioni distribuite in maniera uniforme ha mostrato uno scarso miglioramento rispetto al caso delle 20 stazioni selezionate in maniera random. 34 G. Iiritano, T. Calmiero, G. La Loggia, L.V. Noto, F. Viola, I. Nalbantis, G. Tsakiris 9.0 2, 8.3 8.0 Random sampling RMSE (mm) 7.0 6.0 Regular spacing 3, 5.7 5.0 4.0 3.0 20, 1.6 2.0 1.0 51, 1 20, 1.2 0.0 0 4 8 12 16 20 24 28 32 36 40 44 48 52 56 Number of gauges Fig. 2.2 - Radice quadrata dell’errore quadratico medio della stima della MAP (RMSE) in funzione del numero di stazioni nella rete per il bacino Bristol Avon, UK (adattato da O’Connel, 1978). 2.3.3 METODOLOGIA C La Metodologia C sfrutta i progressi compiuti nel campo della geostatistica dai ricercatori della Ècole de Mines, a Fontainebleau, Parigi. Più precisamente il metodo del kriging e le sue varianti costituiscono le basi per lo studio dei campi di precipitazione. La struttura spaziale dei campi di precipitazione è rappresentata mediante il semivariogramma definito come: 1 2 γ (x − x′) = Var[Y (x) − Y (x′)] (2.18) dove Var[.] indica la varianza, x e x’ sono due punti distinti nello spazio 2-D L’introduzione del semivariogramma conduce all’adozione di assunzioni sulla precipitazione che sono fondamentalmente differenti da quelle fatte nel caso della covarianza. Fatta eccezione per tali assunzioni le restanti caratteristiche della Metodologia B rimangono invariate. La MAP è stimata mediante kriging: Per i = 1,..., K ∑ K j =1 λj = 1 ∑ K j =1 λ jγ (xi − x j ) + μ = 1 γ (x − x i )dx A ∫A (2.19) Reti per il monitoraggio meteoclimatico 35 dove λi e µ sono i parametri da stimare. Allo stesso tempo il MSE (errore quadratico medio) della MAP stimata è ottenuto analiticamente come: MSE = − 1 A2 ∫∫ γ (x A i − x j )dxi dx j + K 1 λ jγ (x − x j )dx + μ ∑ ∫ A A j =1 (2.20) Dividendo il semivariogramma di ciascuna realizzazione per la varianza del campo si ottiene il semivariogramma riscalato. La media del semivariogramma riscalato calcolata sul numero totale di realizzazioni di campo è definita come semivariogramma climatologico riscalato (Lebel e Bastin, 1985). L’applicazione del kriging con il semivariogramma climatologico riscalato fornisce la varianza in scala dell’errore della MAP, che rappresenta il criterio chiave per la progettazione di reti, dal momento che: (a) dipende dal comportamento della media del campo di precipitazione nell’area di interesse, e (b) è legata solamente alla configurazione della rete. La verifica di una specifica rete comprende i seguenti passi: 1. la (2.19) fornisce i parametri per il variogramma climatologico riscalato; 2. il MSE della (2.20) adesso rappresenta la varianza riscalata dell’errore della MAP; 3. quest’ultima viene moltiplicata per la varianza del campo per dare il MSE della MAP. Come nella Metodologia B, l’analisi prende avvio dall’adattamento di un modello teorico ad un semivariogramma climatologico riscalato “empirico” ottenuto a partire dai dati. E’ possibile ritrovare alcuni di questi modelli nella letteratura scientifica relativa alla geostatistica. La metodologia è stata testata in una regione nel Sud della Francia, la regione di Cevennes, caratterizzata da un’alta densita di strumenti di misura delle precipitazioni. Il bacino principale è il Gordon d’Anduze con 34 stazioni di misura della pioggia. I risultati nella regione di Cevennes per un piccolo sottobacino sono riportati in Figura 2.3. La Figura 2.4 mostra risultati analoghi per l’intero bacino di Gordon d’Anduze, con scala temporale di un’ora. Nella fase successiva la metodologia è stata ampiamente testata all’interno della struttura dell’Hydrologic-Atmospheric Pilot Experiment nel Sahel (HAPEX Sahel) nell’Ovest dell’Africa. Tale verifica è stata condotta su un dominio di 1o×1o dotato di 107 stazioni in totale. La principale scala temporale era quella dell’evento piovoso (fino a poche ore), sebbene sia stata utilizzata anche una scala più ampia. Un esempio dei risultati per la scala temporale relativa all’evento è riportato in 36 G. Iiritano, T. Calmiero, G. La Loggia, L.V. Noto, F. Viola, I. Nalbantis, G. Tsakiris figura 2.5, dove la deviazione standard riscalata della MAP è la radice quadrata della varianza riscalata della MAP. Hourly rainfall on Gardon St. Andre 2 (53 km ) (Lebel et al., 1987) Scaled variance 0.6 0.5 0.4 0.3 From analyses 0.2 Power (From analyses) 0.1 0.0 0 2 4 6 8 10 12 14 16 18 Number of stations in network Fig. 2.3 - Varianza riscalata della MAP in funzione del numero di stazioni della rete per una scala temporale di un’ora per lo studio del Cevennes (adattato da Lebel et al., 1987) Hourly rainfall on Gardon d'Anduze 2 (545 km ) (Lebel et al., 1987) Scaled variance 0.08 0.07 0.06 0.05 From analyses 0.04 Power (From analyses) 0.03 0.02 0.01 0.00 0 2 4 6 8 10 12 14 16 18 Number of stations in network Fig. 2.4 - Varianza riscalata della MAP in funzione del numero di stazioni della rete per una scala temporale di un’ora per lo studio del Cevennes (adattato da Lebel et al., 1987) 37 Scaled standard deviation (%) Reti per il monitoraggio meteoclimatico 60 50 40 30 20 10 0 0 20 40 60 80 Number of stations per 1000 km 100 120 2 Fig. 2.5 - Deviazione standard riscalata della MAP come funzione del numero di stazioni nelle rete per la scala temporale dell’evento per la sperimentazione della HAPEX-Sahel e per un’area di 100 km2 (adattato da Lebel e Le Barbe, 1997). 2.3.4 METODOLOGIA D La procedura elaborata da Bacchi et al. (1991) è finalizzata al progetto e alla verifica delle reti pluviometriche ed è estendibile anche a tutte le grandezze meteoclimatiche. Essa si basa sulla determinazione della densità ottimale di una rete di monitoraggio. Intuitivamente, ma anche teoricamente (Schertzer e Lovejoy, 1987), si arguisce che per la misura della piogge una rete di misura regolare risulta più efficiente rispetto a una irregolarmente spaziata. Detta L l’interdistanza tra i pluviometri, le reti regolari possibili sono: a. triangolare equilatera, con distanza massima dal punto di stima più b. lontano, d m = L 3 4 ; quadrate, con distanza massima dal punto di stima più lontano, dm = L 2 2 ; c. esagonali, con distanza massima dal punto di stima più lontano, d m = L ; Per non incrementare troppo la distanza tra baricentro (punto critico) e punti di misura, la rete più conveniente appare quella a maglie quadrate. 38 G. Iiritano, T. Calmiero, G. La Loggia, L.V. Noto, F. Viola, I. Nalbantis, G. Tsakiris 2.3.4.1 Elaborazioni preliminari In base alle osservazioni pluviometriche disponibili nell’area di interesse, si effettua l’identificazione e la stima della funzione di covarianza spaziale del campo di pioggia con procedure ampiamente descritte nella letteratura scientifica (Chua e Bras, 1980; Bacchi e Kottegoda, 1994). Effettuata tale operazione si fissa, in relazione alla desiderata efficienza della rete, e compatibilmente con gli oneri economici e gestionali tollerabili, la massima varianza di progetto Max( σ p2 ) delle stime puntuali di precipitazione. A tale massimo valore, in base alla relazione precedente, corrisponde una densità di progetto della rete, D*, tale da garantire che, mantenendo in ogni punto della regione una densità D > D*, gli errori di stima si mantengano ovunque inferiori a Max( σ p2 ) . Parallelamente per la zona di interesse si elabora, con la metodologia prima illustrata la mappa delle densità locali. 2.3.4.2 Eliminazione delle stazioni ridondanti Per ciascuna delle aree che presentano una densità superiore a D*, aree ottenute raggruppando le celle contigue con densità superiore a D*, si stabilisce il numero ottimale di stazioni moltiplicando l’area medesima per D*. La differenza tra il numero di stazioni realmente esistente e quello ottimale rappresenta il numero di stazioni eventualmente da dismettere. Questa dismissione deve essere eseguita con opportuni accorgimenti, operando in modo che le stazioni rimanenti risultino distribuite nel modo più uniforme possibile e cercando di eliminare le stazioni con periodi di osservazione più brevi o i cui dati siano meno affidabili. 2.3.4.3 Allocazione dei nuovi punti di misura Nelle aree che risultano a densità D < D * si procede all’allocazione di nuove stazioni sovrapponendo all’area di interesse una griglia a maglie quadrate con lato L* = 1 D * . Quando all’interno di una maglia così determinata non ricade alcuna stazione esistente, se ne posiziona una nuova. Anche questa operazione deve essere condotta in modo tale da rendere la distribuzione risultante il più uniforme possibile; in tal senso, nelle zone del tutto prive di stazioni, un buon criterio è quello di ubicare le nuove installazioni nel centro delle maglie. 2.3.4.4 Aggiustamento e verifica della nuova rete Soprattutto nelle aree di confine tra le zone ad alta densità (D>D*) e quelle a bassa densità (D<D*), può verificarsi che permangano piccole aree dove la densità risulta inferiore a D* a causa dell’eliminazione di alcune stazioni preesistenti. Di 39 Reti per il monitoraggio meteoclimatico conseguenza occorre effettuare un riaggiustamento della rete reinserendo qualche stazione soppressa o allocandone qualcuna nuova. Definite le allocazioni, si procede infine alla verifica della rete tramite la costruzione della mappa σ2 rappresentativa della distribuzione spaziale dei valori della varianza di stima, p , ottenuta applicando la tecnica del kriging accennata in precedenza (Chua e Bras, σ2 σ2 p 1980). L’eventuale presenza di zone ove è maggiore di Max( p )*, di progetto, indica immediatamente le zone ove occorrerà installare qualche ulteriore stazione. 2.3.4.5 Varianza di stima In letteratura esistono diverse espressioni teoriche della varianza di stima in funzione della densità della rete per diverse espressioni analitiche della funzione di covarianza. La funzione di covarianza, Cov(u1,u2), di un generico processo stocastico spaziale Z(u), ove u è il vettore di coordinate che individua il punto all’interno del campo di definizione del processo, risulta definita come: Cov(u1 , u2 ) = E [(Z (u1 ) − m(u1 )) ⋅ (Z (u2 ) − m(u2 ))] = = E [Z (u1 ) ⋅ Z (u2 )] − m(u1 ) ⋅ m(u2 ) (2.21) Nelle ipotesi di stazionarietà del secondo ordine e di isotropia essa si riduce a: Cov(u1 , u2 ) = Cov(u1 − u2 ) = E[Z (u1 ) ⋅ Z (u2 )] − m 2 = Cov(h) (2.22) dove h = h = u1 − u 2 è la distanza tra i punti indicati. Le espressioni analitiche isotrope di covarianza più utilizzate nelle applicazioni tecnico-scientifiche sono quelle relative ai modelli: 1. Lineare ⎧ ⎛ h⎞ ⎪ A0 [1 − ϕ (h )] + w⎜1 − ⎟ per h < δ Cov(h ) = ⎨ ⎝ δ⎠ ⎪⎩ 0 per h ≥ δ (2.23) 2. Sferico 3 ⎧ w⎛ h ⎛h⎞ ⎞ ⎪ A0 [1 − ϕ (h )] + ⎜ 2 − 3 + ⎜ ⎟ ⎟ per h < δ Cov(h ) = ⎨ 2 ⎜⎝ δ ⎝ δ ⎠ ⎟⎠ ⎪ 0 per h ≥ δ ⎩ (2.24) 40 G. Iiritano, T. Calmiero, G. La Loggia, L.V. Noto, F. Viola, I. Nalbantis, G. Tsakiris 3. Esponenziale ⎛ h⎞ Cov(h ) = A0 [1 − ϕ (h )] + w ⋅ exp⎜ − ⎟ ⎝ δ⎠ (2.25) 4. Gaussiano ⎡⎛ h ⎞ 2 ⎤ Cov(h ) = A0 [1 − ϕ (h )] + w ⋅ exp ⎢⎜ − ⎟ ⎥ ⎣⎢⎝ δ ⎠ ⎦⎥ (2.26) nei quali la funzione ϕ (h ) assume valori ⎧1 per h > 0 ⎩0 per h = 0 ϕ (h ) = ⎨ (2.27) e i parametri che compaiono nei modelli rappresentano la distanza di correlazione ( δ ), la caduta della covarianza nell’origine ( A0 ) e la varianza del campo depurata della discontinuità ( w = σ 2 − A0 ). Dalle espressioni analitiche isotrope di covarianza, sostituendo in luogo della distanza h la densità D, si ottengono per Max( σ p2 ) le relazioni: 1. 2. w ⎧ ⎪⎪ A 0 + 0,561 δ D Max( σ ) = ⎨ ⎪A 0 + w 0,914 − 0,25 δ D ⎪⎩ δ 2 p [ ( 4. )] ⎧ ⎡ 0,841 0,25 ⎤ ⎪ A 0 + w⎢ + ⎥ 3 ⎢⎣ δ D δ D ⎥⎦ ⎪⎪ 2 Max( σ p ) = ⎨ ⎡ 1,371 ⎤ 0,104 ⎪ A 0 , 25 + − − ⎢ ⎥ 0 3 ⎪ ⎪⎩ ⎣⎢ δ D δ D ⎦⎥ ( ( 3. per D ≥ 2 δ 2 ) ) (2.28) D per 1 δ 2 ≤ D ≤ 2 δ 2 per D ≥ 2 δ 2 (2.29) per 1 δ 2 ≤ D ≤ 2 δ 2 ⎧⎪ ⎡ ⎛ ⎛ ⎛ 1 ⎞⎟ 2 ⎞ 1 ⎞⎤ ⎫⎪ ⎟ + 2 exp⎜⎜ − + exp⎜⎜ − Max( σ p2 ) = A0 + w⎨1 + 0,25⎢1 − 8 exp⎜ − ⎟⎟⎥ ⎬ ⎟ ⎜ δ 2D ⎟ ⎝ δ D ⎠⎦⎥ ⎪⎭ ⎪⎩ ⎝ δ D⎠ ⎝ ⎠ ⎣⎢ per D ≥ 0,133 δ 2 (2.30) 2 ⎧⎪ ⎡ (2.31) 1 ⎞ ⎛ 1 ⎞ ⎞ ⎤ ⎫⎪ ⎛ ⎛ Max( σ p2 ) = A0 + w⎨1 + 0,25⎢− 8 exp⎜ − 2 ⎟ + ⎜⎜1 + exp⎜ − 2 ⎟ ⎟⎟ ⎥ ⎬ per D ≥ 0,244 δ 2 ⎝ 2δ D ⎠ ⎝ ⎝ δ D ⎠ ⎠ ⎥⎦ ⎪⎭ ⎢⎣ ⎪⎩ utilizzabili direttamente per la valutazione analitica dell’errore di estrapolazione, Reti per il monitoraggio meteoclimatico 41 una volta fissata la densità delle stazioni, D, e stimati, in base alle osservazioni sperimentali, i parametri A0 , w , e δ 2.3.5 METODOLOGIA E Una problema che spesso si deve affrontare nell’ambito delle reti di misura è quello della stima in tempo reale del valore medio di pioggia su una data area a partire da misure effettuate con pochi pluviometri situati sulla stessa. In particolare se si parte da una rete esistente si possono verificare le seguenti circostanze: (a) (b) (c) scelta del sito ottimale di un nuovo strumento di misura, in modo tale da migliorare l'accuratezza della stima del MAP; selezione del sito ottimale tra una serie di possibili siti; selezione dei più rappresentativi strumenti tra quelli disponibili (rete fiduciale). In questo caso l’approccio seguito, che discende direttamente dalla metodologia C, può essere di tipo geostatistico, assumendo che il campo di pioggia sia un campo casuale 2-D; ciò permette di tenere in conto in modo sistematico e rigoroso la variabilità spaziale e stagionale delle precipitazioni. Lo stimatore della variabile campionata (nello specifico la pioggia) fa parte degli stimatori BLUE (lineari e non distorti) ed è derivato dal kriging. La stima ottimale richiede la conoscenza del variogramma del campo casuale di pioggia come funzione spazio-temporale. Questo approccio, basato sulla definizione di un variogramma in tempo reale del campo casuale di pioggia, è stato adoperato da Lebel et al. (1987). Gli AA. hanno esaminato i trend stagionali dei variogrammi e l'influenza su questi dell'intensità di pioggia. Ciò ha condotto all'adozione di un modello di semivariogramma non-stazionario in cui la non-stazionarietà temporale è interamente concentrata nel fattore di scala tempo-variante la cui stima può essere condotta in tempo reale. Il vantaggio è che i coefficienti di peso per la determinazione della stima ottimale sono calcolati una volta per tutti, mentre la varianza di tale stima è calcolata per ogni evento in tempo reale utilizzando il fattore di scala. La media areale (effettiva) della precipitazione sull’area A di riferimento è data da: P(k ) = 1 Z (k , x)dx A ∫A (2.32) 42 G. Iiritano, T. Calmiero, G. La Loggia, L.V. Noto, F. Viola, I. Nalbantis, G. Tsakiris dove k è l’indice temporale della precipitazione; la stima della media areale della precipitazione viene effettuata a partire da N punti di misura tramite la seguente relazione: N Pˆ (k ) = ∑ λi (k ) Z (k , xi ) (2.33) i =1 dove λi è il peso da attribuire alla stazione i (i=1, 2,… N). Tali pesi si ricavano dalla risoluzione del sistema di kriging riportato di seguito: ⎧N 1 ⎪⎪∑ λ j (k )γ (k , zi , z j ) + μ (k ) = A ∫ γ (k , xi , ξ )dξ j =1 A i=1,….,N ⎨ N ⎪ λi (k ) = 1 ∑ ⎪⎩ i =1 (2.34) dove μ(k) è il moltiplicatore di Lagrange relativo all’indice temporale k. Il termine di destra della prima equazione del sistema di kriging, può essere discretizzato su una griglia a maglie quadre con M nodi computazionali che ricadono nel bacino, utilizzando la seguente approssimazione: 1 1 γ (k , xi , ξ )dξ ≅ ∫ AA M M ∑ γ (k , x , x i j =1 N+ j ) (2.35) Utilizzando questo tipo di schematizzazione la pioggia media effettiva può essere espressa da: 1 P (k ) = M M ∑ Z (k , x j =1 N+ j ) (2.36) mentre la varianza di stima è data da: σ E2 (k ) = μ (k ) + 1 M N M ∑∑ λi (k )γ (k , xi , xN + j ) − i =1 j =1 1 M M ∑∑ γ (k , xN +i , xN + j ) (2.37) M 2 i=1 j =1 Per procedere alla determinazione per ogni evento dei pesi λi(k) e della varianza di stima σ E2 (k ) si deve innanzitutto determinare il semivariogramma che dovrebbe essere diversa per ogni evento k ma che viene computata indipendentemente da k. 2 1 K γ (d ij ) = ∑ [z (k , xi ) − z (k , xj)] 2 K k =1 (2.38) Reti per il monitoraggio meteoclimatico 43 Ai punti sperimentatali è possibile adattare il modello non stazionario detto di potenza γ (d ij ) = αd ij β Al posto di tale modello poteva essere utilizzato un qualsiasi altro modello (esponenziale, gaussiano, etc.); una difficoltà nasce dal fatto che la scelta del modello è difficile da validare poiché il valore medio reale non è conosciuto. I coefficienti α e β sono stai stimati con il metodo dei minimi quadrati. Naturalmente non è realistico assumere un variogramma tempo-invariante poiché questo non tiene conto della variabilità stagionale delle precipitazioni e porterebbe dunque alla determinazione di un'unica varianza di stima eguale per tutti gli eventi indipendentemente dalla stagione o dall'intensità di pioggia. Gli AA. hanno determinato, per due bacini siti in Belgio, un variogramma per ogni mese stimando dunque i coefficienti α(m) e β(m) m=1, 2, 3, ..., 12. Si è successivamente osservato che i variogrammi mensili differiscono molto di più nel coefficiente α che in quello β. Ciò ha portato ad un'ulteriore semplificazione; β(m) si è assunto come parametro tempo invariante e posto pari a β* (derivato dal variogramma unico, senza distinzioni mensili), mentre la nonstazionarietà viene trasferita nel fattore di scala α(m) i cui valori una volta fissato β(m) si ricavano con il metodo dei minimi quadrati. γ (k , xi , x j ) = α (m)γ * (d ij ) (2.39) γ * (d ij ) = dij β * (2.40) con Si è dunque operata una separazione di variabili: − α(m) tempo-variante spazio-indipendente; − γ(d) tempo-invariante spazio-dipendente. Il sistema è riscritto nel modo seguente: 1 ⎧N ⎪⎪∑ λ jγ * (d ij ) + μ * = M j =1 ⎨ N ⎪ λi = 1 ∑ i =1 ⎩⎪ M ∑ γ * (d j =1 ij ) i=1,….,N (2.41) Poiché i pesi λi sono indipendenti da α(m), essi vengono stimati soltanto una volta mentre il valore medio della precipitazione è dato da: 44 G. Iiritano, T. Calmiero, G. La Loggia, L.V. Noto, F. Viola, I. Nalbantis, G. Tsakiris N Pˆ (k ) = ∑ λi Z (k , xi ) (2.42) i =1 La varianza di stima è pari a: σ E2 (k ) = α (k )VE* (2.43) dove: VE* = μ * + 1 M N M ∑∑ λiγ * (di, N + j ) − i =1 j =1 1 M M ∑∑ γ * (d N +i,N + j ) M 2 i=1 j =1 (2.44) VE* è tempo invariante e viene calcolato solo una volta mentre σ E2 dipende da VE* tramite α(k). Per tenere conto dell'intensità di pioggia, gli eventi di cui gli AA. disponevano, sono stati suddivisi in classi in funzione dell’intensità di pioggia e della stagione di appartenenza. Per ciascuna di questa classe si è provveduto alla determinazione di α(k) e si è dunque creato un grafico log-log A(k)-α(k). Questo grafico consente nota la stagione e il valore medio stimato di ricavare α(k) e dunque la varianza di stima σ E2 . La varianza di stima normalizzata VE* , ottenuta come descritto in precedenza, dipende solo dalla localizzazione spaziale dei pluviometri e solo indirettamente (attraverso la scelta del variogramma) dai dati registrati. Il valore di VE* allora può essere usato indipendentemente dalla gravità dell’evento meteorico e dalla stagione considerata (a) per scegliere il sito ottimale di un nuovo strumento di misura, in modo tale da migliorare l'accuratezza della stima; (b) selezionare il sito ottimale tra una serie di possibili siti; (c) selezionare i più rappresentativi strumenti tra quelli disponibili. 2.4 METODOLOGIA PROPOSTA DAL GRUPPO DEL NTUA 2.4.1 CONCLUSIONI DAI LAVORI PRECEDENTI Nelle sezioni precedenti sono state analizzate le metodologie esistenti per il progetto di reti pluviometriche. Essi comprendono dei comuni passi metodologici che sono: 1. l’adattamento di modelli teorici per la struttura spaziale dei campi di Reti per il monitoraggio meteoclimatico 45 precipitazione; 2. la stima della MAP mediante una combinazione lineare di punti di precipitazione, e 3. stima analitica dell’MSE della MAP. La metodologia A comprende una procedura di discretizzazione del dominio di interesse che è fastidiosa e si rivela inutile. La metodologia B potrebbe essere pienamente soddisfacente per le nostre esigenze. Tuttavia le difficoltà nel suo utilizzo derivano da: (a) la mancanza di un software collegato, (b) la grande complessità del modello di covarianza utilizzato, (c) la mancanza di risultati di ricerche pubblicate in aree vicine al Mediterraneo, e (d) la considerazione degli errori di misura che nel nostro caso di scala temporale mensile risulta inutile. Si ritiene che, per le esigenze legate ai problemi della siccità, le metodologie C ed E siano equivalenti alla metodologia B sia nell’output a cui si vuole giungere che nella pesantezza computazionale che essa implica. E’ preferibile tuttavia adottare una tra le Metodologie C ed E per i motivi di seguito esposti: 1. sono basate sull’uso del kriging, metodo incluso in molte delle funzioni generali dei pacchetti software; 2. è possibile utilizzare una grande varietà di estensioni del kriging; 3. esistono risultati pubblicati di applicazioni di questo metodo in aree vicine al Mediterraneo e all’Europa; 4. non si considerano gli errori di misura, cosa del tutto realistica per la scala temporale utilizzata in questo lavoro; 5. la metodologia C è stata più ampiamente applicata a ampi spettri di scale temporali e spaziali come il dominio della sperimentazione dell’HAPEX – Sahel. Le tipiche fasi metodologiche per il progetto di una rete mediante le Metodologia C ed E sarebbero: 1. stima del semivariogramma empirico basato sui dati provenienti da una rete preesistente; 2. adattamento di un modello analitico teorico al semivariogramma empirico; 3. selezione di siti per le stazioni per una possibile rete; 4. stima dell’MSE della MAP; 5. se essa non risulta adeguata si ritorna al passo 3, altrimenti approvare la rete progettata. Per ottenere una performance “media” della rete in fase di progetto può essere applicato il concetto di semivariogramma climatologico riscalato, come esposto nel paragrafo 2.3.3 o quello di semivariogramma tempo-variante esposto nel paragrafo 2.3.5. In entrambi i casi, al primo passo del progetto di una rete non è richiesta la 46 G. Iiritano, T. Calmiero, G. La Loggia, L.V. Noto, F. Viola, I. Nalbantis, G. Tsakiris stima della MAP poiché il problema del progetto viene risolto utilizzando i concetti di densità della rete (numero di stazioni per km2) e la struttura di correlazione del campo di pioggia evidenziata dal semivariogramma. 2.4.2 ADATTAMENTO DELLA METODOLOGIA ESISTENTE L’esperienze relative alle applicazioni della metodologia C in Francia e Nell’Ovest dell’Africa sono riassunte da Lebel e La Barbe (1987) come segue: “Per aree inferiori o uguali a 1000 km2, è richiesto lo stesso numero di stazioni (dieci), ciò significa che finché lo spazio coperto da stazioni di misura è maggiore della metà della lunghezza di decorrelazione, il criterio principale da considerare è il numero assoluto di stazioni presenti sulla superficie di stima piuttosto che la densità della rete. Per aree ancora più piccole il numero di stazioni sulla superficie di stima può essere valutato imponendo che lo spazio occupato da stazioni sia pari a metà della lunghezza di decorrelazione, cioè una stazione ogni 15 km. Ad ogni modo sotto i 10 km2 la variabilità spaziale connessa alle celle convettive non è più rappresentabile dalla media spaziale…”. Alla luce di queste conclusioni, le fasi metodologiche da 1 a 5 del precedente paragrafo sono state semplificate nelle seguenti: 1. stima del semivariogramma empirico basato su dati provenienti da una rete preesistente; 2. adattamento del semivariogramma empirico ad un modello analitico teorico e stima della lunghezza di decorrelazione, che in genere è uguale al range del semivariogramma; 3. selezione dei siti delle stazioni per una possibile rete fiduciale; 4. stima della distanza massimo tra le stazioni; 5. se esso risulta minore della lunghezza di decorrelazione, allora si accetta il progetto della rete, altrimenti si ritorna al passo 3. Per questo approccio viene suggerito l’utilizzo del modello sferico, dato da: ( ⎧c0 + c 1.5u / a − 0.5(u / a ) 3 γ (u ) = ⎨ ⎩c0 + c ) u≤a u>a (2.45) dove c0 è il nugget, c + c0 è il sill, a è il range e u è la distanza. Il modello ha tre parametri (c, c0 ed a). La metodologia proposta dal NTUA si basa su due assunzioni: − la media della precipitazione puntuale non varia nello spazio; Reti per il monitoraggio meteoclimatico − 47 il campo di precipitazione è isotropo. Queste assunzioni, sebbene molto utili, dovrebbero essere messe in discussione quando si ha a che fare con aree del Mediterraneo, dal momento che: − − ci si aspetta che la brusca variazione delle quote dovuta ad una topografia irregolare induca variazioni nella media della precipitazione puntuale, dette anche derive (drift); la presenza di umidità persistente proveniente dal mare può provocare un comportamento anisotropo del campo di precipitazione. Il problema della deriva e dell’anisotropia è affrontato con l’aiuto di metodologie preesistenti. In particolare il problema della deriva è stato affrontato mediante una rimozione del trend nel punto medio tramite una semplice procedura che comprende i seguenti passi: − − − calibrazione di un modello di regressione lineare tra l’altezza di precipitazione mediata nel tempo (variabile dipendente) e quota (variabile indipendente); de-trending di tutti i dati riducendoli al una quota comune di riferimento H0 (ad esempio il livello del mare) usando il suddetto metodo di regressione; applicazione dei passi metodologici da 1 a 5 sui dati in cui è stato rimosso il trend. Il problema dell’anisotropia è invece affrontato modificando il passo metodologico 2 come segue: − il cerchio intorno ad ogni stazione è suddiviso in quattro settori ciascuno corrispondente ad una direzione prevalente (1 = Ovest – Est, 2 = Sudovest – Nordest, 3 = Nordest – Sudovest, 4 = Nord – Sud); − si seleziona una direzione specifica; − la determinazione del semivariogramma è limitata all’utilizzo di coppie di stazioni che soddisfano la direzione scelta. Per evitare confusione, l’applicazione di tutte le varianti metodologiche necessità della definizione sistematica di test. Così: − sotto l’ipotesi di isotropia viene fatta una serie di test applicati senza rimozione del trend; − questi test sono seguiti da altri su dati in cui non è stato rimosso il trend sotto l’ipotesi di anisotropia. In Appendice A1 è riportata l’applicazione di tale metodologia all’isola greca di Creta. 48 G. Iiritano, T. Calmiero, G. La Loggia, L.V. Noto, F. Viola, I. Nalbantis, G. Tsakiris 2.5 CONSIDERAZIONI CONCLUSIVE L’analisi delle informazioni necessarie per le stime di siccità ha consentito di porre il problema del monitoraggio come un problema di progetto delle reti pluviometriche. Le metodologie connesse sono state esaminate con lo scopo di selezionarne alcune tra queste per altre analisi. Per la selezione sono stati applicati criteri rigorosi. Cinque metodologie (A ÷ E) rispondono a questi criteri. Questi hanno in comune le seguenti caratteristiche: 1. sono basate sulla teoria dei campi random; 2. la struttura spaziale dei campi di precipitazione è rappresentata attraverso i campi di covarianza; 3. la precipitazione media annua (o MAP) è la variabile chiave, la cui precisione nella stima costituisce l’unico criterio di progettazione; 4. la precisione della MAP è rappresentata dall’errore quadratico medio (MSE) della stima della MAP attraverso un modello lineare; 5. il problema della stima è risolto analiticamente; 6. si ottiene anche una stima analitica del MSE della MAP; 7. il trattamento analitico richiede la modellazione della struttura spaziale dei campi di precipitazione. Le stime ottenibili dalle metodologie esposte mostrano che tutte potrebbero essere utilizzate per la determinazione della MAP. Si consiglia tuttavia l’utilizzo delle metodologia C e E soprattutto perché: (a) sono basate sulla geostatistica e sul kriging che è un metodo noto e ampiamente testato, e (b) sono state sviluppate mediante applicazioni in aree vicine al Mediterraneo e all’Europa. In particolare la metodologia C è stata adattata alle esigenze legate allo studio della siccità. A tale scopo per prima cosa abbiamo tratto vantaggio dell’idea di usare un semivariogramma climatologico riscalato e, in secondo luogo, abbiamo utilizzato i risultati di precedenti studi, che ci hanno permesso di limitare le nostre analisi alla stima del range del semivariogramma teorico, evitando così la stima dell’MSE. La metodologia adattata è stata inoltre potenziata per superare i problemi relativi alla presenza di una deriva (drift) e all’anisotropia e nei campi di precipitazione. 2.6 BIBLIOGRAFIA Bacchi, B.( 1991) Criteri di progetto delle reti idrometeorologiche, Atti del Corso di aggiornamento: Modelli idrologici superficiali nella pianificazione di bacino, Milano, pp 49-83 Bacchi B., Kottegoda N.T. (1995) Identification and calibration of spatial correlation patterns of Reti per il monitoraggio meteoclimatico 49 rainfall, J. Hydrol. 165, 311-348(38) Bras, R. L., and I. Rodriguez-Iturbe, (1976) Network design for the estimation of area mean of rainfall events, Water Resour. Res. 12(6), 1185-95. Chua, S. H., Bras, R.L., (1980) Estimation for stationary and non stationary random fields: Kriging in analysis of orographic precipitations, M.I.T. Report N°255 Collins, F.C.; Bolstad, P.V. (1996) A comparison of spatial interpolation techniques in temperature estimation. NCGIA Third International Conference/Workshop on Integrating GIS and Environmental Modelling. Hartkamp, A.D., K. De Beurs, A. Stein, and J.W. White (1999) Interpolation Techniques for Climate Variables. NRG-GIS Series 99-01. Mexico, D.F.: CIMMYT. Hutchinson, M.F., and Corbett J.D. (1995). Spatial interpolation of climate data using thin late smoothing splines. In: Coordination and harmonization of databases and software for agroclimatic applications. Agroclimatology Working paper Series, no. 13. Rome: FAO. Jones, D. A., R. J. Gourney, and O’Connell P. E. (1979) Network design using optimal estimation procedures, Water Resour. Res. 15(6), 1801-1812. Le Barbe, L., and T. Lebel, Rainfall climatology of the HAPEX-Sahel region during the years 1950-1990. J. Hydrol., 188-189, 43-73, 1997. Lebel, T, and L. Le Barbe (1997) Rainfall monitoring during HAPEX-Sahel: 2. Point and areal estimation at the event and seasonal scales, J. Hydrol. 188-189, 97-122. Lebel, T., and G. Bastin (1985) Variogram identification by the mean-square interpolation error method with application to hydrologic fields. J. Hydrol. 77, 31-56. Lebel, T., G. Bastin, C. Obled, and Creutin J. D. (1987) On the accuracy of areal rainfall estimation: a case study, Water Resour. Res. 23(11): 2123-2138. O’Connell, P. E., (1978) Rationalisation of the Wessex Water Authority rain gauge network, Institute of Hydrology, Wallingford, report no 51. 3. DATABASE RELAZIONALE PER L’ARCHIVIAZIONE DEI DATI METEOCLIMATICI E.M. CASTROGIOVANNI Regione Siciliana – Agenzia Regionale per i Rifiuti e le Acque – Settore Osservatorio delle Acque S. ARCURI, L. DE FELICE, G. IIRITANO Regione Calabria – Centro Funzionale – Dip. Presidenza – Settore Prot. Civile R. MALETTA, G. MENDICINO, A. SENATORE Dip. Difesa del Suolo “V. Marone” - Università della Calabria Abstract: le basi di dati e i relativi strumenti di gestione, sono alcuni degli elementi più importanti nell’implementazione di un sistema informativo. L’adeguata progettazione dello schema concettuale/logico della struttura dati e la predisposizione di un adeguato sistema informatico di supporto, sono fondamentali per garantire una efficiente implementazione dell’intero sistema informativo. La raccolta, l’elaborazione e l’accesso a dati meteo-climatici finalizzati al monitoraggio dei rischi derivanti da condizioni pluviometriche estreme, all’interno di un sistema informativo, richiedono l’impiego concorrente di diversi strumenti, oltre alla predisposizione di adeguate strutture dati bisogna infatti prestare particolare attenzione alla modalità di rappresentazione degli stessi. In tal senso rilevante è il contributo che viene dato da sistemi di visualizzazione dei dati di ultima generazione come i web-GIS che utilizzano internet come mezzo di diffusione dell’informazione. Key words: Database, web-GIS. 3.1 3.1.1 INTRODUZIONE DATABASE E SISTEMI INFORMATIVI Un sistema informativo è una combinazione di risorse, umane e materiali, e di procedure organizzate per la raccolta l’archiviazione, l’elaborazione e lo scambio delle informazioni necessarie per svolgere certe attività. Tali attività possono essere operative (informazioni di servizio), di programmazione e controllo (informazioni di gestione) e di pianificazione strategica (infomazioni di governo). 52 E.M. Castrogiovanni, S. Arcuri, L. De Felice, G. Iiritano, R. Maletta, G. Mendicino, A. Senatore In particolare, il sistema informativo automatizzato è quella parte di sistema informativo in cui le informazioni sono raccolte, elaborate, archiviate e scambiate usando un sistema informatico. I sistemi informatici di cui sopra possono essere distinti in due categorie: i sistemi informatici operativi e i sistemi informatici direzionali. I primi utilizzano tipicamente applicazioni per svolgere attività strutturate, abbastanza semplici ma ripetitive; in essi i dati sono organizzati tramite DBMS (Data Base Management Server), dove ogni operazione coinvolge una quantità modesta di dati e con i quali si trattano dati di dettaglio e aggiornati. Nel caso di sistemi informatici direzionali, i dati sono organizzati in data warehouse, le applicazioni (di bussiness intelligence) sono strumenti di controllo delle prestazioni aziendali e di gestione manageriale. L’analisi dei dati ha dunque come fine il supporto alle decisioni; le operazioni da svolgere sono complesse e possono coinvolgere molti dati, dati che possono essere aggregati secondo specifici criteri e riguardare serie temporali storiche anche molto lunghe. Un ruolo chiave, in questo contesto, è quello assunto dai database, intesi come basi di dati e relativi strumenti di gestione: l’organizzazione dei DB riflette, infatti, da un punto di vista sia concettuale che operativo, la struttura dell’intero sistema informativo. 3.1.2 UN DATABASE PER L’ARCHIVIAZIONE DEI DATI METEOCLIMATICI Più in dettaglio, con riferimento ai sistemi informativi relativi alle reti di monitoraggio idro-meteo-pluviometriche, esiste la necessità di disporre di una base di dati relazionale relativa alle stazioni di misura idrologiche. Tale necessità, peraltro, deriva dalla richiesta sempre maggiore da parte dell’utenza interna ed esterna agli enti preposti al monitoraggio idro-meteo-pluviometrico, di disporre di dati informatizzati nel campo idrologico da inserire all’interno di sistemi informativi territoriali (GIS) e di modelli di calcolo e previsione idrologica, ove le informazioni sulla storia delle stazioni sono fondamentali per comprendere eventuali anomalie nelle serie dei dati. La possibilità di ottenere strumenti di modellazione con un certo livello di precisione, al di là della ovvia e necessaria correttezza richiesta al dato rilevato, ovvero alla corretta metodologia della misura, è correlata alla “verificabilità” del dato stesso, caratteristica in assenza della quale viene inficiata la validità di qualsivoglia risultato. D’altra parte il tema della verosimiglianza tra valore misurato di una certa grandezza e valore reale della stessa, è assai delicato ed ha assunto grande rilevanza fin dalle origini della scienza. Non sono oggetto del presente capitolo nè Database relazionale per l’archiviazione dei dati meteoclimatici 53 la teoria degli errori, nè la tematica degli approcci procedurali finalizzati alla minimizzazione degli stessi, sebbene i protocolli implicitamente o espressamente previsti nell’ambito dell’organizzazione dell’informazione, consentano di evidenziare meglio incongruenze ed errori presenti nel sistema e di provvedere facilmente ad una loro rettifica. Più specificatamente, affrontiamo il tema della metodologia che consente di contestualizzare il dato, cercando di comprendere al meglio l’ambito nel quale esso viene raccolto, e come tale informazione deve essere organizzata al fine di consentire lo scambio e la condivisione dell’informazione, e quindi la sua confrontabilità. Nel caso della previsione degli eventi pluviometrici estremi, nella misura in cui gli strumenti di modellazione costituiscono la base dei sistemi di supporto alle decisioni, le problematiche relative alla tracciabilità del dato, e quindi la verifica della sua veridicità, assumono ancora maggiore rilevanza. Da quanto detto si evince che il sistema informatico di supporto è di tipo direzionale: la struttura della banca dati in esame, sebbene non ottemperi all’obiettivo di inquadrare e regolare il datawarehouse, si pone in un livello di complessità intermedio, nel quale le informazioni di natura idrologica devono essere opportunamente organizzate al fine di poter soddisfare tutte le necessità del sistema. 3.1.3 OBIETTIVI La finalità che si persegue è quella di fissare dei riferimenti per la messa a punto di banche dati uniche e condivisibili, in grado di garantire la caratterizzazione “di qualità” del dato. L’obiettivo è quello di consentire l’implementazione di un database relazionale per l’archiviazione dei dati meteo climatici, ad uso degli enti di monitoraggio operanti sul territorio nazionale italiano, contenente tutte le informazioni relative alle stazioni di rilevamento che concorrono al sistema nazionale integrato di monitoraggio idro-meteo-pluviometrico, nonché i dati a scala giornaliera inerenti i principali parametri utili al fine del monitoraggio degli eventi idro-meteo-pluviometrici estremi. La base di dati deve poter contenere tutte le informazioni sulle stazioni in funzione e su quelle dismesse, dalla loro installazione, per tutto il periodo di funzionamento. Essa deve poter essere consultabile integralmente dagli enti preposti al monitoraggio idro-meteo-pluviometrico così come dall’utenza pubblica tramite Internet ad esclusione delle parti attinenti la manutenzione e la gestione delle stazioni e tutti gli aspetti contrattuali ad esse connesse. 54 E.M. Castrogiovanni, S. Arcuri, L. De Felice, G. Iiritano, R. Maletta, G. Mendicino, A. Senatore Al fine di implementare detta banca dati saranno illustrati gli indirizzi per la progettazione e la realizzazione delle strutture dati a livello regionale, utilizzando standard di riferimento unici; deroghe a tale sistema di riferimento, che siano però conformi all’indirizzo generale, sono ammesse al fine di assicurare la rappresentazione di specifiche informazioni di valenza locale. 3.1.4 SOFTWARE, HARDWARE E RISORSE UMANE Dal punto di vista dell’infrastruttura software la piattaforma da utilizzare è costituita da un Relational Data Base Management Server (di seguito RDBMS) accessibile anche via internet attraverso un server specificamente dedicato. In particolare, all’atto della redazione del presente manuale, sulla base di considerazioni legate alle caratteristiche funzionali proprie dell’applicativo (es. la presenza di specifiche funzionalità per la gestione degli attibuti geografici) l’RDBMS più idoneo risulta essere il software GPL denominato PostgreSQL, in ambiente GNU-Linux. Il software server web di supporto per l’interfacciamento con l’utente è invece Apache2, anch’esso in ambiente GNU-Linux. Per quanto attiene alle componenti hardware, esse consistono in due server da utilizzare rispettivamente per il server web e il server RDBMS. Per ciò che concerne le risorse umane per la progettazione e la gestione della banca dati, nonché lo sviluppo degli applicativi di interfacciamento occorre fare ricorso ad apposite figure professionali. Nello specifico sono necessari, nella fase di progetto e realizzazione della soluzione: − − − − direttore del progetto; analista; progettista di DB; programmatore di applicazioni che usano DB; mentre le altre unità richieste al fine di consentire l’attività di manutenzione e messa a punto del DB e gestione dell’RDBMS sono: − − − − − amministratore del DB; amministratore dell’RDBMS; architettura; configurazione; messa a punto. 3.1.5 ATTIVITA’ PRELIMINARI Riguardo agli aspetti operativi legati all’implementazione locale dei sistemi, le Database relazionale per l’archiviazione dei dati meteoclimatici 55 attività da espletare preventivamente, possono essere organizzate secondo le seguenti fasi: Ricerca delle informazioni, analisi, integrazione, eventuale ricostruzione storica del dato con verifiche in campo; 2. Inserimento dei dati nella base di dati provvisoria; 3. Verifica della esattezza dei dati inseriti (effettuata da un responsabile nominato dall’Amministrazione). 1. In particolare le fasi 1. e 2. necessitano delle seguenti competenze: − − − − 3.2 Conoscenza dell’organizzazione interna degli Uffici, in particolare dei metodi di trattamento ed archiviazione dei dati che tali Uffici utilizzano; Conoscenza del territorio di pertinenza degli Uffici; Conoscenza della composizione strumentale delle stazioni di rilevamento; Conoscenze informatiche approfondite sull’utilizzo specifico dei database basati su SQL. DESCRIZIONE DELLA BASE DATI STRUTTURATA Com’è noto, lo scopo della progettazione concettuale è quello di rappresentare le specifiche informali della realtà di interesse in termini di una descrizione formale e completa, ma indipendente dai criteri di rappresentazione utilizzati nei sistemi di gestione di basi di dati. Il prodotto di questa fase viene chiamato schema concettuale e fa riferimento a un modello concettuale dei dati. In particolare, nella fase di progettazione occorre: - analizzare la natura e le caratteristiche dell’informazione da archiviare; determinare le unità atomiche dell’informazione; definire le entità fondamentali della realtà da rappresentare; Nondimeno, in fase di gestione delle banche dati, bisogna prevedere opportuni strumenti di controllo che permettano di aggiornare le basi di dati in maniera coerente e precodificata. Sinteticamente, vanno distinte due categorie di problemi: la necessità di un’organizzazione razionale dei dati e dei metadati relativi all’informazione storica (che permetta, ad esempio, di identificare insiemi omogenei di dati e medati) e, per la fase di gestione, l’esigenza di definire procedure di aggiornamento dei dati storici e l’inserimento di nuove informazioni (ad esempio implementazione di nuove stazioni). In particolare, la prima delle due questioni deve essere affrontata già in fase di 56 E.M. Castrogiovanni, S. Arcuri, L. De Felice, G. Iiritano, R. Maletta, G. Mendicino, A. Senatore progettazione concettuale; la definizione delle procedure di aggiornamento è ad essa strettamente correlata poiché è funzione delle entità fondamentali individuate e dei vincoli di integrità referenziale evidenziati nel processo di strutturazione logico/fisica del DB e predisposti nell’implementazione fisica dello stesso. Il processo che porta alla definizione della struttura di una banca dati relazionale si avvale delle tecniche di progettazione strutturata, largamente reperibili nella letteratura tecnica. Uno dei principi cardine della progettazione strutturata è l’indipendenza logica e fisica dei dati, grazie alla quale le applicazioni sono rese immuni alle variazioni nelle strutture di allocazione e nelle strategie di accesso ai dati. 3.2.1 STRUTTURA CONCETTUALE Le attività da svolgere al livello concettuale riguardano, come primo passo la modellazione della realtà attraverso processi di astrazione e rappresentazione dei dati. La realtà da rappresentare può essere riassunta da dei box descrittivi contenenti una serie di proposizioni in cui si evidenzino gli elementi fondamentali della base di dati e le informazioni da ricavare. In ogni box saranno specificati aspetti particolari della realtà da rappresentare. Le proposizioni contenute nei box dovranno quindi essere man mano affinate in modo da eliminare ambiguità ed incongruenze logiche: la visione di insieme dei vari box porterà ad uno schema generale nel quale dovrà essere prestata particolare cura all’aspetto semantico (definizione univoca dei concetti-oggetti) e a quello funzionale (generalizzazioni, aggregazioni, asserzioni, ecc.); nella fase di revisione del modello generale dovranno altresì essere evidenziati con chiarezza i risultati da fornire, in modo da pervenire ad un diagramma entità-relazioni. Un esempio per un approccio formale per la strutturazione concettuale a base del progetto di una banca dati in grado di assicurare il controllo qualitativo della informazione idrologica storica è sinteticamente nello schema seguente. Sono riportate anche le tabelle che evidenziano le entità fondamentali e le relazioni intercorrenti. Tab.3.1 – Box che mostrano un esempio di approccio formale per una strutturazione concettuale Informazione meteo-climatica (1) La struttura dati deve consentire di ricavare le misure giornaliere delle seguenti grandezze meteo-climatiche: pioggia, temperatura, livelli idrometrici.Tali misure sono caratterizzate dal punto ( la stazione) e dal sensore di rilevamento.Le misure inoltre Database relazionale per l’archiviazione dei dati meteoclimatici 57 devono essere inquadrate all’interno di serie storiche omogenee. Elementi di base (2) I cambiamenti di caratteristiche quali la posizione e la dotazione strumentale delle stazioni di rilevamento determinano una disomogeneità potenziale (intrinseca) della misura. Occorre evidenziare opportunamente i periodi nei quali tali caratteristiche si mantengono costanti nel tempo e marcare la serie dei dati rilevati nel periodo in modo da evidenziarne la intrinseca omogeneità attraverso l'attribuzione di un codice univoco a tale serie elementare. Contestualizzazione territoriale (3) Devono essere opportunamente rappresentate tutte le informazioni utili alla contestualizzazione geografica della misura idrologica: in primo luogo i bacini, i reticoli idrografici (per le stazioni idrometriche) e tutti gli elementi territoriali significativi che si ritiene opportuno ivi compresi i limiti amministrativi. Aggregazione delle serie (4) Deve essere garantita la possibilità di effettuare eventuali accorpamenti tra serie storiche omogenee elementari per dare vita a serie storiche omogenee aggregate che rivelino la sostanziale coerenza dei rilevamenti anche al variare della posizione e/o delle caratteristiche strumentali. Le serie storiche aggregate, relazionate con quelle elementari, saranno identificate da un codice univoco. 3.2.2 DIAGRAMMA ENTITA’-RELAZIONI Il diagramma entità-relazioni permette di stabilire il nesso di causalità tra i vari elementi coinvolti nella rappresentazione di un certo “fatto”. Una entità è detta debole se non ha propri attibuti chiave e se necessita, per essere identificata, di un’altra entità, detta forte. Gli oggetti (entità) sono tra loro collegati tramite relazioni; data una relazione tra due oggetti x e y, è possibile specificare la cardinalità della relazione, cioè quante istanze dell’oggetto x sono in relazione in ogni istante con quante 58 E.M. Castrogiovanni, S. Arcuri, L. De Felice, G. Iiritano, R. Maletta, G. Mendicino, A. Senatore occorrenze dell’oggetto y. Una relazione in cui la cardinalità delle istanze di uno degli oggetti coinvolti può essere zero è detta facoltativa, mentre se almeno una istanza per oggetto deve partecipare alla relazione in ogni istante la relazione viene detta obbligatoria. Per convenzione gli insiemi di entità vengono rappresentati con dei rettangoli etichettati mediante sostantivi, mentre gli insiemi di relazioni vengono rappresentati con rombi etichettati con verbi o preposizioni (dato che le relazioni indicano delle azioni o comunque dei coinvolgimenti fra entità). A partire dal diagramma E-R, è possibile passare agevolmente alla struttura logica del database relazionale, ovvero alla rappresentazione tramite tabelle del modello. Considerando un costrutto elementare costituito da due entità legate da una relazione valgono le seguenti tre regole fondamentali: 1. Le relazioni con cardinalità 1-1 vengono tradotte in una sola tabella 2. Le relazioni con cardinalità 1-N vengono tradotte in due tabelle, una per l’entità che partecipa in N relazioni e una per l’altra entità e la relazione 3. Le relazioni con cardinalità N-M vengono tradotte in tre tabelle, una per ciascuna delle entità e una per la relazione Database relazionale per l’archiviazione dei dati meteoclimatici 59 Fig. 3.1- Schema della struttura relazionale Tab. 3.2 – Descrizione delle entità coinvolte ENTITA’ Osservazioni giornaliere relative alla variabile meteoclimatica v [DD] CARATTERISTICHE PRINCIPALI Osservazioni registrate in un mese NOTE Entità debole (per essere completamente definita necessita dell’apparato di registrazione ) 60 E.M. Castrogiovanni, S. Arcuri, L. De Felice, G. Iiritano, R. Maletta, G. Mendicino, A. Senatore Categoria omogenea relativa alle misure della variabile meteo-climatica v [Om] Classe di dati rilevati con un apparato di registrazione (costituito da un sensore e dalla relativa stazione mediante i quali è stata effettuata una misura). E’ caratterizzata da un codice che identifica una serie omogenea di dati (omogenea previa verifica con test di conformità tra i dati rilevati dai vari apparati) Entità debole (necessita del sensore e della stazione) Stazione di misura [G] Sito strumentato con uno più sensori per la misura delle variabili meteoclimatiche Entità debole (necessita del bacino e della località) Sensore di misura della variabile meteo-climatica v [D v] E’ relativo ad una specifica variabile meteoclimatica. A rigore è indipendente dalla stazione Entità debole (per essere definita necessita del tipo di dispositivo di misura DT). Caratterizzata da anno inizio ed anno fine funzionamento. Bacino [B] Entità territoriale definita. Entità forte Località [M] Entità territoriale definita. Entità forte Fiume [R] (solo per gli idrometri) Entità territoriale definita. Entità debole (dipende dal bacino) Osservatore [Ob] Dati anagrafici dell’addetto. Entità forte Tipo di sensore [DT] Elenco dei tipi di sensori e delle relative specifiche tecniche. Entità forte Tab. 3.3 – Descrizione delle relazioni coinvolte RELAZIONI Osservazione CARATTERISTICHE PRINCIPALI ENTITA’ COINVOLTE Associa un osservatore alla relativa stazione Ob, G NOTE Database relazionale per l’archiviazione dei dati meteoclimatici Posizione Associa una stazione al bacino ed alla località in cui si trova G, B, M Tipo Associa un sensore alle relative specifiche tecniche DT, Dv Aggregazione Associa l’apparato di registrazione alla categoria omogenea. G, Dv, Om Misura Associa le osservazioni giornaliere al relativo apparato di registrazione Om, DD 61 I dati relativi agli apparati di registrazione, ciascuno dei quali è rappresentato da una ed una sola combinazione tra stazione e sensore, identificano una serie elementare (atomica) che viene assunta come implicitamente omogenea. La serie aggregata omogenea è costituita da un insieme di serie elementari che verificano i test di omogeneità. Tale serie aggregata è identificabile attraverso un codice univoco che viene associato al sottoinsieme del prodotto cartesiano tra gli attributi identificativi delle occorrenze delle entità stazione e sensore in corrispondenza delle quali vengono misurate serie elementari omogenee tra loro. 3.3 CONTENUTO DELLA BASE DATI Al fine di ottenere una panoramica completa del sistema di rilevamento delle grandezze idrologiche è necessario svolgere un’analisi storica delle entità coinvolte nel sistema. In particolare le problematiche connesse all’analisi di alcuni specifici elementi di informazione devono essere affrontate e risolte necessariamente secondo modalità uniche per tutte le banche dati regionali (es. le modalità di codifica, le relazioni di appartenza dalla scala di bacino a quello provinciale e comunale, ecc.). La banca dati progettata dovrà in ogni caso corredata da un documento di accompagnamento nel quale dovranno essere specificati tutti gli elementi volti a chiarire tutte le specificità. 62 E.M. Castrogiovanni, S. Arcuri, L. De Felice, G. Iiritano, R. Maletta, G. Mendicino, A. Senatore 3.3.1 ELEMENTI GEOGRAFICI 3.3.1.1 Località. Contiene i riferimenti ai comuni della regione interessata con la denominazione del comune stesso e i codici identificativi secondo lo schema di riferimento nazionale (es. codici ISTAT per l’Italia). 3.3.1.2 Bacini. I bacini da perimetrare sono, in generale, quelli con superficie maggiore di 30 km2, compatibilmente con le caratteristiche geomorfologiche del territorio oggetto di indagine (eccezioni possono, ad es., essere le isole di piccole dimensioni). Per ciò che concerne la codifica, al fine di garantire l’identificazione univoca dei bacini a scala nazionale, è necessario che oltre alle codifiche locali, sia prevista la codifica così come definita dal sistema nazionale di riferimento (es. in Italia come ai sensi della D.Lgs. 152/99). Con riferimento ai tipi di dati, nei GIS il bacino è notoriamente rappresentabile come un’area racchiusa in un poligono (informazione vettoriale), ed è dunque ammesso e possibile procedere all’immagazzinamento dell’informazione binaria direttamente all’interno del DB. Il vantaggio di tale soluzione è la maggiore completezza dell’informazione e la conseguente indipendenza della stessa da specifiche caratteristiche degli applicativi esterni. 3.3.1.3 Stazioni. La stazione è definita come il luogo fisico nel quale sono posizionati gli strumenti di misura di una certa variabile climatica. Ad ogni stazione è associato un codice univoco che è indipendente dal tipo di sensore ivi installato. Tale codice viene modificato quando anche una sola delle caratteristiche assunte a qualificare la posizione della stazione viene modificata (tipicamente nel caso di spostamento della stazione stessa). Alla stazione così definita viene associato un codice univoco composto da sei cifre: le prime due cifre identificano la regione, le ultime quattro l’ordine progessivo di inserimento nella tabella. Per ciascuna stazione ognuno degli eventi verificatisi durante la vita della stazione stessa deve essere registrato su una apposita tabella di dettaglio che contestualizzi temporalmente l’accadimento dell’evento (cambio dell’osservatore, Database relazionale per l’archiviazione dei dati meteoclimatici 63 variazioni della toponomastica storica, cambio del profilo d’orizzonte libero, ecc.). Una procedura possibile, idonea alla caratterizzazione della stazione secondo le definizioni di cui sopra potrebbe essere la seguente: − − − posizionamento su cartografia georiferita delle stazioni e documentazione degli spostamenti avvenuti al fine dell’eventuale aggiornamento del codice stazione; verifica preliminare della conformità della suddivisione in bacini secondo i criteri sopra specificati rispetto alla suddivisione tradizionale come riportata negli annali cui segue il controllo dell’ubicazione della stazione nel bacino di pertinenza con eventuale aggiornamento delle informazioni associate alla stessa; analisi della stazione a partire dalle informazioni pubblicate sugli annali idrologici, la memoria storica del personale dell’ufficio, le schede degli osservatori, l’analisi della toponomastica in cartografia. 3.3.2 CODIFICA DELLE CARATTERISTICHE STRUMENTALI Gli apparati in esame sono quelli che consentono la misura di pioggia, temperatura e tirante idrico. In funzione della specifica variabile climatica occorre individuare e caratterizzare lo strumento utilizzato per la sua misura. Elementi utili per tale caratterizzazione sono, ad es.: − − il tipo di strumento di misura installato (attraverso una etichetta che permetta di risalire alle specifiche tecniche dello strumento, specificate in una apposita tabella); l’altezza dal suolo dello strumento o zero idrometrico nel caso di idrometri. 3.3.3 SERIE STORICHE OMOGENEE La serie storica non deve essere intesa come misura di una certa variabile climatica nel punto, bensì come successione di dati omogenei. Questo significa che le misure effettuate con una stessa stazione possono appartenere a due serie storiche differenti, nella misura in cui, ad es., sulla stazione è stato cambiato il modello di sensore e questo ha determinato una disomogeneità della serie di dati. Di contro, dati che provengono da stazioni diverse (caso tipico di piccoli spostamenti di una stazione che ne determinano un cambiamento di codice), possono appartenere alla stessa serie storica nella misura in cui tali serie di dati risultino essere congruenti. 64 E.M. Castrogiovanni, S. Arcuri, L. De Felice, G. Iiritano, R. Maletta, G. Mendicino, A. Senatore La serie storica omogenea sarà quindi identificabile solo attraverso una lettura incrociata delle informazioni relative alle stazioni, ai dati in essa rilevati, al sensore con il quale, al tempo considerato, è stata effettuata la misura, e alla verifiche di omogeneità. Durante l’analisi ogni variazione deve essere contestualizzata temporalmente, registrando il “periodo di funzionamento omogeneo” inteso come periodo in cui una certa caratteristica si è mantenuta costante. In conseguenza dell’analisi condotta sulle stazioni e sui sensori, è possibile optare, in certi casi, per la suddivisione della singola serie storica, registrata in una certa stazione, in “serie elementari” ognuna delle quali corrispondente ad un periodo di funzionamento “omogeneo”. Tali serie dovranno essere sottoposte a test di omogeneità per valutarne la bontà e la possibilità di una eventuale riaggregazione che porta all’attribuzione di un codice identificativo della serie. 3.3.4 DATI GIORNALIERI Le osservazioni giornaliere devono essere codificate secondo uno schema che ne evidenzi l’appartenenza ad una serie omogenea elementare. Oltre all’informazione sulla misura effettuata sarà necessario utilizzare ulteriori attributi che permettano di interpretare correttamente il tipo di dato, in particolare: presenza di dato rilevato direttamente o indirettamente (es. interpolato spazialmente) e, nel caso di misure pluviometriche, se cumulato o cumulato interpolato. 3.3.5 RETE ELEMENTI INFORMATIVI SU ASPETTI GESTIONALI DELLA 3.3.5.1 Osservatori Le informazioni relative agli osservatori devono fondamentalmente consentire il contatto con la persona interessata e l’associazione con la stazione da esso curata. Possono altresì permettere di tracciare lo stato dei rimborsi. Contenendo dati personali deve essere prestata particolare attenzione agli aspetti inerenti la privacy, nel rispetto delle vigenti normative nazionali (D. Lgs. 196/2003 per l’Italia) Database relazionale per l’archiviazione dei dati meteoclimatici 3.3.5.2 65 Manutenzioni Contiene i dati relativi alle attività di manutenzione ai sensori, agli apparati di registrazione e alla stazione nel suo complesso. E’ necessaria, oltre alla contestualizzazione temporale degli interventi, anche la definizione del tipo di intervento (che può essere anche precodificata all’interno di un’apposita tabella), l’operatore che ha effettuato la manutenzione e un campo di testo per ulteriori note. 3.3.6 PORTABILITA’ E COMPATIBILITA’ La portabilità dell’informazione è garantita dall’utilizzo di SQL standard che permette di utilizzare varie piattaforme senza che ciò comporti sostanziali traumi all’architettura di sistema e quindi alla possibilità di accesso ai dati. Tuttavia la presenza di “oggetti geografici” all’interno della banca dati impone, nella fase di progettazione, una scelta precisa riguardo alla (o alle) modalità di rappresentazione che si riflette inevitabilmente sui tipi di dati da utilizzare e, conseguentemente anche sul DBMS “nativo” che deve renderli disponibili.L’indirizzo che si vuole dare è stato quello di utilizzare una piattaforma Open Source (PostgreSQL), proprio per le maggiori possibilità di sviluppo condiviso da questo offerte. La compatibilità è definita come la capacità di eseguire un dato programma su differenti tipi di computer senza modificare il programma o il computer. Nella progettazione della banca dati occorre tenere in considerazione questa problematica dal punto di vista del client e suggerire espressamente quali debbano essere i requisiti posseduti dal client per l’accesso ai dati e la relativa visualizzazione. Strumenti molto utili, messi a disposizione dai più comuni DBMS, che possono essere utilizzati al fine di minimizzare i problemi connessi all’utilizzo (lato client) multipiattaforma sono i trigger e le stored procedure. Una stored procedure è un un programma scritto in SQL o in altri linguaggi mantenuto nel database stesso. Spesso vengono scritti in versioni proprietarie di SQL, che sono dei veri e propri linguaggi strutturati, come il PL/pgSQL di PostgreSQL il PL/SQL di Oracle. Le stored procedure accettano zero o più parametri in input e possono restituire un risultato. Generalmente il DBMS compila le stored procedure, il chè significa che le ottimizza e stabilisce il piano di esecuzione delle query. I principali vantaggi che derivano dall'utilizzo delle stored procedure sono i seguenti: − La stored procedure evita al client di riscrivere query complesse offrendo la possibilità di richiamare una procedura archiviata all'interno del database. 66 E.M. Castrogiovanni, S. Arcuri, L. De Felice, G. Iiritano, R. Maletta, G. Mendicino, A. Senatore − − − − Di conseguenza anche il numero di informazioni che saranno scambiate tra client e server sarà minore a tutto vantaggio delle prestazioni. La compilazione di una stored procedure avviene una volta sola, al suo inserimento. Ogni volta che la procedura viene richiamata viene semplicemente eseguita e questo aumenta significativamente le prestazioni. L'utilizzo di stored procedure permette di mantenere librerie di funzioni da utilizzare all'interno del database stesso. Potenzialmente si potrebbe eseguire ogni operazione richiamando una diversa procedura, senza conoscere la struttura di un database magari complesso, o avendone una conoscenza limitata. Proprio per questo motivo, l'amministratore di database può a volte evitare di concedere i permessi di modifica o di lettura su molte tabelle a determinati utenti, concedendo semplicemente il permesso di eseguire le stored procedure. Gli svantaggi principali sono invece i seguenti: − − − Le stored procedure aumentano il carico di lavoro per il server. A volte non si può utilizzare il linguaggio che si vorrebbe utilizzare, perché il DBMS non lo supporta. La logica del programma viene spostata sul server; questo non è necessariamente uno svantaggio, ma non è compatibile con il modello logico di applicativi a più livelli. Un trigger è una procedura (routine o metodo) di un database che è associato ad una tabella e si attiva quando la tabella viene modificata. Sono strumenti molto utili e possono essere utilizzati, per esempio, per tenere un log delle modifiche o per restringere l'accesso ai dati. Vi sono due classi di trigger: quelli che si attivano una volta per ogni riga modificata e quelli che si attivano una volta per ogni istruzione SQL eseguita. Questi ultimi si attivano anche se un'istruzione non modifica nulla (es: una DELETE con una WHERE che non individua nemmeno una riga) e, nel caso un'istruzione modifichi diverse righe, si attivano una volta sola. In entrambi casi, il trigger può essere di due tipi: può essere attivato prima della modifica, oppure dopo. Alcuni database, come Oracle, consentono una funzionalità non standard: il trigger si può attivare annullando la modifica richiesta dall'istruzione SQL. Gli eventi che possono attivare i trigger sono le istruzioni: − − − INSERT (un nuovo record viene creato) UPDATE (modifica dei dati) DELETE (cancellazione di record) Database relazionale per l’archiviazione dei dati meteoclimatici 67 Le istruzioni di tipo REPLACE non possono essere associate a un trigger; esse eseguono prima una DELETE, poi una INSERT, quindi attivano i trigger associati a queste istruzioni. Le istruzioni di tipo TRUNCATE sono trattate come DELETE. 3.3.7 CASI PARTICOLARI A partire dalle serie omogenea aggregata è possibile strutturare specifici livelli informativi volti ad organizzare sistematicamente i risultati delle elaborazioni per la caratterizzazione della siccità, ad esempio attraverso l’indice SPI (Spatial Precipitation Index). Nel caso più frequente l’informazione relativa alla distribuzione dell’indice SPI nell’ambito del territorio regionale, è rappresentabile facendo uso di specifiche mappe. All’interno del database proposto possono quindi trovare posto mappe, anche in formato binario, che siano frutto di elaborazioni condotte con applicativi esterni che facciano ovviamente riferimento allo stesso dataset contenuto nel DB. Ad un livello di complessità superiore possono realizzarsi soluzioni che prevedano l’esecuzione on-line dell’elaborazione, ovvero l’automatizzazione delle procedure di calcolo finalizzate a restituire un certo risultato (valori alfa-numerici, mappe, ecc.) al verificarsi di un certo evento. 68 E.M. Castrogiovanni, S. Arcuri, L. De Felice, G. Iiritano, R. Maletta, G. Mendicino, A. Senatore 3.4 3.4.1 DATABASE TERRITORIALI: LE APPLICAZIONI GIS INTRODUZIONE I Sistemi Informativi Territoriali (SIT), sino a qualche anno fa erano strumenti riservati a pochi operatori di settori specifici e di conseguenza anche l’informatica geografica era considerata un ambiente di nicchia. I motivi di tale collocazione erano dovuti sia alla necessaria struttura informatica, ovvero hardware potente e costoso e sistemi operativi per specialisti, sia alla mancanza di una interfaccia grafica amichevole con caratteristiche comunicative basate sulla intuitività. Si deve inoltre aggiungere che i dati necessari alla creazione di un sistema informativo territoriale erano costosi e la rilevazione e manutenzione/aggiornamento rimane tuttora spesso un problema. Recentemente, entrambi i fattori citati hanno avuto una evoluzione enorme: oggi un personal computer base ha praticamente potenza sufficiente per le elaborazioni richieste, i software GIS (Geographic Information Systems) sono economicamente alla portata di tutti e sono dotati di interfacce grafiche. A seguito di questo progresso, le informazioni legate al territorio stanno conoscendo una diffusione considerevole e sempre più vengono richieste per completare i sistemi informativi nei loro ambiti tradizionali. La nuova sfida che si presenta oggi è quella di ampliare ulteriormente la conoscenza e la diffusione di tali sistemi informativi sfruttando la nuova tecnologia WEB-GIS, e questa non è una operazione semplice se si desidera avere una palette di funzioni ampia, tipica dei sistemi client/workstation, in abbinamento con velocità di risposta ed una interfaccia semplice. Ma se si riesce nell’intento, i SIT possono essere utilizzati da un pubblico sempre più vasto, contribuendo in modo determinante alla diffusione delle informazioni, sia in ambito scientifico che generale. 3.4.2 GLI OBIETTIVI Obiettivo primario della realizzazione di un WEB GIS è certamente la diffusione dei dati territoriali in possesso, rendendo fruibili le informazioni in modo semplice e completo. Raggiungere questo obiettivo significa concretamente realizzare i seguenti punti: Database relazionale per l’archiviazione dei dati meteoclimatici − − − − − − − − 69 completezza dell’informazione (ad esempio con l’integrazione di informazioni a corredo come le norme di attuazione per i piani urbanistici comunali); possibilità di scaricare i dati direttamente dal servizio (download); creare la piattaforma software sulla quale implementare nuovi servizi di pubblicazione di qualità in tempi rapidi; semplificare l’interfaccia e dare un aspetto uniforme a tutti i servizi; pubblicare le metainformazioni dei dati per rendere un servizio completo e fruibili in modo professionale; multilinguismo, ma senza sdoppiare l’applicazione per non creare ridondanze e difficoltà di manutenzione; prestazioni, sia in termini di velocità sia in termini di disponibilità; ridurre la quantità di richieste di informazioni a carico delle Amministrazioni. 3.4.3 L’APPROCCIO SEGUITO Le procedure di seguito descritte sono state definite nell’ambito dell’Applicazione web-GIS per il controllo delle aree soggette a deficit idrico, progetto oggetto di convenzione tra la Regione Calabria e l’Università della Calabria. Il sistema descritto di seguito (che sfrutta in maniera efficace le possibilità offerte dalla tecnologia WEB GIS) costituisce un esempio di realizzazione concreta di uno strumento di diffusione dei dati grezzi ed elaborati acquisiti e prodotti dagli enti di gestione del territorio, in particolare orientata allo sviluppo di un efficiente sistema di diffusione dell’informazione in ambito di gestione dei fenomeni meteoclimatici estremi. 3.4.4 DESCRIZIONE DEL WEB-GIS I mutamenti climatici che stanno interessando l’intero pianeta influiscono nella naturale definizione del ciclo idrologico. Le conseguenze di tali mutamenti, dal punto di vista idrologico, si manifestano in un drastico aumento dei fenomeni estremi (Houghton et al., 2001). Il riscaldamento globale infatti, fornendo maggiore energia all’atmosfera, determina una crescita delle precipitazioni abbondanti seguite da periodi di aridità, aumentando il rischio di siccità ed alluvioni. A conferma di ciò è interessante osservare le analisi pluviometriche condotte sul Mediterraneo da Xie et al. (2003) durante il periodo 1986-2002 che, in particolare, mostrano una forte variabilità della precipitazione rispetto alla media del periodo. Le zone con valori locali della deviazione standard più elevati, e tra 70 E.M. Castrogiovanni, S. Arcuri, L. De Felice, G. Iiritano, R. Maletta, G. Mendicino, A. Senatore queste le regioni meridionali d’Italia, sono anche quelle maggiormente colpite dalle ricorrenti, improvvise e lunghe siccità. Diversi studi (Mendicino e Versace, 2003; Bonaccorso et al., 2004) mostrano come nelle regioni dell’Italia meridionale la situazione meteo-climatica osservata negli ultimi venti anni ha reso ancor più critica la disponibilità delle risorse idriche superficiali e sotterranee. La siccità è un evento climatico di complessa determinazione che comporta un notevole impatto sull’ambiente, sulle produzioni agricole, e sulla società. Il fenomeno della siccità è molto temuto a causa della concreta difficoltà di prevedere l’inizio e la durata dell’evento stesso. In ragione di ciò è necessario sviluppare degli appositi strumenti di analisi e di supporto, che consentono di fornire adeguate strategie di gestione e di intervento in concomitanza di periodi caratterizzati da prolungati deficit idrici (Mendicino e Senatore, 2004). Nell’ambito del progetto comunitario INTERREG IIc Siccità, e successivamente nel programma INTERREG IIIB – MEDOCC SEDEMED, in Calabria è stato elaborato un sistema Web-GIS per il monitoraggio e la previsione delle aree soggette a stress idrico (Mendicino e Versace, 2002). La valutazione del rischio, così come la previsione degli eventi estremi, richiede un unico ambiente di gestione e di analisi delle informazioni spazialmente distribuite sul territorio, le quali, nella quasi totalità dei casi, provengono da diverse fonti (come tipo e come scala di acquisizione) e con strutture tra loro disomogenee: la tecnologia GIS, in questa ottica, riveste un ruolo di rilevanza strategica poiché diventa un mezzo indispensabile per convertire il dato in informazione e, soprattutto, per omogeneizzare i differenti contenuti informativi, sia attraverso le proprie funzionalità, sia attraverso procedure e modelli specifici integrati direttamente all’interno dello stesso sistema. L’integrazione del GIS con reti di monitoraggio e con adeguati modelli di simulazione ai fini del preannuncio del fenomeno siccitoso, per quanto completa e articolata, risulta di per sé molto specialistica e, pertanto, comporta una limitazione nella divulgazione delle elaborazioni anche a quelle fasce di utenza non tecnica che comunque risulta strategica nello scambio di informazioni e conoscenze. In tal senso, il Sistema Informativo Geografico deve tener conto di un’utenza più ampia rappresentata dalla rete Internet e, di conseguenza, deve essere progettato secondo un ambiente Web-GIS (fig. 3.2). Database relazionale per l’archiviazione dei dati meteoclimatici 71 Interfaccia Web GIS Retedi monitoraggio Banca Dati Omogeneizzazione dei differenti contenuti informativi Modelli di simulazione WebServer Connectors Application Server Spatial Server UTENTI INTERNET Data Acquisizione Conversione del dato Diffusione del dato ininformazione dell’informazione Fig. 3.2 - Struttura generale del web-GIS La nota espone la struttura del sistema Web-GIS proposto: dopo una descrizione del sistema integrato per la previsione ed il monitoraggio in tempo reale dei fenomeni siccitosi, l’attenzione è focalizzata sulla realizzazione di un’interfaccia Web che consente a qualsiasi utente, attraverso l’accesso alla rete Internet, di stimare in forma distribuita le principali componenti del bilancio idrologico su singoli bacini oppure sull’intero territorio regionale. 3.4.5 IL SISTEMA INTEGRATO A SCALA REGIONALE Il sistema integrato per la previsione ed il monitoraggio dei fenomeni siccitosi comprende l’intero territorio calabrese e comporta la progettazione di quattro moduli principali: il sistema di acquisizione dati; l’interfaccia GIS; i modelli per la stima del bilancio idrico; l’interfaccia WEB (Mendicino e Versace, 2002). La gestione dell’acquisizione dati è effettuata dalla componente DAS (Data Acquisition System) sviluppata per l’acquisizione in tempo reale dei dati registrati 72 E.M. Castrogiovanni, S. Arcuri, L. De Felice, G. Iiritano, R. Maletta, G. Mendicino, A. Senatore dalle stazioni idrometeorologiche gestite dal Centro Funzionale della Protezione Civile Regionale della Calabria. Il territorio in esame risulta costantemente monitorato da circa 300 sensori in telemisura, di varie tipologie: pluviometri, termometri, idrometri, barometri, igrometri, radiometri, anemometri, freatimetri, evaporimetri e sensori di umidità del suolo. I dati acquisiti dalle stazioni in telemisura hanno una cadenza temporale di 20 minuti. Il sistema stesso provvede giornalmente alla stima ed all’archiviazione di dati sintetici giornalieri, ad esempio temperatura minima, media e massima, cumulato giornaliero di pioggia, radiazione solare media, numero di ore di insolazione, etc. Queste informazioni sono archiviate in una apposita banca dati “storica” che contiene altresì i dati provenienti dagli annali idrologici per tutto il periodo 19252003. Il software ArcView GIS è stato appositamente personalizzato allo scopo di consentire una connessione diretta con le banche dati in modo da poter visualizzare le informazioni relative alle stazioni di misura, che risultano così costantemente aggiornate. La base cartografica disponibile nel GIS è composta da molti strati informativi quali: limiti amministrativi; idrografia; litologia; usi del suolo; estensione dei principali bacini idrografici; modello digitale del terreno con maglia regolare a 250 m per le analisi regionali; modelli digitali con maglia regolare a 20 m per analisi su bacini campione. Le grandezze acquisite direttamente dalla rete di misura (precipitazione, temperatura, radiazione solare netta, velocità del vento) sono processate dai vari moduli per determinare le grandezze “derivate”, come la radiazione netta e l’evapotraspirazione potenziale, ottenute attraverso l’impiego di codici di calcolo basati su robusti modelli teorici (Mendicino e Versace, 2002), e successivamente l’evapotraspirazione effettiva, l’umidità del suolo, il surplus e il deficit idrico, fondamentali per una analisi idrologica del fenomeno della siccità (Thornthwaite e Mather, 1955). In particolare, per quanto riguarda la modellistica di bilancio idrologico, il GIS possiede al suo interno un modello a scala regionale che consente la stima del bilancio idrico su base mensile attraverso una griglia spaziale di analisi di lato pari a 5 km. I risultati ottenuti dal modello di bilancio idrologico consentono la realizzazione di grafici rappresentativi dell’evoluzione dei valori medi mensili delle aree in esame, la mappatura con cadenza mensile delle grandezze, e Database relazionale per l’archiviazione dei dati meteoclimatici 73 l’individuazione spaziale delle possibili zone di crisi; l’accesso a tali informazioni è reso possibile al comune utente della rete Internet attraverso la consultazione dell’interfaccia Web-GIS. 3.5 L’INTERFACCIA WEB-GIS L’immediata e semplice comunicazione, verso qualsiasi tipo di utente, riguardo rilevanti argomenti di natura prevalentemente idrologica è il fine ultimo di progettazione dell’architettura del sistema Web-GIS. Una prima pagina di informazioni generali fornisce i concetti base sul bilancio idrologico e chiare indicazioni sull’utilizzo e sulle funzionalità dello strumento Web-GIS. Nelle pagine che seguono, invece, è possibile esplorare il territorio calabrese per mezzo di opportuni strumenti e monitorare i cambiamenti climatici tramite grafici e mappe. L’ambiente operativo scelto per lo sviluppo e la pubblicazione in Internet di questo progetto è ArcIMS, realizzato dalla Esri, integrato da tecnologie di scripting per il processing e per l’output. Le applicazioni ArcIMS rendono possibile la creazione, il disegno e l’amministrazione del sito Internet, che fornisce accesso ad una vasta gamma di funzionalità GIS, oltre che ad un trasferimento diretto data streaming del dato vettoriale dal lato server verso il client. L’architettura di ArcIMS è organizzabile secondo tre livelli. Il livello client è rappresentato dal viewer HTML (scaricabile gratuitamente), da tutti i Desktop client ArcGIS (ArcView, ArcEditor e ArcInfo) e da ArcExplorer. Al livello di server è demandato tutto il trattamento riguardante le richieste, le risposte, la gestione organizzativa e la configurazione completa delle mappe. Le componenti che interagiscono in questo livello sono: − Application Server Connector, − Application Server − Spatial Server ArcIMS. Il livello dei data è rappresentato da tutte le sorgenti di dati utilizzate da ArcIMS. L’applicazione realizzata per mezzo del software ArcIMS è notevolmente personalizzata, sia nell’interfaccia grafica (dinamica e funzionale, si avvale di tecnologie dal lato client per l’immediata esecuzione ed interpretazione delle istruzioni), sia nelle elaborazioni di output. 74 E.M. Castrogiovanni, S. Arcuri, L. De Felice, G. Iiritano, R. Maletta, G. Mendicino, A. Senatore L’impiego di un Server-Web Windows con IIS permette di sfruttare una tecnologia specifica Microsoft nota come ASP (Active Server Pages). L’interfaccia client è in parte realizzata integrando la tecnologia ASP (ambiente per l’esecuzione server-side di script su server) con l’ActiveX Connector di ArcIMS. La scelta dell’approccio server-side migliora le prestazioni del sistema nelle fasi di elaborazione più complesse e garantisce una fondamentale indipendenza dalle caratteristiche hardware e software del terminale dell’utente finale. La connessione all’informazione degli strati cartografici implementata con l’ActiveX Connector di ArcIMS rende possibile la creazione di oggetti ActiveX, accessibili in ASP. Sfruttando questo canale di comunicazione verso i servizi di ArcIMS, è possibile all’interno del sito creare mappe virtuali riferite a specifiche componenti di bilancio idrologico. L’insieme delle informazioni, sulle quali si fondano le operazioni di elaborazione, risiede in parte nei file associati ai layer cartografici vettoriali, pubblicati nei servizi di ArcIMS ed in parte su un database SQL Server. Si è adottata infatti la tecnologia Open DataBase Connectivity (ODBC) come driver di comunicazione tra l’applicazione Web e il DBMS. La connessione diretta di un database alfanumerico (attraverso codici ASP), esterno all’ambiente di ArcIMS, fornisce in modo continuativo stime di grandezze idrologiche acquisite direttamente dalla rete di misura, e rende possibile l’applicazione del modello idrologico per la determinazione di grandezze derivate, come ad esempio l’evapotraspirazione reale, il deflusso totale, ed il deficit idrico, fondamentali per un’analisi idrologica del fenomeno della siccità. L'interfaccia client (figura 3.2) presenta una struttura a frame. In particolare sono previsti 5 frame: − − − − frame centrale-alto: contiene la barra degli strumenti che abilitano le funzionalità GIS per navigare (p.es. zoom-in/out, zoom alla scala del layer in analisi, pan, ecc.) e per interrogare i vari temi cartografici; frame centrale: contiene la mappa dove sono rappresentati graficamente i temi cartografici. In questa area, in seguito all'attivazione dei layer, è possibile interagire direttamente con i tematismi e visualizzare le mappe virtuali; frame di destra: consente la gestione dei layer presenti nella mappa e la visione della loro legenda. Secondo le preferenze è possibile l’intersezione tra più piani grafici attivati attraverso un pulsante che permette il refresh dell’immagine; frame di sinistra: contiene gli strumenti necessari per l’esecuzione del calcolo del bilancio idrologico. Specificando un intervallo temporale e Database relazionale per l’archiviazione dei dati meteoclimatici − 75 spaziale si avvia, lato server, l’elaborazione del modello idrologico con la relativa visualizzazione dei grafici risultanti, nei frames adiacenti; frame in basso: contiene i grafici riassuntivi, ottenuti dal calcolo del modello di bilancio. Nello specifico sono mostrati il diagramma ombrotermico (che rappresenta l’andamento della precipitazione e dell’evapotraspirazione nel periodo di analisi) e l’andamento temporale dei valori di deflusso e di deficit idrico, entrambi messi a confronto con i valori storici calcolati rispetto alla stessa porzione di territorio selezionata. Il sistema Web-GIS, così strutturato, è dotato di automatismi che consentono, in modo semplice ed intuitivo, una vasta gamma di operazioni di interazione e visualizzazione delle mappe. L’insieme delle informazioni utilizzate dal progetto che, come già precedentemente sottolineato, risiedono in parte in una base di dati SQL Server e in parte nei files *.dbf associati ai layer cartografici integrati nei servizi di ArcIMS, consentono all’utente, tramite un semplice browser Internet, il reperimento di informazioni utili per il monitoraggio della siccità nella propria zona di interesse. Fig. 3.3 - Layout dell’interfaccia grafica del sistema Web-GIS 76 E.M. Castrogiovanni, S. Arcuri, L. De Felice, G. Iiritano, R. Maletta, G. Mendicino, A. Senatore 3.6 CONDIDERAZIONI CONCLUSIVE L’analisi dei fenomeni siccitosi è molto complessa, a causa della molteplicità dei fattori da cui essi sono generati e della loro distribuzione nello spazio e nel tempo. La corretta valutazione del rischio comporta una progettazione complessa ed articolata, che richiede conoscenze nei campi dell’idrologia e della tecnologia GIS, indispensabile per omogeneizzare i differenti contenuti informativi e contribuire alla conversione del dato in informazione. In particolare il primo passo da compiere per favorire la conoscenza del fenomeno è la corretta organizzazione dell’informazione secondo criteri che, da un lato permettano di stabilire il grado di affidabilità dell’informazione rilevata, e dall’altro semplifichino la elaborazione di modelli e la produzione di indici. Una volta colti i segnali di preannuncio, tuttavia, si rende necessario attuare una serie di interventi che non necessariamente devono essere demandati a personale altamente qualificato. La divulgazione dell’informazione acquisisce quindi un’importanza strategica ai fini della gestione degli interventi per il contrasto del fenomeno siccitoso. Il sistema proposto unisce, alla completezza ed accuratezza dell’integrazione del GIS con reti di monitoraggio e modelli di simulazione, la fruibilità nell’accesso ai dati, grazie ad un’architettura Web-GIS che tiene conto di un’utenza più ampia rappresentata dalla rete Internet. Esso, costituendo un agile strumento di valutazione per l’individuazione delle zone critiche soggette a deficit idrico, agevola la trasmissione delle informazioni ai responsabili delle decisioni e al pubblico, e facilita la partecipazione di tutti i “portatori di interesse” (stakeholders) alle decisioni in campo idrico ed in particolare alla scelta dei provvedimenti per la mitigazione della siccità. Database relazionale per l’archiviazione dei dati meteoclimatici 3.7 77 BIBLIOGRAFIA References text type should be 9 point (Times Roman) at the end of each chapter for an edited volume with the standard below indicated. References can be listed in the alphabetical order (cited by author name and year, e.g. (Kendall and Stuart, 1973)). 1. Appunti Quaglini, S., Appunti del corso di Sistemi Informativi Sanitari. Università degli Studi di Pavia, Facoltà di Ingegneria. 2. Appunti Parisi Presicce, F. (2001) Appunti del corso di Ingegneria del Software. Università La Sapienza di Roma, Facoltà di Ingegneria. 3. Libro Ramakrishnan, R., Gehrke, J. Sistemi di basi di dati, McGraw-Hill. Bonaccorso B., Bordi I., Cancelliere A., Rossi G., Sutera A. (2003), “Spatial Variability of drought: an analysis of the SPI in Sicily”, Water Resources Management, 17: 273-296. Houghton J.T., Ding Y., Griggs D.J., Noguer M., Van der Linden P.J., Xiaosu D. (2001), Climate change 2001: the scientific basis, Contribution of Working Group 1 to the Third Assessment Report of the Intergovernmental Panel on Climate Change (IPCC), Cambridge University Press, Cambridge, 944p. Mendicino G., Versace P. (2002), “Aspetti Metodologici nella Ricostruzione del Bilancio Idrologico a Scala Interregionale”, Giornata di Studio dell’Associazione Idrotecnica Italiana, Aprigliano (CS), Quaderni di Idrotecnica, Ed. Bios, Cosenza, 14: 45-93. Mendicino G., Versace P. (2003), “Analisi Spaziale delle Condizioni di Stress Idrico in Regioni Meridionali”, Atti del Convegno: Giornata Mondiale dell’Acqua “La Siccità in Italia”, Accademia Nazionale dei Lincei, Roma, 227-236. Mendicino G., Senatore A. (2004), “Desertificazione e siccità: dall’analisi del rischio alla previsione del fenomeno tramite procedure GIS”, Atti del I° Workshop Modeci – Modelli Matematici per la simulazioni di catastrofi Idrogeologiche, 30-31 Marzo 2004, Rende (CS). Thornthwaite C. W., Mather J.R. (1955), “The water balance”, Climatology, Drexel Inst. Of Technology, Centeron, New Jersey. Xie P., Janowiak J.E., Arkin P.A., Adler R., Gruber A., Ferraro R., Huffman G.J., Curtis S. (2003), “GPCP pentad precipitation analyses: an experimental dataset based on gauge observations and satellite estimates”. J. Climate, 16: 2197-2214. 4. PROCEDURE DI CONTROLLO DI QUALITA’ DEI DATI PROVENIENTI DALLA RETE IDROMETEOROLOGICA G. ROSSI, A. CANCELLIERE, B. BONACCORSO, G. SCIUTO, A. CAMPISANO Dipartimento di Ingegneria Civile e Ambientale, Università di Catania V. PAVAN, S. MARCHESI, A. SELVINI, R.TOMOZEIU, M. DI LORENZO Servizio Idrometeorologico Emilia Romagna Abstract: I dati idrometeorologici acquisiti in telemisura sono potenzialmente affetti da errori che possono pregiudicare l’affidabilità del monitoraggio in tempo reale dei fenomeni idrologici. Poiché il controllo tradizionale dei dati non è compatibile con le necessità del monitoraggio in tempo reale di elaborare e rendere disponibili in tempi brevi le informazioni relative all’evolversi dei fenomeni in studio, è necessario ricorrere a metodologie di controllo automatico dei dati, che consentano di individuare tra i numerosi dati acquisiti, quelli presumibilmente soggetti ad errori, riducendo così notevolmente i tempi per la verifica dei dati stessi. In tale contesto si inserisce il presente capitolo, in cui viene presentata una procedura per il controllo della qualità dei dati di precipitazione e temperatura mensili, sviluppata dal DICA dell’Università di Catania e due procedure per il controllo di dati giornalieri acquisiti da reti in telemisura sviluppate rispettivamente dall’ARPA Emilia Romagna e dal DICA dell’Università di Catania. Le procedure proposte consentono l’attribuzione di un giudizio di qualità in base al quale i dati si considerano validati, ovvero non validati e, quindi, da sottoporre ad ulteriori controlli di tipo manuale. Key words: misure meteorologiche, qualità dei dati, metodi statistici, idrologia. 80 G. Rossi, A. Cancelliere, B. Bonaccorso, G. Sciuto, A. Campisano, V. Pavan, S. Marchesi, A. Selvini, R.Tomozeiu, M. Di Lorenzo 4.1 INTRODUZIONE I dati idrometeorologici acquisiti in telemisura sono potenzialmente affetti da errori derivanti da molteplici cause che ne possono pregiudicare un utilizzo finalizzato al monitoraggio in tempo reale dei fenomeni idrologici (Madsen, 1989). In questo caso infatti, i tempi necessari per un controllo tradizionale dei dati, basato su una ispezione “manuale” dei dati stessi, non sono compatibili con la necessità di elaborare e rendere disponibili in tempi brevi le informazioni relative all’evolversi del fenomeno in studio. Appare necessario quindi lo sviluppo e la predisposizione di metodologie di controllo automatiche dei dati, che consentano di effettuare una analisi preliminare delle informazioni acquisite in telemisura e di segnalare eventuali anomalie nelle osservazioni (Abbott, 1986; Reek, 1992). Tali anomalie possono essere oggetto di ulteriori analisi da parte dell’operatore il quale, basandosi sulla propria esperienza e buon senso è in grado di giudicare la qualità del dato stesso. Le procedure di controllo consentono quindi di effettuare una selezione tra i numerosi dati acquisiti in tempo reale e di segnalare soltanto quelli presumibilmente soggetti ad errori, riducendo così notevolmente i tempi per la verifica dei dati stessi. Le procedure automatiche di controllo della qualità dei dati sono anche molto importanti nel caso che si debba procedere alla valutazione delle serie storiche di dati idrometeorologici raccolte con reti tradizionali nel passato. Anche in questo caso risulta d’indubbio interesse la possibilità di ridurre il dati su cui procedere ad una verifica manuale. E’ evidente che il livello di controllo e di automazione varia in dipendenza delle scale temporali su cui si analizzano i dati. E’ infatti molto più facile che sistemi di controllo automatizzati possono rilevare anomalie sui dati alla scala mensile che non alla scala giornaliera. In questo capitolo viene presentata una procedura per il controllo della qualità dei dati di precipitazione e temperatura mensili, sviluppata dal DICA dell’Università di Catania e due procedure per il controllo di dati giornalieri acquisiti da reti in telemisura sviluppate rispettivamente dall’ARPA Emilia Romagna e dal DICA dell’Università di Catania. In particolare le procedure del DICA sono state verificate testate con i dati acquisiti dalla rete in telemisura gestite dal ex Ufficio Idrografico Regionale della Sicilia, oggi Agenzia Regionale per i Rifiuti e le Acque Settore Osservatorio delle Acque della Regione Siciliana, mentre quella proposta dall’ARPA Emilia Romagna per i dati giornalieri è stata applicata dallo stesso ente a tutto il territorio della regione. Procedure di controllo di qualita’ dei dati provenienti dalla rete idrometeorologica 4.2 VALIDAZIONE DEI DATI MENSILI DI TEMPERATURA (PROCEDURA DICA-UNICT) ** 4.2.1 PIOGGIA 81 E PROCEDURA DI CONTROLLO La procedura si basa sulle esperienze già condotte dal Dipartimento di Ingegneria Civile e Ambientale di Catania (Campisano et al., 2002). Per ciascuna stazione la metodologia prevede che il dato rilevato venga confrontato con i dati storici relativi allo stesso intervallo temporale e alla stessa stazione verificando che ricada all’interno di fasce di confidenza di fissata probabilità. Tale metodologia è integrata con un controllo di tipo spaziale, basato sul concetto che ad una scala temporale sufficientemente ampia gli eventi idrologici possiedono una limitata variabilità spaziale e, per conseguenza, risulta possibile verificare la correttezza del dato osservato nella stazione in esame mediante il confronto con quelli osservati in opportune stazioni vicine, dette stazioni di riferimento. In particolare, sulla base dei dati storici disponibili vengono determinate le leggi di regressione multipla tra le serie di dati registrati nella stazione in esame e le serie di dati contemporaneamente registrati nelle stazioni di riferimento. L’analisi di regressione multipla consente di valutare i valori stimati dei dati della stazione in esame sulla base dei valori osservati delle stazioni di riferimento e di determinare le fasce di confidenza del dato stimato entro le quali il dato in telemisura nella stazione deve ricadere per essere validato. Il risultato del confronto prevede l’assegnazione al dato di una delle 4 possibili classi di qualità sotto elencate: 1. 2. 3. 4. Dato Validato (V); Dato Incerto (I); Dato Non Validato Automaticamente (NV); Dato Rifiutato (R). Tale attribuzione dipende dal superamento di uno, entrambi o nessuno dei test di controllo riguardanti il dato corrente registrato in una stazione. La metodologia proposta è stata applicata alle medie mensili delle temperature medie giornaliere e ai totali mensili di precipitazione. Essa prevede due fasi: la prima riguarda la “calibrazione” dei modelli di controllo mediante le due categorie di fasce di confidenza e la seconda riguarda il controllo del dato acquisito in telemisura. ** G. ROSSI, A. CANCELLIERE, A. CAMPISANO Dipartimento di Ingegneria Civile e Ambientale, Università di Catania 82 G. Rossi, A. Cancelliere, B. Bonaccorso, G. Sciuto, A. Campisano, V. Pavan, S. Marchesi, A. Selvini, R.Tomozeiu, M. Di Lorenzo I principali passi delle due fasi di calibrazione e controllo proposte sono riassunti in figura 4.1. In particolare, la procedura di controllo per i dati mensili si articola nei seguenti passi: a) Fase di calibrazione 1. acquisizione delle serie dei dati storici delle temperature o delle precipitazioni e determinazione delle medie mensili delle temperature medie giornaliere o delle precipitazioni totali mensili; 2. costruzione di fasce di confidenza della temperatura o della precipitazione del mese espresse in termini di probabilità di non superamento calcolata sulla serie storica disponibile (ad es. fascia più restrittiva 2,5% e 97,5% e fascia più ampia 0,5% e 99,5%); 3. scelta preliminare delle stazioni termometriche o pluviometriche di riferimento sulla base sia della contiguità spaziale, dell’altitudine e della esposizione del versante sia della disponibilità di sufficienti osservazioni storiche in base alle quali adattare i modelli di regressione; 4. adattamento delle regressioni multiple che esprimono il dato della temperatura media mensile o della precipitazione totale mensile della stazione in esame in funzione dei contemporanei dati delle stazioni di riferimento; 5. calcolo dei parametri necessari alla costruzione di fasce di confidenza del dato stimato sulla base della regressione multipla; 6. stima del dato tramite regressione multipla utilizzando i dati nelle stazioni di riferimento; 7. validazione dei metodi proposti per il controllo dei dati (verifica che il dato osservato nei mesi di alcuni anni non utilizzati per la costruzione delle fasce di confidenza ricada nelle fasce di confidenza della stazione e in quelle relative ai dati stimati con la regressione multipla in funzione dei dati delle stazioni di riferimento). b) Fase di controllo 1. controllo che il dato corrente registrato (ottenuto come media delle temperature o come somma delle precipitazioni trasmesse dall’apparecchio in telemisura nel mese) rientri nelle fasce di confidenza della stessa stazione per le probabilità fissate; 2. confronto tra dato corrente registrato e dato stimato sulla base dei dati delle stazioni di riferimento mediante la verifica che il dato rientri all’interno delle fasce di confidenza ottenute tramite analisi di regressione multipla; 3. accettazione del dato se entrambi i test sono superati per la fascia di confidenza più restrittiva e classificazione del dato con giudizio di qualità “validato” (V) senza procedere a controllo manuale; Procedure di controllo di qualita’ dei dati provenienti dalla rete idrometeorologica 83 4. nel caso che uno o entrambi i test non vengano superati per la fascia di confidenza più restrittiva ma entrambi sono superati per la fascia più ampia, classificazione del dato con giudizio di qualità “incerto” (I) procedendo al controllo manuale; 5. nel caso che uno dei test non sia superato per la fascia di confidenza più ampia classificazione del dato con giudizio di qualità “non validato automaticamente” (NV) procedendo al controllo manuale; 6. nel caso che entrambi i test non vengano superati per la fascia di confidenza più ampia, classificazione del dato come “rifiutato” (R), procedendo comunque al controllo manuale; 7. confronto tra dato corrente registrato e dato stimato sulla base dei dati delle stazioni di riferimento mediante la verifica che il dato rientri all’interno delle fasce di confidenza ottenute tramite analisi di regressione multipla; 8. accettazione del dato se entrambi i test sono superati per la fascia di confidenza più restrittiva e classificazione del dato con giudizio di qualità “validato” (V) senza procedere a controllo manuale; 9. nel caso che uno o entrambi i test non vengano superati per la fascia di confidenza più restrittiva ma entrambi sono superati per la fascia più ampia, classificazione del dato con giudizio di qualità “incerto” (I) procedendo al controllo manuale; 10. nel caso che uno dei test non sia superato per la fascia di confidenza più ampia classificazione del dato con giudizio di qualità “non validato automaticamente” (NV) procedendo al controllo manuale; 11. nel caso che entrambi i test non vengano superati per la fascia di confidenza più ampia, classificazione del dato come “rifiutato” (R), procedendo comunque al controllo manuale. Nella tabella 4.1 sono riassunti i possibili esiti della procedura di controllo automatica. 84 G. Rossi, A. Cancelliere, B. Bonaccorso, G. Sciuto, A. Campisano, V. Pavan, S. Marchesi, A. Selvini, R.Tomozeiu, M. Di Lorenzo Tabella 4.1 - Possibili esiti della procedura di controllo automatica Test 1 (Dati ricadenti nella fascia della stessa stazione) 95% Test 2 (Dati ricadenti nella fascia della regressione) 99% 95% Giudizio di qualità dato Operazione 99% SI SI SI SI Validato (V) Accettazione NO SI SI SI Incerto (I) Controllo manuale SI SI NO SI Incerto (I) Controllo manuale NO SI NO SI Incerto (I) Controllo manuale NO SI NO NO Non validato autom. (NV) Controllo manuale NO NO NO SI Non validato autom. (NV) Controllo manuale NO NO SI SI Non validato autom. (NV) Controllo manuale SI SI NO NO Non validato autom. (NV) Controllo manuale NO NO NO NO Rifiutato (R) Controllo manuale La procedura di controllo manuale potrà comunque consentire, nel caso di esito positivo, di riclassificare come “validato” il dato “incerto”, quello “non validato automaticamente” e anche quello “rifiutato”. Nel caso invece che la procedura di controllo manuale fornisca esito negativo per dati classificati come “incerti” con la procedura automatica, tali dati potranno rimanere classificati come “incerti”. Se l’esito negativo del controllo manuale riguarda dati già classificati come “non validati automaticamente” o “rifiutati”, tali dati verranno definitivamente classificati come “rifiutati”. Procedure di controllo di qualita’ dei dati provenienti dalla rete idrometeorologica Dati storici relativi alla stazione in esame Dati storici relativi alle stazioni di riferimento Determinazione fasce di confidenza probabilistiche mediante i dati storici della stazione Calcolo dei parametri delle regressioni con le stazioni di riferimento e determinazione fasce di confidenza 85 Dato acquisito in telemisura Verifica basata sulle fasce di confidenza della stazione in esame Verifica basata sulle fasce di confidenza delle regressioni Classificazione dato con giudizio di qualità Dato validato Dato incerto Dato non validato automaticamente Dato rifiutato Controllo manuale Figura 4.1 - Fasi della procedura di controllo automatico di dati mensili Nel seguito si riportano i dettagli della metodologia sviluppata mentre per le applicazione si rimanda alle appendici A2 e A3 rispettivamente per i dati di temperatura media mensile e precipitazione mensile. 86 G. Rossi, A. Cancelliere, B. Bonaccorso, G. Sciuto, A. Campisano, V. Pavan, S. Marchesi, A. Selvini, R.Tomozeiu, M. Di Lorenzo 4.2.2 4.2.2.1 CONTROLLO DEI DATI DI TEMPERATURA MEDIA MENSILE Fasce di confidenza basate sui dati della stazione La prima fase della metodologia proposta per il controllo dei dati di temperatura prevede che il dato mensile corrente acquisito in telemisura (temperatura media mensile) venga confrontato con le temperature osservate nella stessa stazione nel passato e per lo stesso mese. Tale confronto viene effettuato verificando che il dato stesso rientri all’interno di fasce di confidenza della temperatura del mese determinate in corrispondenza di prefissate probabilità di non superamento calcolate sulle serie storiche disponibili. In particolare le serie dei dati delle temperature mensili possono essere regolarizzate mediante le usuali tecniche statistiche utilizzando varie distribuzioni di probabilità e determinando per le distribuzioni relative ai vari mesi i valori corrispondenti a opportuni limiti di confidenza inferiore e superiore della probabilità di non superamento. Appare opportuno scegliere come distribuzioni di probabilità candidate all’adattamento della distribuzione di frequenza delle serie delle temperature di ciascun mese le distribuzioni normale, lognormale e normale delle radici cubiche. I parametri possono essere stimati mediante il metodo della massima verosimiglianza, mentre la bontà di adattamento delle distribuzioni analizzate viene verificata mediante il test del χ2. Se si indica con V j la media della variabile trasformata Vi , j (ad es Vi , j = ln Ti , j ) e con SV , j lo s.q.m. della stessa, gli estremi dell’intervallo di confidenza di probabilità P=1- α saranno: Vi ,α / 2 , Vi ,1−α / 2 = V j m u α 2 SV , j (4.1) dove uα/2 è il quantile di una variabile normale standard corrispondente ad una probabilità di non superamento α/2. I corrispondenti valori di temperatura mensile si otterrano mediante V l’antitrasformata (ad es. T 4.2.2.2 j, α =e j, α 2 per la log-normale). 2 Fasce di confidenza basate sui dati di stazioni limitrofe Per la costruzione delle fasce di confidenza della temperatura media mensile basate sui dati di stazioni di riferimento si è assunto un legame lineare tra il dato mensile Z i , j misurato nella stazione in esame e i contemporanei dati Z i(,1j) , Z i(,2j) ,…, Z i(,kj) misurati nell’anno i e nel mese j nelle k stazioni di riferimento del tipo: Procedure di controllo di qualita’ dei dati provenienti dalla rete idrometeorologica 87 Z i , j = b (j0 ) + b (j1) Z i(,1j) + b (j2 ) Z i(,2j) + ... + b (jk ) Z i(,kj) + ε i , j (4.2) Il termine ε i, j rappresenta una variabile normale avente media zero e varianza σ ε2 che si assume indipendente da Z i(,1j) , Z i(,2j) ,…, Z i(,kj) . Considerando il campione Z i , j , i=1,…, n, costituito dai valori osservati negli n anni di osservazione di un generico mese j e i k campioni costituiti dalle osservazioni contemporanee nelle k stazioni di riferimento Z i(,1j) , Z i(,2j) ,…, Z i(,kj) , si possono definire il vettore Y j (n × 1) della stazione in esame e la matrice X j (n × (k + 1)) relativa alle stazioni di riferimento come: Y j = [Z 1, j ⎡1 Z ⎢ 1 Z Xt = ⎢ ⎢M M ⎢ (1) ⎢⎣1 Z n , j (1) 1, j (1) 2, j Z 2, j Z Z ... Z n , j ] (2) 1, j (2) 2, j M Z n( 2, j) T (4.3) ⎤ ⎥ ⎥ O M ⎥ ⎥ L Z n( k, j) ⎥⎦ L Z L Z (k ) 1, j (k ) 2, j (4.4) [ Una volta valutato il vettore dei parametri b j = b (j0 ) b (j1) ... b (jk ) ] T mediante la relazione matriciale (Kottegoda e Rosso, 1997): T b j = (X j X j ) −1 X Tj Y j (4.5) è possibile determinare, a partire dalle osservazioni nelle stazioni di riferimento, un intervallo che contiene con prefissata probabilità l’osservazione Z i , j nella [ stazione in esame. In particolare, indicando con Ζ i , j = 1 Z i(,1j) ] Z i(,2j) ... Z i(,kj) il vettore delle osservazioni nelle stazioni di riferimento e con Zˆ i , j il dato stimato tramite la regressione multipla Zˆ i , j = Z i , j b j , i limiti di tale intervallo (con livello di confidenza P=1-α) possono essere espressi in funzione dei parametri della regressione e dei dati osservati tramite la relazione (Kottegoda e Rosso, 1997): Z j ,α / 2 , Z j ,1−α / 2 = Zˆ i , j m t n − p , α 2 σˆ dove T 1 + Z i , j (X j X j ) −1 Z i , j T (4.6) σ̂ 2 è la varianza dei residui della regressione e t n − p , α 2 è il quantile di una variabile t di Student con n-p gradi di libertà e corrispondente ad una probabilità di superamento α/2. Qualora il valore osservato non rientri in tale intervallo, il dato può considerarsi quindi potenzialmente soggetto ad errori per la probabilità fissata e andrà sottoposto ad ulteriori verifiche. 88 G. Rossi, A. Cancelliere, B. Bonaccorso, G. Sciuto, A. Campisano, V. Pavan, S. Marchesi, A. Selvini, R.Tomozeiu, M. Di Lorenzo 4.2.3 CONTROLLO DEI DATI DI PRECIPITAZIONE MENSILE Fasce di confidenza basate sui dati della stazione 4.2.3.1 La definizione delle fasce di confidenza probabilistiche per la precipitazione non può essere condotta con la stessa metodologia applicata ai dati di temperatura in quanto in questo caso i dati possono assumere il valore zero con probabilità non nulla, specialmente nei mesi estivi. La presenza di zeri fa sì che la distribuzione di probabilità cumulata del dato pluviometrico debba essere considerata come una combinazione di una funzione discreta e di una continua. In particolare, indicando con po la probabilità di avere precipitazione nulla e con FY(hi,j) la distribuzione di probabilità cumulata dei valori di precipitazione non nulli, la distribuzione di probabilità cumulata dei valori di precipitazione FX(hi,j) può essere scritta come: ⎧ ⎪ po se hi , j ≤ 0 FX ( hi , j ) = ⎨ ⎪ po + (1 − po )FY ( hi , j ) se hi , j > 0 ⎩ (4.7) il valore di precipitazione hq corrispondente ad una probabilità di non superamento q può essere derivato dalla espressione precedente come: ⎧ ⎪⎪0 se q ≤ po hq = ⎨ ← ⎛ q − po ⎞ ⎟⎟ se hi , j > 0 ⎪ FY ⎜⎜ ⎝ 1 − po ⎠ ⎩⎪ (4.8) dove FY← è l’inversa della distribuzione di probabilità cumulata, ovvero il quantile corrispondente ad un dato valore di probabilità. Questa espressione consente quindi di determinare le fasce di confidenza fissati due livelli di probabilità q (ad es. 2,5% e 97,5%) che rappresentano l’intervallo entro cui deve ricadere il dato osservato affinché esso possa essere considerato attendibile. Con riferimento ad una serie di precipitazioni mensili hi,j (i=anno, j=mese). la procedura per la costruzione delle fasce di confidenza nel generico mese j può essere così riassunta: − analisi di frequenza dei valori nulli e stima della probabilità p0 tramite l’espressione: ∑ (I { }(h )) n po = 0 i =1 n i, j (4.9) Procedure di controllo di qualita’ dei dati provenienti dalla rete idrometeorologica 89 ( ) dove la funzione indicatore I {0} hi , j assume il valore 1 se hi,j è uguale a zero, zero altrimenti e n è il numero di anni di osservazione; − adattamento di una distribuzione di probabilità cumulata FY(x) ai dati di precipitazione non nulli; − per fissati q (0,5%, 2,5%, 97,5%, 99,5%), calcolo dei quantili tramite l’equazione 4.8. 4.2.3.2 Fasce di confidenza basate sui dati sui dati di stazioni limitrofe La metodologia per la costruzione delle fasce di confidenza basate sulla regressione nel caso di dati pluviometrici è sostanzialmente identica a quella prima esposta per il caso di dati termometrici. L’unica differenza di rilievo è che nel caso in cui l’estremo inferiore della fascia di confidenza dovesse risultare negativo, occorre troncare tale valore a zero. 4.3 PROCEDURE OPERATIVE PER LA VALIDAZIONE DI DATI GIORNALIERI DI TEMPERATURA E PRECIPITAZIONE (PROCEDURA ARPA-EMILIA ROMAGNA) †† Le procedure di validazione proposte nel presente paragrafo si basano sulle esperienze condotte dall’ARPA (Agenzia Regionale Prevenzione e Ambiente) dell’Emilia Romagna e sono applicata al controllo della qualità dei dati giornalieri di precipitazione e di temperatura (massima e minima). Altre procedure, sviluppate dal Dipartimento di Ingegneria Civile e Ambientale dell’Università di Catania sono riportate nel paragrafo 4.4) Le tecniche di validazione qui descritte possono essere applicate solo nel caso siano disponibili serie temporali sufficientemente lunghe (di almeno trenta o quaranta anni di dati) sia per la stazione da controllare, che per alcune stazioni circonvicine, e che si abbia una conoscenza delle caratteristiche principali del clima della regione in cui è collocata la stazione da controllare. Le tecniche di controllo non includono controlli incrociati fra precipitazione e temperatura. Infine, le soglie che definiscono la validità dei dati sono state scelte empiricamente in modo tale da minimizzare il numero di dati apparentemente validi, scartati dal controllo di qualità, e nello stesso tempo massimizzare l’identificazione di possibili dati erronei. †† V. PAVAN, S. MARCHESI, A. SELVINI, R.TOMOZEIU, M. DI LORENZO Servizio Idrometeorologico Emilia Romagna 90 G. Rossi, A. Cancelliere, B. Bonaccorso, G. Sciuto, A. Campisano, V. Pavan, S. Marchesi, A. Selvini, R.Tomozeiu, M. Di Lorenzo Al termine del controllo di qualità ad ogni dato è associata una flag che consiste in un numero intero che può assumere i valori 0, 1 e 2. Se la flag ha valore 0, il dato è valido, se la flag ha valore 1, il dato è considerato sospetto, ma può essere usato, se infine la flag ha valore 2, il dato non ha passato il controllo di qualità, è molto probabilmente sbagliato e bisogna evitare di usarlo. Nel seguito, prima è descritta la procedura di controllo di qualità per i dati di temperatura, poi per quelli di precipitazione. 4.3.1 CONTROLLO DI QUALITÀ DELLA TEMPERATURA MASSIMA E MINIMA Prima di iniziare il controllo di qualità è necessario che per ogni stazione siano identificate le stazioni di riferimento. Si propone di adottare cinque stazioni vicine da identificare automaticamente sulla base dei dati di anagrafica delle stazioni, facendo uso del solo criterio della distanza. Per ogni stazione sono calcolate le distanze da tutte le altre stazioni disponibili e quindi sono riordinate in base al criterio di distanza crescente. A questo punto, le prime otto stazioni sono usate come riferimento per la stazione analizzata. Questa scelta trascura completamente l’informazione riguardante la quota della stazione. Da un lato, questo è possibile perché, diversamente dal caso della precipitazione, la componente di variabilità della temperatura legata a spostamenti orizzontali è molto più bassa rispetto alla sua variabilità temporale. Inoltre, prima di applicare il controllo di qualità, i dati sono normalizzati rispetto al clima della stazione di appartenenza. Questa tecnica permette di ridurre in gran parte la dipendenza dei dati dalla quota della stazione considerata. Fatto ciò, il dato è controllato confrontandolo con il clima giornaliero‡‡ della stazione, sia per quanto riguarda il suo valore che per la sua variazione sulle 24 ore, facendo uso di soglie caratteristiche per ogni stazione, ed entrambi questi controlli risultano essere sufficientemente indipendenti dalla quota della stazione stessa. Dall’altro, questa scelta è resa necessaria dal ridotto numero di stazioni disponibili che rende la distanza media fra stazioni molto grande, soprattutto per certe fasce di altitudine. ‡‡ Data una serie temporale di “n” anni di dati giornalieri xki, (“k” è l’indice degli anni, “i” è l’indice dei giorni) abbiamo definito come clima giornaliero del giorno “i” la grandezza: c(i ) = 1 n ⎛ ⎛ 1 ⎞ i+ j ⎞ ⎟ ∑ x kj ⎟ , cioè come media mobile su 5 giorni centrata nel ∑⎜⎜ n k =1 ⎜⎝ ⎜⎝ 2 j + 1 ⎟⎠k =i − j ⎟⎠ giorno “i” valutata sugli “n” anni a disposizione. Nel nostro caso “j” è stato considerato uguale a 2 Procedure di controllo di qualita’ dei dati provenienti dalla rete idrometeorologica 91 Il controllo della temperatura minima e massima giornaliera si ottiene quindi facendo passare i dati in successione attraverso tre gruppi di controlli: controlli di tipo logico, controlli di tipo climatologico e controlli di tipo temporale. Qualora un dato non superi uno dei criteri sotto elencati, gli è assegnata una flag non nulla. a) Controlli logici Inizialmente, il dato viene fatto passare attraverso i seguenti controlli: 1. 2. se il dato ha un valore uguale al valore scelto per il dato mancante (nel nostro caso 3276.7), ad esso viene data una flag di valore 2; se Tmin o Tmax sono minori di un valore minimo o maggiori di un valore massimo assegnato, il dato è considerato sbagliato (flag=2). I dati sono considerati validi solo se -40.0oC < Tmin< 40.0oC oppure -30.0oC < Tmax< 50.0oC. Ulteriori controlli logici vengono fatti in chiusura del controllo di ogni coppia di valori giornalieri di temperatura. b) Controlli climatologici Il controllo climatologico si sviluppa in due stadi successivi. Prima di tutto, il dato è confrontato con il clima giornaliero (vedasi nota 1 precedente) della stazione presso la quale è stato rilevato. Si possono verificare le seguenti possibilità: 1. 2. se l’anomalia del dato rispetto alla climatologia del giorno in cui è stato rilevato è minore o uguale di due deviazioni standard, tipiche per quel giorno dell’anno e quella stazione, allora il dato viene considerato corretto (flag=0); se l’anomalia è maggiore di tre deviazioni standard, allora si procede ad un’ulteriore indagine di confronto del dato con quelli delle stazioni vicine (controllo spaziale). Il controllo spaziale, applicato ai soli dati possibilmente sbagliati, mette di fronte alle seguenti possibilità: 1. 2. se sono definiti i dati in almeno tre delle stazioni vicine, e il valore rilevato presso almeno una di queste ha una anomalia rispetto alla sua climatologia di quel giorno maggiore di due deviazioni standard, il dato viene considerato corretto (flag=0); se, sono definiti i dati in almeno tre delle stazioni vicine, e in nessuna di esse è stato rilevato un dato con anomalia maggiore di due deviazioni standard, il dato viene considerato non valido (flag=2). 92 G. Rossi, A. Cancelliere, B. Bonaccorso, G. Sciuto, A. Campisano, V. Pavan, S. Marchesi, A. Selvini, R.Tomozeiu, M. Di Lorenzo 3. Se infine mancano i dati necessari per il controllo spaziale, si assegna al dato flag 1. c) Controlli temporali I dati sono sottoposti a due tipi di controllo temporale. Da un lato si verifica che la variazione della temperatura minima e massima in 24 ore non superi una soglia assegnata; dall’altro viene fatto un controllo sulle persistenze, definite come quei casi in cui il valore della temperatura da un giorno a quello successivo non varia (al decimo di grado). Il controllo sulla variazione giornaliera di temperatura (variazione di Tmin o Tmax sulle 24h) mette di fronte alle seguenti possibilità: 1. se la variazione osservata presso la stazione è minore di tre volte il suo valore quadratico medio§§ per quel giorno e quella stazione, il dato viene considerato valido (flag=0); 2. se la variazione osservata è maggiore di tre volte il suo valore quadratico medio, il dato viene considerato sospetto e si procede al controllo dell’escursione termica giornaliera (Tmax-Tmin): a) se questa grandezza non è definita o nel giorno in esame o in quello precedente (per mancanza di dati) non si può procedere ad ulteriori accertamenti il dato viene considerato sospetto (flag=1); b) se questa grandezza è definita nel giorno in esame e nel giorno precedente, e la sua variazione in 24 ore è minore della sua variazione quadratica media per la stazione e il giorno di calendario in esame, il valore viene considerato valido (flag=0); c) se questa grandezza è definita nel giorno in esame e nel giorno precedente, e la sua variazione in 24 ore è maggiore della sua variazione quadratica media per la stazione e il giorno di calendario in esame, allora si procede ai seguenti controlli: prima di tutto si considera il valore della sua variazione nelle stazioni più vicine. Se, in almeno una stazione, la variazione in 24 ore dell’escursione termica supera la variazione quadratica media §§ Il valore quadratico medio dello scarto inter-giornaliero (variazione in 24 ore) della Tmin (Tmax) è definito come: n s = ∑ (Ti , k − Ti ±1, k ) / n dove “n” è il numero di anni sui quali viene calcolata la media, 2 k =1 “i” è l’indice dei giorni e “k” è l’indice degli anni, T è indifferentemente la temperatura minima o la massima Procedure di controllo di qualita’ dei dati provenienti dalla rete idrometeorologica 93 per quella stazione e quel giorno, allora il dato viene considerato buono (flag=0); se il valore di temperatura del giorno prima era stato considerato non valido perché non aveva passato il controllo temporale o perchè si era verificata una persistenza che non aveva passato il controllo di qualità, allora il dato del giorno in esame viene considerato valido (flag=0) in quanto si ritiene inadeguato scartare un dato sulla base di un confronto con un dato sbagliato; Se, dopo i controlli fatti, non è ancora chiaro se il valore possa essere considerato o no corretto, vengono fatti due ulteriori controlli, così da verificare se i problemi riscontrati con il valore in questione siano invece dovuti al valore rilevato il giorno prima, che ha comunque già passato il controllo di qualità. Ci sono due possibilità: - - La forte variazione di temperatura in realtà sia avvenuta il giorno precedente, senza essere rilevata. Un valore del giorno prima vicino alla persistenza, ma non esattamente uguale a quello per giorno precedente ad esso, per esempio, potrebbe avere superato il controllo di qualità pur essendo sbagliato. Nessuna variazione di temperatura sia avvenuta in realtà e il valore sbagliato sia quello del giorno in questione. Questo giustificherebbe la presenza di una variazione giornaliera intensa, senza alcun riscontro con quanto successo realmente. Per controllare se si è verificato uno dei 2 casi ora citati si crea una serie temporale di riferimento per gli ultimi tre giorni in questione mediando i valori corretti rilevati presso le stazioni vicine. Quindi si procede come segue: o o se si può calcolare la variazione sulle 24h sia per il giorno in esame che per il giorno prima e sia per la stazione in esame che per la serie di riferimento e se il rapporto fra la variazione sulle 24 del giorno prima nella serie di riferimento e quella nella stazione in esame è maggiore di 2.0, allora si assume che il forte cambiamento temporale sia avvenuto il giorno prima e quindi viene data una flag uguale a 2 al valore del giorno prima, mentre il valore in esame viene considerato corretto (flag=0); alternativamente, si confronta il valore in esame con quelli dei due giorni precedenti. Ciò si fa calcolando la derivata seconda temporale alle differenze finite centrata nel giorno precedente (definita come (Td - 2Td-1 + Td-2)/Δ dove d è il giorno in 94 G. Rossi, A. Cancelliere, B. Bonaccorso, G. Sciuto, A. Campisano, V. Pavan, S. Marchesi, A. Selvini, R.Tomozeiu, M. Di Lorenzo o questione e Δ è pari a 1 giorno). Se il rapporto fra tale derivata per la stazione in esame e per la serie di riferimento è maggiore di 2 si assume che si sia verificato un errore nei dati. Se il segno della variazione di temperatura del giorno prima è uguale per la stazione in esame e per quella della serie di riferimento, il valore in esame è considerato errato (flag=2) e quello del giorno prima corretto (flag=0). Alternativamente si considera sbagliato il dato del giorno precedente e corretto il dato del giorno in esame; se mancano i dati per procedere agli accertamenti sopra descritti, si assegna flag 1 al dato che viene considerato sospetto. Questo conclude il controllo temporale sulla variazione giornaliera di temperatura. Il controllo sulle persistenze procede nel seguente modo: 1. se il valore rilevato un giorno è uguale (al decimo di grado) a quello rilevato il giorno prima, allora il dato viene considerato sospetto e viene confrontato con la media delle stazioni vicine (dato di riferimento). Se il dato di riferimento è definito insieme alla sua variazione giornaliera (almeno tre delle stazioni vicine sono funzionanti e non riportano persistenze) e la sua variazione giornaliera in quel giorno specifico è maggiore del suo valore quadratico medio (calcolato come funzione del giorno e del mese di calendario), allora il dato è considerato non valido (flag=2). Se nei giorni successivi il valore della temperatura continua ad essere persistente, tutti i dati si considerano non validi (flag=2) fino a che la persistenza si interrompe; 2. se il valore rilevato un giorno è uguale (al decimo di grado) a quello rilevato il giorno prima, e il dato di riferimento non è definito per mancanza di dati presso le stazioni vicine il dato viene considerato sospetto, ma non necessariamente sbagliato (flag=1); 3. in tutti gli altri casi il dato viene considerato valido. E’ opportuno notare che il controllo sulle persistenze funziona solo se tali persistenze sono distribuite nelle stazioni in modo casuale. Purtroppo ciò non risulta essere sempre vero per le stazioni non automatiche: esistono date in cui è più probabile che si verifichino persistenze (ad esempio intorno alle festività principali come Natale, Capodanno, Epifania, Pasqua, Ferragosto, ecc…) In questi casi spesso più di una delle stazioni circonvicine presenta persistenza e talvolta può essere difficile trovare un numero minimo di stazioni vicine con dati utilizzabili. E’ possibile dunque che persistenze non accettabili non siano individuate a causa della Procedure di controllo di qualita’ dei dati provenienti dalla rete idrometeorologica 95 bassa qualità dei dati disponibili. In pratica questo succede solo per un numero molto limitato di casi. d) Controlli logici finali Il controllo di qualità della temperatura si conclude con un gruppo di controlli logici fra Tmax e Tmin. Tmin = Tmax. Se i due valori sono identici, la stazione è collocata ad una altitudine inferiore a 500m slm e il giorno considerato è incluso nel periodo fra l’inizio di aprile e fine settembre si assume che si sia verificato un errore nella registrazione del dato e per assegnare una flag si procede nel seguente modo: • • • se ad uno dei due dati è stato precedentemente assegnato un valore 2 di flag, si assume che l’errore sia già stato identificato e il controllo di qualità si considera chiuso se ad uno dei due dati è stato assegnato un valore 1 di flag, allora si incrementa tale flag a 2, assumendo che sia questo dei due dati quello meno credibile se sia Tmax che Tmin hanno superato senza problemi il controllo di qualità, non essendo in alcun modo chiaro quale dei due sia sbagliato, entrambi vengono scartati e ad entrambi viene assegnata una flag 2. Tmin > Tmax . Questo controllo consiste nel controllare se Tmin è maggiore di Tmax per il giorno in questione. Se ciò accade allora • • • se ad uno dei due dati, o ad entrambi è già stata assegnata una flag 2, il controllo del dato si considera concluso; se ad uno dei due dati, o ad entrambi è già stata assegnata una flag 1, ma nessuno ha flag 2, tale flag viene posta uguale a 2; se entrambi i dati hanno flag 0, la flag di entrambi viene posta uguale a 2. Confronto incrociato con il giorno prima. Questo controllo si ispira al controllo incrociato fatto tradizionalmente presso gli Uffici Idrografico e Mareografico e si basa sul fatto che i valori della Temperatura massima e minima giornalieri vengono rilevati utilizzando o un termometro a massima e minima o un termografo, e si può assumere che gli estremi di temperatura siano individuati a partire da una funzione continua nel tempo. In entrambi i casi, i valori dei due parametri coincidono con gli effettivi valori massimi e minimi assunti dalla temperatura indipendentemente 96 G. Rossi, A. Cancelliere, B. Bonaccorso, G. Sciuto, A. Campisano, V. Pavan, S. Marchesi, A. Selvini, R.Tomozeiu, M. Di Lorenzo dall’ora in cui essi si verificano. Questo confronto consta di due controlli successivi: • • • La differenza fra Tmax del giorno precedente e Tmin del giorno corrente deve essere maggiore di -1.0 (ciò tiene conto che l’errore sulla differenza sia la somma dei due possibili errori di lettura del dato, che si assume siano minori o uguali di 0.5°C). Se ciò non si verifica allora se uno dei due dati, o entrambi, hanno già una flag 2, il controllo dei dati si considera concluso; se uno dei due dati, o entrambi, hanno una flag 1, ma nessuno ha flag 2, allora ogni valore di flag 1 viene posto uguale a 2 e si passa al controllo successivo; se entrambi i dati hanno flag 0, la flag di entrambi viene messa uguale a 2 e si passa al controllo successivo. La differenza fra Tmax del giorno corrente e Tmin del giorno precedente deve essere maggiore di -1.0. Se ciò non si verifica allora se uno dei due dati, o entrambi, hanno già una flag 2, si procede al fine controllo; se uno dei due dati, o entrambi, hanno una flag 1, ma nessuno ha flag 2, allora ogni valore di flag 1 viene posto uguale a 2 e si passa a fine controllo; se entrambi i dati hanno flag 0, la flag di entrambi viene messa uguale a 2 e si conclude il controllo. Questo conclude il processo di controllo di qualità della temperatura massima e minima. 4.3.2 CONTROLLO DI QUALITA’ DELLA PRECIPITAZIONE Il controllo di qualità della precipitazione si prefigge di identificare due diversi tipi di errori presenti nei dati. Da un lato, si vuole eliminare la presenza di valori eccessivi di precipitazione giornaliera non rispondenti a realtà, spesso dovuti o a errori di digitazione dati o alla registrazioni di valori di pioggia cumulata su più giorni, ma non identificati come tali. Dall’altro, si vogliono identificare periodi non segnalati di mancato funzionamento della stazione. Entrambi questi controlli si avvalgono del confronto del dato della stazione in esame con quelli rilevati presso otto stazioni situate nelle sue vicinanze (stazioni circonvicine). L’identificazione di tali stazioni procede in modo diverso rispetto a quello della temperatura per due motivi: il numero di stazioni disponibili in questo caso è maggiore che per la temperatura e la variazione con la quota della pioggia è complessa e la variazione con la distanza orizzontale fra le stazioni è molto maggiore che per la temperatura. Per questi motivi le otto stazioni più vicine a quella in esame devono anche avere una una quota sufficientemente vicina alla stazione in esame seguendo i seguenti criteri: Procedure di controllo di qualita’ dei dati provenienti dalla rete idrometeorologica • • 97 se la stazione in esame si trova a meno di 1000 m s.l.m. allora vengono considerate solo le stazioni che cadono ad una quota che differisca da quella della stazione stessa di meno di 200 m; se la stazione in esame si trova oltre i 1000 m s.l.m. allora vengono considerate solo le stazioni che cadono ad una quota che differisca da quella della stazione stessa di meno di 500 m. Tutti i controlli spaziali prevedono che siano disponibili almeno tre stazioni con dati rilevati validi. a) Controlli logici Prima di tutto si procede ad un gruppo di controlli logici: • • • se il dato coincide con il valore di dato mancante (nel caso dei dati in questione 3276.7), viene dato alla flag valore 2; se il dato coincide con il valore di dato cumulato (nel nostro caso –777.7) oppure se il valore del dato del giorno precedente è tale, il dato viene considerato non valido (flag=2); se infine il dato ha valore negativo, viene considerato non valido (flag=2). b) Eliminazione valori eccessivi Il controllo per eliminare i valori eccessivi di precipitazione non rispondenti a realtà si articola nel seguente modo: se il valore di precipitazione osservata è minore del valore climatologico o differisce dalla precipitazione media (valore climatologico) di quel giorno per quella stazione per meno di 5 deviazioni standard, allora il dato viene considerato valido (flag=0); se il valore differisce da quello climatologico per più di 5 deviazioni standard, il dato viene considerato sospetto e si procede ad ulteriori indagini. Il trattamento del dato cambia al variare della stagione considerata. Se il giorno in questione cade in estate (dall’1/6 al 31/8) allora il valore viene confrontato con il valore climatologico medio ottenuto sulla base dei soli giorni piovosi (precipitazione maggiore o uguale di 1.0 mm) nel corso della decade in questione (ogni mese viene diviso in tre decadi: dal 1 al 10, dall’11 al 20 e oltre il 20 del mese). se la differenza tra il valore osservato e quello climatologico è minore di 5 deviazioni standard allora si assume che il valore si riferisca ad un temporale intenso e viene ritenuto valido (flag=0). 98 G. Rossi, A. Cancelliere, B. Bonaccorso, G. Sciuto, A. Campisano, V. Pavan, S. Marchesi, A. Selvini, R.Tomozeiu, M. Di Lorenzo se la differenza tra il valore osservato e quello climatologico è maggiore di 5 deviazioni standard ma in almeno una delle stazioni vicine si osserva una precipitazione che differisca dal clima dei giorni piovosi della decade per più di 2 deviazioni standard, si assume che il valore analizzato si riferisca ad un evento sinottico localmente molto intenso e che sia dunque valido (flag=0); in tutti gli altri casi si assume che il dato sia sbagliato (flag=2). Nel caso il giorno in esame cada negli altri mesi dell’anno, si procede come segue se in almeno una delle stazioni vicine piove una quantità di pioggia che supera di due deviazioni standard il valore di pioggia climatologico (?) del giorno stesso, si assume che il dato sia valido (flag=0); alternativamente il dato viene considerato errato (flag=2). Concluso il controllo di piogge di intensità eccessiva, si passa alla identificazione dei periodi di mancato funzionamento della stazione non segnalati. c) Identificazione mancato funzionamento stazione non segnalato Innanzitutto, questo controllo si fa solo nel caso in cui si osservino 15 giorni successivi senza pioggia. A questo fine è necessario che non manchi alcun dato nel corso dei quindici giorni in esame, né alcun dato di questo periodo sia stato considerato sbagliato in base ai controlli precedentemente fatti riguardo all’intensità delle piogge giornaliere. Si procede, quindi, a controllare la validità dei dati raccolti nel corso di questi 15 giorni solo se esistono almeno tre stazioni circonvicine in cui siano stati rilevati i dati validi per i 15 giorni consecutivi in questione. In tal caso, si calcola sia la pioggia cumulata su questo periodo per ognuna delle stazioni vicine e si effettua la media su tutte, sia il numero di giorni di pioggia (con precipitazione giornaliera maggiore di 1.0 mm) per ogni stazione sul periodo e se ne fa la media sulle stazioni. Fatto ciò, se non sono disponibili almeno tre stazioni fra quelle circonvicine con cui confrontare i dati in questione, i dati vengono considerati sospetti (flag=1); se la precipitazione cumulata mediata fra le stazioni circonvicine è minore di 30.0 mm, i valori vengono considerati corretti (flag=0); se la quantità media di pioggia cumulata sulle stazioni è maggiore di 30.0 mm, ma il numero medio di giorni piovosi è minore o uguale a tre, si assume che la pioggia sia caduta nel corso di eventi temporaleschi, che possono non aver coinvolto la stazione in esame, e quindi si ritiene che la stazione abbia funzionato correttamente (flag=0); se la quantità media di pioggia cumulata sulle stazioni è maggiore di 10.0 mm, e il numero medio di giorni piovosi è maggiore di due, ma ci sono almeno due stazioni in cui la cumulata è minore o uguale a 15.0 mm, si Procedure di controllo di qualita’ dei dati provenienti dalla rete idrometeorologica 99 ritiene che la precipitazione sia dovuta ad eventi a carattere locale e che la stazione abbia funzionato correttamente (flag=0); alternativamente, se la quantità media di pioggia cumulata sulle stazioni è maggiore di 10.0 mm, il numero medio di giorni piovosi è maggiore di due e la pioggia cumulata è minore o uguale a 15.0 mm al massimo in una stazione di quelle circonvicine, si conclude che la stazione non abbia funzionato correttamente nel corso degli ultimi 15 giorni e tutti i dati relativi a questo periodo per la stazione in esame vengono considerati non validi (flag=2). Nel caso sia stata individuata una serie di 15 valori non validi, ogni valore nullo successivo viene automaticamente considerato non valido fino al primo giorno di precipitazione con valore non nullo. Il primo giorno di precipitazione seguente ad un periodo non valido viene anch’esso considerato non valido, dal momento che probabilmente è da identificarsi con un valore di pioggia cumulata, non segnalato. Questo controllo termina la procedura di controllo qualità per i dati di precipitazione. 4.4 4.4.1 VALIDAZIONE DEI DATI GIORNALIERI DI TEMPERATURA E PRECIPITAZIONE (PROCEDURA DICA-UNICT) *** CONTROLLO DI QUALITÀ DELLA TEMPERATURA MASSIMA E MINIMA 4.4.1.1 Metodologia La procedura proposta comprende due diverse fasi: una fase di calibrazione e una di controllo (cfr. Figura 4.2). Nella fase di calibrazione vengono determinate le fasce di confidenza basate sui dati storici (dopo aver rimosso l’eventuale trend annuo e adattato la distribuzione di probabilità) e le regressioni con i dati delle stazioni di riferimento (previa rimozione di eventuali trend). Le varie fasi sono illustrate in figura 4.2 La fase successiva relativa al controllo consiste, invece, nel verificare che il *** G. ROSSI, A. CANCELLIERE, B. BONACCORSO, G. SCIUTO Dipartimento di Ingegneria Civile e Ambientale, Università di Catania 100 G. Rossi, A. Cancelliere, B. Bonaccorso, G. Sciuto, A. Campisano, V. Pavan, S. Marchesi, A. Selvini, R.Tomozeiu, M. Di Lorenzo dato corrente acquisito in telemisura (valori giornalieri di temperatura massima e minima) rientri sia all’interno della fascia di confidenza calcolata sulla base dei dati della stazione in esame, sia all’interno della fascia di confidenza ottenuta tramite regressione in funzione dei dati delle stazioni di riferimento. A seguito del risultato di tali verifiche il dato viene classificato mediante un giudizio di qualità sulla base del quale può essere accettato ovvero sottoposto ad un ulteriore controllo di tipo manuale. I possibili esiti della procedura di controllo automatico sono: 1. Dato Validato (V); 2. Dato Non Validato (N.V); 3. Dato Rifiutato (R); Le elaborazioni vengono effettuate solo sui dati archiviati in banca dati, non considerando i dati mancanti ai quali il sistema di gestione della rete in telemisura ha già attribuito un codice di riconoscimento. In Tabella 4.2 sono riassunti i giudizi di qualità adottati e le conseguenti operazioni da effettuare in relazione ai possibili esiti della procedura di controllo automatica. La tabella mostra che se entrambe le verifiche sono positive la procedura prevede che il dato venga classificato come “validato” (V) e venga quindi accettato. In tutti gli altri casi, quando la procedura di controllo fornisce i giudizi di qualità “non validato automaticamente” (NV) o “rifiutato” (R), occorre procedere ad un successivo controllo manuale del dato registrato. La procedura di controllo manuale potrà comunque consentire, nel caso di esito positivo, di riclassificare come “validato” il dato che precedentemente non aveva superato la verifica. Procedure di controllo di qualita’ dei dati provenienti dalla rete idrometeorologica 101 Calibrazione Dati storici di temperatura giornaliera relativi alle stazioni Dati storici di temperatura giornaliera relativi alla stazione in esame Rimozione del trend Rimozione del trend Scelta delle stazioni di riferimento Determinazione fasce di confidenza basate sui dati storici della stazione Calcolo dei parametri delle regressioni e determinazione fasce di confidenza Dato di temperatura massima o minima giornaliera acquisito in telemisura Controllo Verifica basata sulle fasce di confidenza relative alla stazione in esame Verifica basata sulle fasce di confidenza delle regressioni Classificazione dato con giudizio di qualità Validato Non validato automaticamente Rifiutato Controllo manuale Figura 4.2 - Fasi della procedura di controllo automatico dei dati termometrici Nel seguito si riportano i dettagli della metodologia sviluppata e si rimanda all’appendice A6 per le applicazioni ai dati di temperatura massima e minima giornalieri registrati in alcune stazioni gestite dall’ex Ufficio Idrografico Regionale della Sicilia, oggi Agenzia Regionale per i Rifiuti e le Acque. 102 G. Rossi, A. Cancelliere, B. Bonaccorso, G. Sciuto, A. Campisano, V. Pavan, S. Marchesi, A. Selvini, R.Tomozeiu, M. Di Lorenzo Tabella 4.2 - Possibili esiti della procedura di controllo automatico dei dati basata su fasce di confidenza associate ad un livello probabilità e relativi giudizi di qualità Verifica 1 Verifica 2 Il dato ricade nella fascia di confidenza della stessa stazione Il dato ricade nella fascia di confidenza della regressione Giudizio di qualità dato Operazione SI SI Validato (V) Accettazione SI NO Non validato autom. (NV) Controllo manuale NO SI Non validato autom. (NV) Controllo manuale NO NO Rifiutato (R) Controllo manuale 4.4.1.2 Costruzione di fasce di confidenza basate sui dati della stazione In via preliminare occorre effettuare la verifica della presenza di un eventuale trend significativo nelle serie disponibili. L’analisi viene condotta sulle serie di temperature massime e minime giornaliere accertando l’esistenza di un trend annuo. Dalle analisi preliminari effettuate non è risultato conveniente procedere alla ricerca del trend per periodi più brevi (ad es. trimestri) sia per evitare maggiori complessità delle elaborazioni sia perché la rimozione di trend differenti avrebbe ostacolato l’applicazione dei metodi scelti sui residui così ottenuti (in particolare l’analisi di Fourier) come è mostrato nell’esempio di applicazione (cfr. A6). Calcolati i parametri dell’equazione della retta rappresentativa del trend si applica, per la valutazione della sua significatività, il test della “t” di Student con un livello di significatività α = 0.05. Qualora il trend risulti significativo si procede alla sua rimozione, creando la serie dei residui. La prima fase della metodologia proposta prevede di verificare che il dato di temperatura massima e minima giornaliera acquisito in telemisura rientri all’interno di opportune fasce di confidenza di fissata probabilità. Per l’individuazione della metodologia che consegua i migliori risultati assicurando anche il rispetto del principio di parsimonia dei parametri è stato eseguito un confronto fra i tre seguenti metodi basati sull’utilizzo diretto delle serie osservate o sulla loro descrizione tramite un’analisi di Fourier: a) Costruzione delle fasce di confidenza probabilistica utilizzando le medie e gli scarti quadratici medi dei residui giornalieri dei 365 giorni (ottenuti dopo la rimozione del trend); b) Costruzione delle fasce di confidenza probabilistica utilizzando le medie e gli scarti quadratici medi dei residui giornalieri regolarizzati attraverso uno sviluppo in serie di Fourier; c) Costruzione delle fasce di confidenza probabilistica utilizzando le medie e gli scarti quadratici medi della serie dei residui, regolarizzati attraverso uno Procedure di controllo di qualita’ dei dati provenienti dalla rete idrometeorologica 103 sviluppo in serie di Fourier dei valori della media mobile a finestra di 11 giorni centrata sul generico giorno. Il primo metodo a) consiste nel costruire le fasce di confidenza dei residui della temperatura giornaliera utilizzando le coppie dei parametri statistici media e s.q.m. per ciascun giorno dell’anno, assumendo valida una distribuzione di probabilità normale per la variabile considerata ed esprimendo pertanto i limiti di confidenza per il livello di confidenza P=1-α come: Tt ,α / 2 , Tt ,1−α / 2 = Tt ± uα 2 S t (4.10) essendo Tt la media dei residui della temperatura del giorno t, S t il relativo scarto quadratico medio e uα / 2 il valore della variabile normale standard corrispondente ad una probabilità di non superamento α/2. I metodi b) e c) sono sull’applicazione dell’analisi di Fourier a due diverse variabili di base: nel metodo b) il residuo della temperatura giornaliera dopo la rimozione del trend, nel caso c) la media mobile a finestra di 11 giorni dei residui della temperatura giornaliera. La scelta di descrivere la media e lo scarto quadratico medio delle serie di temperature massime e minime giornaliere mediante uno sviluppo in serie di Fourier consente di descrivere l’andamento nel tempo delle due statistiche considerate mediante un numero limitato di parametri, cioè due parametri per ciascuna armonica più una costante. Come è noto le serie di Fourier hanno lo scopo di descrivere una funzione periodica mediante una combinazione lineare di funzioni periodiche elementari, ovvero le funzioni trigonometriche seno e coseno. Lo sviluppo in serie di Fourier della funzione x(t) si scrive come: ∞ ⎛ 2π kt ⎞ ∞ ⎛ 2π kt ⎞ x ( t ) = a0 + ∑ ak ⋅ cos ⎜ (4.11) ⎟ + ∑ bk ⋅ sin ⎜ ⎟ ⎝ T ⎠ k =1 ⎝ T ⎠ k =1 dove i coefficienti a0, ak e bk , detti coefficienti di Fourier, si calcolano tramite le espressioni: 1 a0 = T T /2 ∫ x ( t ) dt (4.12) −T / 2 2 ⎛ 2π kt ⎞ x ( t ) ⋅ cos ⎜ ⎟ dt T −T∫/ 2 ⎝ T ⎠ T /2 ak = (4.13) 104 G. Rossi, A. Cancelliere, B. Bonaccorso, G. Sciuto, A. Campisano, V. Pavan, S. Marchesi, A. Selvini, R.Tomozeiu, M. Di Lorenzo 2 ⎛ 2π kt ⎞ bk = x ( t ) ⋅ sin ⎜ ⎟ dt ∫ T −T / 2 ⎝ T ⎠ T /2 (4.14) In particolare, nel caso in esame i coefficienti di Fourier si possono determinare come: 2 365 2π u t cos kt ∑ 365 t =1 365 2 365 2π bk = u t sen kt ∑ 365 t =1 365 essendo ut la media o scarto quadratico medio. ak = (4.15) (4.16) Ciascuna serie delle temperature massime e minime giornaliere osservate in una stazione termometrica può considerarsi (se un trend significativo non esiste o è stato eliminato) come una realizzazione di un processo periodico-stocastico. La variabile ottenuta rimuovendo le periodicità nella media e nello scarto quadratico medio dalla serie originaria, può considerarsi come una variabile casuale stazionaria e indipendente nel tempo. I parametri periodici media e s.q.m. possono essere espressi a mezzo dello sviluppo in serie di Fourier: h _ ∧ ⎡ 2π ⎤ T t = T + ∑ Ak (T ) cos ⎢ kt + θ k (T )⎥ ⎣ 365 ⎦ k =1 (4.17) h _ ∧ ⎤ ⎡ 2π S t = S + ∑ Ak ( S ) cos ⎢ kt + θ k ( S )⎥ 365 ⎦ ⎣ k =1 (4.18) _ con T media dei valori medi giornalieri osservati, S media degli scarti quadratici medi giornalieri osservati, Ak e θk rispettivamente ampiezza e fase della kma armonica ed h numero di armoniche significative e t =1,2,…,365 i giorni dell’anno. Una volta calcolati i coefficienti di Fourier ak e bk si possono calcolare Ak e θk come: ⎛ bk ⎞ (4.19) ⎟⎟ ⎝ ak ⎠ Nell’utilizzo dell’analisi di Fourier per la descrizione della periodicità dei parametri meteorologici l’esperienza mostra che per serie aggregate a piccola scala temporale come quelli giornalieri e settimanali sono sufficienti le prime 4-6 armoniche per una buona rappresentazione della serie di dati (Salas et al., 1995). Per la scelta del numero di armoniche significative si può ricorrere al “cumulative Ak = a k2 + bk2 ; θ k = arctan⎜⎜ − Procedure di controllo di qualita’ dei dati provenienti dalla rete idrometeorologica 105 periodogram test” (Yevjevich, 1972) che è basato sul grafico che descrive l’andamento della varianza spiegata in funzione del numero complessivo di armoniche utilizzato per la descrizione della periodicità. Nel grafico, si noteranno in genere due tratti ben distinti con pendenze molto diverse: il punto in cui si ha una variazione di pendenza significativa indicherà il numero di armoniche che può risultare sufficiente per la descrizione della periodicità. Ipotizzando che la serie dei residui della temperatura giornaliera segua una distribuzione normale, una volta scelto il numero di armoniche sufficiente a descrivere sia la media che lo s.q.m., è possibile costruire i limiti di confidenza per livello di confidenza P=1- α: Tt ,α / 2 , Tt ,1−α / 2 = Tˆi ,t ± uα 2 Sˆt (4.20) dove uα/2 è il quantile di una variabile normale standard corrispondente ad una propabilità di non superamento α/2. La verifica del dato viene, quindi, effettuata sulla base del fatto che il dato rientri o meno nella fascia di confidenza considerata; qualora il dato ricada fuori esso sarà sottoposto ad un controllo manuale. Nell’appendice A6 è riportato il confronto dell’applicazione dei tre modelli sopra elencati per la costruzione delle fasce di confidenza. Per i casi riportati in appendice, dal confronto delle prestazioni dei tre metodi, può concludersi che il secondo metodo con 2 armoniche per la descrizione della media e 7 per lo s.q.m. permette di coniugare la parsimonia dei parametri con dei risultati accettabili. 4.4.1.3 Costruzione di fasce di confidenza basate sui dati delle stazioni di riferimento La metodologia adottata richiede anzitutto l’individuazione delle stazioni di riferimento, da scegliere tra quelle che sono ubicate a distanza limitata e ad una quota non molto differente da quella della stazione in esame, prendendo in conto, se possibile, anche l’esposizione del versante e verificando che il numero di anni di osservazioni contemporanee sia abbastanza elevato. Tra le stazioni individuate con i predetti criteri, vengono quindi scelte come stazioni di riferimento quelle che presentano i più elevati valori mediani dei coefficienti di correlazione giornalieri. Ipotizzando un legame di tipo lineare tra i dati giornalieri della stazione in esame e quelli registrati nelle stazioni di riferimento per la costruzione delle fasce di confidenza si può utilizzare la metodologia esposta nel paragrafo 4.2.2.2 indicando questa volta con il simbolo j il generico giorno dell’anno (j=1,…,365). Per considerare la possibilità che una o più stazioni di riferimento non stiano funzionando occorre costruire le fasce di confidenza relative al caso di disponibilità di dati in tutte le stazioni di riferimento sia al caso disponibilità solo in alcune di 106 G. Rossi, A. Cancelliere, B. Bonaccorso, G. Sciuto, A. Campisano, V. Pavan, S. Marchesi, A. Selvini, R.Tomozeiu, M. Di Lorenzo dette stazioni (ad es. se le stazioni di riferimento sono tre si costruirà una fascia di confidenza relativa alla regressione ottenute con le tre stazioni e tre relative alle regressioni ricavate in funzione delle tre possibili combinazioni di stazioni a due a due). 4.4.2 CONTROLLO DI QUALITÀ DELLA PRECIPITAZIONE 4.4.2.1 Metodologia La metodologia proposta per il controllo dei dati termometrici giornalieri non può essere semplicemente estesa al caso dei dati pluviometrici, poiché questi ultimi presentano una elevata variabilità che rende inefficace una verifica basata sul confronto con i dati storici della stessa stazione. Inoltre, i dati di precipitazione giornaliera presentano generalmente un carattere intermittente (dati non nulli che si alternano a numerosi dati nulli), che rende insufficiente l’applicazione di regressioni determinate solo tra precipitazioni non nulle. Pertanto, la metodologia proposta per la validazione dei dati pluviometrici acquisiti in telemisura prevede due diversi controlli a seconda che il dato rilevato sia nullo o non nullo. In entrambi i casi la verifica del dato osservato nella stazione considerata viene effettuata mediante il confronto con quelli osservati nelle stazioni di riferimento scelte. Il controllo consiste in un confronto di tipo spaziale, basato sulla probabilità di contemporanea presenza-assenza di pioggia tra la serie di dati osservati nella stazione in esame a scala giornaliera e la serie delle osservazioni in stazioni limitrofe che presentino caratteristiche abbastanza simili. A tal fine, vengono implementate due diverse reti neurali per verificare la correttezza dei dati: − la prima rete neurale, definita binaria, è utilizzata per stimare nella stazione in esame la presenza o meno di precipitazione, sulla base delle contemporanee osservazioni in stazioni di riferimento; − la seconda rete neurale è utilizzata per valutare l’entità della precipitazione nel caso che il valore osservato nella stazione sia non nullo e che la prima rete abbia confermato che per il giorno in esame ci si aspetti un valore di pioggia. Nel caso di dati non nulli, confermati dalla prima rete neurale, si procede al controllo che il dato in telemisura ricada in una fascia di confidenza di fissata probabilità, costruita sulla base dei valori osservati nelle stazioni di riferimento. Il risultato della procedura consiste quindi in un giudizio di qualità sul dato rilevato, che può essere: Procedure di controllo di qualita’ dei dati provenienti dalla rete idrometeorologica 107 1. Dato Validato (V); 2. Dato Rifiutato (R); La metodologia viene applicata anche in questo caso in due fasi distinte: una fase di calibrazione e una fase di controllo (cfr. Figura 4.3). Nel seguito si riportano i dettagli della metodologia sviluppata e si rimanda all’appendice A7 per le applicazioni ai dati di precipitazioni giornaliere in alcune stazioni gestite dall’ex Ufficio Idrografico Regionale della Sicilia, oggi Agenzia Regionale per i Rifiuti e le Acque Calibrazione Selezione delle stazioni di riferimento sulla base della contemporanea assenza-presenza di pioggia Allenamento della rete neurale “binaria” per la predizione dei valori nulli/non nulli sulla base delle contemporanee osservazioni nelle stazioni di riferimento Osservazione pluviometrica giornaliera Controllo =0 Rete binaria Non validato Allenamento della rete neurale per la stima dei valori non nulli sulla base delle contemporanee osservazioni nelle stazioni di riferimento >0 >0 Precipitazione giornaliera osservata Rete binaria Valore stimato Valore stimato =0 Non validato >0 =0 Rete neurale continua Validato si Valore che rientra nella fascia no Figura 4.3 - Procedura per la validazione dei dati pluviometrici giornalieri Non validato 108 G. Rossi, A. Cancelliere, B. Bonaccorso, G. Sciuto, A. Campisano, V. Pavan, S. Marchesi, A. Selvini, R.Tomozeiu, M. Di Lorenzo 4.4.2.2 Individuazione delle stazioni di riferimento Per l’individuazione delle stazioni di riferimento, non essendo significative le correlazioni fra le serie giornaliere a causa della presenza di dati nulli, si è scelto di utilizzare un criterio basato sulla frequenza di contemporanea assenza/presenza di pioggia. (k ) In particolare, introducendo una variabile booleana Y , pari a 1 nel caso di pioggia giornaliera osservata nella k-esima stazione e pari a 0 nel caso di assenza di pioggia, è possibile procedere alla stima delle probabilità condizionate come segue: [ ] Pij = P Y ( c ) = j | Y ( r ) = i ≅ [ ] n°volte Y ( c ) = j , Y ( r ) = i i, j = 0,1 n°volte[Y ( r ) = i ] (4.21) dove c indica la stazione considerata ed r indica la stazione di riferimento. Le probabilità condizionate, utili ai fini della selezione delle stazioni, sono la P00 e P11, e cioè rispettivamente la probabilità di contemporanea assenza e di contemporanea presenza di pioggia giornaliera. Inoltre, per affinare la scelta delle stazioni di riferimento, vengono presi in considerazione i seguenti indici di affinità: I1 = N sp Nt ; I2 = Np Nt ; I = I1 + I 2 (4.22) dove Np e Nsp sono rispettivamente il numero di giorni con pioggia e senza pioggia contemporaneamente osservati nelle due stazioni ed Nt è il numero totale di giorni di osservazioni. Si osservi che tali indici differiscono dalle probabilità di cui all’eq. (4.22) in quanto essi stimano le probabilità congiunte, e non già condizionate. 4.4.2.3 Validazione dei valori delle precipitazioni attraverso l’applicazione di reti neuronali La procedura di controllo delle precipitazioni prevede in una prima fase un confronto del dato osservato con la stima ottenuta dalla rete cosiddetta binaria, che restituisce cioè valori 0 o 1 in corrispondenza rispettivamente di pioggie nulle o non nulle. Per l’allenamento della rete binaria si utilizzano le serie contemporanee di osservazioni giornaliere nella stazione e nelle stazioni di riferimento. I dati di input della rete sono costituiti dai valori di precipitazioni nelle stazioni di riferimento mentre i dati di output sono i dati della stazioni in esame. Viene adottata una rete neuronale con uno strato nascosto con 5 neuroni e con una funzione lineare tra lo stato di input e lo strato nascosto ed una funzione sigmoidale tra lo strato nascosto e quello di output. Poichè tale rete restituisce valori continui, Procedure di controllo di qualita’ dei dati provenienti dalla rete idrometeorologica 109 essi vengono trasformati in corrispondenti valori 0 o 1 attraverso l'introduzione di un valore di soglia. La ricerca del valore soglia opportuno viene effettuata sulla base di un’analisi di sensitività delle percentuali di valori nulli o non nulli validati al variare della soglia. Poiché più alta è la soglia maggiore sarà la quantità di valori nulli verificati, il valore soglia preferibile è quello in corrispondenza del quale risultano uguali le percentuali dei valori nulli e non nulli validati. A titolo di esempio in figura 4.4 sono riportate le percentuali di valori nulli/non nulli validati al variare della soglia, relativamente ai dati pluviometrici giornalieri registrati dal 1950-2004 nella stazione di Sommatino appartenete alla rete di rilevamento dell’Agenzia Regionale per i Rifiuti e le Acque- Settore Osservatorio delle Acque della Regione Siciliana. Dalla figura si evince come in questo caso il valore preferibile sia 0.18. Una volta determinato il valore soglia si procede alla trasformazione dei valori stimati in zero o uno secondo la seguente formulazione: Y t ⎧0 = ⎨ ⎩1 _ se X ≤ x0 _ se X > x0 (4.23) _ dove x0 è il valore soglia e X assumerà valore uno o zero. è il valore che restituisce la rete binaria mentre Yt Se il dato giornaliero osservato è nullo, la verifica sulla qualità del dato consisterà essenzialmente nel verificare che la rete binaria restituisca 0; in tal caso il dato sarà considerato “Validato”. 110 G. Rossi, A. Cancelliere, B. Bonaccorso, G. Sciuto, A. Campisano, V. Pavan, S. Marchesi, A. Selvini, R.Tomozeiu, M. Di Lorenzo 100 90 80 % validati 70 60 50 40 30 20 10 0.18 0 0 0.1 0.2 Non Nulli 0.3 Valore Soglia 0.4 0.5 0.6 Nulli Figura 4.4 - Andamento dei valori nulli e non nulli validati in corrispondenza di diversi valori soglia per la rete binaria relativa ai dati di precipitazione giornaliera della stazione di Sommatino Diversamente il dato verrà giudicato “Non Validato” e sarà sottoposto ad un successivo controllo annuale. Qualora, invece, il valore osservato e il valore stimato dalla rete binaria siano entrambi non nulli, si verifica se il dato acquisito dalla stazione in esame rientri all’interno della fascia di confidenza di fissata probabilità, ottenuta mediante la seconda rete neuronale a partire dai contemporanei dati registrati nelle stazioni di riferimento. L’esito di questa seconda verifica permette ancora una volta di esprimere un giudizio di qualità del tipo “Validato” o “Non Validato”. Anche per questa metodologia, analogamente a quella di controllo dei dati termometrici, per contemplare il caso in cui una o più stazioni di riferimento non stiano funzionando occorre costruire le reti neurali relative sia al caso in cui tutte le stazioni stiano funzionando e sia ai casi di un numero inferiore di stazioni fornite di dati (ad es. se le stazioni di riferimento sono 4 e tutte funzionanti si avrà una rete neurale, se ne funzionano solo 3 o 2 si avranno altre reti costruite a partire dai soli dati delle stazioni funzionanti). Procedure di controllo di qualita’ dei dati provenienti dalla rete idrometeorologica 4.4.3 ANALISI DELL'AFFIDABILITÀ DELLA VALIDAZIONE DEI DATI GIORNALIERI PROCEDURA 111 DI 4.4.3.1 Caso delle serie delle temperature massime e minime giornaliere L’affidabilità della procedura proposta (il cui esempio di applicazione è riportato in appendice A7) può essere valutata introducendo degli errori in una serie di dati storici supposti corretti e verificando la capacità del modello di “riconoscere” tali errori. Al fine di valutare le performance delle procedure di validazione, sono stati introdotti errori in modo random sulle serie di dati da sottoporre a controllo. In particolare, nel caso delle temperature, volendo simulare una staratura dello strumento, si è introdotto un errore corrispondente ad una fissata variazione (positiva) di temperatura. Una volta effettuata la validazione automatica dei dati così alterati, si è proceduto alla stima delle seguenti probabilità condizionate, sulla base delle frequenze valutate sul campione di dati disponibili: P[corretto | validato] ≅ P[non _ corretto | non _ validato] ≅ n°volte[corretto, validato] n°volte[validato] n°volte[non _ corretto, non _ validato] n°volte[non _ validato] (4.24) (4.25) Le equazioni (4.24) e (4.25) rappresentano una misura dell’affidabilità della procedura in quanto esprimono le probabilità che i giudizi emessi su un dato (validato o non validato) siano corretti. Viceversa, i complementi ad uno delle probabilità (4.24) e (4.25), rappresentano le probabilità che i giudizi siano sbagliati. Pertanto, valori elevati delle probabilità (4.24) e (4.25) indicheranno una elevata affidabilità della procedura, intesa come probabilità di non sbagliare nell'emettere un giudizio su un dato. Al fine di valutare l'affidabilità della procedura proposta sono state sottoposte a validazione automatica serie di dati di temperatura, in ipotesi originariamente corretti, nelle quali fossero stati introdotti errori sistematici corrispondenti ad incrementi fissati di temperatura. Per scegliere in maniera opportuna l’errore, è stata condotta un’analisi di sensitività del modello di validazione al variare dell’entità degli errori. In particolare, sono stati introdotti errori variabili giorno per giorno in funzione dello s.q.m. L’espressione dell’errore introdotto nel generico giorno t (Δt) è la seguente: Δ t = δ *σ t (4.26) 112 G. Rossi, A. Cancelliere, B. Bonaccorso, G. Sciuto, A. Campisano, V. Pavan, S. Marchesi, A. Selvini, R.Tomozeiu, M. Di Lorenzo dove δ rappresenta un coefficiente moltiplicativo dello scarto σt. In figura 4.5 sono riportate le percentuali degli errori individuati dal modello e dei dati validati al variare del parametro δ, e cioè al variare dell’entità degli errori introdotti sull'intera serie delle temperature massime e minime giornaliere registrate nella stazione di Trapani appartenente alla rete di rilevamento dell’Agenzia Regionale per i Rifiuti e le Acque- Settore Osservatorio delle Acque della Regione Siciliana, utilizzando il secondo metodo per la costruzione delle fasce di confidenza basate sui dati della stessa stazione. Si noti come la percentuale di dati validati in assenza di errori è maggiore del 90 % sia per le temperature massime che minime. Inoltre, come era lecito attendersi, il modello individua una percentuale di errori sempre crescente al crescere dell’entità dell’errore. In particolare, per δ ≅2, corrispondente ad un errore compreso tra 3 e 8 °C, il modello è in grado di individuare il 50 % di errori. 100.0 100.0 a 75.0 b P% P% 75.0 50.0 50.0 25.0 25.0 0.0 0.0 0 1 2 3 4 5 0 1 2 delta Validati Errori Scoperti 3 4 5 delta Validati Errori Scoperti Figura 4.5. Performance del modello al variare dell’entità degli errori introdotti sulle temperature massime (a) e minime (b) giornaliere osservate nella stazione di Trapani Per eseguire il confronto delle performance della procedura considerando i tre diversi metodi per la costruzione delle fasce di confidenza, utilizzando i dati della stazione in esame, è stato fissato in modo arbitrario un valore δ ≅2 e sono state stimate frequenzialmente le probabilità condizionate di cui all’equazioni (4.24) e (4.25). I risultati ottenuti per la temperatura minima sono riportati in figura 4.6, dalla quale si evince che l’andamento delle frequenze al variare della percentuale di errori introdotti è dello stesso tipo e ordine di grandezza per i tre diversi metodi di costruire le fasce di confidenza. 113 Procedure di controllo di qualita’ dei dati provenienti dalla rete idrometeorologica I METODO III METODO II METODO 100 90 80 70 60 P % 50 40 30 100 100 90 90 80 80 70 70 60 60 P % 50 P % 50 40 40 30 30 20 20 20 10 10 10 0 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0 0 n° errori/totale dati termometrici giornalieri 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 0 0.1 n° errori/totale dati termometrici giornalieri P[C|V] P[N.C|N.V] P[C|V] 0.2 0.3 0.4 P[C|V] P[N.C|N.V] 0.5 0.6 0.7 0.8 0.9 1 n° errori/totale dati termometrici giornalieri P[N.C|N.V] Figura 4.6. Performance della procedura di validazione, per i tre diversi metodi di costruire le fasce di confidenza, al variare dell’entità degli errori introdotti sulle temperature minime giornaliere osservate nella stazione di Trapani 4.4.3.2 Caso delle serie delle precipitazioni giornaliere Volendo simulare un malfunzionamento del pluviometro corrispondente ad un’occlusione dell’imbuto raccoglitore, si è proceduto a introdurre valori nulli in una serie di dati giornalieri, supposti corretti. Gli errori sono stati introdotti in modo casuale, ipotizzando cioè che la probabilità di un malfunzionamento sia la stessa per i giorni piovosi e per quelli non piovosi. Naturalmente, nei giorni non piovosi, l’otturazione del pluviometro non costituisce errore, e pertanto i dati sono stati considerati corretti. 100 90 80 70 60 P % 50 40 30 20 10 0 0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 n° errori/totale dati pluviometrici non nulli P[C|V.] 0.9 1.0 P[N.C|N.V] Figura 4.7. Performance del modello al variare della percentuale di errori introdotti nella serie dei dati di precipitazioni giornaliere della stazione di Mirabella Imbaccari. 114 G. Rossi, A. Cancelliere, B. Bonaccorso, G. Sciuto, A. Campisano, V. Pavan, S. Marchesi, A. Selvini, R.Tomozeiu, M. Di Lorenzo In maniera analoga a quanto visto per le temperature, in figura 4.7 sono rappresentate le probabilità condizionate attraverso le quali è possibile valutare l’affidabilità del modello proposto in riferimento ai dati pluviometrici giornalieri registari nella stazione di Mirabella Imbaccari appartenente alla rete di rilevamento dell’Agenzia Regionale per i Rifiuti e le Acque- Settore Osservatorio delle Acque della Regione Siciliana. Dal grafico si evince che al crescere della percentuale di errori introdotti la probabilità che i dati validati siano anche corretti decresce, mantenendosi comunque superiore al 95 %, mentre aumenta la probabilità che i dati non validati siano non corretti, non superando comunque mai il 75 %. 4.5 CONSIDERAZIONI CONCLUSIVE La procedura per il controllo dei dati mensili di temperatura e precipitazione acquisiti da reti in telemisura a servizio del monitoraggio della siccità consente di classificare i dati acquisiti mediante giudizi di qualità in base ai quali è possibile accettare tali dati o procedere all’ulteriore controllo manuale. La procedura, ha il vantaggio di effettuare un doppio controllo basato sia sul confronto del valore osservato con i dati dello stesso mese rilevati nella stessa stazione negli anni precedenti, sia sul confronto con i dati osservati contemporaneamente in stazioni di riferimento. La procedura è stata applicata ai dati di 43 stazioni termopluviometriche inserite nella rete in telemisura realizzata dall’ex Ufficio Idrografico Regionale della Sicilia, oggi Agenzia Regionale per i Rifiuti e le Acque e ha condotto a validare oltre il 90% e a procedere al controllo manuale di circa il rimanente 10% dei dati a disposizione. Entrambe le procedure proposte per il controllo dei dati giornalieri di temperatura massima e minima e precipitazione utilizzano i dati delle stazioni limitrofe con la differenza che l’ARPA-EMR li utilizza per creare valori soglia con cui confrontare i dati rilevati mentre il DICA-UNICT per costruire opportune fasce di confidenza entro le quali il dato deve rientrare per essere ritenuto di qualità. Per ciò che riguarda la procedura dell’ARPA-EMR, le soglie che definiscono la bontà dei dati sono state scelte in modo tale da minimizzare il numero di dati apparentemente validi, scartati dal controllo di qualità, e nello stesso tempo massimizzare l’identificazione di possibili dati erronei. Al termine del controllo di qualità ad ogni dato viene associato un flag che consiste in un numero intero che può assumere i valori di 0, 1 o 2. Se il flag ha valore 0 il dato è valido, nel caso in cui il valore di flag è 1 il dato è considerato Procedure di controllo di qualita’ dei dati provenienti dalla rete idrometeorologica 115 sospetto, ma può essere usato, se infine il flag ha valore 2 il dato non ha passato il controllo di qualità e, pertanto, il dato è quasi certamente errato e bisogna evitare di usarlo. E’ in via di implementazione un codice di calcolo in linguaggio Visual Basic per il controllo di qualità qui descritto. La procedura proposta dal DICA-UNICT applicata a dati di precipitazione e di temperatura massima e minima a scala giornaliera, consente di classificare i dati acquisiti attribuendo ad essi un giudizio di qualità in base al quale i dati possono essere accettati ovvero sottoposti a ulteriori controlli di tipo manuale. La procedura proposta per la validazione dei dati termometrici è basata sia sul confronto del valore osservato con i dati rilevati dalla stazione in esame nello stesso giorno degli anni precedenti, sia sul confronto con i dati osservati contemporaneamente in stazioni di riferimento. La validazione dei dati pluviometrici, invece, è affidata al solo confronto con le stazioni di riferimento. La procedura è stata applicata ai dati di diverse stazioni termometriche e pluviometriche che fanno parte della rete in telemisura dell’ex Ufficio Idrografico Regionale (UIR) della Sicilia. Nel caso delle temperature, l’88% circa dei dati di temperatura massima giornaliera e l’82% circa dei dati di temperatura minima hanno superato la validazione automatica. Per quel che concerne le precipitazioni oltre l’85 % circa dei dati risulta validato. È stata, infine, valutata la performance delle procedure proposte attraverso la validazione di serie di dati termometrici e pluviometrici, inizialmente corretti, successivamente all’introduzione di errori atti a simulare ipotetici malfunzionamenti degli strumenti. In base ai risultati ottenuti si evince che, per entrambe le procedure, al crescere della percentuale di errori nella serie, la probabilità che i dati validati siano anche corretti decresce, mentre aumenta la probabilità che i dati non validati siano non corretti. La procedura adottata per le temperature appare, tuttavia, più sensibile all’incremento del numero di errori introdotti. In particolare, se la percentuale del numero di errori introdotti rispetto al numero totale di dati supera il 35 %, la procedura mostra una maggiore affidabilità (con probabilità superiori all’80%) nel non validare dati non corretti, mentre si riduce significativamen-te la capacità di validare dati corretti. Per quanto riguarda, invece, le precipitazioni si osserva che fra i dati validati oltre il 95% sono sempre dati corretti, mentre la probabilità di non correttezza di dati non validati si mantiene sempre inferiore al 75 %, rivelando una minore capacità della procedura di riconoscere dati non corretti. 116 G. Rossi, A. Cancelliere, B. Bonaccorso, G. Sciuto, A. Campisano, V. Pavan, S. Marchesi, A. Selvini, R.Tomozeiu, M. Di Lorenzo 4.6 BIBLIOGRAFIA Abbott, P.F., (1986). Guidelines on the quality control of surface climatological data, WMO/TD 111. Campisano, A., Cancelliere, A., Rossi, G., “Una procedura semi-automatica per il controllo di qualità dei dati pluviometrici e termometrici”, XXVIII Convegno di Idraulica e Costruzioni idrauliche, Potenza 16-19 settembre, 2002. Kottegoda, N., Rosso, R., “Statistics, Probability, and Reliability for Civil and Environmental Engineers”, McGraw-Hill, New York, (1997). Madsen, H., “Quality control of precipitation measurements in Denmark”, Proceedings of the fourth International Meeting on Statistical Climatology, Rotura, New Zealand, (1989), pp. 13-15. Reek, T., Doty, S.R. & Owen, T.W. A deterministic approach to the validation of historical daily temperature and precipitation data from the cooperative network. Bulletin American Meteorological Society, 1992, 73(6), 753-762. Salas, J. D., Delleur, J. W., Yevjevich, V. and Lane, W. L., “Applied Modeling of Hydrologic Time Series”. Water Resources Publications, Fort Collins, Colorado, (1985). Yevjevich, V., “Stochastic Processes in Hydrology”. Water Resources Publications, Fort Collins, Colorado, (1972). 5. PROCEDURE DI CARATTERIZZAZIONE DEI DATI STORICI G. LA LOGGIA, L.V. NOTO, F. VIOLA Dipartimento di Ingegneria Idraulica ed Applicazioni Ambientali, Università degli Studi di Palermo M.T. NOTO Regione Siciliana - Agenzia Regionale per i Rifiuti e per le Acque – Osservatorio per le Acque Abstract: E’ estremamente difficile che osservazioni raccolte nell’arco di più decenni, con strumenti e metodi notevolmente differenti tra loro, siano direttamente confrontabili; ciò fa si che, per un’efficace ricostruzione del clima storico, avendo a disposizione una grande quantità di dati, che nasca la necessità di utilizzo di strumenti conoscitivi che permettano di gestire i numerosi problemi legati all’analisi di lunghe serie storiche. Dalla caratterizzazione della serie storica, si arriva alla definizione di criteri per la selezione di una rete di monitoraggio della siccità, e a criteri per l’attribuzione di un giudizio di qualità alla singola stazione, alla rete di monitoraggio di una singola grandezza climatica ed al sistema di monitoraggio per la siccità, inteso come insieme di reti. Key words: Serie storica, omogeneità, dati mancanti, criteri 5.1 INTRODUZIONE Le serie storiche possono essere definite come un set di dati climatici consecutivi nel tempo, relativi ad una certa area geografica e ad uno specifico intervallo di tempo (generalmente lungo); la disponibilità di un’ampia base di dati storici non costituisce di per sé condizione sufficiente per poter procedere ad una dettagliata ricostruzione del clima in una data località e/o in una data regione. Una serie storica può essere definita “omogenea” se le variazioni, in essa presenti, sono dovute unicamente ai cambiamenti del tempo meteorologico e/o del clima. Come tutte le definizioni, questa rappresenta una condizione ideale, raramente realizzata nelle serie storiche di dati meteorologici, con cui si lavora in pratica. In generale, è possibile dire che non esistono serie storiche, soprattutto secolari, prive di disomogeneità. Infatti, dall’analisi di serie storiche, possono emergere differenti tipi di disomogeneità, sintetizzabili in due grandi categorie: 118 G. La Loggia, L.V. Noto, F. Viola, M.T. Noto − − Discontinuità nette (salti bruschi), dovute essenzialmente a cambi nella strumentazione o cambi di posizione della stazione stessa; Presenza di trend graduale nel valore medio e/o nella varianza (salti graduali), possono sorgere da cambiamenti nei dintorni della stazione, quali l’urbanizzazione, o da modifiche progressive delle caratteristiche dello strumento. A prescindere dalla loro origine, tutte le disomogeneità hanno un importante aspetto in comune: esse "nascondono" i veri segnali climatici e vanno pertanto eliminate prima di procedere all'analisi dei dati. L'operazione per la quale si eliminano le disomogeneità prende il nome di omogeneizzazione. E’ importante sottolineare che l’omogeneizzazione di una serie meteorologica è una operazione molto delicata e complessa, che quasi mai restituisce una serie come essa sarebbe stata se non fosse stata affetta da disomogeneità. Questo chiarisce il significato essenzialmente estimativo delle tecniche di omogeneizzazione e la differenza tra una serie omogenea e una serie omogeneizzata. In altre parole, si può dire che la procedura di omogeneizzazione restituisce alla serie una “omogeneità relativa” (cioè, la serie corretta mostra un andamento in linea con quello di serie provenienti da stazioni vicine), cosa che è ben diversa dall'omogeneità "vera". In questo studio, si pone l’accento al concetto di omogeità, inteso come prova per la caratterizzazione di una serie storica e per la successiva valutazione della sua “bontà” (livello di qualità sufficiente, buono, ottimo), utilizzando metodi diretti, cioè analisi di informazioni di carattere storico contenute nei metadati, o metodi indiretti, utilizzando tecniche statistiche, generalmente basate sull’analisi statistica della singola serie oppure sul confronto con una serie di riferimento. Le serie storiche, non sono state, invece, sottoposte ad omogeneizzazione. 5.2 CONTROLLI DI OMOGENEITA’ BASATI SULLO STORICO (METADATI) I controlli di omogeneità di tipo diretto sono quelli basati su informazioni ricavate da studi di carattere storico (metadati), relativi alle stazioni e agli strumenti di misura in esse utilizzati. Tali informazioni, possono essere tratte dai registri delle stazioni, o dagli annali meteorologici regionali e/o nazionali. Nel migliore dei casi, i metedati forniscono le cause, le date in cui sono avvenute le discontinuità; talvolta, forniscono anche le entità del cambiamento. L’utilizzo dei metadati può avvenire sia in fase di ricostruzione della serie sia in fase di omogeneizzazione. La procedura seguita effettivamente dipende molto 119 Procedure di caratterizzazione dei dati storici spesso dalla natura dei dati studiati (es: temperatura, pressione, etc.), ma anche dalla reperibilità di informazioni sulla stazione. La ricerca e la classificazione dei metadati, infatti, è una attività laboriosa che richiede molto tempo e ciò, in molti casi, ne limita il loro utilizzo. Oggi, si registra una tendenza crescente verso la sistematizzazione della raccolta di metadati dalle singole stazioni, con l’obbiettivo di costruire dei database che li raccolgano. A livello locale, la digitalizzazione dei metadati consente un loro più agevole utilizzo in fase di omogeneizzazione e una maggiore integrazione con i metodi statistici. 5.3 CONTROLLI DI MATEMATICI OMOGENEITA’ BASATI SU METODI La maggior parte dei controlli di omogeneità utilizza, in maniera diretta o indiretta (tramite lo sviluppo di serie di riferimento), i dati meteorologici di stazioni vicine a quella in studio. Per una data variabile atmosferica, una serie di riferimento è, in generale, una serie storica costruita mediando in maniera opportuna i dati omologhi di parecchie stazioni, possibilmente molto vicine alla stazione sa sottoporre al controllo di omogeneità (serie “candidata”). Il numero di stazioni utilizzate per costruire la serie di riferimento dovrebbe essere abbastanza grande da mascherare eventuali disomogeneità dei dati di riferimento. In realtà, il numero esatto di stazioni dipende dalle finalità dell'analisi, dalla densità della rete di stazioni e soprattutto dalla quantità dei dati a disposizione. Formalmente, possiamo rappresentare i dati di una generica serie “candidata” come somma di più termini. Sia X(t) il valore al tempo t del parametro climatico X che si vuole analizzare. Allora, possiamo scrivere: X (t ) = C (t ) − IH (t ) + e(t ) (5. 1) In cui: − − − − (t) = 1, 2,…n C(t) è la funzione di tendenza di un ipotetico segnale climatico IH(t) è l’eventuale disomogeneità presente nel valore t-esimo della serie e(t) rappresenta un errore casuale. Utilizzando termini analoghi, la serie di riferimento si rappresenta nella seguente forma: R (t ) = C ' (t ) − R (t ) = IH ' (t ) + e' (t ) (5.2) 120 G. La Loggia, L.V. Noto, F. Viola, M.T. Noto Se le due serie appartengono alla stessa regione climatica, possiamo assumere che C(t) = C’(t) per ogni valore di t. Inoltre, se la serie di riferimento è supposta essere già omogenea, risulterà sempre IH´(t) = 0. Perciò, se costruiamo la serie delle differenze, abbiamo: Z (t ) = X (t ) − R(t ) = IH (t ) + d (t ) (5.3) Quindi la serie delle differenze (Z(t)) esprime le disomogeneità della serie "candidata"(IH(t)), rispetto alla serie di riferimento, più un termine casuale di errore (d(t)). Appare chiaro che l’efficacia di questo metodo risiede fondamentalmente nella capacità di isolare le discontinuità della stazione studiata dalle variazioni climatiche regionali. Difatti, le stazioni vicine sono utilizzate proprio come indicatori del clima della regione circostante. In sostanza, si accetta ragionevolmente come mutamento climatico una variazione che trovi riscontro nelle stazioni vicine, mentre un cambiamento che compaia solo nella stazione da esaminare viene considerato di natura non climatica (C(t) = C´(t) nelle (5.1) e (5.2)). Questa considerazione di fondo mostra le potenzialità insite nelle serie di riferimento, ma ne sottolinea anche i limiti. Innanzitutto, il segnale climatico regionale, introdotto nella serie della stazione “candidata”, tende a cancellare nella serie in esame gli eventuali segnali del suo microclima, interpretandoli sempre come disomogeneità. L’inconveniente principale dell’adozione di una serie di riferimento è che i dati considerati come riferimento potrebbero non essere del tutto omogenei. Ciò significa avere il termine (IH’(t)) nella (5.2) diverso da zero. Per evitare questo rischio, si può procedere al confronto di ogni serie con tutte le (o con un definito numero) altre serie e basare poi la valutazione della presenza di eventuali inomogeneità su una matrice decisionale che contiene tutte le informazioni relative alla omogeneità relativa di ogni serie con tutte le (o con un definito numero di) altre. Problema fondamentale sta, quindi, nella costruzione della serie di riferimento, ottenibile come media pesata di più serie singole (sj) che ben correlano la serie da esaminare ∑r s = ∑r 2 i j j SRi 2 j (5.4) j In cui i pesi sono i quadrati dei coefficienti di correlazione tra la serie in esame e la serie j-esima. 121 Procedure di caratterizzazione dei dati storici Questo metodo permette di ottenere una serie di riferimento nella quale le eventuali disomogeneità presenti nelle singole serie sj sono smorzate dall’operazione di media. Esistono diversi test utilizzabili per la verifica dell’omogeneità di una serie storica. E’ possibile, inoltre, utilizzare, più serie singole come riferimento (HOCLIS procedure); in questo caso non si richiede l’esistenza a priori di una serie omogenea di riferimento. 5.4 LA STIMA DEI DATI CLIMATICI MANCANTI RICOSTRUZIONE DELLE SERIE STORICHE PER LA Diversi autori hanno studiato il problema dell’analisi di banche dati climatiche al fine di determinare la presenza di dati mancanti o inattendibili e di stimare in tali casi il valore della grandezza climatica mancante in modo da ottenere delle serie storiche complete di dati climatici. Nella maggior parte dei casi tale problema viene risolto facendo ricorso alle tecniche di interpolazione spaziale dei dati di pioggia. Lo scopo è quello di stimare la precipitazione in un punto non strumentato, servendosi dei dati registrati in altre posizioni da altri strumenti. In questo modo si possono costruire delle mappe di precipitazione valide per interi regioni, e non solo per i punti in cui sono posizionati gli strumenti di misura. Nei vari studi disponibili in letteratura, quasi sempre vengono utilizzati precipitazioni medie annuali e medie mensili, mentre in pochissimi casi vengono interpolati addirittura dati giornalieri. Viene studiata la correlazione spaziale tra i dati misurati nelle stazioni pluviometriche e anche la correlazione della variabile precipitazione con altre variabili, prima tra tutte la quota del terreno ma anche l’esposizione e la pendenza del terreno, la presenza e la forza di determinati venti. Gli algoritmi più di frequente utilizzati sono il kriging ordinario e, ancora di più, la regressione lineare multipla. Per esaminare gli effetti di due o più parametri contemporaneamente, per esempio la precipitazione e la quota del terreno, sono stati utilizzati vari metodi, quali ad esempio il cokriging e, appunto, la regressione lineare multipla, che risulta molto più semplice da utilizzare e implementare. Molto spesso vengono accoppiati modelli deterministici a modelli geostatistici. L’accoppiata più utilizzata e con migliori risultati consiste nello studiare con la regressione multipla la correlazione tra i vari parametri e la pioggia e di utilizzare il kriging per interpolare spazialmente i residui. Gandin (1965) ha proposto un modello, chiamato Interpolazione Ottimale, che stima il valore in un punto non strumentato come combinazione lineare di dei valori misurati in n stazioni vicine tramite dei coefficienti λi. Per avere stime non 122 G. La Loggia, L.V. Noto, F. Viola, M.T. Noto distorte, si applica il modello ai residui, cioè le deviazioni dalla media. I pesi vengono determinati minimizzando la varianza. Come si vede l’interpolazione ottimale presenta molte analogie con il kriging; la differenza risiede che per ottenere una stima non distorta, nel kriging vengono vincolati i pesi; inoltre nell’interpolazione ottimale al posto della semivarianza viene studiata la covarianza. Quest’ultima differenza, in realtà, è di poco conto, in quanto abbiamo visto che per variabili stazionarie la covarianza e la semivarianza differiscono per una costante. Creutin e Obled (1982) hanno pubblicato uno studio comparativo, accompagnato da un caso studio, delle varie tecniche di interpolazione disponibili. Lo stesso approccio di Creutin e Obled viene seguito in molti altri studi analoghi (Goovaerts, 1999a e 1999b; Tabios e Salas, 1985; Phillips et al., 1992; MartìnezCob, 1996), nei quali si dimostra come i metodi geostatistici portino a stime migliori di quelle date dai metodi convenzionali. L’approccio consiste intanto nel suddividere i vari metodi in due classi, a secondo che questi usino solo il dato pluviometrico o anche la quota del terreno: A. Metodi che utilizzano esclusivamente il dato di pioggia: Poligoni di Thiessen; IDW (Inverse Distance Weighting) o ISD (Inverse Square Distance); Kriging ordinario; EOF (Emphirical Orthogonal Function Analysis). B. Metodi che utilizzano anche l’elevazione: Regressione lineare; Kriging semplice con medie locali variabili (SKlm); Kriging con deriva esterna (KED); Cokriging. I metodi del primo gruppo stimano la variabile precipitazione in un punto utilizzando unicamente l’informazione precipitazione, nota nei punti di campionamento. I Poligoni di Thiessen sono sempre stati utilizzati per il ragguaglio delle piogge, mentre qui vengono utilizzati per la loro interpolazione. Il metodo è molto semplice e molto approssimato: ad ogni punto non strumentato viene assegnata la pioggia misurata nella stazione più vicina. Nel metodo IDW, il valore di un punto non strumentato è dato da una media pesata dei valori di n stazioni vicine. Il peso da dare ad ogni stazione è inversamente proporzionale alla distanza. In particolare il metodo ISD il peso è proporzionale al quadrato della distanza (da qui il nome Inverse Square Distance). Anche nel kriging, la classe dei metodi geostatistici, la stima viene determinata Procedure di caratterizzazione dei dati storici 123 effettuando una stima pesata delle precipitazioni registrate in posizioni vicine. La differenza rispetto altri metodi simili non geostatistici, come l’IDW, sta nella determinazione dei pesi. Nel kriging, infatti, i pesi sono una funzione dell’autocorrelazione spaziale della variabile che si vuole interpolare, cioè la precipitazione. Nei metodi che sono inseriti nel secondo gruppo, la stima della precipitazione viene fatta in base sia all’informazione precipitazione, nota nei punti di campionamento, ma anche utilizzando la correlazione tra la precipitazione e un’altra informazione, nella fattispecie la quota del terreno. Come primo metodo viene studiata una regressione lineare semplice del tipo: * PRL (u 0 ) = α + βQ(u 0 ) (5.5) dove con la solita notazione P* è la stima della precipitazione e Q è la quota. Quindi secondo questo modello la stima della precipitazione in un punto u0 dipende unicamente dalla quota del terreno in quel punto, attraverso una relazione lineare. E non dipende in nessun modo da come la precipitazione vari nell’intorno del punto u0. Con la regressione lineare non facciamo altro che riscalare la quota del terreno attraverso il coefficiente β e la costante α. Di questo semplice modello esistono diverse possibili evoluzioni. Per esempio, unendo alla variabile indipendente quota altre variabili indipendenti si passa a modelli regressivi lineari multipli. Un’altra possibile evoluzione è costituita dalla Regressione Geograficamente Pesata (GWR, Geographically Weighted Regression), proposta da Brunsdon (2001) sul territorio inglese. In questo modello i coefficienti β e α non sono costanti ma dipendono dalla posizione. Questo metodo permette di studiare la non-stazionarietà della relazione pioggiaelevazione. Nella regressione multipla la precipitazione è modellata come una funzione di un certo numero di variabili caratterizzanti la morfologia del territorio. Nei vari modelli sviluppati e disponibili in letteratura, si trova ovviamente la quota del terreno, presa dal DEM del territorio, la sua esposizione (Aspect) e la sua pendenza (Slope). Per particolari regioni con conformazioni speciali, per esempio isole che si allungano in una certa direzione, viene tenuto conto anche della latitudine o della longitudine, viste come distanza da una certa linea verticale o orizzontale. Ne è un esempio l’isola di Creta, che si sviluppa lungo un parallelo (Naoum, 2003 e 2004). La precipitazione è influenzata sia dalle variazioni geografiche che dalle variazioni stagionali. La durata e le caratteristiche delle stagioni sono funzioni della latitudine, ed entra in gioco anche la distanza dal mare visto come sorgente di umidità. La distribuzione spaziale delle piogge è fortemente influenzata anche dalla 124 G. La Loggia, L.V. Noto, F. Viola, M.T. Noto circolazione atmosferica (Wibig, 1999; Conway et al., 1996; Roebber and Bosart, 1998; Busuioc et al., 2001), dai venti e dalla loro direzione. La direzione dalla quale spira il vento si mantiene infatti in un range di 90° nell’arco del singolo evento piovoso. Johansson (2003) inserisce tra i parametri della regressione multipla la forza del vento, la pendenza del lato sopravvento e di quello sottovento e in ultimo la distanza dal mare. Altri utilizzano in aggiunta l’umidità relativa dell’aria. Molto spesso le variabili vengono trasformate o combinate tra loro (Naoum, 2003 e 2004; Marquìnez, 2003): P* = (b1 x1 + b2 x2 + b3 x3 ) ( ) + b4 x12 + b5 x22 + b6 x32 + (5.6) + (b7 x1 x2 + b8 x1 x3 + b9 x2 x3 ) + b0 ( ) + (b DEM + b DEM + b DEM ) + + (b SLOPE + b SLOPE + b SLOPE ) + + (b D + b D + b D ) + + (b D + b D + b D ) + b P* = b1DEM + b2 DEM 2 + b3 DEM 3 + 4 b 2 b 5 3 b 6 2 7 8 3 (5.7) 9 10 ovest 11 2 ovest 12 3 ovest 13 mare 14 2 mare 15 3 mare 0 oppure viene operata direttamente una trasformazione della precipitazione, per esempio usando la radice quadrata o il logaritmo: log P* = α 0 + α1 log( X 1 ) + α 2 log( X 2 ) + ... + α n log( X n ) + ε (5.8) Un’altra evenienza è che la stessa caratteristica del territorio venga inserita nel modello non come unico parametro, ma sotto forma di diverse variabili. Per esempio per tenere conto della conformazione del territorio, Drogue (2002) utilizza diversi parametri di elevazione: la quota nel punto della stazione, la quota media e la pendenza media calcolata su un quadrato di tre metri di lato, centrato nella stazione, le stesse quantità su un quadrato di cinque metri, eccetera. Per ottimizzare metodi come il precedente, che possono avere anche centinaia di variabili, viene utilizzato spesso l’approccio stepwise, con il quale si eliminano una alla volta le variabili indipendenti del modello che fanno peggiorare il coefficiente di determinazione R2. I risultati ottenuti dalla regressione semplice o multipla vengono spesso raffinati effettuando un kriging sui residui (Martìnez-Cob, 1996; Thomas, 2004; Kyriakidis, 2004). Procedure di caratterizzazione dei dati storici 125 Gli altri metodi del secondo gruppo sono geostatistici. Sono delle estensioni del kriging ordinario nelle quali possono essere studiate più variabili o informazioni contemporaneamente. In questi metodi si ha il vantaggio che la precipitazione non dipende più unicamente dalla quota del terreno, ma anche dal comportamento della variabile precipitazione nel dominio. I vari metodi di interpolazione geostatistici danno buoni risultati, paragonabili fra loro. In generale, comunque, le performance di questi metodi dipendono sia dalla variabile da interpolare che dalla configurazione spaziale dei dati e dalle ipotesi fatte (Isaaks and Srivasta, 1989), quindi è bene testarli tutti in ogni applicazione, per vedere quale ottiene il migliore risultato. La varianza σ2, è un buon indicatore dell’incertezza delle stime ottenute con metodi geostatistici. Diversi altri autori utilizzano i metodi geostatistici, quali il kriging o il cokriging, per interpolare spazialmente solo un residuo. Per esempio Kyriakidis (2004) determina la precipitazione, a scala giornaliera, come somma di una componente deterministica più un certo residuo stazionario con media nulla. Le due parti sono indipendenti tra loro. La componente deterministica viene studiata attraverso un modello locale, secondo il quale la precipitazione è funzione della variabile tempo; i residui verranno invece interpolati spazialmente utilizzando il cokriging. La parte deterministica è data da: n [ ] m = ∑ bi f (5.9) i =1 dove f è una funzione del tempo detta profilo temporale, unica per tutte le stazioni, cioè indipendente dallo spazio, che tiene conto delle variazioni climatiche a scala regionale nel tempo; per esempio eventi periodici possono essere descritti da funzioni sinusoidali. Questo fattore f può essere calcolato attraverso l’analisi EOF (Rao e Hsieh, 1991; Hisdal e Tveito, 1992; Sauquet et al., 2000). bi indica una serie di coefficienti incogniti, variabili nello spazio, autocorrelati e correlati con la quota. Si determinano attraverso un’applicazione dei minimi quadrati ordinari. Individuata la parte deterministica, si calcolano i residui per tutti i punti strumentati. Sui residui si effettua l’interpolazione con il cokriging ottenendo il valore del residuo per ogni punto non strumentato. La parte deterministica può essere calcolata anche in altri modi. Generalmente vengono utilizzati modelli regressivi lineari o lineari multipli visti prima. Sebbene la gran parte degli studi è basata sui modelli appena descritti, esistono una moltitudine di diversi altri metodi. Per esempio l’interpolazione con superfici spline e l’analisi EOF (Empirical Orthogonal Function) (Creutin et al., 1982). Con la Spline si determina una superficie interpolante polinomiale; questo metodo è deterministico e può essere applicato globalmente oppure localmente su 126 G. La Loggia, L.V. Noto, F. Viola, M.T. Noto un sottoinsieme di punti. Il metodo EOF (Emphirical Orthogonal Function Analysis), invece, è una estensione bidimensionale del metodo Karhunen-Loeve (Papoulis, 1965). La stima viene effettuata con una combinazione lineare di autovalori ϕi attraverso dei valori Yi ottenuti tramite proiezione ortogonale della quantità da stimare, cioè la pioggia, sugli autovalori. L’unico problema è il calcolo degli autovalori. Linderson (2003) si serve della EOF utilizzando le seguenti informazioni: forza e “vorticità” del vento, pressione atmosferica, pendenza ed esposizione del terreno, distanza topografica dal mare e distanza da una linea di riferimento con direzione SO-NE. A questo punto individua dei pattern di pioggia giornaliera, correlati con attività ciclonica o anticiclonica, o correlati con i venti, per esempio il pattern di pioggia con vento proveniente da ovest, o da nordovest, ecc. La covariabilità spaziale è alta e dipende molto dalla pressione per le piogge giornaliere. La precipitazione giornaliera dipende molto dalla direzione del vento; inoltre, in giorni in cui la circolazione atmosferica è di tipo ciclonico, la precipitazione è legata maggiormente alla topografia del territorio. Molto importante è anche la distanza dal mare, visto che l’umidità è uno degli “ingredienti” essenziali per la pioggia. Un altro metodo (Jeffrey, 2001) utilizza la normalizzazione (Hutchinson, 1993). Secondo la normalizzazione una potenza della precipitazione, con una opportuna frazione come esponente, ha approssimativamente una distribuzione normale. Dallo studio dei dati osservati si ricava un esponente di 0,5 costante per tutto il dominio. Il processo di interpolazione si sviluppa in una serie di passaggi, nei quali si utilizza la cross-validation per trovare i vari parametri ottimali: 1. 2. 3. Si calcola media e varianza dei dati trasformati (cioè elevati a 0,5); Con la spline a tre variabili si calcola la media e la varianza; I dati di pioggia trasformati vengono normalizzati con i parametri calcolati al punto 1; 4. I dati di pioggia normalizzati vengono interpolati attraverso il kriging, utilizzando un semivariogramma empirico esponenziale con nugget=0, per ottenere una interpolazione esatta; 5. Per ottenere i dati di pioggia definitivi si effettua la trasformazione inversa dei risultati del punto 4 utilizzando i parametri calcolati al punto 2. 6. Vengono calcolati gli errori tra i dati osservati e i dati ottenuti al punto 5. Tra l’altro Jeffrey utilizza una doppia interpolazione per eliminare eventuali dati errati e outliers: dopo una prima interpolazione vengono calcolati i residui; alti residui sono indicativi di dati errati e vengono quindi esclusi da un successivo e finale stadio di interpolazione. Come valore di soglia viene utilizzato quel valore che non elimina più del 5% dei dati. Guenni (1998) utilizza un criterio diverso da tutti gli altri quando si tratta di Procedure di caratterizzazione dei dati storici 127 stimare i parametri di un modello. In generale vengono usati il metodo dei momenti, in quanto il più semplice metodo della massima verosimiglianza è più difficile da utilizzare in forma chiusa. Tuttavia esistono dei metodi con i quali la stima di massima verosimiglianza è possibile operando una trasformazione di Fourier dei dati (Chandler, 1995). Guenni, invece, considera i parametri del modello come variabili regionalizzate che possono essere quindi interpolate. Cioè vengono interpolati i parametri del modello, invece che direttamente i dati di pioggia. In questo modo si riesce ad avere una rappresentazione della variabilità spaziale e dei cicli stagionali tramite isoplete dei coefficienti. Con queste mappe è possibile determinare la pioggia con il modello scelto. Guenni e Hutchinson utilizzano ad esempio un modello prettamente statistico, il modello RPPM (Rectangular Pulses Poisson Model), che è una semplificazione di un altri modello, l’NSRP (Neyman-Scott Rectangular Pulses, Cowpertwait et al., 1996). Questo modello viene tarato sulle piogge giornaliere in ogni stazione, per effettuare la stima della pioggia in punti non strumentati. Secondo il modello RPPM, la pioggia arriva secondo un processo di Poisson con parametro λ. Per ogni occorrenza del processo di Poisson (al tempo ti) si ha un evento di pioggia di data durata li e intensità xi. Al generico istante t l’intensità totale Y(t) è data dalla somma di tutti i contributi xi essendo infatti possibili sovrapposizioni di diversi eventi. Calcolato il parametro λ in tutte le stazioni, possiamo effettuare la sua interpolazione, utilizzando una spline, per produrre le carte isoplete di cui sopra. Gonzàles-Hidalgo (2000) analizza la variabilità spaziale e temporale delle medie annuali di pioggia, per determinare se esistono dei trend temporali e, nel caso, se questi siano nel verso di una diminuzione o di un aumento della pioggia. I dataset di pioggia vengono inizialmente testati per omogeneità, in modo da selezionare solo le stazioni che abbiano una serie omogenea di dati che coprano come minimo il periodo 1961-1990 definito dal WMO. Per ogni stazione viene calcolata la media annuale R e l’indice PCI (Precipitation Concentration Index, De Luìs et al., 1997), definito come: 12 PCI = 100 ∑P i =1 2 i ⎛ ⎞ ⎜ ∑ Pi ⎟ ⎝ i=1 ⎠ 12 2 (5.10) dove Pi è la pioggia al mese i-esimo. Valori di PCI inferiori a 10 indicano che la distribuzione mensile di pioggia è 128 G. La Loggia, L.V. Noto, F. Viola, M.T. Noto uniforme, valori compresi tra 11 e 20 indicano variazioni stagionali, valori superiori a 21 indicano una forte variabilità tra i mesi. Infine il kriging viene utilizzato per l’interpolazione spaziale di questi dati. Le variabili R e PCI vengono normalizzate, per potere confrontare i dati di anni diversi; altrimenti la diversità delle misure sarebbe stata maggiormente legata alle variazione dei dati medi di pioggia piuttosto che alla variabilità della pioggia tra i vari anni. L’ultimo passaggio sui dati prima dell’analisi è lo smoothing dei dati con una media mobile di 9 anni (Wheeler e Martìn-Vide, 1992; Salinger et al., 1995). Viene utilizzato il test statistico Cramèr-von Mises con opportune modifiche dovute al fatto che i punti non possono essere scelti casualmente, in quanto le stazioni di misura sono già posizionate (Syrjala, 1996). Quindi come variabile casuale viene scelto il segno del trend in ogni stazione, anziché la posizione della stazione. Il test consiste nel calcolo delle differenze al quadrato tra le due distribuzioni cumulate calcolate su tutte le stazioni. Ad ogni stazione viene assegnato un simbolo, a seconda se in essa viene osservato un trend positivo, negativo o nessun trend (rispettivamente si usa “+”, “-” , “o”). Dopodichè si eseguono dei confronti a coppie tra le distribuzioni: “+” contro “-”,“-” contro “o”,“o” contro “+”. Inoltre vengono calcolati quattro statistici Ψ1, Ψ2, Ψ3 e Ψ4, che indicano la distribuzione dei segni di trend lungo quattro diversi percorsi: due longitudinali e due latitudinali. Adesso si tratta di vedere se per ogni stazione le 3 distribuzioni sono omogenee, quindi c’è semplicemente una certa variazione casuale, oppure se diversamente una distribuzione è più frequente delle altre, utilizzando il test Cramèr-von Mises. Si nota un trend negativo nelle zone umide (zone con precipitazione media annua maggiore di 550 mm/anno) e nelle zone vicine al mare, mentre nelle zone interne sono presenti trend positivi e trend negativi. Per determinare quale metodo tenga il comportamento migliore si utilizzano generalmente due metodi: la validazione e/o la cross-validazione. Nella validazione, il dataset viene suddiviso in due gruppi: nei punti appartenenti al secondo gruppo viene stimata la pioggia attraverso il modello costruito con i dati del primo sottoinsieme. La differenza tra dato stimato e dato misurato costituisce l’errore: e = P*(u) – P(u) (5.11) Nella cross-validation, invece, si toglie dai dati una stazione per volta e se ne stima il valore con i vari modelli, determinando l’errore commesso. Per confrontare tra loro diversi metodi si usano degli statistici determinati sugli errori. Gli statistici più spesso utilizzati sono l’errore assoluto medio MAE, Procedure di caratterizzazione dei dati storici 129 l’errore quadratico medio MSE, l’errore quadratico medio standardizzato SMSE, la distorsione (Bias) o MBE (Magnitude of Mean Errors), la deviazione standard degli errori e la varianza dell’errore σ2. Queste quantità sono definite nel seguente modo: MAE = MSE = 1 n * ∑ Pi (u ) − Pi (u) n i=1 [ ] [ ] [ ] 2 1 n * Pi (u ) − Pi (u ) ∑ n i=1 * 1 n Pi (u ) − Pi (u ) SMSE = ∑ n i=1 σ i2 (u ) MBE = (5.12) 1 n * ∑ Pi (u) − Pi (u) n i=1 2 (5.13) (5.14) (5.15) In generale, comunque, le performance dei metodi geostatistici dipendono sia dalla variabile da interpolare che dalla configurazione spaziale dei dati e dalle ipotesi fatte (Isaaks and Srivasta, 1989), ma danno sempre risultati migliori dei metodi più semplici, come l’IDW o il Thiessen, o puramente deterministici, come la regressione lineare semplice (Goovaerts, 1999; Drogue, 2002). Lin (2004) valuta i modelli attraverso la generazione di una griglia di valori casuali secondo l’algoritmo HYDRO_GEN (Bellin e Rubin, 1996). Vengono scelti 25 punti su questa griglia e con questi vengono calcolati i restanti 75 valori con diversi metodi di interpolazione, calcolando l’RMSE. La scelta dei 25 punti è casuale e viene ripetuta 10 volte. Inoltre i vari metodi vengono applicati ad un caso studio reale. 5.5 CRITERI PER LA SELEZIONE DI UNA RETE DI QUALITA’ Si è voluto proporre una procedura quanto più oggettiva possibile per definire la qualità di un sistema di monitoraggio della siccità articolato secondo tre passi successivi. Si considera sia il caso di una rete per il monitoraggio delle grandezze idro-meteorologiche già operativa, che il caso di rete nuova, ancora non entrata in funzione o con pochi anni di funzionamento. Le procedure che seguono hanno il fine valutare il livello di qualità della rilevazione dei dati, sia con riferimento alla singola stazione di misura, che 130 G. La Loggia, L.V. Noto, F. Viola, M.T. Noto all’intero sistema di raccolta dati. I criteri qui proposti per le reti esistenti guardano alla storia delle stazioni, alla quantità e alla continuità dei dati raccolti: tale approccio è evidentemente orientato all’analisi della siccità nel tempo. Per le reti nuove il progettista della rete può decidere a priori il livello di qualità da perseguire nella costruzione della stessa. Seguendo le indicazioni circa le caratteristiche degli strumenti, tracciando nel tempo la posizione e la tipologia degli strumenti e avendo cura di rispettare le densità spaziali appresso indicate, il gestore potrà decidere di ottenere una rete per il monitoraggio di grandezze idrometeorologiche di prefissata qualità. I criteri proposti per le reti di nuova progettazione sono validi allorché si voglia monitorare la siccità in tempo reale. Le etichette di qualità sono qui definite secondo criteri non oggettivi e proprio per questo criticabili, ma l’intento è quello di creare un riferimento unico comune per le diverse realtà che si occupano del monitoraggio della siccità che consenta un confronto agile e omogeneo dei risultati. Il primo passo della procedura proposta riguarda l’attribuzione di una etichetta di qualità alla singola stazione di misura della generica grandezza idrometeorologica. Verranno prese in considerazione le stazioni di misura della pioggia, della temperatura, dell’umidità, della radiazione solare e dei livelli idrici. Una volta etichettate tutte le stazioni si passa all’attribuzione dell’etichetta di qualità alla rete di misura della generica grandezza idro-meteorologica. Infine si affronta il problema dell’attribuzione dell’etichetta di qualità al sistema di monitoraggio della siccità. 5.5.1 ATTRIBUZIONE DELL’ETICHETTA DI QUALITÀ ALLA SINGOLA STAZIONE DI MISURA DELLA GENERICA GRANDEZZA IDROMETEOROLOGICA 5.5.1.1 Misura della pioggia Con riferimento ai dati di pioggia, una generica stazione di una rete esistente, o da installare, può essere etichettata come stazione di qualità se la risoluzione temporale dello strumento utilizzato risulta almeno giornaliera, la risoluzione del dato è compresa tra 0.5/0.05 mm e la precisione è di 0.3/0.1 mm per valori di piovosità inferiori a 4 mm e compresa tra 7.5% e 2.5% per valori superiori a 4 mm. Se la generica stazione di nuova installazione opera secondo i requisiti di tracciabilità del dato, avendo cura di registrare il dato in continuo, verificando i dati on-line e off-line, allora la stazione può essere etichettata come di qualità ottima. 131 Procedure di caratterizzazione dei dati storici La qualità delle stazioni appartenenti a reti esistenti e funzionanti può essere etichettata come sufficiente, buona o ottima se la stazione supera contemporaneamente tutti i requisiti della Tabella 1. Tabella 5.1 – Qualità delle stazioni Soglie di qualità Sufficiente Buona Ottima Anni di funzionamento ≥ [anni] 30 40 50 Massimo periodo interpolato ≤ [mesi] 10 7 5 Totale dati interpolati ≤ [mesi] 20 10 5 Massimo periodo mancante ≤ [mesi] 20 10 5 Totale dati mancanti ≤ [mesi] 40 20 10 Presenza outliers (μ ±3σ) ≤ [-] 15 10 5 Superamento test di omogeneità [-] yes yes yes Tracciabilità della posizione dello strumento [-] yes yes yes Tracciabilità della strumentazione utilizzata [-] yes yes yes 5.5.1.2 Misura della temperatura Con riferimento ai dati di temperatura, una generica stazione di una rete esistente, o da installare, può essere etichettata come stazione di qualità se la risoluzione dello strumento è compresa tra 0,2°C e 0,05°C, se la precisione è compresa tra 0,5 e 0,1°C., e se la risoluzione temporale è oraria con valori della massima e minima calcolati ogni 12 ore. Se la generica stazione di nuova installazione opera secondo i requisiti di tracciabilità del dato, avendo cura di registrare il dato in continuo, verificando i dati on-line e off-line, allora la stazione può essere etichettata come di qualità ottima. La qualità delle stazioni appartenenti a reti esistenti e funzionanti può essere etichettata come sufficiente, buona o ottima se la stazione supera contemporaneamente tutti i requisiti della Tabella 2. 132 G. La Loggia, L.V. Noto, F. Viola, M.T. Noto Tabella 5.2 - Qualità delle stazioni Soglie di qualità Sufficiente Buona Ottima Anni di funzionamento ≥ [anni] 20 30 40 Massimo periodo interpolato ≤ [mesi] 10 7 5 Totale dati interpolati ≤ [mesi] 20 10 5 Massimo periodo mancante ≤ [mesi] 20 10 5 Totale dati mancanti ≤ [mesi] 40 20 10 Presenza outliers (μ ±3σ) ≤ [-] 20 15 10 Superamento test di omogeneità [-] si si si Tracciabilità della posizione dello strumento [-] si si si Tracciabilità della strumentazione utilizzata [-] si si si 5.5.1.3 Misura dell’umidità Con riferimento ai dati di umidità, una generica stazione di una rete esistente, o da installare, può essere etichettata come stazione di qualità se la risoluzione dell’umidità relativa è compresa tra 2 e 0,5% con una precisione compresa tra 5 ed 1 % per valori di umidità relativa inferiore al 75% e 2 - 0.5 % per valori dell’umidità relativa maggiore al 75% e se la risoluzione temporale è almeno giornaliera. Se la generica stazione di nuova installazione opera secondo i requisiti di tracciabilità del dato, avendo cura di registrare il dato in continuo, verificando i dati on-line e off-line, allora la stazione può essere etichettata come di qualità ottima. La qualità delle stazioni appartenenti a reti esistenti e funzionanti può essere etichettata come sufficiente, buona o ottima se la stazione supera contemporaneamente tutti i requisiti della Tabella 3. 133 Procedure di caratterizzazione dei dati storici Tabella 5.3 - Qualità delle stazioni Soglie di qualità Sufficiente Buona Ottima Anni di funzionamento ≥ [anni] 7 10 15 Massimo periodo interpolato ≤ [mesi] 10 7 5 Totale dati interpolati ≤ [mesi] 20 10 5 Massimo periodo mancante ≤ [mesi] 20 10 5 Totale dati mancanti ≤ [mesi] 40 20 10 Presenza outliers (μ ±3σ) ≤ [-] 15 10 5 Superamento test di omogeneità [-] si si si Tracciabilità della posizione dello strumento [-] si si si Tracciabilità della strumentazione utilizzata [-] si si si 5.5.1.4 Misura della radiazione solare Con riferimento ai dati di radiazione solare, una generica stazione di una rete esistente, o da installare, può essere etichettata come stazione di qualità se la risoluzione temporale è oraria più un massimo giornaliero e la risoluzione è di 20/10 kJ/m2 e precisione del 7/4%. Se la generica stazione di nuova installazione opera secondo i requisiti di tracciabilità del dato, avendo cura di registrare il dato in continuo, verificando i dati on-line e off-line, allora la stazione può essere etichettata come di qualità ottima. La qualità delle stazioni appartenenti a reti esistenti e funzionanti può essere etichettata come sufficiente, buona o ottima se la stazione supera contemporaneamente tutti i requisiti della Tabella 4. 134 G. La Loggia, L.V. Noto, F. Viola, M.T. Noto Tabella 5.4 - Qualità delle stazioni Soglie di qualità Sufficiente Buona Ottima Anni di funzionamento ≥ [anni] 7 10 15 Massimo periodo interpolato ≤ [mesi] 10 7 5 Totale dati interpolati ≤ [mesi] 20 10 5 Massimo periodo mancante ≤ [mesi] 20 10 5 Totale dati mancanti ≤ [mesi] 40 20 10 Presenza outliers (μ ±3σ) ≤ [-] 15 10 5 Superamento test di omogeneità [-] si si si Tracciabilità della posizione dello strumento [-] si si si Tracciabilità della strumentazione utilizzata [-] si si si 5.5.1.5 Misura dei livelli idrici Con riferimento ai livelli idrici, una generica stazione di una rete esistente (o da installare) può essere etichettata come stazione di qualità se la risoluzione temporale è oraria, la precisione dello strumento utilizzato è dell’ordine dello 0.1% o comunque non superiore a ± 5mm. Sia per stazioni di misura nuove o già esistenti, laddove la misura del livello idrico è finalizzata anche al calcolo della portata idrica defluente a mezzo di una scala di deflusso affinché la stazione sia etichettabile come stazione di qualità è necessario che il controllo della scala delle portate sia effettuato (o sia stata effettuata), almeno semestralmente e in occasione di eventi di piena. Se la generica stazione di nuova installazione opera secondo i requisiti di tracciabilità del dato, avendo cura di registrare il dato in continuo, verificando i dati on-line e off-line, allora la stazione può essere etichettata come di qualità ottima. Nel caso in cui la misura del livello idrico è finalizzata anche al calcolo della portata idrica defluente per tracciabilità deve intendersi anche il resoconto 135 Procedure di caratterizzazione dei dati storici dettagliato delle operazioni effettuate per la redazione della curva di deflusso e la memoria storica di tutte le curve utilizzate. La qualità delle stazioni operanti può essere etichettata come sufficiente, buona o ottima se la stazione supera contemporaneamente tutti i requisiti della Tabella 5. Tabella 5.5 - Qualità delle stazioni Soglie di qualità Sufficiente Buona Ottima Anni di funzionamento ≥ [anni] 20 30 40 Massimo periodo interpolato ≤ [mesi] 20 10 5 Totale dati interpolati ≤ [mesi] 100 80 50 Massimo periodo mancante ≤ [mesi] 30 20 10 Totale dati mancanti ≤ [mesi] si si si Presenza outliers (μ ±3σ) ≤ [-] si si si Superamento test di omogeneità [-] si si si Tracciabilità della posizione dello strumento [-] Tracciabilità della strumentazione utilizzata [-] 20 30 40 5.5.2 ATTRIBUZIONE DELL’ETICHETTA DI QUALITÀ ALLA RETE DI MISURA DELLA GENERICA GRANDEZZA IDROMETEOROLOGICA Attribuita l’etichetta di qualità alla singola stazione di misura della generica grandezza idro-meteorologica, sia nel caso di rete esistente che di rete nuova, si vuole ora assegnare un giudizio alla rete di misura nel suo complesso. Si farà riferimento a reti di misura della pioggia, della temperatura, dell’umidità, della radiazione solare e dei livelli idrici, ancora una volta con 136 G. La Loggia, L.V. Noto, F. Viola, M.T. Noto riferimento alle reti esistenti o di nuova progettazione. 5.5.2.1 Misura della pioggia Una rete per la misura della pioggia, esistente o di nuova progettazione, sarà definita di qualità sufficiente, buona o ottima se le stazioni ad essa appartenenti sono tutte etichettate come di qualità sufficiente, buona o ottima e se la risoluzione spaziale risulta essere compresa nei limiti della tabella 6. Tabella 5.6 – Qualità della rete Soglie di qualità Risoluzione spaziale ≥ [numero stazioni/km2] Sufficiente Buona Ottima 1/10000 1/2500 1/900 5.5.2.2 Misura della temperatura Una rete per la misura della temperatura, esistente o di nuova progettazione, sarà definita di qualità sufficiente, buona o ottima se le stazioni ad essa appartenenti sono tutte etichettate come di qualità sufficiente, buona o ottima e se la risoluzione spaziale risulta essere compresa nei limiti della tabella 7. Tabella 5.7 - Qualità della rete Soglie di qualità Risoluzione spaziale ≥ [numero stazioni/km2] Sufficiente Buona Ottima 1/22500 1/10000 1/4500 5.5.2.3 Misura dell’umidità Una rete per la misura dell’umidità, esistente o di nuova progettazione, sarà definita di qualità sufficiente, buona o ottima se le stazioni ad essa appartenenti sono tutte etichettate come di qualità sufficiente, buona o ottima e se la risoluzione spaziale risulta essere compresa nei limiti della tabella 8. 137 Procedure di caratterizzazione dei dati storici Tabella 5.8 - Qualità della rete Soglie di qualità Risoluzione spaziale ≥ [numero stazioni/km2] Sufficiente Buona Ottima 1/22500 1/10000 1/4500 5.5.2.4 Misura della radiazione solare Una rete, esistente o di nuova progettazione, sarà definita di qualità sufficiente, buona o ottima se le stazioni ad essa appartenenti sono tutte etichettate come di qualità sufficiente, buona o ottima e se la risoluzione spaziale risulta essere compresa nei limiti della tabella 9. Tabella 5.9 - Qualità della rete Soglie di qualità Risoluzione spaziale ≥ [numero stazioni/km2] Sufficiente Buona Ottima 1/6400 1/4225 1/2500 5.5.2.5 Misura dei livelli idrici Una rete per la misura dei livelli idrici, esistente o di nuova progettazione, è definita di qualità se sono monitorati tutti i corsi d’acqua naturali di primo ordine recapitanti direttamente in mare (ordinamento della rete secondo Shreve) il cui bacino imbrifero abbia una superficie maggiore di 200 km2 e tutti i corsi d’acqua naturali di secondo ordine o superiore il cui bacino imbrifero abbia una superficie maggiore a 400 km2 . In aggiunta a queste caratteristiche, che debbono pensarsi come basilari per l’attribuzione dell’etichetta di qualità, una rete per la misura dei livelli idrici, esistente o di nuova progettazione, è definita di qualità sufficiente, buona o ottima se le stazioni ad essa appartenenti sono tutte etichettate come di qualità sufficiente, buona o ottima. 138 G. La Loggia, L.V. Noto, F. Viola, M.T. Noto 5.6 CRITERI PER L’ASSEGNAZIONE DI UN GIUDIZIO DI QUALITA’ ALLA RETE PER IL MONITORAGGIO DELLA SICCITA’ In precedenza sono stati illustrati i criteri per poter assegnare un giudizio di qualità alle reti per il monitoraggio della pioggia, della temperatura, dell’umidità, della radiazione solare e dei livelli idrici. Si vuole ora concentrare l’attenzione sul monitoraggio della siccità e sulle reti preposte a questo scopo. I principi di seguito enunciati valgono sia per le reti esistenti che per quelle nuove. 5.6.1 RETE PER IL MONITORAGGIO DELLA SICCITÀ DI QUALITÀ SUFFICIENTE Una rete di monitoraggio della siccità che comprenda: − − una rete per la misura della pioggia una per la misura della temperatura entrambe di qualità sufficiente è definita di qualità sufficiente. 5.6.2 RETE PER IL MONITORAGGIO DELLA SICCITÀ DI QUALITÀ BUONA Una rete di monitoraggio della siccità che comprenda: − − − una rete per la misura della pioggia, una rete per la misura della temperatura, una rete per la misura della portata tutte di qualità buona, così come precisato sopra, è definita di qualità buona. 5.6.3 RETE PER IL MONITORAGGIO DELLA SICCITÀ DI QUALITÀ OTTIMA Una rete di monitoraggio della siccità che comprenda reti: − − − − − per la misura della pioggia, della temperatura, dell’umidità, della radiazione solare, della portata. tutte di qualità ottima, così come precisato sopra, è definita di qualità ottima. Procedure di caratterizzazione dei dati storici 5.7 139 BIBLIOGRAFIA Plummer N., Allsopp T., Lopez J.A. (2003) Guidelines on Climate Observation Networks and Systems, WMO/TD N.1185 Aguilar E., Auer I., Brunet M., Peterson T.C., Wieringa J. (2003) Guidelines on Climate Metadata and Homogenization, WMO/TD N.1186 World Meteorological Organization, 1981: Manual on the Global Observing System. Volume 1: Global aspects. WMO-No. 544 Geneva. World Meteorological Organization, 1988: Practical experience of the operation of quality evaluation programs for automated observations both on land and over the sea (M. Field and J. Nash). Papers Presented at the WMO Technical Conference on Instruments and Methods of Observation (TECO-88) Leipzig, 16-20 May 1988, Instruments and Observing Methods Report No. 33, 222, Geneva. Böhm, R., Auer, I., Brunetti, M., Maugeri, M., Nanni, T., Schöner W., 2001: Regional Temperature Variability in the European Alps 1760-1998 from homogenised instrumental time series. Int. J. Climatol., 21, 1779-1801 Štepánek, P. (2005): AnClim - software for time series analysis. Dept. of Geography, Fac. of Natural Sciences, MU, Brno. (http://www.sci.muni.cz/~pest/software.html) 6. ASPETTI DI QUALITA’ PER L’OTTENIMENTO DI MAPPE DI TEMPERATURA SUPERFICIALE DEL SUOLO (LST) DA DATI TELERILEVATI DA SATELLITE P. F. PELLEGRINI, G. ADEMBRI, M. TOMMASINI, M. INNOCENTI, G. POLI Stazione Ricezione Satelliti - PIN Servizi Didattici e Scientifici per l’Università di Firenze and Dipartimento di Ingegneria Elettronica e delle Telecomunicazioni, Università di Firenze Abstract: L’obiettivo era l’impostazione di un sistema di qualità per la ricezione, elaborazione ed archiviazione dati da satellite, finalizzato all’ottenimento di mappe di temperatura superficiale del suolo. La metodologia di lavoro adottata si è basata su un approccio “per processi” [UNI-EN-ISO9000:2005], al fine di evidenziare, ad ogni passo dell’elaborazione, i prodotti di ingresso, d’uscita e gli algoritmi utilizzati. Alla qualità complessiva finale del prodotto telerilevato concorrono i seguenti aspetti: ricezione, georeferenziazione, calibrazione radiometrica, modelli per l’ottenimento dei prodotti. Per consentire la verifica della rispondenza dei dati alle specifiche di produzione si considera un insieme di informazioni, che completano il prodotto elaborato (metadata) [UNI-EN-ISO19100:2005]. Altri aspetti riguardano l’organizzazione dei prodotti e delle informazioni ausiliarie in formati standard e l’organizzazione dell’archivio dati. La ricerca è stata applicata alla catena di elaborazione dati AVHRR/NOAA, con osservazioni intensive sul territorio della Sicilia, presso la Stazione Ricezione Satelliti del PIN-Prato. Key words: Land Surface Temperature, satellite remote sensing, data quality, metadata, archiving. 6.1 INTRODUZIONE Il rilevamento della temperatura superficiale del suolo (LST) su ampie zone e le sue variazioni nel tempo danno un contributo importante, non solo alla climatologia di un certo territorio, ma anche alla determinazione di altri parametri, quali l’inerzia termica, a sua volta legata al grado di umidità del terreno, al grado di salute della vegetazione e ai processi di desertificazione. Il telerilevamento effettuato da satellite su scala regionale offre la possibilità di monitorare i fenomeni di siccità e consente di integrare le misure dei dati a terra. 142 P. F. Pellegrini, G. Adembri, M. Tommasini, M. Innocenti, G. Poli La ricezione diretta dei dati permette l’elaborazione in tempo reale dei passaggi del satellite. Presso la Stazione Ricezione Satelliti del PIN - Polo Universitario di Prato (Università degli Studi di Firenze) è stato realizzato il sistema per l’ottenimento di mappe di parametri al suolo, a partire dai segnali ricevuti direttamente dai sensori AVHRR (Advanced Very High Resolution Radiometer) a bordo dei satelliti della serie NOAA. Particolare attenzione è stata dedicata alla qualità dei dati. La qualità di un parametro fisico, ottenuto dalle misure di radianza telerilevate da un sensore satellitare, dipende dalla qualità della catena di ricezione ed elaborazione dati. Nasce quindi l’esigenza di certificare i dati prodotti, ricevuti o elaborati, attraverso la descrizione delle procedure alle quali sono sottoposti. In questo contesto si è inteso realizzare uno strumento che consenta la verifica della qualità dei prodotti ottenuti dall’osservazione da satellite, tenendo conto del corretto funzionamento delle procedure realizzate, dell’aggiornamento dei coefficienti di calibrazione utilizzati, della corretta manutenzione del software, della corretta archiviazione dei dati. Attraverso alcune informazioni ausiliarie che completano le immagini prodotte (metadata), è possibile rendere conto della qualità del data set e consentire una verifica della rispondenza dei dati alle specifiche di produzione. 6.2 NORMATIVA DI RIFERIMENTO E PRINCIPI DI QUALITÀ PER LA GESTIONE DEI DATI DA SATELLITE L’approccio seguito per l’impostazione di un sistema di qualità per dati da satelliti fa riferimento alla norma UNI EN ISO 9000:2005. Per quanto riguarda invece la certificazione della qualità del prodotto fisico telerilevato si sono prese in considerazione alcune norme della serie UNI EN ISO 19100:2005, in particolare sono le: UNI EN ISO 19113:2005, UNI EN ISO 19114:2005 e UNI EN ISO 19115:2005. 6.2.1 NORMATIVA DI RIFERIMENTO Le norme di riferimento, con relativo sommario, prese in considerazione sono riportate di seguito: Aspetti di qualità per l’ottenimento di mappe di temperatura superficiale del suolo (LST) da dati telerilevati da satellite 143 UNI EN ISO 9000:2005 - Sistemi di gestione per la qualità - Fondamenti e vocabolario (ISO 9000:2005) Sommario: La presente norma è la versione ufficiale in lingua inglese e italiana della norma europea EN ISO 9000 (edizione settembre 2005). La norma descrive i fondamenti dei sistemi di gestione per la qualità, su cui si basa la famiglia di norme ISO 9000, e ne definisce i relativi termini. La norma si applica a: a) organizzazioni che cercano di ottenere vantaggi dall'attuazione di un sistema di gestione per la qualità; b) organizzazioni che cercano di assicurare che i loro fornitori soddisfino i loro requisiti relativi ai prodotti; c) utilizzatori dei prodotti; d) coloro che sono interessati ad una comune comprensione della terminologia utilizzata nella gestione per la qualità (per esempio: fornitori, clienti, autorità regolamentatrici); e) coloro, interni o esterni all'organizzazione, che valutano i sistemi di gestione per la qualità o li sottopongono ad audit per verificarne la conformità ai requisiti della ISO 9001 (per esempio: auditor, autorità regolamentatrici, organismi di certificazione); f) coloro, interni o esterni all'organizzazione, che addestrano o danno consiglio sul sistema di amministrazione di qualità appropriato a quella organizzazione; g) sviluppatori dei relativi standard. UNI EN ISO 19113:2005 - Informazioni geografiche - Principi di qualità (ISO 19113:2002) Sommario: La presente norma è la versione ufficiale in lingua inglese e italiana della norma europea EN ISO 19113 (edizione settembre 2005). La norma stabilisce i principi per la descrizione della qualità dei dati geografici e definisce i componenti per documentare le informazioni relative alla qualità. La norma si applica ai produttori di dati che forniscono informazioni di qualità per descrivere e verificare in quale misura i dati corrispondono alla realtà come definito nelle specifiche di prodotto, formali o implicite. La norma si applica anche agli utenti per stabilire se la qualità di determinati dati geografici è adeguata per l'applicazione richiesta. La norma dovrebbe essere seguita dagli organismi responsabili dell'acquisizione e vendita in modo da rendere possibile l'adeguamento alle specifiche di prodotto. La norma può inoltre essere utilizzata per la definizione di schemi applicativi e per definire requisiti di qualità. Oltre ad essere applicata ai dati geografici codificati numericamente, i principi della norma possono estesa a molti altre forme di dati geografici come mappe, tabelle e documenti testuali. 144 P. F. Pellegrini, G. Adembri, M. Tommasini, M. Innocenti, G. Poli UNI EN ISO 19114:2005 Informazioni geografiche - Procedure di valutazione della qualità (ISO 19114:2003) Sommario: La presente norma è la versione ufficiale in lingua inglese e italiana della norma europea EN ISO 19114 (edizione settembre 2005). La norma fornisce una struttura di riferimento di procedure per determinare e valutare la qualità applicabile a dati relativi a informazioni geografiche codificate numericamente, in coerenza con i principi di qualità definiti dalla norma UNI EN ISO 19113. La norma fornisce inoltre un quadro di riferimento per valutare e documentare i risultati relativi alla qualità dei dati solo come dati riferiti alla qualità dei metadati oppure come documentazione della qualità dei dati. La norma può essere applicata dai produttori di dati per fornire informazioni relative alla qualità e in particolare se l'insieme dei dati sia conforme alla specifica di prodotto e può essere applicata dagli utilizzatori di dati per determinare se l'insieme dei dati contenga o meno dati di qualità sufficiente per l'uso in una determinata applicazione. Benché la norma si applichi ai dati geografici rappresentati numericamente, i suoi principi possono essere estesi a molte altre forme di dati geografici come mappe, tabelle e documenti testuali. UNI EN ISO 19115:2005 Informazioni geografiche - Metadata (ISO 19115:2003) Sommario: La presente norma è la versione ufficiale in lingua inglese e italiana della norma europea EN ISO 19115 (edizione settembre 2005). La norma definisce gli schemi necessari a descrivere le informazioni geografiche ed i servizi. Fornisce informazioni relative all'identificazione, l'estensione, la qualità, gli schemi temporali e spaziali, i riferimenti spaziali e la distribuzione di dati geografici numerici. La norma si applica: − − − − − − − alla catalogazione di dati (dataset), attività di clearinghouse, descrizione completa dei dati; a dati geografici, serie di dati geografici e caratteristiche geografiche singole e proprietà delle caratteristiche. La norma definisce: sezioni di metadati obbligatorie e condizionali, entità di metadati ed elementi di metadati; l’insieme minimo di metadati richiesti dalla gamma completa di applicazioni di metadati (scoperta dei dati, determinazione della pertinenza per l'uso, accesso ai dati, trasferimento dei dati e uso dei dati numerici); elementi opzionali di metadati per permettere, ove richiesto, una descrizione standard di dati geografici più estesa; un metodo per estendere i metadati per soddisfare esigenze specifiche. Aspetti di qualità per l’ottenimento di mappe di temperatura superficiale del suolo (LST) da dati telerilevati da satellite 6.2.2 145 PRINCIPI DI QUALITÀ APPLICATI AI DATI TELERILEVATI DA SATELLITE PER L’OTTENIMENTO DELLA LST L’obiettivo di tutte le norme ISO della serie 9000 è quello di controllare tutte le fasi del processo che genera il prodotto o il servizio. Nella descrizione delle varie attività finalizzate al raggiungimento di un risultato finale, la norma ISO 9000:2005 consiglia di seguire un “approccio per processi”. La metodologia di lavoro adottata in questo studio è basata su tale approccio, al fine di evidenziare tutte le operazioni ad ogni passo dell’elaborazione. In Fig. 6.1 è mostrato lo schema di principio del sistema di ottenimento di mappe LST da dati AVHRR/NOAA, nel quale sono evidenziati regole, vincoli, risorse, strumenti, ingressi, uscite e le relazioni che intercorrono tra di essi. REGOLE: documentazione, archiviazione dati, metodologia Dato grezzo NOAA/AVHRR VINCOLI: operativi, finali prodotti Radianze canali 1 e 2 Geolocazione e Temperature di brillanza canali 4 e 5 calibrazione radiometrica Parametri geometrici Correzione atmosferica RISORSE: informazioni disponibili, ambiente di lavoro Parametri superficiali LST Coefficienti correzione atmosferica STRUMENTI: hardware, software Fig. 6.1 - Schema per il calcolo della temperatura superficiale del suolo (LST) da dati NOAA/AVHRR secondo l’analisi per processi (UNI EN ISO 9000:2005). Il primo elemento da considerare riguarda i vincoli a cui si deve sottostare per la creazione di un processo sostenibile, cioè di un processo che effettivamente crei un valore aggiunto. Occorrono poi regole stabilite a priori, che consentono la standardizzazione delle operazioni da compiere, oltre a garantire l’uniformità dei dati e delle procedure. La descrizione delle procedure deve seguire quindi uno schema standard in cui siano immediatamente riconoscibili ingressi e uscite del processo rappresentato, oltre agli algoritmi utilizzati. Altro aspetto importante è la disponibilità delle risorse necessarie all’esecuzione del processo, ovvero il reperimento di informazioni senza le quali non è possibile garantire l’elaborazione in tempo reale dei dati (ad es. coefficienti di calibrazione, profilo atmosferico). 146 P. F. Pellegrini, G. Adembri, M. Tommasini, M. Innocenti, G. Poli La disponibilità degli strumenti per l’esecuzione del processo impone dei limiti alle possibilità operative e alla fattibilità di una certa operazione, andando ad influire nella valutazione dell’efficienza del processo. Gli strumenti sono di due tipologie: strumenti hardware, quali l’apparato di ricezione dati e i sistemi di calcolo ed archiviazione; strumenti software, quali applicativi commerciali, “Open Source” e applicativi originali. I dati AVHRR/NOAA alla Stazione Ricezione Satelliti sono ricevuti da una strumentazione dedicata [TECNAVIA, 05] e vengono processati da una catena di elaborazione dati sviluppata appositamente (v. p. 6.3), che deriva dalla ricerca in ambito telerilevamento e dallo studio dello stato dell’arte. Sono stati sviluppati algoritmi originali per la georeferenziazione. Algoritmi noti in letteratura per i parametri superficiali sono stati adattati alle zone geografiche di interesse. Oltre alla qualità del processo, è stata prestata particolare attenzione anche alla qualità dei dati telerilevati ottenuti, intesa come conformità del prodotto a soddisfare i risultati attesi. Alla qualità del prodotto fisico telerilevato concorrono i seguenti aspetti: − − − − − qualità della ricezione; qualità della georeferenziazione; qualità della calibrazione radiometrica; qualità del modello di ottenimento del prodotto fisico al suolo; qualità complessiva finale del prodotto fisico. La qualità del dato ricevuto dipende dal sistema di acquisizione e trasmissione del dato a bordo del satellite, dal canale di comunicazione Satellite-Stazione e dagli apparati di ricezione, che vanno mantenuti in corretta operatività, garantendo l’aggiornamento delle risorse esterne. La procedura di georeferenziazione consente di poter riferire i dati acquisiti dal satellite alla loro posizione sul territorio. Questo è realizzato attraverso l’attribuzione per il pixel osservato della latitudine e della longitudine geografiche riferite ad un certo ellissoide e Datum. La correttezza di tale passaggio è di fondamentale importanza per l’affidabilità della misura e per l’analisi comparata con altri dati da satellite e/o acquisiti a terra. Per un’interscambiabilità di dati tra diversi paesi, sia in ambito Mediterraneo che in altre aree, i riferimenti geografici sono solitamente presi sulla base del Datum WGS84. La calibrazione radiometrica deve consentire di risalire dal valore registrato dal sensore al corrispondente valore di radianza (frequenze visibili, ch. 1, 2 e 3A AVHRR) o di temperatura di brillanza (frequenze infrarosso termico, ch. 3B, 4 e 5 AVHRR) che lo ha generato. Su questo argomento sono da considerare lo stato dell’arte e le fonti di acquisizione dei coefficienti di calibrazione, di norma forniti dall’Ente responsabile del satellite ed aggiornati periodicamente (v. p. 6.3.2). Aspetti di qualità per l’ottenimento di mappe di temperatura superficiale del suolo (LST) da dati telerilevati da satellite 147 Per modello di ottenimento del prodotto fisico al suolo in questo caso si intende il modello di calcolo della Temperatura Superficiale del Suolo (LST), ovvero la relazione tra radiazione misurata dal sensore nell’infrarosso termico e la temperatura del terreno. Tale relazione dipende dalle proprietà di emissione del suolo osservato. Per stimare l’emissività di un certo terreno si possono utilizzare dei valori predefiniti oppure la si può telerilevare dall’AVHRR per avere un’accuratezza migliore. L’algoritmo di calcolo implementato (Ulivieri, 1994)], applicato solo ai pixel non nuvolosi, è funzione della temperatura di brillanza dei canali 4 e 5 dell’AVHRR e dell’emissività superficiale, che viene calcolata dai canali nel visibile dell’AVHRR, attraverso una procedura che tiene conto anche del profilo atmosferico. La correzione atmosferica è realizzata con un applicativo Open Source denominato 6S (Vermote, 1997), al quale vengono passati in ingresso le radianze (ch. 1 e 2), i profili di ozono e aerosol più prossimi all’ora del passaggio, le caratteristiche morfologiche dell’area geografica (modello di elevazione digitale del terreno - DEM) e le mappe degli angoli di vista del sole e del satellite al momento del passaggio, rispetto ai punti osservati. Per qualità complessiva finale del prodotto fisico si intende quella risultante dalla qualità del parametro telerilevato, in questo caso la temperatura di brillanza, e quella del modello di calcolo applicato per l’ottenimento della grandezza fisica di interesse (LST). Per tenere conto degli aspetti di qualità dei prodotti ottenuti da satellite e fornire indicazioni agli utilizzatori finali, si è ritenuto opportuno seguire le indicazioni degli standard internazionali di riferimento inerenti l’informazione geografica, rappresentati dalla serie ISO 19100; in particolare, per quanto riguarda la qualità, sono state prese in considerazione le seguenti norme: − − − ISO 19113 - Geographic Information – Quality principles ISO 19114 - Geographic Information – Quality evaluation procedures ISO 19115 - Geographic Information – Metadata Tali standard ISO sono diventati norme europee, quindi la loro applicazione è obbligatoria per gli stati membri; in Italia sono stati recepiti dall’Ente Nazionale Italiano di Unificazione (UNI) nel 2005. Come già accennato, sono chiamati metadata l’insieme delle informazioni che descrivono il prodotto; la UNI EN ISO 19115 stabilisce i possibili tipi di informazioni ausiliarie a seconda della tipologia del prodotto e le relazioni gerarchiche tra i vari gruppi di metadati. Per quanto riguarda specificatamente i metadata sulla qualità del prodotto, si è fatto riferimento alla UNI EN ISO 19113, che definisce i componenti da utilizzare: − − informazioni non-quantitative quali uso, scopo e provenienza; componenti quantitative di un dataset (v. Tab. 6.1). 148 P. F. Pellegrini, G. Adembri, M. Tommasini, M. Innocenti, G. Poli Il documento UNI EN ISO 19114 fornisce indicazioni sui metodi di valutazione della qualità di un dataset. La conformità al livello di qualità rappresenta un valore di soglia (o un set di valori di soglia) utilizzato per determinare in che misura il data set corrisponde alle specifiche di produzione (Fantozzi, 2001). Tabella 6.1- Data quality element e sub-element Data quality element Descrizione Data quality subelement Descrizione completeness presenza e/o mancanza commission di caratteristiche, loro attributi e relazioni omission dati mancanti in un insieme di dati logical consistency aderenza alle regole dello schema concettuale grado di aderenza alle regole di logica di una struttura dati, agli attributi e relazioni conceptual consistency presenza di dati richiesti in un insieme di dati domain consistency aderenza dei valori ai valori di dominio format consistency grado con cui i dati sono immagazzinati in accordo alle struttura fisica dell’insieme di dati topological consistency positional accuracy accuratezza delle caratteristiche di posizione correttezza delle caratteristiche topologiche esplicitamente codificate di un insieme di dati absolute or vicinanza dei valori delle coordinate external accuracy riportate ai valori accettati o veri relative or internal vicinanza delle posizioni relative delle accuracy caratteristiche in un insieme di dati alle loro rispettive posizioni relative vicinanza dei valori di posizione dei dati gridded data position accuracy su griglia ai valori accettati o veri temporal accuracy thematic accuracy accuratezza degli attributi temporali e relazione delle caratteristiche di temporali accuracy of a time correttezza dei riferimenti temporali di un measurement aspetto temporal consistency correttezza di eventi ordinati o di sequenza, se presenti temporal validity validità dei dati rispetto al tempo accuratezza degli classification attributi quantitativi e correctness correttezza degli attributi non-quantitativi e delle classificazioni non-quantitative delle caratteristiche e attribute correctness confronto delle classi assegnate alle caratteristiche o ai loro attributi rispetto all’universo dei discorsi correttezza degli attributi non-quantitativi Aspetti di qualità per l’ottenimento di mappe di temperatura superficiale del suolo (LST) da dati telerilevati da satellite delle loro relazioni 149 quantitative accuratezza degli attributi quantitativi attribute accuracy La procedura per determinare i metadati di qualità prevede i seguenti passi: − − − − − 6.3 si identifica una (o più) misura della qualità, per ciascun data quality element/sub-element (ISO19113); si seleziona un metodo di valutazione della qualità (ISO19114); si determina il risultato quantitativo dell'applicazione del metodo di valutazione della qualità; si specifica il conformance quality level (cioè il valore di soglia, definito spesso come numero di item non conformi, oppure in percentuale, o altro); si fa il confronto tra il conformance quality level e il risultato quantitativo dell'applicazione del metodo di valutazione adottato. Il risultato del confronto è in pratica il metadato di qualità. PROCEDURE DI QUALITÀ PER LA ELABORAZIONE DEI DATI AVHRR/NOAA RICEZIONE ED In linea con quanto previsto dalla norma ISO 9000 occorre considerare i processi che concorrono all’ottenimento della Temperatura Superficiale del Suolo da dati AVHRR/NOAA. Quando necessario all’esemplificazione, come prima accennato, si fa riferimento all’installazione di ricezione ed elaborazione effettiva realizzata presso la Stazione Ricezione Satelliti - Polo Universitario di Prato (PIN). Tale catena per il trattamento dei dati è riferita all’ottenimento di mappe di LST, a partire dai dati dei sensori AVHRR/2, a bordo dei satelliti NOAA 12 e 14, e AVHRR/3, a bordo dei satelliti NOAA 15, 16, 17, 18, tutti ricevuti direttamente alla Stazione. Tali sensori radiometrici passivi sono ricevibili direttamente per operazioni in tempo reale a costi contenuti. Da tenere presente che, per un’efficace valutazione della qualità dei dati, è opportuno che gli algoritmi impiegati per le operazioni siano resi trasparenti. In quest’ottica appare quindi desiderabile la realizzazione di programmi propri, rispetto a pacchetti commerciali, anche a dispetto del lavoro necessario allo sviluppo della catena di elaborazione. In questo contesto è valido il riferimento sopra citato alla Stazione Ricezione Satelliti, presso la quale tutte le operazioni per il trattamento dei dati vengono effettuate tramite programmi sviluppati ad hoc con linguaggi standard ANSI C e C++ (ISO/IEC 9899:1999, Programming Languages); l’insieme dei programmi realizzati costituisce la catena di elaborazione AmEDIT (Ambiente di Elaborazione Dati Immagini Telerilevate). 150 P. F. Pellegrini, G. Adembri, M. Tommasini, M. Innocenti, G. Poli La catena per il trattamento dei dati AVHRR/NOAA per l’ottenimento delle mappe di LST è schematizzabile secondo lo schema a blocchi di Fig. 6.1, nel quale sono evidenziati tre blocchi di processi principali: − − − Geolocazione e calibrazione radiometrica: questa parte è costituita dall’insieme di elaborazioni necessarie all’ottenimento di mappe su griglia di proiezione del parametro misurato dal sensore (radianza e temperatura di brillanza). La Geolocazione è la procedura che associa longitudine e latitudine geografiche ai punti acquisiti dal sensore; tale operazione viene effettuata tramite una catena retro-azionata, in modo che i risultati di una prima elaborazione vengano utilizzati per migliorare la precisione del calcolo. La Calibrazione Radiometrica è la procedura attraverso la quale i dati numerici grezzi acquisiti dal sensore sottoforma di parole binarie (count) vengono trasformati in grandezze fisiche correlate all’entità della radiazione elettromagnetica misurata dal sensore (v. p. 6.3.3), attraverso dei coefficienti di calibrazione (v. p. 6.3.2). Correzione atmosferica: questa procedura consente di impostare il profilo atmosferico al momento della misura del sensore sulla zona d’osservazione, permettendo di ricavare dei coefficienti che tengono conto dell’effetto del passaggio della radiazione dal suolo al sensore nel calcolo dell’emissività; Parametri superficiali: quest’ultimo blocco di elaborazione implementa il modello di calcolo per l’ottenimento della LST a partire dalle temperature di brillanza, tenendo conto degli effetti atmosferici e delle zone nuvolose. 6.3.1 CONTROLLO DELLA GEOLOCAZIONE DEI DATI Il sensore AVHRR effettua, durante il suo moto a bordo dei satelliti NOAA, una scansione angolare della superficie terrestre registrando un certo numero di valori, proporzionali all’emissione elettromagnetica, per ogni linea di scansione. La geolocazione di tali dati consiste nella localizzazione sulla superficie terrestre di ognuno di essi, cioè nel determinare la loro longitudine e latitudine geografiche. La procedura di geolocazione utilizzata presso la Stazione Ricezione Satelliti si basa sulla ripresa orbitale effettiva del satellite (v. Figg. 6.2, 6.3 e 6.4 e Tab. 6.2 per la legenda) e sulla proiezione Mercatore Datum WGS84; essa è stata testata con continuità su un campione di circa 200 immagini AVHRR (Pellegrini, 2002). Si articola nei passi seguenti: 1. estrazione dei time-code (istante di acquisizione del primo pixel-riga AVHRR) dal file HRPT - Tecnavia (v. p. 6.5.2) per ogni riga di scansione; 2. calcolo della posizione di satellite e sensore nell’istante dell’acquisizione; Aspetti di qualità per l’ottenimento di mappe di temperatura superficiale del suolo (LST) da dati telerilevati da satellite 151 3. estrazione dei count e dei coefficienti di calibrazione per l’area di interesse; 4. calcolo di longitudine e latitudine geografiche dei punti osservati da satellite sulla base della geometria di ripresa; 5. proiezione su griglia regolare Mercatore WGS84; 6. sovrapposizione delle linee di costa all’immagine; 7. correzione del risultato ottenuto sulla base di opportuni punti di controllo. Tabella 6.2 - Parametri orbitali e di scansione dell’AVHRR (Fig. 6.2, 6.3 e 6.4) Simbolo Significato Simbolo Significato E direzione di riferimento delle coordinate celesti (linea degli equinozi) GHA Greenwich Hour Angle, angolo di Greenwich rispetto a E G direzione meridiano di Greenwich HA angolo orario tra P e O i inclinazione dell’orbita del satellite (λO,φO) longitudine e latitudine del punto O PG perigeo dell’orbita del satellite (λP,φP) longitudine e latitudine del punto P N nodo ascendente C centro della Terra Ω longitudine del nodo ascendente γ Angolo di puntamento di P dal satellite ω argomento del perigeo h quota del satellite Rlm raggio terrestre locale medio Elh Elevazione del satellite da P Reqm raggio terrestre equatoriale medio Aaz Azimuth della traiettoria del satellite a terra ferma da O O punto sub-satellite At Azimuth della traiettoria del satellite a terra in movimento da O P punto osservato dal satellite Az Azimuth di puntamento di P da O 152 P. F. Pellegrini, G. Adembri, M. Tommasini, M. Innocenti, G. Poli Fig. 6.2 - Parametri del modello orbitale nel riferimento delle coordinate celesti Fig. 6.3 - Geometria di scansione dell’AVHRR/NOAA. Aspetti di qualità per l’ottenimento di mappe di temperatura superficiale del suolo (LST) da dati telerilevati da satellite A) 153 B) γ γ ρ α Fig. 6.4 - Geometria di scansione del sensore AVHRR. A) Vista sul piano contenente la direzione di scansione e la congiungente centro della Terra-Satellite. B) Vista sul piano tangente il punto sub-satellite (O). Considerando la geometria di ripresa e le caratteristiche del sensore e conoscendo l’istante di acquisizione tj della j-esima linea di scansione di un’immagine (fornito dal sensore insieme ai dati telerilevati di ogni linea), si ricavano le seguenti informazioni (relative alla linea j): − − − (λO ,ϕ O ) longitudine [rad] e latitudine [rad] del punto subsatellite O (v. Fig. 6.3); Aaz, [rad] Azimuth della traiettoria del satellite a terra ferma da O (v. Fig. 6.4); ρ, [m] distanza centro della Terra – satellite (v. Fig. 6.3 e 6.4). Calcolo di longitudine e latitudine dei punti osservati I punti osservati dal satellite sono indicati con una coppia di indici (j,i), dove j (j = 0, 1, ..., Nj – 1) è la riga di scansione ed i (i = 0, 1, ..., Ni – 1) il pixel di ripresa (Ni = 2048) (Goodrum, 2000). Indicando con P un punto osservato, esso sarà caratterizzato da l’angolo di puntamento dal satellite γ relativo al punto P è dato da: ⎛ ⎝ γ = Δγ ⎜ iP − Ni − 1 ⎞ ⎟ 2 ⎠ ( j P , iP ) ; (6.1) 154 P. F. Pellegrini, G. Adembri, M. Tommasini, M. Innocenti, G. Poli dove: Δγ = 0.95 [mrad] è il passo di scansione angolare L’azimuth Az con cui è visto P dal punto sub-satellite è (v. Fig. 6.4): π ⎧ ⎪⎪ Az = Aaz + 2 if 0 ≤ i < 1024 ⎨ ⎪ A = A + 3π if 1024 ≤ i < 2047 az ⎪⎩ z 2 (6.2) considerando il raggio terrestre locale medio Rlm (noto in base al Datum scelto), l’elevazione del satellite Elh dal punto osservato P è data da: ⎡ ρ ⎤ Elh = cos −1 ⎢ sin (γ )⎥ ⎣ Rl m ⎦ (6.3) posto: α= π 2 − Elh − γ (6.4) le coordinate (λP , ϕ P ) del punto osservato P sono date da (v. Fig. 6.3): ϕ P = sin −1 [cos(α ) sin(ϕ O ) + sin(α ) cos(ϕ O ) cos( Az )] ⎛ sin (HA) ⎞ ⎟⎟ ⎝ cos(HA) ⎠ λ P = λ S − tan −1 ⎜⎜ (6.5) (6.6) dove: sin (HA) = − sin( Az ) cos(HA) = 1 − sin(α ) cos(ϕ P ) cos(ϕ O − ϕ P ) cos(α ) cos(ϕ O ) cos(ϕ P ) (6.7) (6.8) Correzione del risultato ottenuto Acquisiti il modello dell’orbita del satellite e le informazioni sul suo moto fornite dalle effemeridi, esistono alcuni fattori che possono condizionare la precisione della geolocazione: la perturbazione dell’assetto del sensore durante il moto rispetto ai suoi tre assi di inerzia (imbardata, beccheggio, rollio), errori sulla registrazione del tempo d’acquisizione delle linee di scansione, dovuti all’orologio interno, errori sulla precisione dei parametri orbitali. Tali errori sono fortemente Aspetti di qualità per l’ottenimento di mappe di temperatura superficiale del suolo (LST) da dati telerilevati da satellite 155 ridotti dall’impiego di due punti di riferimento nella procedura di geolocazione. Possibili riferimenti validi sono punti cospicui delle linee di costa (Pellegrini, 2002). 6.3.2 ESTRAZIONE DEI COUNT E CALCOLO DEI COEFFICIENTI DI CALIBRAZIONE PER UN’AREA GEOGRAFICA Per la rappresentazione di mappe su una certa area geografica, è necessaria una procedura che effettui l’estrazione dei count relativi all’area di interesse; in questo passo vengono determinati anche i coefficienti di calibrazione radiometrica che dipendono da dai target di calibrazione interni al sensore. La procedura si distingue per tipo di sensore e per satellite, AVHRR/2 (NOAA 12 e 14) e AVHRR/3 (NOAA 15, 16, 17 e 18). L’algoritmo impiegato consta di tre parti: − − − estrazione dei count per l’area geografica di interesse; calcolo dei coefficienti di calibrazione per i canali 1 e 2 (AVHRR/2); calcolo dei coefficienti di slope Gi e intercept Qi per i canali 3, 4 e 5 (AVHRR/2) e 3B, 4 e 5 (AVHRR/3). I coefficienti di calibrazione radiometrica calcolati in questo passo vengono inseriti nella testata dei files di uscita e servono in ingresso alla procedura di calibrazione. Una parte dei coefficienti, relativi ai canali visibili (1, 2, 3A) dell’AVHRR/3, è fissa, ma viene aggiornata periodicamente via web. I canali 3A e 3B sono acquisiti alternativamente dal sensore AVHRR/3. 6.3.3 CALIBRAZIONE RADIOMETRICA DEI DATI Le grandezze fisiche nelle quali vengono convertiti i valori dei count variano a secondo i canali dell’AVHRR. In particolare si esprime la radianza per le bande solari (canali 1, 2 e 3A), espressa in [W m–2 sr–1 μm–1] e la temperatura di brillanza (detta temperatura equivalente di corpo nero), espressa in Kelvin [K] per le bande termiche (canali 3B, 4 e 5). Il valore del count registrato è proporzionale alla radianza media emessa dall’area illuminata dal lobo di scansione dell’antenna del sensore (con risoluzione a terra di circa 1.1 km al nadir), mediata a sua volta dalla risposta in frequenza del canale che effettua l’acquisizione. Le mappe di tali grandezze, a 32 bit/pixel (floating point) e 8 bit/pixel per la visualizzazione in scala di grigi, sono ottenute eseguendo un’interpolazione dei dati satellitari su una griglia Mercatore WGS84. La scelta della tecnica di interpolazione da utilizzare viene effettuata sulla base della variabilità spaziale della scena osservata ed in relazione alla frequenza di campionamento spaziale con cui opera il sensore. Nel caso della superficie del suolo, che contiene frequenze spaziali anche molto elevate, viene utilizzata l’interpolazione nearest neighbour. (Tommasini, 2005). 156 P. F. Pellegrini, G. Adembri, M. Tommasini, M. Innocenti, G. Poli Calcolo di albedo e radianza per le bande solari La calibrazione delle bande “solari” del sensore AVHRR (bande 1, 2, 3A) è la procedura con cui il valore del count a 10 bit registrato nella banda i-esima (C10i) viene convertito in un valore di albedo Ai, definito dalla (6.9) (Goodrum, 2000). Ai = 100 π ⋅ Ii Fi (6.9) dove: i indice di banda (i = 1, 2, 3A) Ai [percento], albedo della banda i-esima λi 2 I i = ∫ I (λ )τ i (λ )dλ [Wm–2sr–1], radianza della banda i-esima λi1 λi1, λi2 [μm], lunghezze d’onda inferiore e superiore della banda i-esima I (λ ) [Wm–2sr–1μm–1], radianza τ i (λ ) risposta normalizzata dello strumento alla lunghezza d’onda λ λi 2 Fi = ∫ F0 (λ )τ i (λ )dλ [W m–2], irradianza del sole λi1 F0 (λ ) [W m–2μm–1], irradianza del sole alla lunghezza d’onda λ La conversione del count in albedo viene effettuata, secondo la (6.10), attraverso gli opportuni coefficienti (Gi, Qi) aggiornati periodicamente e forniti da NOAA (Goodrum, 2000) e specifici per ogni satellite della costellazione. Ai = Gi ⋅ C10i + Qi (6.10) dove: Gi [percento count-1], coefficiente di scalatura (slope) della banda i-esima Qi [percento], coefficiente di intercetta (intercept) della banda i-esima C10i [count], count a 10 bit della banda i-esima (C10i = 0, 1, .., 1023) Dal valore di albedo viene calcolata la radianza in banda Ii definita dalla (6.11): Ii = Fi Ai 100π ⋅ Wi dove: Wi [μm], ampiezza equivalente della banda i-esima (Goodrum, 2000) (6.11) Aspetti di qualità per l’ottenimento di mappe di temperatura superficiale del suolo (LST) da dati telerilevati da satellite 157 Calcolo della temperatura di brillanza per le bande “termiche” La calibrazione delle bande “termiche” del sensore AVHRR (bande 3B, 4, 5) trasforma la radianza terrestre della banda i-esima (Ri) nel valore di temperatura di brillanza Tbi [K] (temperatura equivalente di corpo nero) (Goodrum, 2000). Prima, a partire dal count registrato C10i, si ottiene il valore della radianza terrestre Ri incidente sul sensore [mW m-2 sr-1 cm], in funzione del numero d’onda centrale υic della banda i-esima (υ [cm-1] corrisponde alla lunghezza d’onda λ [μm] in accordo a λ = 10 4 / υ ); i coefficienti per la calibrazione sono basati sui valori di pre-lancio (specifici per ogni satellite della costellazione) e sui valori di calibrazione interna al sensore forniti per ogni linea di scansione (Goodrum, 2000)]. Ottenuta la radianza Ri, la temperatura di brillanza Tbi viene ricavata con le (6.12) e (6.13): Tbi* = C 2 ⋅ υ ic C ⋅υ 3 ln[1 + ( 1 ic )] Ri Tbi = Tbi* − Ai Bi (6.12) (6.13) dove: i Tbi υic Ri esima C1 C2 Ai Bi indice di banda (i = 3B, 4, 5) [K], temperatura di brillanza della banda i-esima [cm-1], numero d’onda centrale della banda i-esima [mW m-2 sr-1 cm], radianza della zona terrestre osservata nella banda i- 6.4 IMPOSTAZIONI PER IL CONFRONTO DEI PRODOTTI OTTENUTI DA SATELLITE CON MISURE VERITÀ A TERRA [mW m-2 sr-1 cm4], first radiation constant (C1 = 1.1910427x10-5) [K cm], second radiation constant (C2 = 1.4387752) [K], coefficiente di correzione della banda i-esima coefficiente di correzione della banda i-esima I prodotti geofisici ottenuti dalle elaborazioni da dati satellitari, come ad esempio la Temperatura Superficiale del Suolo, sono molto indicativi della superficie osservata, ma rappresentano delle stime di parametri ambientali misurabili a terra. Il confronto con misure verità effettuate a terra è però di grande 158 P. F. Pellegrini, G. Adembri, M. Tommasini, M. Innocenti, G. Poli utilità per valutare gli andamenti dei prodotti ottenuti da satellite. È però opportuno precisare che il dato verità a terra: − − − non viene utilizzato per valutare la precisione delle elaborazioni effettuate, ma solo per effettuare un confronto con quanto ottenuto dalle elaborazioni; molte volte infatti il dato a terra è il risultato di una misura effettuata con modalità non compatibili con quelle con cui si effettua la misura da satellite (una misura di LST ad esempio può essere effettuata con un termometro che valuta la dilatazione di un metallo, i sensori satellitari misurano invece la radiazione emessa dal terreno); è un valore puntuale, a differenza di una misura da satellite; la superficie del suolo in particolare può presentare caratteristiche fortemente eterogenee che contribuiscono a falsare la stima del parametro di interesse; non risente degli effetti atmosferici che invece condizionano in modo non trascurabile, anche in assenza di copertura nuvolosa, le misure da satellite. Per una stima oggettiva della misura del parametro LST, più che un mero raffronto con dati di temperatura del suolo rilevati a terra, che sono raramente disponibili [Qin, 01], è conveniente una valutazione comparata dell’andamento della LST con misure puntuali a terra di temperatura dell’aria, delle quali invece c’è ampia disponibilità su tutto il territorio. Di particolare interesse per questo confronto nel caso della Regione Sicilia è la rete in telemisura dell’Ufficio Idrografico Regionale, che dispone di oltre 150 stazioni distribuite su tutto il territorio siciliano; tali stazioni, che fanno parte di una rete di qualità consolidata in seno al progetto SEDEMED, consentono di rilevare, tra i vari parametri, la temperatura del suolo a 2 m da terra, in qualunque orario del giorno. In Fig. 6.5 è riportato un esempio di mappa di LST della Sicilia Ovest, ottenuta il 07.05.2005 dal satellite NOAA16, alle ore 13.39 UTC . Aspetti di qualità per l’ottenimento di mappe di temperatura superficiale del suolo (LST) da dati telerilevati da satellite 159 Fig. 6.5 - Mappa LST sulla Sicilia Ovest in proiezione Mercatore WGS84, ottenuta dai dati NOAA 16/AVHRR, 07.05.2005 ore 13:19 UTC, scala 1:1’300’000. Palette dei colori [8÷40 °C]. Per l’ottenimento di dati di temperatura dell’aria misurati a terra che siano i più idonei possibili per il confronto con i dati di LST, è opportuno rilevare tali misure nell’ora esatta in cui il satellite passa sull’area di interesse. A tal proposito si procede come segue: − si individua un giorno di tempo sereno con l’aiuto delle previsioni meteorologiche per l’area geografica di interesse; 160 P. F. Pellegrini, G. Adembri, M. Tommasini, M. Innocenti, G. Poli − − si effettua una previsione dei passaggi del satellite per quel giorno con un apposito programma sviluppato alla Stazione. Se la traccia del satellite interessa un punto interno dell’area, si prende in considerazione quel giorno per il reperimento delle misure a terra e si prende nota dell’ora esatta. si prelevano i dati dalle stazioni in telemisura nel giorno e nell’ora individuati. A titolo d’esempio è riportato in Fig. 6.6 la situazione geometrica di scansione dei passaggi del NOAA 16, ottenuta con il programma Orbswath6.exe, per il giorno 1 aprile 2006, dalla quale si determina che il satellite passa sul territorio siciliano esattamente alle ore 13:42 UTC. Le linee di scansione sono tracciate ogni 60 secondi (|–•–|) e tenendo conto dell’angolo di apertura del sensore AVHRR. Fig. 6.6 - Esempio di previsione dei passaggi giornalieri del satellite NOAA 16 del giorno 01.04.2006 sull’area Mediterranea, compresi tra le 07.00 e le 20.00 UTC. 6.5 PROCEDURE DI ARCHIVIAZIONE E INTERSCAMBIABILITÀ DEI DATI L’archivio dati della Stazione Ricezione Satelliti del PIN Prato raccoglie sia dati grezzi che dati elaborati, su supporto CD e DVD. I dati raccolti riguardano i sensori AVHRR/NOAA, SeaWiFS/SeaSTAR, SSM-I/DMSP, MVIRI/METEOSAT e, dal 1 gennaio 2006, SEVIRI/MSG (Meteosat Second Generation). Nell’ambito Aspetti di qualità per l’ottenimento di mappe di temperatura superficiale del suolo (LST) da dati telerilevati da satellite 161 della normale attività della Stazione, l’archiviazione dei dati ricevuti avviene secondo una procedura giornaliera (anche se le apparecchiature di ricezione della Stazione prevedono una registrazione automatica fino a 6 giorni), che prevede la compressione (formato *.zip) e successiva memorizzazione su supporti ottici CD e DVD etichettati. I dati generali relativi ai files archiviati grezzi (nome file, satellite, data ed ora del passaggio, ecc.) ed elaborati (tipo prodotto, area geografica, data, ecc.) sono memorizzati anche nel database elettronico della Stazione (v. p. 6.5.1). I formati dei files grezzi seguono le convenzioni indicate nel p. 6.5.2. Per agevolare l’interscambio dei prodotti ottenuti da satellite, è opportuno memorizzare le mappe prodotte su formati standard. L’International Standards Organization (ISO) e il World Meteorological Organization (WMO) raccomandano i formati HDF (Hierarchical Data Format) [NCSA, 03] e GeoTIFF (Geographic Tagged Image File Format) [Ritter, 95], largamente utilizzati dalla comunità scientifica. I formati HDF e GeoTIFF si prestano infatti molto bene a gestire i dati telerilevati da satellite; entrambi permettono di includere sia i dati satellitari acquisiti sia opportune informazioni per la descrizione dei dati stessi, i cosiddetti metadata, quali ad esempio il tipo di prodotto, le modalità di acquisizione, informazioni sull’area geografica cui si riferiscono i dati, informazioni per la geolocazione, le grandezze fisiche monitorate, le unità di misura utilizzate, nonché informazioni riguardanti la qualità dei dati. ISO e WMO forniscono raccomandazioni circa il trattamento dei metadati e i criteri di nomenclatura dei files contenenti dati satellitari. Presso la Stazione sono state messe a punto procedure specifiche per l’archiviazione dei prodotti elaborati in files HDF e GeoTIFF (v. p. 6.5.3), e per il trattamento dei dati in tali formati. 6.5.1 ARCHIVIO ELETTRONICO DELLA SATELLITI DEL PIN - PRATO STAZIONE RICEZIONE Le procedure sviluppate presso la Stazione sono configurate in modo da aggiornare l’archivio elettronico sul server di Stazione, al termine della catena di operazioni. L’archivio è stato sviluppato su piattaforma Linux-MYSQL ed è organizzato in tabelle; la Fig. 6.7 mostra la struttura delle tabelle e delle loro relazioni. Le tabelle contengono: il file grezzo elaborato, il nome del satellite che lo ha trasmesso, l’ora UTC della prima linea acquisita stimata correttamente, l’elenco dei file prodotti dall’elaborazione, il formato geografico di elaborazione ed i parametri di correzione. Quotidianamente sono prodotte e stampate le immagini ‘QuickLook’ dei passaggi NOAA e delle riprese METEOSAT/MSG. I QuickLook sono ottenuti sottocampionando opportunamente i dati del ch. 3B dell’AVHRR/3 e dell’IR-39 dell’MSG. Dall’analisi di tali immagini vengono ricavate le caratteristiche generali relative alla qualità del passaggio inserite nel database relazionale. Queste 162 P. F. Pellegrini, G. Adembri, M. Tommasini, M. Innocenti, G. Poli informazioni sono utili nelle ricerche di possibili immagini da elaborare. La disponibilità delle sole immagini grezze è riportata in Table III. [ 1 - Molti ] ID-IDFormato formati PK,I1 Nome Lon1 Lon4 Phi1 Phi2 Phi0 Scala dpi PixRiga RigheImmagine DistMP PriPix LetteraID I1 ID I2 I2 IDFormato ID2Lines dEpoca dOmega dg dAzimuth file2lines I1 Nome Path File TwoLines utilizzato per la geolocazione [ 1 - Molti ] ID-IDTipoQualità [ 1 - Molti ] ID-IDFormatoFile formatifile TipoQualità I1 qualità ID TipoQualità I1 ID I2 I2 I2 I2 IDFormato IDGrezzo IDTipoQualità IDTipoPosizione Condizioni atmosferiche sulle aree geografiche [ 1 - Molti ] assegnate dall'operatore analizzando il QuickLook ID-IDTipoPosizione ID FormatoDato HeaderBytes BitPixel Attributo sulle condizioni atmosferiche TipoPosizione I1 ID TipoPosizione Formato del file prodotto grezzinoaa PK,I1 ID I1 Nome Data Ora IDSat [ 1 - Molti ] ID-IDGrezzo Posizione dell'area geografica elaborata rispetto alla traccia subsatellite [ 1 - Molti ] ID-IDSat satelliti PK,I1 ID Parametri di correzione geografica calcolati Area geografica su cui si è elaborato il file prodotto PK,I1 [ 1 - Molti ] ID-ID2Lines corrgeo ID ID Nome TLENumber HRPTNumber Nome del file grezzo da cui deriva il prodotto Satellite che ha trasmesso i dati grezzi relativi al prodotto tipoprodotti PK,I1 ID Nome Descrizione [ 1 - Molti ] ID-IDProdotto fileprodotti PK,I1 ID I1 I1 I1 I1 IDFormato IDFormatoFile IDGrezzo IDProdotto PathCartella NomeFile Riepilogo delle informazioni del prodotto Tipo di prodotto Fig.6.7 Struttura del database relazionale dell’archivio elettronico della Stazione. 163 Aspetti di qualità per l’ottenimento di mappe di temperatura superficiale del suolo (LST) da dati telerilevati da satellite Esistono due modi per interrogare il database relazionale di Fig. 6.7: attraverso l’utilizzo di un apposito programma che realizza opportune query, oppure on-line, collegandosi al sito: http://maresat.ing.unifi.it/ricerca/Ricerca.php . Tabella 6.3 - Consistenza passaggi archiviati alla Stazione Ricezione Satelliti del PIN Prato relativamente al periodo di ricezione indicato (situazione al 21.04.2006). Sensore/Satellite n. di immagini disponibili Dal Al AVHRR/NOAA 25'200 25.03.1995 21.04.2006 SeaWiFS/SeaStar 79 07.10.1997 03.03.1998 SSM/I/DMSP 5'500 19.09.1999 21.04.2006 MVIRI/METEOSAT (*) 86'500 10.11.1994 31.12.2005 SEVIRI/MSG (METEOSAT-8) (*) 7'700 01.01.2006 21.04.2006 (*) Questi dati, distribuiti con licenza EUMETSAT ‘Educational Use and Research Project’, sono utilizzabili previa autorizzazione del Ministero della Difesa - Direzione Generale delle Telecomunicazioni Informatica e Tecnologie Avanzate. 6.5.2 FORMATO HRPT DEI DATI NOAA ACQUISITI ALLA STAZIONE RICEZIONE SATELLITI DEL PIN - PRATO I dati ottenuti dai sensori installati a bordo dei satelliti NOAA sono trasmessi in formato HRPT (High Resolution Picture Transmission); secondo le tecniche utilizzate nelle unità di ricezione per la memorizzazione dei dati su disco, il formato HRPT può non essere mantenuto. L’unità di ricezione TECNAVIA presso la Stazione Ricezione Satelliti del PIN – Polo Universitario di Prato, ad esempio, utilizza un proprio formato, che differisce dall’HRPT standard per l’aggiunta di una testata ASCII e per il numero di bit-spare presenti all’inizio ed alla fine del minor frame HRPT ([Tecnavia, 1985). Il nome dei files contenenti dati grezzi presenti nell’archivio della Stazione segue, ad oggi, la convenzione stabilita da TECNAVIA (Tecnavia, 1985). Tale convenzione prevede che i nomi dei files grezzi abbiano la forma: Taaggghh.mms: codice identificativo TECNAVIA − T − aa ultime due cifre dell’anno di acquisizione − ggg giorno di acquisizione (compreso tra 1 e 365, giorno 1 = 1° gennaio) − hh ora UTC di acquisizione − mm minuti UTC di acquisizione s secondi UTC (decine) di acquisizione I nomi dei files elaborati presso la Stazione e presenti in archivio seguono invece una convenzione interna che ricalca quella proposta da TECNAVIA. 164 P. F. Pellegrini, G. Adembri, M. Tommasini, M. Innocenti, G. Poli Dai dati elaborati nella catena si ottengono mappe di prodotti intermedi (albedo, riflettanza, radianza, temperatura di brillanza, angoli di elevazione sole e satellite, classificazione pixel nuvolosi, etc) in proiezione Mercatore (Datum WGS84). Le mappe sono salvate in un formato raster a 32 bit/pixel o a 16 bit/pixel, a seconda del prodotto, con 800 byte di testata (10 righe di testo da 80 caratteri ciascuna); le mappe sono inoltre salvate anche a 8 bit/pixel per una pronta visualizzazione. Ogni pixel è memorizzato da un numero di byte corrispondente alla precisione con cui è memorizzato il dato (un byte per pixel se i dati sono a 8 bit, 2 byte per pixel se a 16 bit, 4 byte per pixel se a 32 bit). 6.5.3 FORMATI STANDARD DI MEMORIZZAZIONE SU FILE (HDF E GEOTIFF) I formati HDF e GeoTIFF sono due dei più diffusi standard di memorizzazione di immagini e dati satellitari e non solo. Di seguito sono fornite alcune note sulle caratteristiche e sull’utilizzo dei formati HDF e GeoTIFF. Il formato HDF (Hierarchical Data Format) è nato per soddisfare le esigenze in ambiente scientifico nel salvataggio e nello scambio di dati tra enti. Lo standard HDF prevede delle strutture predefinite per la memorizzazione dei dati utilizzabili in base alla natura stessa dei dati. Ogni file HDF è self-describing, ovvero autodescrittivo: al suo interno possono essere incluse tutte le informazioni riguardanti i dati in esso contenuti, sulla loro tipologia, sulla loro organizzazione e posizione all’interno del file, ecc. Queste informazioni prendono il nome di metadata. Il formato HDF: − − − − è utilizzabile per memorizzare qualsiasi prodotto, anche intermedio, con tutti i tipi di formato numerico (interi a 8 o 16 bit, decimali a singola o doppia precisione); è possibile memorizzare all’interno di un singolo file anche i dati relativi a più di un’immagine e anche dati di altro tipo; è caratterizzato da una grande flessibilità, i campi dati sono completamente configurabili riguardo a tipo e contenuto; dati ausiliari possono essere memorizzati anche sottoforma di tabella; ha una struttura completamente flessibile e configurabile in ogni aspetto per tipo di dati, tipo e contenuto di metadati; svantaggi del formato HDF: necessità di software apposito (meno diffuso, è di utilizzo meno immediato) per la lettura dei dati e dei metadati memorizzati e per la visualizzazione in immagine dei dati; necessità di organizzare in modo chiaro la struttura del file e dei metadati (nonché il contenuto di essi) per rendere chiari il più possibile l’interpretazione e l’utilizzo dei dati. Aspetti di qualità per l’ottenimento di mappe di temperatura superficiale del suolo (LST) da dati telerilevati da satellite 165 Il GeoTIFF [Ritter, 95] è un’estensione del formato TIFF (Tag Image File Format) (si vedano le specifiche TIFF TIFF Revision 6.0. Final, Adobe Developers Association, Settembre 1992) e definisce ed integra le immagini raster di un set di informazioni aggiuntive inerenti i dati rappresentati, quali la risoluzione, la provenienza e le elaborazioni che hanno subito. GeoTIFF non è propriamente un formato di file (il formato rimane il TIFF), ma una specifica che definisce e standardizza i nuovi tag utilizzabili per il salvataggio delle informazioni aggiuntive per la descrizione dei dati memorizzati nel file. Quest’ultimi, ovviamente, non sono interpretabili da qualunque programma ma solo da quelli che ne conoscono il significato, al tempo stesso però non interferiscono in alcun modo con il funzionamento di ogni altra applicazione, che è comunque in grado di leggere tutte le informazioni utili, ignorando quelle contrassegnate da tag sconosciuti. Il formato GeoTIFF: − − − − è utilizzabile per la memorizzazione di dati geografici equispaziati, cioè dati che hanno subito una qualche procedura di proiezione (tramite interpolazione spaziale); per i dati equispaziati, è possibile risalire alle loro coordinate in un certo sistema di riferimento e per una certa proiezione utilizzata (note le caratteristiche dell’area geografica e della griglia di disposizione dei dati); il tipo e il numero di metadati minimi memorizzabili in un file GeoTIFF sono fissati dalle specifiche dello standard oltre a questi altri possono essere definiti e configurati dall’utente; i metadati di un file GeoTIFF riguardano informazioni circa il riferimento geografico dei dati in esso memorizzati (il tipo di proiezione della mappa); vantaggi del formato GeoTIFF: essendo un’estensione del formato TIFF, è perfettamente compatibile con tale formato (è possibile ad esempio la memorizzazione di immagini a 8 bit con palette); l’immagine memorizzata in un file GeoTIFF è visualizzabile da tutti i programmi in grado di visualizzare i files TIFF; per la lettura dei metadati occorre comunque un apposito software. svantaggi del formato GeoTIFF: ha una struttura rigida (un file GeoTIFF è semplicemente un file raster TIFF con qualche tag in più), adatta soprattutto per dati equispaziati; i metadati memorizzabili sono quelli che identificano il tipo di proiezione utilizzata e che individuano le trasformazioni necessarie per risalire, dalle coordinate spaziali dei dati, alle coordinate geografiche. 166 P. F. Pellegrini, G. Adembri, M. Tommasini, M. Innocenti, G. Poli 6.6 BIBLIOGRAFIA Beni, P. (1979) L’acquisizione ed il tracking dei satelliti artificiali. Revisione A. Consiglio Nazionale delle Ricerche, Istituto di Ricerca sulle Onde Elettromagnetiche (IROE-TR), Firenze. CelesTrack (2005) NORAD Two-Line Element Set. (http://www.celestrak.com/). Fantozzi, P.L., Garberi, M.L., Graziosi, B., Visicchio, F. and Artioli, G.P. (2001) Aspetti tecnici e metodologici delle procedure di collaudo della banca dati geologici del programma CARG, 5° Conferenza Nazionale ASITA - La qualita’ dell’informazione geografica, Rimini, Italy. National Center for Supercomputing Applications (2003) HDF User’s Guide, HDF4 Release 2.0, (ftp://ftp.ncsa.uiuc.edu/HDF/HDF/Documentation/HDF4.2r0/HDF42r0_UserGd.pdf), NCSA. Goodrum, G.,Kidwell, K. B. and Winston, W. (2000) NOAA KLM User's Guide, September 2000 revision, U.S. Department of Commerce, National Oceanic and Atmospheric Administration, National Environmental Satellite, Data, and Information Service, September 2000. Pellegrini, P. F., Tommasini, M., Francini, C., Innocenti, M., Marconi, M. and Poli, G. (2002) Automatic Navigation of AVHRR and SeaWiFS imagery on the sea with segmented Interpolation. In: Enzo dalle Mese (Ed.) Novel methodologies for the integration, processing and analysis of data from spaceborne sensors for the monitoring of the hydrosphere, rainfall phenomena and the ground, ASICNIT, Dalle Mese., Pisa. Qin, Z., Dall’Olmo, G., Karnieli, A. and Berliner, P. (2001) Derivation of split window algorithm and its sensitivity analysis for retrieving land surface temperature from NOAA-AVHRR data, Journal of Geophysical Research, Vol. 106, pp. 22655-70. Ritter, N. and Ruth, M. (1995) GeoTIFF Revision 1.0, Version: 1.8.1. (ftp://ftp.remotesensing.org/pub/geotiff/spec/). TECNAVIA (2005) Lugano, (http://www.tecnavia.com/). Tommasini, M., Poli, G. and Pellegrini, P. F.(2005) Segmented Interpolation Along the Coastline for AVHRR NOAA Images. EARSeL eProceedings 4, 1/2005, pp. 26-43 Ulivieri, C., Castronuovo M. M., Francioni R., and A. Cardillo (1994) A Split Window Algorithm For Estimating Land Surface Temperature From Satellites, Advances in Space Research, Volume 14, Issue 3, March 1994, Pages 59-65. Vermote, E., Tanré, D., Deuze, J. L., Herman, M. and Morcrette J. J. (1997) Second Simulation of the Satellite Signal in the Solar Spectrum, 6S: An Overview , IEEE Transactions On Geoscience And Remote Sensing. pp. 675-686. APPENDICE A1 CASO DI STUDIO: SELEZIONE DI UNA RETE PER IL MONITORAGGIO DELLA SICCITA’ NELLA REGIONE DI CRETA I. NALBANTIS, G. TSAKIRIS Laboratory of Reclamation Works and Water Resources Management, National Technical University of Athens F. VIOLA Dipartimento di Ingegneria Idraulica ed Applicazioni Ambientali, Università di Palermo A1.1 AREA DI STUDIO L’area di studio è la parte Est dell’isola che copre due delle quattro province dell’isola (Heraklion and Lasithi). Una più precisa descrizione dell’area è fornita in altri articoli di questa serie. Quello che è interessante per la nostra analisi è che la rete esistente per la misura delle precipitazioni è composta da 44 stazioni disposte più o meno uniformemente nello spazio. Sfortunatamente la rete non copre le aree a quota più elevata dove la neve non è infrequente. Quaranta stazioni appartengono al Ministero dello sviluppo Agricolo mentre le rimanenti quattro appartengono al Servizio Meteorologico Nazionale. Le ultime sono situate sulla costa. Una mappa della rete di misura delle precipitazioni è presentata in Figura A1.1. 170 I. Nalbantis, G. Tsakiris, F. Viola Figure A1.1 - Rete delle stazioni di misura della precipitazione nella parte Est di Creta. A1.2 ACQUISIZIONE DEI DATI E PRE-PROCESSING I dati grezzi giornalieri sono stati aggregati per ricavare i totali mensili e annuali, che sono stati poi passati al controllo di qualità. Dopo un primo controllo sommario sui dati (ad es. sui ranges) è stata valutata la consistenza degli stessi attraverso i quattro passi sotto elencati. L’intera area di studio è stata divisa in sotto aree (Northern Heraklion, Southern Heraklion, Western Lasithi, Eastern Lasithi). All’interno di ogni sotto area sono state calcolate le cross-correlazioni tra i totali annuali nei punti di misura; questo ha poi consentito la selezione di una stazione di riferimento per ogni sotto area, la quale fornisce i dati più affidabili. Sono state costruite le curve di doppia massa per tutte le stazioni in relazione alla stazione di riferimento di ogni sotto area. I cambi di pendenza in tali curve identificano delle inconsistenze. L’applicazione della metodologia appena descritta non ha rivelato inconsistenze significative nei dati. Solamente in sei casi sono stati riscontrati cambi di pendenza nelle curve a doppia massa. Ciò ha consentito di trascurare queste inconsistenze e di evitare la correzione dei dati. Un esempio di un evidente cambio di pendenza nella curva a doppia massa è mostrato in Figura A1.2. 171 Cumulative annual total precipitation at Krousonas (mm) Selezione di una rete per il monitoraggio della siccità nella regione di Creta 40000 35000 30000 25000 20000 15000 1992-93 10000 5000 0 0 5000 10000 15000 20000 25000 30000 35000 40000 Cumulative annual total precipitation at Prophet Elias (mm) Figure A1.2 - Esempio di curva a doppia massa con cambio di pendenza nell’anno idrologico 1992-93 A1.3 RISULTATI La metodologia proposta descritta nel paragrafo 2.4 è stata applicata a varie scale temporali. All’inizio è stata scelta la scala annuale. Si suppone che tale scala conduca ai risultati più affidabili visto che i totali annuali sono più vicini alla distribuzione normale di quanto non lo siano i totali a qualsiasi altra scala di aggregazione temporale più piccola. Il fatto che nelle aree Mediterranee esiste una distinzione netta tra la stagione secca e quella umida, conduce alla selezione del periodo umido come seconda scala di aggregazione. Tale periodo è supposto di sei mesi, e include i totali di pioggia da Ottobre a Marzo. Scendendo di scala temporale, sono stati considerati intervalli di tre mesi, dividendo il periodo umido in due sottoperiodi di tre mesi (da ottobre a Dicembre e da Gennaio a Marzo). Infine, è stata testata la scala mensile, considerando solo i mesi della stagione umida (da Ottobre a Marzo). Riassumendo, sono stati esaminati i seguenti periodi all’interno dell’anno idrologico. 1. Anno 2. Stagione umida (da Ottobre a Marzo) 3. Da Ottobre a Dicembre 172 I. Nalbantis, G. Tsakiris, F. Viola 4. 5. 6. 7. 8. 9. 10. Da Gennaio a Marzo Ottobre Novembre Dicembre Gennaio Febbraio Marzo. La prima serie di analisi numeriche è stata svolta su dati senza l’eliminazione della stagionalità. Per ognuno dei periodi temporali è stato stimato il range del semi-variogramma. I risultati sono riportati in Figura A1.3. Per scale temporali ampie (da quella annuale a quella di tre mesi) il range (il parametro a dell’equazione 2.45) si assesta leggermente sotto i 30 Km, mentre per la scala temporale mensile fluttua attorno ai 30 Km. Semivariogramrange(km) Quando si considerano i dati destagionalizzati i range si dispongono leggermente sopra i 35 Km per la scala annuale e quella a sei mesi e cominciano a fluttuare per scale inferiori. Tali fluttuazioni sono moderate per la scala trimestrale ma diventano più marcate per I dati mensili. Questa è la ragione per cui in Figura 1.3 vengono mostrate le scale dall’annuale fino alla trimestrale. 40 35 30 25 20 15 Not det rended 10 Det rended 5 0 1 2 3 4 5 6 7 8 9 10 Time period Figure A1.3 - Range del semi-variogramma (km) per diversi periodi temporali ( 1= anno, 2= Stagione umida da Ottobre a Novembre, 3= da Ottobre a Dicembre, 4= da Gennaio a Marzo, 5= Ottobre, 6= Novembre, 7= Dicembre, 8= Gennaio, 9= Febbraio, 10= Marzo) e campi isotropici di precipitazione. I controlli sull’anisotropia nei campi di precipitazione eseguiti secondo la metodologia del paragrafo 2.4 hanno rivelato grandi variazioni nel range del semivariogramma tra differenti direzioni. L’incertezza dei risultati è dovuta a due ragioni. : Selezione di una rete per il monitoraggio della siccità nella regione di Creta 173 Il numero delle coppie di stazioni usate nei calcoli è significativamente limitato per ogni specifica direzione se comparato a tutte le possibili coppie. La forma dell’area di studio (allungata nella direzione Est-Ovest e sottile nella direzione Nord-Sud) ha reso molto complessa la stima del semi-vagiogramma empirico. I risultati con le più piccole variazioni tra le direzioni corrispondono alla scala annuale. Per i dati non destagionalizzati il range di 28 km per tutte le direzioni cresce a 55 km per la direzione Est-Ovest e arriva a76 km nella direzione Sud Ovest Nord Est. Al contrario scende a 24 km per la direzione Nord Ovest- Sud Est e ancora a 15 km per la direzione Nord-Sud. I ranger basati su dati destagionalizzati sono generalmente più elevati. L’alta incertezza nei risultati del test sull’anisotropia ci hanno condotti ad considerare tali risultati solo qualitativamente ai fini della progettazione della rete. Quindi è stata adottata l’ipotesi di isotropia per la progettazione della rete. Abbiamo preferito considerare scale temporali ampie (annuale e sei mesi) per le quali le ipotesi di base della metodologia sono meglio rispettate. Abbiamo preferito inoltre considerare i risultati provenienti dai dati detrendizzati perché l’effetto orografico certamente gioca un ruolo importante nella parte Est di Creta. Considerate le ipotesi di cui sopra il range del semi-variogramma per la progettazione della rete è di 35.5 km per la scala annuale e di 35.3 per la scala a sei mesi. Essendo tali valori molto simili la distanza massima tra le stazioni è di (35.3/2) ≈ 17.6 km. Il relativo semi-variogramma per la scala annuale è mostrato in Figura 1.4. Tenendo a mente tale criterio di progettazione sono state costruite diverse reti attraverso un campionamento spaziale casuale. La selezione casuale di siti specifici è stata eseguita selezionando punti vicini a stazioni esistenti che diventano quindi siti “approssimati”. Ricordando i risultati circa il test dell’isotropia si potrebbe obiettare che la distanza tra le stazioni dovrebbe essere maggiore nella direzione Est-Ovest. Questa considerazione, comunque, non è tenuta in conto nella progettazione della rete all’interno della struttura di questo progetto. Un esempio di rete con 15 stazioni è mostrato in Figura 1.5. la distanza massima tra le stazioni è di 14.3 km. Infine, la rete finale è stata scelta basandosi su altri criteri tra i quali: l’accessibilità alle stazioni, la qualità dei dati e la copertura di zone ipsometriche. 2 2 Semivariogram (mm /mm ) 174 I. Nalbantis, G. Tsakiris, F. Viola 1.2 1.0 0.8 0.6 Empirical 0.4 Theoretical 0.2 Range 35528 0.0 0 25000 50000 75000 100000 125000 Distance (m) Figure A1.4 - Adattamento del semi-variogramma teorico a quello empirico per dati destagionalizzati, tutte le direzioni e scala annuale Figure A1.5 - Esempio di rete per la misura delle piogge nell’Est di Creta con 15 stazioni, progettata con campionamento spaziale casuale A2 APPLICAZIONE DELLA PROCEDURA DICA-UniCT DI VALIDAZIONE DEI DATI TERMOMETRICI MENSILI A 43 STAZIONI DELLA SICILIA G. ROSSI, A. CANCELLIERE, A. CAMPISANO Dipartimento di Ingegneria Civile e Ambientale, Università di Catania La metodologia per la costruzione delle fasce di confidenza esposta nel paragrafo 4.2.2, è stata applicata al controllo delle medie mensili delle temperature medie giornaliere registrate nelle 43 stazioni appartenenti alla rete in telemisura dell’ex Ufficio Idrografico Regionale della Sicilia, oggi Agenzia Regionale per i Rifiuti e le Acque, scelte sulla base di studi precedenti effettuati nell’ambito degli “Studi applicativi per l’avviamento del sistema di monitoraggio idrometeorologico per fronteggiare le crisi idriche nelle aree a rischio di siccità” affidati dal Servizio Tecnico Idrografico Regionale per la Sicilia al Dipartimento di Ingegneria Civile e Ambientale dell’Università di Catania (convenzione del 18/01/2001). In particolare sono state utilizzate le serie delle medie mensili delle temperature medie giornaliere relative al periodo 1926-94 per determinare i parametri sia delle fasce di confidenza basate sui dati delle stazioni stesse sia delle fasce di confidenza basate sui dati delle stazioni limitrofe (limitate a due per semplicità). I dati relativi al 1995 e al 1996 sono stati invece utilizzati per la fase di validazione della procedura; in particolare, il dato relativo a ciascuno dei 24 mesi del periodo di validazione, è stato confrontato con le rispettive fasce, attribuendo ad ognuno di essi un giudizio di qualità. In una prima fase dell'applicazione, per la determinazione delle fasce di confidenza basate sui dati della stazione stessa si è proceduto alla determinazione delle distribuzioni di probabilità che meglio si adattano ai dati di temperatura. In particolare, sono state scelte come distribuzioni di probabilità candidate all’adattamento della distribuzione di frequenza delle serie dei dati di ciascun mese le distribuzioni normale, lognormale e normale delle radici cubiche. I parametri delle diverse distribuzioni sono stati stimati mediante il metodo della massima verosimiglianza, mentre la bontà di adattamento delle stesse distribuzioni è stata verificata mediante il test del χ2. I risultati dei test per ciascuna delle 43 stazioni sono riassunti in tabella A2.1 dove è indicato, per ciascuna legge di probabilità analizzata, il numero di distribuzioni di probabilità delle serie delle temperature medie mensili che hanno G. Rossi, A. Cancelliere, A. Campisano 176 superato il test di adattamento del χ2 per livello di significatività del 5%. La tabella mostra che praticamente le 3 distribuzioni si equivalgono in termini di bontà di adattamento alle serie di temperature mensili per le 43 stazioni considerate per cui il calcolo delle fasce di confidenza è stato effettuato scegliendo la distribuzione normale. Tabella A2.1 Numero di distribuzioni di probabilità delle serie delle temperature medie mensili che superano il test del χ2 per livello di significatività del 5%. Stazione Normale Log- Normale normale rad. cub. Stazione Normale Lognormale Normale rad. cub. Tindari 10/12 10/12 10/12 Caltanissetta 12/12 11/12 12/12 San Fratello 12/12 10/12 11/12 Licata 11/12 12/12 12/12 Cefalù 10/12 10/12 10/12 Gela 11/12 11/12 11/12 Ciminna 12/12 12/12 12/12 Piazza Armerina 10/12 11/12 9/12 Ficuzza 10/12 11/12 11/12 Monterosso A. 12/12 10/12 10/12 Partinico 11/12 9/12 8/12 Vittoria 10/12 11/12 10/12 Palermo (S.I.) 11/12 11/12 11/12 Ragusa 11/12 9/12 9/12 S. Giuseppe Jato 11/12 11/12 12/12 Cozzo Spadaro 11/12 10/12 11/12 Trapani 9/12 10/12 9/12 Siracusa 10/12 10/12 10/12 S. Vito Lo Capo 10/12 11/12 10/12 Lentini (città) 11/12 12/12 12/12 Marsala 10/12 11/12 10/12 Cesarò 10/12 10/12 11/12 Mazara d.Vallo 10/12 10/12 10/12 Adrano 11/12 11/12 11/12 Partanna 11/12 11/12 10/12 Caltagirone 10/12 12/12 12/12 Corleone 12/12 12/12 12/12 Nicolosi 11/12 11/12 10/12 Sciacca 11/12 7/12 8/12 Zafferana Etnea 11/12 11/12 12/12 Piano del Leone 10/12 10/12 11/12 Linguaglossa 11/12 11/12 10/12 Bivona 9/12 11/12 11/12 Acireale 7/12 10/12 8/12 Lercara Friddi 12/12 12/12 12/12 Catania (Oss.) 8/12 9/12 8/12 Racalmuto 10/12 10/12 10/12 Floresta 9/12 8/12 8/12 Agrigento 12/12 12/12 12/12 Taormina 9/12 10/12 10/12 Petralia Sottana 10/12 10/12 11/12 Messina (I.G.) 10/12 10/12 10/12 Enna 11/12 11/12 11/12 Applicazione della procedura DICA-UniCt di validazione dei dati termometrici mensili a 43 stazioni della Sicilia 177 Scelta quindi tale distribuzione per la regolarizzazione delle serie delle temperature, per ciascun mese sono stati determinati i valori corrispondenti allo 0.5%, 2.5%, 97.5% e 99.5% della probabilità di non superamento individuando due fasce, una più restrittiva che contiene al suo interno il dato con probabilità 95% ed una più ampia, contenente il dato con probabilità 99%. Nelle figure A2.1 e A2.2 sono riportate, come esempio, le fasce di confidenza relative alle medie delle temperature medie giornaliere rispettivamente per le stazioni di Tindari e di Zafferana Etnea ed i punti relativi ai dati osservati nelle stesse stazioni negli anni 1995 e 1996. Le figure mostrano che, per entrambe le stazioni, i 24 dati osservati nel biennio 1995-96 rientrano nella fascia di confidenza più restrittiva (2.5%-97.5%). Ai fini della costruzione delle fasce di confidenza delle temperature basate sui dati di stazioni limitrofe, per ciascuna delle 43 stazioni si sono scelte come stazioni di riferimento le due che per distanza potevano ritenersi più prossime tra le 42 rimanenti, accertando l’esistenza di un legame di regressione tra le serie di temperature osservate. Per ciascuna delle 43 stazione base esaminate, si sono quindi calcolati i parametri delle 12 regressioni multiple mensili, utilizzando la procedura riportata nel sottoparagrafo 4.2.2.2 e con riferimento al periodo 19261994. I coefficienti di determinazione R2 delle regressioni mensili di ciascuna stazione sono riportati nella tabella A2.2. Dalla tabella si evince che i coefficienti di determinazione sono quasi sempre maggiori di 0.5, con alcune eccezioni generalmente relative ai mesi estivi di luglio e agosto. Utilizzando le leggi di regressione ottenute si sono quindi calcolate le due fasce di confidenza che contengono rispettivamente al loro interno il dato con probabilità pari al 95% e con probabilità pari al 99%. Nelle figure A2.3 e A2.4 sono in particolare riportate le fasce di confidenza per le stazioni di Tindari e di Zafferana Etnea ed i punti relativi ai dati osservati nelle stesse stazioni negli anni 1995 e 1996. Le figure mostrano rispettivamente che, mentre per la stazione di Tindari ancora una volta i 24 dati osservati nel biennio 1995-96 rientrano nella fascia di confidenza più restrittiva (2.5%-97.5%), per la stazione di Zafferana Etnea, quasi tutti i dati osservati nel periodo 1995-96 non rientrano nemmeno nella fascia di confidenza più ampia (0.5%-99.5%). Al fine di individuare le cause del comportamento anomalo delle temperature di Zafferana nel periodo 1995-1996 si è proceduto a riportare in un grafico l'andamento delle temperature medie annue nelle stazioni di Zafferana, Acireale e Linguaglossa nel periodo 1926-1996. Il grafico, riportato in fig. A2.5, mostra una apparente difformità di comportamento delle temperature medie annue registrate a Zafferana rispettivamente nel periodo 1926-1991 e 1992-1996. In particolare, mentre nel primo periodo le temperature risultano generalmente comprese tra G. Rossi, A. Cancelliere, A. Campisano 178 quelle registrate nelle altre due stazioni, nel secondo periodo esse risultano sempre inferiori. Una analisi più di dettaglio degli Annali Idrologici pubblicati dallo STIR ha evidenziato come la stazione termometrica di Zafferana presenti una discontinuità di funzionamento proprio nell'anno 1990, anno in cui probabilmente è stato sostituito lo strumento, il che potrebbe spiegare la difformità dei dati osservati nei due periodi rispettivamente precedente e successivo al 1990. Tindari 40 36 Fascia 0,5%-99,5% Temperature (°C) 32 Fascia 2,5%-97,5% 28 24 20 16 12 8 4 0 G F M A M G L A S 1995 O N D G F M A M G L A 1996 S O N D Mese Figura A2.1 Stazione di Tindari. Medie mensili delle temperature medie giornaliere (1995-1996) e fasce di confidenza calcolate sulla base delle temperature medie del periodo 1926-94 osservate nella stessa stazione. Applicazione della procedura DICA-UniCt di validazione dei dati termometrici mensili a 43 stazioni della Sicilia Zafferana Etnea 40 36 Fascia 0,5%-99,5% 32 Temperature (°C) 179 Fascia 2,5%-97,5% 28 24 20 16 12 8 4 0 G F M A M G L A S O N D G F M A M G L A S O N D 199 199 Mese Figura A2.2 Stazione di Zafferana Etnea. Medie mensili delle temperature medie giornaliere (1995-1996) e fasce di confidenza calcolate sulla base delle temperature nel periodo 1926-94 nella stazione. Tindari Temperature (°C) 40 36 Fascia 0,5%-99,5% 32 Fascia 2,5%-97,5% 28 24 20 16 12 8 4 0 G F M A M G L A S O N D G F M A M G L A S O N D 1995 1996 Mese Figura A2.3 Stazione di Tindari. Medie mensili delle temperature medie giornaliere (1995-1996) e fasce di confidenza basate sulle regressioni mensili con i dati contemporanei delle stazioni di San Fratello e Cefalù. G. Rossi, A. Cancelliere, A. Campisano 180 Zafferana Etnea 40 36 Fascia 0,5%-99,5% 32 Fascia 2,5%-97,5% Temperature (°C) 28 24 20 16 12 8 4 0 G F M A M G L A 199 S O N D G F M A M G L A 199 S O N D Mese Figura A2.4 Stazione di Zafferana Etnea. Medie mensili delle temperature medie giornaliere (1995-1996) e fasce di confidenza basate sulle regressioni mensili con i dati contemporanei delle stazioni di Acireale e Linguaglossa. Tabella A2.2. Stazioni di riferimento e coefficienti di determinazione R2 delle regressioni lineari per ciascun mese adottate per il controllo dei dati di temperatura media mensile nelle stazioni. Stazione Stazioni di riferimento Gen Feb Mar Apr Mag Giu Lug Ago Set Ott Nov Dic Tindari San Fratello Cefalù Ciminna Ficuzza Partinico Palermo (S.I.) S. Giuseppe Jato Trapani S. Vito Lo Capo Marsala Mazara del Vallo Partanna Corleone Sciacca Piano del Leone Bivona Lercara Friddi Racalmuto Agrigento Petralia Sottana Enna Caltanissetta San Fratello Tindari Palermo (S.I.) Ficuzza Ciminna S. Giuseppe Jato Partinico Partinico S. Vito Lo Capo Trapani Trapani Marsala Mazara del Vallo Ficuzza Mazara del Vallo Bivona Piano del Leone Piano del Leone Agrigento Sciacca Enna Petralia Sottana Racalmuto 0,80 0,91 0,73 0,78 0,79 0,47 0,39 0,70 0,78 0,76 0,38 0,45 0,74 0,83 0,58 0,67 0,64 0,77 0,77 0,76 0,76 0,71 0,79 0,68 0,74 0,68 0,76 0,78 0,47 0,27 0,54 0,81 0,81 0,64 0,61 0,46 0,83 0,09 0,78 0,69 0,76 0,85 0,53 0,54 0,56 0,85 Cefalù Floresta Tindari Lercara Friddi Corleone Palermo (S.I.) Cefalù Ciminna Marsala Palermo (S.I.) Mazara del Vallo Sciacca Corleone Bivona Agrigento Lercara Friddi Racalmuto Bivona Caltanissetta Licata Lercara Friddi Piazza Armerina Piazza Armerina 0,82 0,82 0,77 0,82 0,80 0,53 0,39 0,60 0,83 0,83 0,42 0,49 0,76 0,82 0,52 0,85 0,81 0,86 0,66 0,73 0,81 0,71 0,70 0,80 0,87 0,76 0,77 0,66 0,52 0,48 0,62 0,84 0,84 0,65 0,58 0,76 0,69 0,57 0,81 0,75 0,87 0,69 0,72 0,69 0,68 0,80 0,45 0,85 0,53 0,63 0,60 0,41 0,44 0,55 0,79 0,79 0,15 0,12 0,50 0,56 0,33 0,66 0,53 0,71 0,59 0,50 0,57 0,57 0,64 0,50 0,70 0,49 0,69 0,66 0,49 0,39 0,68 0,80 0,80 0,27 0,21 0,44 0,69 0,52 0,72 0,61 0,80 0,80 0,60 0,63 0,60 0,82 0,57 0,78 0,58 0,65 0,74 0,39 0,48 0,66 0,66 0,66 0,40 0,35 0,42 0,72 0,43 0,76 0,51 0,81 0,82 0,48 0,40 0,42 0,83 0,43 0,67 0,47 0,58 0,58 0,28 0,36 0,51 0,69 0,65 0,50 0,58 0,49 0,56 0,46 0,74 0,41 0,75 0,78 0,50 0,42 0,47 0,78 0,58 0,79 0,52 0,68 0,66 0,40 0,37 0,56 0,68 0,66 0,45 0,46 0,61 0,63 0,40 0,78 0,45 0,78 0,78 0,59 0,49 0,45 0,78 0,41 0,54 0,41 0,75 0,71 0,32 0,17 0,46 0,68 0,70 0,46 0,45 0,48 0,72 0,40 0,67 0,55 0,72 0,76 0,52 0,57 0,47 0,76 0,52 0,82 0,46 0,73 0,74 0,32 0,16 0,70 0,76 0,77 0,46 0,47 0,43 0,83 0,05 0,65 0,63 0,73 0,75 0,53 0,54 0,51 0,74 0,63 0,83 0,64 0,77 0,75 0,53 0,18 0,66 0,72 0,69 0,45 0,35 0,59 0,85 0,19 0,71 0,66 0,75 0,72 0,71 0,62 0,60 0,75 Continua Tabella A2.2. Stazioni di riferimento e coefficienti di determinazione R2 delle regressioni lineari per ciascun mese adottate per il controllo dei dati di temperatura media mensile nelle stazioni. Stazione Stazioni di riferimento Gen Feb Mar Apr Mag Giu Lug Ago Set Ott Nov Dic Licata Gela Agrigento 0,92 0,93 0,87 0,79 0,91 0,75 0,88 0,79 0,90 0,88 0,84 0,90 Gela Licata Vittoria 0,93 0,92 0,85 0,76 0,90 0,75 0,86 0,73 0,88 0,88 0,84 0,90 Piazza Armerina Enna Caltagirone 0,74 0,88 0,78 0,75 0,79 0,60 0,77 0,80 0,81 0,86 0,77 0,76 Monterosso Almo Ragusa Caltagirone 0,89 0,86 0,85 0,82 0,84 0,76 0,77 0,88 0,86 0,84 0,80 0,88 Vittoria Ragusa Gela 0,30 0,30 0,19 0,11 0,17 0,18 0,16 0,12 0,07 0,24 0,13 0,26 Ragusa Vittoria Monterosso Almo 0,83 0,80 0,80 0,77 0,64 0,58 0,50 0,68 0,69 0,74 0,75 0,80 Cozzo Spadaro Siracusa Gela 0,85 0,87 0,85 0,73 0,80 0,58 0,56 0,75 0,75 0,58 0,77 0,82 Siracusa Lentini (città) Cozzo Spadaro 0,78 0,84 0,83 0,72 0,79 0,53 0,50 0,68 0,60 0,18 0,69 0,66 Lentini (città) Catania (Oss.) Siracusa 0,55 0,70 0,62 0,44 0,44 0,29 0,38 0,21 0,55 0,69 0,53 0,47 Cesarò Floresta Enna 0,34 0,38 0,35 0,22 0,2 0,34 0,29 0,28 0,29 0,30 0,25 Adrano Lentini (città) Nicolosi 0,56 0,67 0,68 0,65 0,76 0,75 0,65 0,67 0,51 0,59 0,30 0,36 Caltagirone Piazza Armerina Lentini (città) 0,75 0,90 0,84 0,77 0,82 0,69 0,82 0,82 0,82 0,86 0,78 0,77 Nicolosi Zafferana Etnea Acireale 0,79 0,89 0,88 0,84 0,89 0,79 0,89 0,89 0,74 0,88 0,84 0,82 Zafferana Etnea Acireale Linguaglossa 0,66 0,68 0,64 0,54 0,71 0,49 0,60 0,63 0,42 0,65 0,47 0,54 Linguaglossa Acireale Taormina 0,73 0,76 0,76 0,62 0,52 0,53 0,63 0,66 0,57 0,63 0,52 0,67 Acireale Catania (Oss.) Zafferana Etnea 0,80 0,85 0,89 0,84 0,84 0,80 0,76 0,83 0,78 0,85 0,83 0,80 Catania (Oss.) Acireale Lentini (città) 0,81 0,85 0,91 0,83 0,85 0,80 0,76 0,83 0,83 0,87 0,85 0,82 Floresta Cesarò Linguaglossa 0,74 0,76 0,79 0,69 0,55 0,45 0,56 0,52 0,39 0,50 0,67 0,70 Taormina Acireale Messina (I.G.) 0,51 0,59 0,59 0,40 0,35 0,41 0,34 0,49 0,45 0,47 0,28 0,36 Messina (I.G.) Taormina Tindari 0,44 0,49 0,42 0,17 0,45 0,36 0,35 0,50 0,45 0,24 0,08 0,41 Applicazione della procedura DICA-UniCt di validazione dei dati termometrici mensili a 43 stazioni della Sicilia 183 Si può quindi concludere che la procedura di controllo ha correttamente individuato in maniera automatica i dati osservati a Zafferana come da rigettare, poiché essi presentano un comportamento anomalo rispetto a quelli osservati nelle stazioni di riferimento. Temperature medie annue 25,0 20,0 15,0 10,0 Zafferana Acireale 5,0 Linguaglossa 1995 1992 1989 1986 1983 1980 1977 1974 1971 1968 1965 1962 1959 1956 1953 1950 1947 1944 1941 1938 1935 1932 1929 1926 0,0 Anni Figura A2.5 Confronto degli andamenti delle temperature medie annue nelle stazioni di Zafferana, Acireale e Linguaglossa nel periodo 1926-1996. Si è infine proceduto a verificare su tutte le stazioni la metodologia di controllo dei dati utilizzando le temperature registrate nel periodo 1995-1996. In particolare, per ogni mese e per ogni anno di tale periodo (24 osservazioni per ciascuna stazione) si è attribuito un giudizio di qualità al singolo dato a secondo se il valore osservato ricadesse all’interno delle fasce di confidenza determinate sulla base dei dati della stessa stazione e all’interno delle fasce di confidenza determinate sulla base delle regressioni con le stazioni limitrofe. I risultati dei test di controllo e giudizi di qualità sui dati di temperature mensili del periodo 1995-96 nelle 43 stazioni analizzate sono riassunti in tabella A2.3. La tabella mostra in particolare che la procedura di controllo condurrebbe complessivamente a validare (V) il 77,4% dei dati osservati nel periodo 1995-96, ad assegnare il giudizio di "incerto" (I) al 12,1% dei dati, a non validare automaticamente (NV) il 9,3% dei dati e a rifiutare (R) solo l'1,2% dei dati osservati. 184 G. Rossi, A. Cancelliere, A. Campisano Tabella A2.3 Risultati dei test di controllo e giudizi di qualità sui dati di temperature mensili del periodo 1995-96 nelle stazioni scelte. Giudizio di qualità Giudizio di qualità Stazione V I NV R Stazione V I NV R Tindari 24 0 0 0 Caltanissetta 23 1 0 0 San Fratello 21 2 1 0 Licata 7 5 11 1 Cefalù 22 2 0 0 Gela 6 4 14 0 Ciminna 18 5 1 0 Piazza Armerina 16 3 3 2 Ficuzza 12 4 8 0 Monterosso A. 16 7 1 0 Partinico 21 3 0 0 Vittoria 17 4 1 2 Palermo (S.I.) 11 4 9 0 Ragusa 18 2 4 0 S. Giuseppe Jato 23 1 0 0 Cozzo Spadaro 24 0 0 0 Trapani 15 2 5 2 Siracusa 24 0 0 0 S. Vito Lo Capo 16 1 6 1 Lentini (città) 21 3 0 0 Marsala 23 0 1 0 Cesarò 21 2 1 0 23 1 0 0 Adrano 22 2 0 0 Partanna 14 7 2 1 Caltagirone 16 5 3 0 Corleone 16 4 3 1 Nicolosi 20 4 0 0 Sciacca 24 0 0 0 Zafferana Etnea 5 10 9 0 Piano del Leone 20 2 2 0 Linguaglossa 17 3 3 1 Bivona 22 1 1 0 Acireale 14 9 1 0 Lercara Friddi 18 4 2 0 Catania (Oss.) 15 8 1 0 Racalmuto 23 1 0 0 Floresta 19 3 1 1 Agrigento 21 2 1 0 Taormina 20 3 1 0 Petralia Sottana 24 0 0 0 Messina (I.G.) 23 1 0 0 Enna 0 0 0 Totale 799 125 96 12 Totale (%) 77,4 12,1 9,3 1,2 Mazara Vallo del 24 A3 APPLICAZIONE DELLA PROCEDURA (DICA-UniCT) DI VALIDAZIONE DEI DATI PLUVIOMETRICI MENSILI A 43 STAZIONI DELLA SICILIA G. ROSSI, A. CANCELLIERE, A. CAMPISANO Dipartimento di Ingegneria Civile e Ambientale, Università di Catania La metodologia per la costruzione delle fasce di confidenza delle precipitazioni mensili è stata applicata alle 43 stazioni dell’ex Ufficio Idrografico Regionale della Sicilia, oggi Agenzia Regionale per i Rifiuti e le Acque selezionate utilizzando i dati di precipitazione relativi al periodo 1921-1996. Anche in questo caso, allo scopo di verificare l’applicabilità della procedura di controllo, sono state utilizzate le serie delle precipitazioni mensili relative al periodo 1921-94 per determinare i parametri delle fasce di confidenza basate sui dati delle stazioni stesse e delle fasce di confidenza basate sui dati delle stazioni limitrofe, mentre i dati relativi al 1995 e al 1996 sono stati utilizzati per la fase di validazione della procedura; in particolare, il dato relativo a ciascuno dei 24 mesi del periodo di validazione, è stato confrontato con le rispettive fasce, attribuendo ad ognuno di essi un giudizio di qualità. Per la determinazione delle fasce di confidenza basate sui dati della stazione stessa sono state scelte come distribuzioni di probabilità candidate all’adattamento della distribuzione di frequenza delle serie dei dati di precipitazione di ciascun mese le distribuzioni normale, lognormale e normale delle radici cubiche. I parametri delle diverse distribuzioni sono stati stimati mediante il metodo della massima verosimiglianza, mentre la bontà di adattamento delle stesse distribuzioni è stata verificata mediante il test del χ2. I risultati dell’applicazione del test alle 43 stazioni sono riassunti in tabella A3.1 dove è indicato, per ciascuna legge di probabilità analizzata, il numero di distribuzioni di probabilità delle serie delle precipitazioni mensili che hanno superato il test di adattamento del χ2 per livello di significatività del 5%. La tabella mostra che la distribuzione che meglio si adatta alle serie di precipitazioni mensili per le 43 stazioni considerate è la normale delle radici cubiche. Scelta quindi tale distribuzione per la regolarizzazione delle serie delle temperature, per ciascun mese sono stati determinati i valori corrispondenti allo 0.5%, 2.5%, 97.5% e 99.5% della probabilità di non superamento utilizzando la procedura descritta nel sottoparagrafo 4.2.3.1. Si sono così individuate due fasce, una più restrittiva che contiene al suo interno il dato con probabilità 95% ed una più ampia, contenente il dato con probabilità 99%. G. Rossi, A. Cancelliere, A. Campisano 186 Tabella A3.1 Numero di distribuzioni di probabilità delle serie delle precipitazioni mensili che superano il test di adattamento del χ2 per livello di significatività del 5%. Stazione Normale Log- Normale normale rad. cub. 10/12 12/12 Stazione Normale Lognormale Normale rad. cub. 5/12 5/12 10/12 Tindari 5/12 San Fratello 5/12 6/12 11/12 Licata 0/12 9/12 9/12 Cefalù 4/12 7/12 10/12 Gela 3/12 4/12 9/12 Ciminna 4/12 8/12 10/12 Piazza Armerina 2/12 8/12 9/12 Ficuzza 5/12 6/12 10/12 Monterosso A. 2/12 3/12 10/12 Partinico 4/12 4/12 11/12 Vittoria 5/12 6/12 10/12 Palermo (S.I.) 3/12 9/12 8/12 Ragusa 3/12 7/12 11/12 S. Giuseppe Jato 4/12 7/12 10/12 Cozzo Spadaro 0/12 5/12 8/12 Trapani 4/12 2/12 8/12 Siracusa 0/12 8/12 9/12 S. Vito Lo Capo 2/12 6/12 8/12 Lentini (città) 0/12 6/12 10/12 Marsala 3/12 9/12 10/12 Cesarò 1/12 6/12 11/12 Mazara del Vallo 2/12 8/12 11/12 Adrano 3/12 8/12 10/12 Partanna 2/12 9/12 11/12 Caltagirone 4/12 6/12 10/12 Corleone 6/12 6/12 9/12 Nicolosi 0/12 9/12 9/12 Sciacca 1/12 6/12 10/12 Zafferana Etnea 0/12 10/12 10/12 Piano del Leone 5/12 8/12 10/12 Linguaglossa 0/12 9/12 10/12 Bivona 4/12 4/12 9/12 Acireale 0/12 10/12 11/12 Lercara Friddi 6/12 8/12 10/12 Catania (Oss.) 0/12 8/12 8/12 Racalmuto 2/12 8/12 11/12 Floresta 4/12 9/12 11/12 Agrigento 2/12 8/12 9/12 Taormina 1/12 7/12 10/12 Petralia Sottana 6/12 6/12 10/12 Messina (I.G.) 7/12 9/12 11/12 Enna 0/12 9/12 9/12 Caltanissetta Nelle figure A3.1 e A3.2 in particolare sono riportate, come esempio, le fasce di confidenza relative alle precipitazioni mensili rispettivamente per le stazioni di Piazza Armerina e di Gela e i punti relativi ai dati osservati nelle stesse stazioni negli anni 1995 e 1996. Le figure mostrano rispettivamente che, mentre per la stazione di Piazza Armerina i 24 dati osservati nel biennio 1995-96 rientrano nella fascia di confidenza più ampia (0.5%-99.5%), per la stazione di Gela i dati di giugno 1995, luglio 1995, agosto 1995, febbraio 1996, luglio 1996 e dicembre 1996 non rientrano in tale fascia di confidenza e addirittura i dati di luglio 1995 e luglio 1996 risultano essere esterni anche alla fascia di confidenza più ampia (0.5%-99.5%). Applicazione della procedura DICA-UniCt di validazione dei dati pluviometrici mensili a 43 stazioni della Sicilia Piazza Armerina 400 Fascia 0,5%-99,5% 350 Precipitazione (mm) 187 Fascia 2,5%-97,5% 300 250 200 150 100 50 0 G F M A M G L A S O N D G F M A M G L A S O N D Mese 199 199 Figura A3.1 Stazione di Piazza Armerina. Precipitazioni mensili (1995-1996) e fasce di confidenza calcolate sulla base delle precipitazioni del periodo 1926-94 nella stazione stessa. Gela Precipitazione (mm) 400 350 Fascia 0,5%-99,5% 300 Fascia 2,5%-97,5% 250 200 150 100 50 0 G F M A M G L A S O N D G F M A M G L A S O N D Mese 199 199 Figura A3.2 - Stazione di Gela. Precipitazioni mensili (1995-1996) e fasce di confidenza calcolate sulla base delle precipitazioni del periodo 1926-94 nella stazione stessa. 188 G. Rossi, A. Cancelliere, A. Campisano Anche per quanto riguarda la costruzione delle fasce di confidenza delle precipitazioni basate sui dati di stazioni limitrofe, per ciascuna delle 43 stazioni si sono scelte come stazioni di riferimento le due più prossime per distanza tra le 42 rimanenti, accertando l’esistenza di un legame di regressione tra le serie di precipitazione osservate. Per ciascuna delle 43 stazione base esaminate, si sono quindi calcolati i parametri delle 12 regressioni multiple mensili con riferimento al periodo 19211994. In tabella A3.2, per ciascuna stazione sono indicate le corrispondenti stazioni di riferimento e, per ciascun mese, il coefficiente di determinazione R2 delle regressioni lineari suddette. Dalla tabella si evince che i coefficienti di determinazione sono quasi sempre maggiori di 0.6, con alcune eccezioni generalmente relative ai mesi estivi. Utilizzando le leggi di regressione ottenute si sono quindi calcolate le due fasce di confidenza che contengono rispettivamente al loro interno il dato con probabilità pari al 95% e con probabilità pari al 99%. Nelle figure A3.3 e A3.4 in particolare sono riportate le fasce di confidenza per le stazioni di Piazza Armerina e di Gela ed i punti relativi ai dati osservati nelle stesse stazioni negli anni 1995 e 1996. Le figure mostrano rispettivamente che, mentre per la stazione di Piazza Armerina i 24 dati osservati nel biennio 1995-96 rientrano nella fascia di confidenza più restrittiva (2.5%-97.5%), per la stazione di Gela, i dati osservati relativi a giugno 1995 e marzo 1996, rientrano solo nella fascia di confidenza più ampia (0.5%-99.5%) mentre i dati relativi a luglio 1996 e dicembre 1996 non rientrano nemmeno nella fascia di confidenza più ampia. Si è infine proceduto a verificare per le 43 stazioni esaminate la metodologia di controllo dei dati utilizzando le precipitazioni registrate nel periodo 1995-1996. In particolare, per ogni mese e per ogni anno di tale periodo (24 osservazioni per ciascuna stazione) si è attribuito un giudizio di qualità al singolo dato di precipitazione a secondo se il valore osservato ricadesse all’interno delle fasce di confidenza determinate sulla base dei dati della stessa stazione e all’interno delle fasce di confidenza determinate sulla base delle regressioni con le stazioni limitrofe. I risultati dei test di controllo e giudizi di qualità sui dati di precipitazione mensili del periodo 1995-96 nelle 43 stazioni analizzate sono riassunti in tabella A3.3. La tabella mostra in particolare che la procedura di controllo condurrebbe complessivamente a validare (V) l'82,7% dei dati osservati nel periodo 1995-96, ad assegnare il giudizio di "incerto" (I) al 7,1% dei dati, a non validare automaticamente (NV) il 6,2% dei dati e a rifiutare (R) il 4,0% dei dati osservati. Tabella A3.2 Stazioni di riferimento e coefficienti di determinazione R2 delle regressioni lineari per ciascun mese adottate per il controllo dei dati di precipitazione mensile nelle stazioni. Stazione Tindari San Fratello Cefalù Ciminna Ficuzza Partinico Palermo (S.I.) S. Giuseppe Jato Trapani S. Vito Lo Capo Marsala Mazara del Vallo Partanna Corleone Sciacca Piano del Leone Bivona Lercara Friddi Racalmuto Agrigento Petralia Sottana Enna Caltanissetta Stazioni di riferimento San Fratello Tindari Palermo (S.I.) Ficuzza Ciminna S. Giuseppe Jato Partinico Partinico S. Vito Lo Capo Trapani Trapani Marsala Mazara del Vallo Ficuzza Mazara del Vallo Bivona Piano del Leone Piano del Leone Agrigento Sciacca Enna Petralia Sottana Racalmuto Cefalù Floresta Tindari Lercara Friddi Corleone Palermo (S.I.) Cefalù Ciminna Marsala Palermo (S.I.) Mazara del Vallo Sciacca Corleone Bivona Agrigento Lercara Friddi Racalmuto Bivona Caltanissetta Licata Lercara Friddi Piazza Armerina Piazza Armerina Gen Feb Mar Apr Mag Giu Lug Ago Set Ott Nov Dic 0,45 0,44 0,61 0,59 0,73 0,69 0,68 0,65 0,63 0,26 0,65 0,41 0,68 0,74 0,55 0,66 0,71 0,66 0,68 0,52 0,63 0,50 0,77 0,50 0,48 0,76 0,68 0,79 0,80 0,76 0,79 0,68 0,41 0,84 0,82 0,83 0,83 0,62 0,54 0,69 0,75 0,83 0,67 0,68 0,58 0,79 0,65 0,55 0,71 0,69 0,70 0,75 0,65 0,71 0,82 0,64 0,82 0,62 0,62 0,74 0,59 0,77 0,76 0,48 0,68 0,61 0,62 0,59 0,65 0,55 0,53 0,71 0,77 0,81 0,76 0,76 0,67 0,78 0,74 0,75 0,73 0,82 0,78 0,64 0,84 0,79 0,76 0,76 0,70 0,66 0,52 0,74 0,54 0,61 0,52 0,61 0,71 0,69 0,62 0,61 0,68 0,65 0,74 0,72 0,66 0,72 0,71 0,61 0,74 0,64 0,71 0,70 0,67 0,75 0,78 0,26 0,62 0,37 0,44 0,65 0,81 0,68 0,80 0,21 0,11 0,56 0,53 0,65 0,70 0,33 0,46 0,42 0,13 0,33 0,61 0,46 0,48 0,31 0,64 0,67 0,45 0,61 0,49 0,65 0,30 0,74 0,55 0,15 0,53 0,19 0,54 0,40 0,14 0,56 0,21 0,55 0,43 0,16 0,60 0,36 0,32 0,33 0,51 0,42 0,69 0,61 0,75 0,65 0,74 0,67 0,22 0,77 0,66 0,61 0,52 0,61 0,64 0,62 0,54 0,42 0,71 0,62 0,60 0,37 0,52 0,63 0,51 0,59 0,62 0,68 0,62 0,59 0,56 0,62 0,65 0,66 0,56 0,51 0,32 0,67 0,54 0,61 0,70 0,53 0,58 0,51 0,55 0,51 0,54 0,50 0,62 0,60 0,55 0,53 0,57 0,56 0,35 0,75 0,76 0,52 0,72 0,54 0,75 0,76 0,67 0,72 0,64 0,70 0,74 0,57 0,46 0,47 0,48 0,64 0,66 0,61 0,62 0,58 0,81 0,66 0,84 0,80 0,67 0,70 0,68 0,78 0,79 0,68 0,79 0,72 0,73 0,64 0,77 0,53 0,53 0,56 0,61 0,71 0,68 0,62 0,64 0,71 0,60 0,63 0,33 0,64 0,72 0,56 0,73 0,73 0,56 0,71 0,63 0,60 0,20 0,69 Continua Tabella A3.2 Stazioni di riferimento e coefficienti di determinazione R2 delle regressioni lineari per ciascun mese adottate per il controllo dei dati di precipitazione mensile nelle stazioni. Gen Feb Mar Apr Mag Giu Lug Ago Set Ott Nov Dic 0,65 0,58 0,58 0,65 0,70 0,62 0,21 0,76 0,68 0,78 0,71 0,63 Vittoria 0,80 0,72 0,74 0,77 0,77 0,34 0,58 0,81 0,68 0,82 0,81 0,69 Caltagirone 0,76 0,72 0,80 0,62 0,73 0,42 0,49 0,53 0,51 0,72 0,63 0,52 Ragusa Caltagirone 0,75 0,69 0,80 0,58 0,59 0,54 0,32 0,50 0,56 0,87 0,83 0,75 Vittoria Ragusa Gela 0,78 0,75 0,73 0,67 0,52 0,36 0,59 0,63 0,52 0,85 0,73 0,58 Ragusa Vittoria Monterosso Almo 0,61 0,63 0,67 0,61 0,45 0,50 0,53 0,39 0,60 0,87 0,77 0,63 Cozzo Spadaro Siracusa Gela 0,51 0,65 0,76 0,67 0,37 0,18 0,64 0,54 0,50 0,56 0,53 0,42 Siracusa Lentini (città) Cozzo Spadaro 0,77 0,70 0,83 0,78 0,63 0,29 0,62 0,64 0,38 0,54 0,64 0,74 Lentini (città) Catania (Oss.) Siracusa 0,87 0,72 0,83 0,77 0,70 0,49 0,25 0,51 0,35 0,60 0,79 0,86 Cesarò Floresta Enna 0,48 0,51 0,45 0,56 0,70 0,53 0,63 0,57 0,51 0,52 0,63 0,49 Adrano Lentini (città) Nicolosi 0,51 0,54 0,41 0,56 0,49 0,22 0,43 0,33 0,41 0,67 0,60 0,61 Caltagirone Piazza Armerina Lentini (città) 0,71 0,66 0,76 0,76 0,73 0,35 0,50 0,49 0,58 0,61 0,75 0,53 Nicolosi Zafferana Etnea Acireale 0,82 0,59 0,90 0,79 0,71 0,51 0,26 0,47 0,70 0,79 0,83 0,86 Zafferana Etnea Acireale Linguaglossa 0,89 0,80 0,79 0,86 0,78 0,60 0,50 0,29 0,73 0,78 0,78 0,92 Linguaglossa Acireale Taormina 0,51 0,65 0,69 0,61 0,61 0,43 0,55 0,51 0,60 0,68 0,56 0,82 Acireale Catania (Oss.) Zafferana Etnea 0,84 0,85 0,73 0,86 0,80 0,55 0,71 0,61 0,73 0,76 0,78 0,87 Catania (Oss.) Acireale Lentini (città) 0,90 0,83 0,74 0,78 0,76 0,59 0,42 0,60 0,65 0,76 0,79 0,88 Floresta Cesarò Linguaglossa 0,48 0,47 0,50 0,50 0,58 0,59 0,63 0,57 0,46 0,51 0,40 0,48 Taormina Acireale Messina (I.G.) 0,67 0,73 0,58 0,68 0,73 0,45 0,32 0,43 0,61 0,61 0,67 0,59 Messina (I.G.) Taormina Tindari 0,46 0,55 0,57 0,42 0,31 0,72 0,10 0,28 0,32 0,39 0,44 0,44 Stazione Licata Gela Gela Licata Piazza Armerina Enna Monterosso Almo Stazioni di riferimento Agrigento 191 Applicazione della procedura DICA-UniCt di validazione dei dati pluviometrici mensili a 43 stazioni della Sicili Piazza Armerina 400 350 Fascia 0,5%-99,5% Precipitazione (mm) 300 Fascia 2,5%-97,5% 250 200 150 100 50 0 G F M A M G L A S O N D G F M A M G L A S O N D Mese 1996 1995 Figura A3.3 - Stazione di Piazza Armerina. Precipitazioni mensili (1995-1996) e fasce di confidenza basate sulle regressioni mensili con i dati contemporanei delle stazioni di Enna e Caltagirone. Gela 400 350 Fascia 0,5%-99,5% Fascia 2,5%-97,5% Precipitazione (mm) 300 250 200 150 100 50 0 G 1995 F M A M G L A S O N D G F M A M 1996 G L A S O N D Me se Figura A3.4 - Stazione di Gela. Precipitazioni mensili (1995-1996) e fasce di confidenza basate sulle regressioni mensili con i dati contemporanei delle stazioni di Licata e Vittoria. G. Rossi, A. Cancelliere, A. Campisano 192 Tabella A3.3 - Risultati dei test di controllo e giudizi di qualità sui dati di precipitazione mensili del periodo 1995-96 nelle stazioni scelte. Giudizio di qualità Giudizio di qualità Stazione V I NV R Stazione V I NV R Tindari San Fratello Cefalù 24 23 22 0 0 1 0 1 1 0 0 0 20 17 18 2 4 4 2 1 0 0 2 2 Ciminna 23 0 1 0 24 0 0 0 Ficuzza Partinico Palermo (S.I.) S. Giuseppe Jato Trapani S. Vito Lo Capo Marsala Mazara del Vallo Partanna Corleone 21 22 21 1 0 0 1 0 1 1 2 2 23 20 21 0 2 1 0 0 0 1 2 2 21 1 1 1 19 1 1 3 11 4 8 1 Caltanissetta Licata Gela Piazza Armerina Monterosso A. Vittoria Ragusa Cozzo Spadaro Siracusa 21 2 1 0 22 0 2 0 Lentini (città) 21 0 1 2 20 2 1 1 Cesarò 17 2 5 0 17 2 3 2 Adrano 21 2 0 1 18 22 5 1 0 1 1 0 21 20 2 1 0 3 1 0 Sciacca 20 2 1 1 Caltagirone Nicolosi Zafferana Etnea 19 1 3 1 19 1 4 0 Linguaglossa 19 3 2 0 19 20 20 18 3 2 2 2 2 2 1 1 0 0 1 3 Acireale Catania (Oss.) Floresta Taormina 18 20 14 15 3 3 0 7 2 0 10 0 1 1 0 2 18 2 2 2 Messina (I.G.) 21 2 0 1 23 1 0 0 Totale Totale (%) 853 82,7 74 7,1 65 6,2 40 4,0 Piano del Leone Bivona Lercara Friddi Racalmuto Agrigento Petralia Sottana Enna A4 ESEMPIO DI APPLICAZIONE DELLA PROCEDURA DELLA ARPA-EMILIA ROMAGNA PER IL CONTROLLO DELLA QUALITA’ DEI DATI TERMOMETRICI GIORNALIERI DI ALCUNE STAZIONI DELLA RETE DELL’EMILIA ROMAGNA V. PAVAN, S. MARCHESI, A. SELVINI, R.TOMOZEIU, M. DI LORENZO Servizio Idrometeorologico Emilia Romagna. (Procedura ARPA-EMILIA ROMAGNA) Il data-set di dati osservati di temperatura massima e minima su cui vogliamo applicare la procedura di controllo di qualità appartiene ad un gruppo di stazioni localizzate sul territorio regionale dell’Emilia Romagna e appartenenti originariamente alla rete del Servizio Idrografico e Marografico Nazionale. Recentemente tali stazioni sono state assegnate al Servizio Meterorologico dell’Emilia Romagna ARPA-SIM che ha il compito di curarne la manutenzione e di rendere accessibili i dati registrati. La Figura A4.1 mostra la localizzazione dell’Emilia Romagna all’interno della penisola italiana e la mappa della regione con la posizione delle principali città e delle stazioni appartenenti alla rete. All’interno di questa mappa sono identificate le due stazioni utilizzate per descrivere i risultati: Cesenatico e Bosco Centrale. I dati coprono il periodo dal 1951-2001. 2000 Piacenza 1800 Ferrara Parma Reggio Emilia 1600 1400 Modena Bologna 1200 Ravenna Bosco C.le 1000 Forli Cesena Cesenatico Rimini 800 600 400 San Marino 200 0 Figura A4.1 - A sinistra localizzazione della regione Emilia Romagna e a destra mappa delle stazioni di temperatura (crocette), delle principali città della Regione (cerchi) e delle due stazioni utilizzate per i casi di studio (Bosco Centrale e Cesenatico) V. Pavan, S. Marchesi, A. Selvini, R.Tomozeiu, M. Di Lorenzo 194 A4.1 IMPATTO DEL CONTROLLO DI QUALITÀ SUI DATI DA STAZIONE L’impatto del controllo di qualità sui dati osservati da stazione e sulla sensibilità della particolare procedura utilizzata per controllare i dati è descritta in questa sezione focalizzando l’attenzione su alcuni indici di frequenza d’eventi meteorologici estremi calcolati dai dati giornalieri. La sensibilità del controllo è ottenuta confrontando le serie temporali dei dati sottoposti al controllo di qualità (indicati nel seguito con flag) con quelle ottenute da dati sottoposti ad una semplice procedura di controllo (indicata nel seguito con simple) o non affatto controllati (no flag). La procedura è applicata ad alcune stazioni scelte tra quelle caratterizzate da una qualità di dati relativamente bassa cosicché l’impatto dell’applicazione delle diverse procedure di controllo possa essere facilmente individuato. Tali stazioni sono Bosco Centrale e Cesenatico e sono riportate nella mappa di destra in Figura A4.1. Nel caso della temperatura il controllo di qualità simple consiste nel dichiarare non validi tutti i dati che non passano tutti i controlli logici, tutti i controlli climatologici, (cioè i dati il cui valore differisca dalla climatologia di più di 3 deviazioni standard) e tutte le persistenze più lunghe di tre giorni. Il valore climatologico è definito come il valore medio su tutti gli anni per i quali siano disponibili i dati per ciascun giorno di calendario, ed è dunque funzione del giorno e del mese. Il valore climatologico è calcolato solo nel caso in cui siano disponibili almeno l’80% di 40 anni di dati, vale a dire 36 valori per ogni giorno di calendario. Lo stesso vale per la deviazione standard rispetto al valore climatologico. Gli indici climatologici su cui si è focalizzato lo studio di sensitività sono la media stagionale e annuale, il 10o percentile della temperatura minima e il 90o percentile della temperatura massima, il numero di giorni di gelo (frost days) cioè il numero di giorni in cui la temperatura minima è minore di 0° C e la massima lunghezza delle onde di calore (HWD) definita come la lunghezza in giorni del periodo con almeno 5 giorni consecutivi in cui la Tmax eccede di 5°C il valore climatologico del 90o percentile di Tmax per quel giorno calcolati sulla stagione e sull’anno. Le serie degli indici si riferiscono a valori calcolati a partire dai dati per i giorni appartenenti alla stessa stagione. In particolare, l’inverno si definisce come il periodo dal 1° Dicembre al 28 Febbraio (DJF), la primavera come il periodo dal 1° Marzo al 31 Maggio (MAM), l’estate come il periodo dal 1° Giugno al 31 Agosto (JJA) ed infine l’autunno come il periodo dal 1° Settembre al 30 Novembre (SON). La temperatura minima e massima su alcune stazioni della rete dell’Emilia Romagna 195 F Figura A4.2 - Andamento del 10o percentile della temperatura minima per le quattro stagioni (DJF, MAM, JJA e SON) presso Bosco Centrale, calcolato con i dati no flag (linea punteggiata), con controllo di qualità simple (linea tratteggiata) e con controllo di qualità flag (linea continua) Il primo caso di studio si riferisce alla stazione di Bosco Centrale. Come si vede dalla Figura A4.1 Bosco Centrale è situato sulle montagne ad una altezza di 748 m sul livello del mare, in prossimità di Parma nella parte centro occidentale dell’Emilia Romagna. Le stazioni utilizzate per controllare Bosco Centrale sono localizzate sulle montagne circostanti e vicine alla città di Parma, Reggio Emila e Modena. In FFigura A4.2 sono mostrati per questa stazione il 10o percentile della temperatura minima per tutte le stagioni, e nella Figura A4.3 è riportata la serie annuale del numero di frost days. La linea continua rappresenta la serie controllata usando il controllo di qualità flag, la linea tratteggiata quella controllata con il controllo simple ed, infine, la linea punteggiata rappresenta la serie temporale non controllata, denominata no flag. 196 V. Pavan, S. Marchesi, A. Selvini, R.Tomozeiu, M. Di Lorenzo Figura A4.3 - Andamento annuale del numero di giorni di gelo (frost days) presso Bosco Centrale, calcolato con dati no flag (linea punteggiata), con controllo di qualità simple (linea tratteggiata) e con controllo di qualità flag (linea continua). La prima osservazione che si può fare è che esistono differenze tra le serie calcolate utilizzando le diverse procedure di controllo di qualità. Le serie temporali ottenute applicando il controllo di qualità flag e quelle ottenute non applicando nessun controllo non risultano però troppo diverse. Questo è spiegabile con il fatto che il controllo spaziale permette di recuperare molti dati che potrebbero essere eliminati sulla base del solo controllo climatologico. L’applicazione delle procedure simple e flag, nel caso in questione, può portare a differenze notevoli, come si vede nella serie autunnale in FFigura A4.2 dove esiste un cambio di segno del trend lineare della serie temporale che passa da 0.08°C/decade per la flag a 0.2°C/decade per la simple. Sebbene la maggior parte dei dati sia recuperata dalla procedura completa, allo stesso tempo, alcuni dei dati originali continuano ad essere segnalati come sbagliati e quindi scartati dalla procedura. La differenza sostanziale tra i dati controllati e i dati non controllati è dovuta principalmente alla bassa qualità dei dati di questa stazione che sono soprattutto affetti da errori di persistenza, infatti 573 dati sono stati rifiutati a causa della presenza di persistenze non valide. In particolare 361 volte il valore del giorno precedente è uguale a quello del giorno successivo, 62 volte il valore di Tmin è uguale per tre giorni consecutivi, 20 volte per quattro giorni consecutivi, 4 volte La temperatura minima e massima su alcune stazioni della rete dell’Emilia Romagna 197 per cinque giorni consecutivi e 3 volte per sei giorni consecutivi. Questo conteggio include solo le persistenze che non hanno passato il controllo spaziale, e non quelle che hanno passato il controllo. A queste vanno aggiunti, i 77 valori che non hanno passato il controllo logico con la Tmax, i 7 valori rifiutati perché non hanno passato il controllo combinato spaziale e climatologico e gli 11 valori rifiutati perché non hanno passato il controllo temporale. Questi errori sono distribuiti lungo la serie temporale e il loro numero implica che per ogni stagione alcuni valori sono rifiutati, apportando dei cambi nel valore degli indici. Nel caso del 10o percentile della Tmin la variazione sarà piccola se i valori rifiutati sono pochi e lontani dal valore del 10o percentile stesso per quell’anno, mentre può essere grande se i valori rifiutati sono molto vicini all’indice. Per brevità analizzeremo in dettaglio solo alcuni casi in primavera ed estate per cui le serie temporali flag e no flag differiscono maggiormente. Per la primavera del 1954 il valore no flag è sostanzialmente più piccolo del valore flag. La differenza è dovuta al fatto che la procedura flag rifiuta due valori riconosciuti come persistenze non valide (Tmin = -2 il 12/03/1954 e Tmin = 1.0 il 24/03/1954). Stessa cosa succede nel 1966 (Tmin= -5 il 27/3/1966 ) nel 1967 (due giorni di persistenza con Tmin= 4.0 dal 10/3/67, Tmin = 7.0 dal 11/5/67, Tmin= 6.0 dal 21/5/67), valori singoli scartati a causa della persistenza cioè Tmin = -3.0 del 20/3/67 e Tmin = 2.0 del 14/4/67 e valori che non passano il controllo temporale come Tmin = -3.0 il 27/4/67). Nel 1973 (due giorni con Tmin= 1.0 dal 26/04/73), valori giornalieri (singoli) rifiutati a causa della persistenza sono Tmin= -3.0 del 4/3/73 e Tmin= -6.0 il 19/3/73, Tmin= 4.0 il 2/04/73 e il valore di Tmin= 9.0 il 7/05/73 che non passa il controllo logico con la Tmax del giorno seguente. Nella serie temporale estiva è possibile trovare molti esempi di valori flag più piccoli di valori non flag, ad esempio nel 1959, quando un singolo valore (Tmin =13.0 il 10/07/59) è rifiutato a causa di una persistenza errata, e nel 1980 quando un valore (Tmin = 14.0 il 12/07/80) è rifiutato perché non passa il controllo temporale e quattro valori (Tmin= 12.0 il 15/06/80, Tmin= 13.0 il 26/07/80, Tmin= 15.0 il 31/07/80 e Tmin= 16.0 il 3/08/80) sono classificati come persistenze non valide. L’impatto della procedura di controllo sul 10o percentile della temperatura minima si riflette similmente sul numero di giorni con gelo in Figura A4.3. Nella stessa stazione l’applicazione del controllo di qualità influisce anche sulla serie temporale stagionale della temperatura massima, anche se, in generale, la temperatura massima è caratterizzata da dati di qualità più alta della temperatura minima. La Figura A4 mostra il 90o percentile della temperatura massima per l’inverno e l’indice HWD per la stessa stagione. Per questa stazione, nella serie temporale di temperatura massima giornaliera dei mesi invernali 43 valori non passano il controllo logico con la temperatura minima, 1 valore non passa il controllo combinato spaziale e climatologico, 49 sono scartati come persistenze non valide con il giorno precedente, 3 gruppi di due valori sono scartati come persistenze non valide di tre giorni e 1 valore non passa gli altri controlli temporali. Questi problemi comportano delle differenze tra le serie temporali invernali del 90o 198 V. Pavan, S. Marchesi, A. Selvini, R.Tomozeiu, M. Di Lorenzo percentile e dell’indice HWD. In particolare, le serie del 90o percentile sono differenti nel 1974, 1975, 1990 e 1995, mentre le serie di HWD sono diverse nel 1976. Tutte le differenze, a parte nel 1995, sono dovute a persistenze, mentre nel 1995 tutti i valori sono influenzati in particolare da un valore (Tmax= 20.0 il 13/12/94) che non passa il controllo combinato spaziale e climatologico. Figura A4.4 - La figura mostra, per la stazione di Bosco Centrale, il 90o percentile della temperatura massima per la stagione invernale e l’indice di durata delle onde di calore (HWD) per la stessa stagione. Il secondo caso di studio si riferisce ai dati rilevati presso la stazione di Cesenatico. Questa stazione è situata lungo la costa Adriatica nella parte Orientale della regione, ad una quota di 4 m sul livello del mare, molto vicina alla città di Cesena. Le stazioni utilizzate per controllare i dati di Cesenatico sono situate sia vicino il mare sia nel primo entroterra. Anche per la stazione di Cesenatico si possono riscontrare differenze nelle serie temporali degli indici. In Figura A4.5 è mostrata la serie temporale della media stagionale di Tmax per la stagione estiva (JJA). Sebbene si notino alcune differenze notevoli tra le serie temporali ci sono in generale meno differenze rispetto a quelle della prima stazione considerata. In particolare si notano differenze negli anni 1951 e 1952. Queste differenze sono dovute principalmente a tre errori identificati nei dati dalla procedura di controllo: il 03/8/51 il valore della Tmax= 39.9 non passa il controllo combinato spaziale e climatologico e il valore registrato nelle stazioni vicine è di 8 gradi più basso. Il 25/7/52 la Tmax raggiunge il valore di 20.1 gradi valore di 9 -10 gradi più basso che nelle stazioni vicine. Altri problemi relativi alla presenza di persistenze non accettabili sono stati La temperatura minima e massima su alcune stazioni della rete dell’Emilia Romagna 199 ulteriormente rilevati, ma non hanno un impatto rilevante per la serie temporale degli indici calcolati. Figura A4.5 - Andamento della media stagionale della Tmax per la stagione estiva (JJA) per la stazione di Cesenatico. A5 ESEMPIO DI APPLICAZIONE DELLA PROCEDURA DELLA ARPA-EMILIA ROMAGNA PER IL CONTROLLO DELLA QUALITA’ DEI DATI PLUVIOMETRICI GIORNALIERI DI ALCUNE STAZIONI DELLA RETE DELL’EMILIA ROMAGNA V. PAVAN, S. MARCHESI, A. SELVINI, R.TOMOZEIU, M. DI LORENZO Servizio Idrometeorologico Emilia Romagna. (Procedura ARPA-EMILIA ROMAGNA) Il data-set di dati osservati di precipitazione su cui vogliamo applicare la procedura di controllo di qualità è costituito dai dati giornalieri di precipitazione cumulata sul periodo 8am-8am (GMT) presso le stazioni in Figura A5.1. Le stazioni utilizzate per i casi studio sono in questo caso Cesenatico e Borgo Taro. La densità delle stazioni è più alta sulle montagne dove la si ritiene necessaria per dare una adeguata descrizione della variabilità spaziale della precipitazione. I dati coprono il periodo dal 1951-2001. 2000 Piacenza 1800 Ferrara Parma Reggio Emilia 1600 1400 Modena Bologna Borgo Taro Ravenna 1200 1000 Forli Cesena Cesenatico Rimini 800 600 400 San Marino 200 0 Figura A5.1 Mappa delle stazioni di precipitazione cumulata giornaliera. Nella mappa sono indicate le stazioni con punti pieni, le città con cerchi vuoti e le due stazioni per le quali sono presentati i casi studio (Borgo Taro e Cesenatico). 202 V. Pavan, S. Marchesi, A. Selvini, R.Tomozeiu, M. Di Lorenzo Nel caso della precipitazione, il controllo di qualità simple consiste nel controllo logico, climatologico e delle persistenze. Nel primo caso studio, la stazione scelta è Cesenatico e gli indici scelti per confrontare l’impatto del tipo di procedura utilizzato sono: le serie temporali della precipitazione media sulla stagione (PAV), il numero di volte che la precipitazione è maggiore del valore climatologico del 90o percentile (PNL90) e il 90o percentile della precipitazione stagionale (PQ90). La Figura A5.2 presenta le serie temporali primaverili (MAM) di tali indici. Sebbene l’applicazione del controllo simple abbia un grande impatto sulle serie temporali scartando molti valori, questi sono poi recuperati dal controllo spaziale con le altre stazioni, suggerendo così che la qualità dei dati sia abbastanza buona. Le differenze tra il controllo flag e il controllo no flag sono principalmente dovute ad un solo anno, il 1993. Due tipi di errori influenzano i dati di questo anno. Il primo riguarda il giorno 17/03/1993 in cui si registra un valore di precipitazione di 29.2 mm, mentre nessun valore di precipitazione è registrato nelle cinque stazioni vicine. Il secondo errore riguarda il periodo dal 14/4/1993 al 29/4/1993 in cui la stazione non ha probabilmente funzionato senza che questo fosse stato segnalato. Questi errori cambiano i valori di pav e pnl90 e portano all’eliminazione dalla serie storica del valore di pq90 per il 1993. Ricordiamo che il pq90 è definito come il 90o percentile della precipitazione stagionale e può essere calcolato solo se esiste una percentuale sufficiente di dati validi per la stazione in esame. In generale, l’applicazione del controllo di qualità comporta che talvolta siano rifiutati molti dati, soprattutto nel caso di serie di dati nulli per mancato funzionamento della stazione non segnalato, e conseguentemente il numero dei valori che si possono utilizzare per il calcolo degli indici si riduce al di sotto della certa soglia minima. Questo succede molto più facilmente per l’indice pq90 che per il pnl90. Il problema diventa ancora più evidente in una stazione dove ci sono molti dati mancanti, come ad esempio per la serie dai dati rilevati presso Borgo Taro, utilizzata per il secondo caso di studio. Come si nota da Figura , questa stazione è situata sulle montagne a circa 441 m sul livello del mare nelle vicinanze della città di Parma nella parte Est dell’Emilia Romagna. Il gruppo di stazioni che sono state scelte per il confronto con Borgo Taro sono prese tra quelle situate nella parte montana vicino alla città di Parma e Piacenza e sono tutte geograficamente vicine alla stazione considerata. Le serie temporali di pav, pq90 e pnl90 per la stagione estiva (JJA) per questa stazione sono mostrate in Figura . La maggior parte degli errori identificati per la stagione estiva per questa stazione sono legati a periodi piuttosto lunghi in cui il suo mancato funzionamento non è stato segnalato. In particolare la stazione non ha funzionato probabilmente durante i seguenti periodi: dal 15/6/1953 al 30/6/1953, dal 6/6/1962 al 25/6/1962, dal 1/7/1962 al 25/7/1962, dal 11/4/1982 al 3/6/1982 e dal 14/8/1990 al 6/9/1990. Alcuni di questi periodi sono completamente inclusi in una stagione, altri no. Questo fa sì che a volte la serie di dati mancanti influenzi il La temperatura minima e massima su alcune stazioni della rete dell’Emilia Romagna 203 valore stagionale dell’indice, altre volte no. Se la serie di dati mancanti o errati influisce solo sulla lunghezza temporale della serie e quindi porta all’impossibilità di definire l’indice stesso, i valori di precipitazione cumulata non dichiarati cambiano le proprietà statistiche della distribuzione della precipitazione e quindi portano a cambiamenti nei valori degli indici. Figura A5.2 - Andamento delle serie temporali degli indici PAV, PNL90 e PQ90 della precipitazione per la stazione di Cesenatico per la stagione primaverile (MAM). 204 V. Pavan, S. Marchesi, A. Selvini, R.Tomozeiu, M. Di Lorenzo Figura A5.3 - Andamento della serie temporale degli indici PAV, PNL90 e PQ90 della precipitazione per la stazione di Borgo Taro per la stagione estiva (JJA). In conclusione, va sottolineato che i dati osservati hanno un grande valore sia scientifico che economico e possono essere utilizzati in molte applicazioni per la descrizione del clima presente, di quello passato e di quello futuro. Il valore di questi dati è strettamente connesso alla loro qualità. In particolare, se i dati non sono affidabili, il loro valore sia economico che scientifico decade rendendo necessaria l’applicazione di un controllo di qualità. Si è verificato con alcuni casi studio che l’impatto del tipo di controllo di qualità utilizzato prima può cambiare in modo tangibile le serie temporali di alcuni indici significativi per lo studio del clima. In particolare si deduce dagli esempi che i valori stagionali medi sono meno condizionati rispetto agli indici di frequenza di eventi meteorologici estremi dalla riduzione di dati osservati in seguito all’applicazione della procedura di controllo di qualità e alla qualità dei dati stessi. A6 ESEMPIO DI APPLICAZIONE DELLA PROCEDURA DI VALIDAZIONE AUTOMATICA (DICA-UniCT) AI DATI DI TEMPERATURA MASSIMA E MINIMA GIORNALIERI G. ROSSI, A. CANCELLIERE, B. BONACCORSO, G. SCIUTO Dipartimento di Ingegneria Civile e Ambientale, Università di Catania A6.1 GENERALITÀ La metodologia di validazione automatica dei dati di temperatura massima e minima giornaliera esposta nel paragrafo 4.4.1 è stata applicata a serie di dati rilevati tra il 1950 ed il 2004 in alcune stazioni termometriche della rete in telemisura dell’ex Ufficio Idrografico Regionale della Sicilia, oggi Agenzia Regionale per i Rifiuti e le Acque, Settore Osservatorio delle Acque della Regione Siciliana ritenute rappresentative delle diverse zone dell’isola. Si presentano di seguito le elaborazioni effettuate sulle temperature massime e minime giornaliere rilevate nella stazione termometrica di Trapani, e vengono riportati i risultati dell’applicazione della procedura ai dati delle stazioni di Mazara del Vallo, Caltanissetta e Acireale osservate nel periodo 1951-2004. Di seguito si presentano i passi effettuati: − − − − − analisi ed eventuale rimozione del trend sulle serie di temperature massime e minime giornaliere; applicazione dei tre diversi metodi prima descritti per la costruzione delle fasce di confidenza basate sui dati della stazione, e scelta di quello che può considerarsi preferibile; individuazione delle stazioni di riferimento per la costruzione delle fasce di confidenza attraverso le regressioni, tra i valori contemporanei osservati; costruzione delle fasce di confidenza basate sulla regressione con le stazioni limitrofe; controllo di qualità dei dati mediante l’impiego dei due tipi di fasce di confidenza e analisi dei risultati. In figura A6.1 sono riportati i grafici (in coordinate polari) dell’andamento nel corso dell’anno solare della media e dello scarto quadratico medio delle temperature massime e minime giornaliere. 206 G. Rossi, A. Cancelliere, B. Bonaccorso, G. Sciuto (a) (b) (c) (d) Figura. A6.1 Andamento nell’anno della media e dello scarto quadratico medio delle temperature giornaliere massime (a,c) e minime (b,d) (stazione di Trapani) Applicazione della procedura di validazione automatica ai dati di temperatura massima e minima giornalieri A6.2 207 COSTRUZIONE FASCE DI CONFIDENZA BASATE SUI DATI DELLA STAZIONE IN ESAME Le fasce di confidenza sono state costruite con i tre metodi descritti al paragrafo 4.4.1.2 e si utilizzeranno quelle che sulla base di un confronto producono i migliori risultati anche in relazione alla parsimonia dei parametri. Metodo (a) Il primo metodo consiste nella costruzione delle fasce di confidenza relative ai valori storici della stazione utilizzando la media e lo scarto quadratico medio dei residui giornalieri della temperatura giornaliera (per i 365 giorni dell’anno). In figura A6.2 si è proceduto ad un confronto fra i residui dei dati giornalieri della temperatura massima e minima degli ultimi sei anni di osservazioni disponibili e le fasce di confidenza sopra descritte. Si noti che la maggior parte dei dati rilevati rientri entro le fasce di confidenza. Il gruppo più numeroso di temperature massime e minime che escono fuori dalle fasce di confidenza superiori si è verificato in ambedue i casi nella primavera, nell’estate e nell’autunno del 2001. Altri outliers si sono verificati per le temperature massime anche nelle estati del 1999 e del 2000, mentre per le minime nella primavera del 1999 e nell’estate del 2000. (a) (b) Figura A6.2 Serie dei residui della temperatura massima (a) e minima (b) giornaliera, osservata negli ultimi sei anni e fasce di confidenza (P = 0. 99) della stazione di TrapaniMetodo(a) 208 G. Rossi, A. Cancelliere, B. Bonaccorso, G. Sciuto Metodo (b) Il secondo metodo proposto differisce sostanzialmente dal primo in quanto invece di considerare le medie e gli s.q.m. dei residui delle temperature dei 365 giorni dell’anno si è descritta la periodicità della media e dello s.q.m. mediante lo sviluppo in serie di Fourier. Dopo aver calcolato i coefficienti delle varie armoniche con la procedura precedentemente descritta al paragrafo 4.4.1.2 si è determinato il numero di armoniche necessarie costruendo il periodogramma cumulato. Da questa analisi è stato possibile scegliere 2 armoniche per descrivere l’andamento della media e 7 armoniche per lo s.q.m. In figura A6.3 è possibile osservare che risultano molto contenuti gli scostamenti tra l’andamento della media e dello scarto quadratico medio giornaliero e la loro descrizione mediante lo sviluppo in serie di Fourier rispettivamente con 2 e 7 armoniche. (a) (b) (c) (d) Figure A6.3 Confronto della media e dello scarto quadratico medio dei residui delle temperature giornaliere massime (a,c) e minime (b,d) lo sviluppo in serie di Fourier per i dati di Trapani-Metodo(b) Applicazione della procedura di validazione automatica ai dati di temperatura massima e minima giornalieri 209 Nella tabella A6.1 sono riportati per la media e per lo s.q.m. delle temperature massime e minime giornaliere i coefficienti dello sviluppo in serie di Fourier limitato rispettivamente alla prime due e sette armoniche e la relativa varianza spiegata. Tabella A6.1 Risultati dell’analisi di Fourier per la media e lo s.q.m. delle temperature massime e minime giornaliere per le stazione di Trapani. T Max Ak θk Ak θk Pk 29.553 -0.523 0.986 0.209 -1.441 0.993 23.791 -0.635 0.982 0.254 -1.403 a 0.993 0.017 0.266 a 0.174 0.036 -0.182 0.337 2 Armonica 0.018 1.538 0.455 0.018 1.531 0.509 3a Armonica 0.004 -0.046 0.486 0.001 -0.086 0.520 0.001 -0.775 0.500 0.004 -0.247 0.559 5a Armonica 0.001 -1.211 0.504 0.001 -1.134 0.570 6a Armonica 0.003 0.451 0.528 0.003 0.430 0.602 0.005 0.220 0.570 0.004 0.257 0.639 Media Scarto quadratico medio Media T Min 1a Armonica 0.948 2a Armonica 1 Armonica 4a Armonica a 7 Armonica Pk 2.672 Media 1.208 2.539 Utilizzando le armoniche ottenute per la media e lo s.q.m. dei residui e ipotizzando la distribuzione di probabilità normale, si sono costruite le fasce di confidenza relative alla probabilità 99%. Infine anche per questa metodologia si è proceduto ad un confronto fra i dati giornalieri degli ultimi sei anni disponibili e le fasce di confidenza prima descritte, come riportato nella figura A6.4 I punti che eccedono le fasce di confidenza si collocano negli stessi periodi individuati con l’applicazione del primo metodo e coincidono con periodi contrassegnati da aumenti generalizzati delle temperature sulla regione. Considerando che la temperatura di un generico giorno non è una caratteristica dello specifico giorno dell’anno ma può essere simile per un insieme di giorni precedenti o successivi a quello considerato, con il terzo metodo si attribuisce a ciascun giorno il valore medio delle temperature di undici giorni centrati su esso. In questo caso l’elevata variabilità della media e dello s.q.m. gia mostrata in fig. A6.1, subisce uno “smoothing”, come può osservarsi dalla figura A6.5. Anche in questo caso la descrizione della periodicità della media e dello s.q.m. delle medie mobili sopra calcolate viene effettuata con uno sviluppo in serie di Fourier. G. Rossi, A. Cancelliere, B. Bonaccorso, G. Sciuto 210 (a) (b) Figura A6.4 Serie dei residui della temperatura massima (a) e minima (b) giornaliera, osservata negli ultimi sei anni e fasce di confidenza (P = 0.99) per la stazione di TrapaniMetodo(b) Metodo (c) In figura A6.6 è possibile osservare, anche per questo caso, che risultano molto contenuti gli scostamenti tra l’andamento della media e dello scarto quadratico medio giornaliero e la loro descrizione mediante lo sviluppo in serie di Fourier rispettivamente con 2 e 7 armoniche. Nella tabella A6.2 sono riportati per la media e per lo s.q.m. delle temperature massime e minime giornaliere il valore medio A0, la fase θ e la varianza spiegata Pi per le prime due armoniche. Table A6.2 Risultati dell’analisi di Fourier per la media e lo s.q.m. dei residui delle temperature massime e minime giornaliere per la stazione di Trapani. T Ak θk Pk 29.376 -0.523 0.989 0.204 -1.441 1 Armonica 0.020 2 a Armonica Ak θk Pk -0.635 0.982 0.996 0.254 -1.403 0.993 0.033 0.011 0.001 1.152 0.297 0.024 1.419 0.510 0.025 1.567 0.668 0.001 0.021 0.604 0.005 0.161 0.678 0.006 -0.196 0.642 0.002 0.578 0.765 5 Armonica 0.003 -1.041 0.652 0.001 -0.883 0.812 6 a Armonica 0.003 0.605 0.747 0.005 0.206 0.858 7 a Armonica 0.005 0.605 0.894 0.007 -0.084 0.938 1 a Armonica 0.948 2 a Armonica a Scarto quadratico medio Min 23.791 Media Media T Max a 3 Armonica a 4 Armonica a 1.994 Media 1.208 1.959 Applicazione della procedura di validazione automatica ai dati di temperatura massima e minima giornalieri (a) (b) (c) (d) 211 Figura A6.5 Confronto della media e dello scarto quadratico medio dei residui delle temperature giornaliere massime (a,c) e minime (b,d) lo sviluppo in serie di Fourier per i dati di Trapani-Metodo(c) In figura A6.6 vengono confrontati i dati giornalieri degli ultimi sei anni e le fasce di confidenza prima descritte. Dalla figura A6.6 si nota che con questo metodo i dati osservati che ricadono fuori dalle fasce di confidenza, risultano in numero maggiore rispetto a quelli che eccedono con l’applicazione dei precedenti metodi. Per la scelta del metodo da preferire per la costruzione delle fasce di confidenza basate sui dati della stazione si sono calcolate le quantità di dati G. Rossi, A. Cancelliere, B. Bonaccorso, G. Sciuto 212 osservati (1951-2004) che ricadono all’esterno delle fasce di confidenza per ciascuno dei metodi analizzati. I numeri e le percentuali di valori fuori fasce sono riportati assieme al numero di parametri da stimare, in tabella A6.3, oltre che per la stazione di Trapani anche per la stazione di Mazara del Vallo, Caltanisetta e Acireale. (a) (b) Figura A6.6 Serie dei residui della temperatura massima (a) e minima (b) giornaliera, osservata negli ultimi sei anni e fasce di confidenza (P = 0.99) per la stazione di TrapaniMetodo(c) Table A6.3 Dati che non ricadono entro i limiti di confidenza per P= 0.995 per i diversi casi analizzati e n° dei parametri necessari. T max N° di parametri Metodo per la media N° di parametri per lo scarto quadratico medio a 365 365 b 5 15 c 5 15 Stazione Trapani Mazara del Vallo Acireale Caltanissetta Trapani Mazara del Vallo Acireale Caltanissetta Trapani Mazara del Vallo Acireale Caltanissetta T min n° anni valori fuori intervallo % valori fuori intervallo valori fuori intervallo % valori fuori intervallo 49 41 48 29 49 41 48 29 49 41 48 29 299 219 214 73 322 253 263 124 552 247 422 227 1.67 1.46 1.22 0.69 1.80 1.69 1.50 1.17 3.09 1.65 2.41 2.14 228 248 142 85 250 274 190 117 240 510 182 117 1.27 1.66 0.81 0.80 1.40 1.83 1.08 1.11 1.34 3.41 1.04 1.11 Applicazione della procedura di validazione automatica ai dati di temperatura massima e minima giornalieri 213 Dal confronto delle prestazioni dei tre metodi può concludersi che il secondo metodo con 2 armoniche per media e 7 per lo s.q.m. permette di coniugare la parsimonia dei parametri con dei risultati accettabili. A6.3 COSTRUZIONE FASCE DI CONFIDENZA BASATE SUI DATI DELLE STAZIONI DI RIFERIMENTO L’applicazione della seconda fase della procedura di validazione richiede in prima analisi l’individuazione delle stazioni di riferimento. A tale scopo si è scelto di adottare una distanza massima Δl = 60-70 km ed una differenza di altitudine ΔH = ± 300 m, selezionando poi quelle che, rispetto alla stazione in esame, presentano i maggiori valori mediani dei coefficienti di correlazione giornalieri. Tabella A6.4 Valori mediani, max e min del coefficiente di correlazione tra le temperature di Trapani e quelle delle stazioni limitrofe Cod. STIR 850 1120 1140 1190 Nome stazione PARTINICO MARSALA MAZARA DEL VALLO CASTELVETRANO Coefficiente di correlazione Temperature massime Temperature minime Mediana Max Min Mediana Max Min 0.58 0.84 0.19 0.51 0.76 -0.03 0.45 0.76 0.02 0.43 0.77 0.01 0.51 0.83 -0.02 0.61 0.85 0.31 0.46 0.77 -0.09 0.38 0.74 -0.15 Sulla base dei risultati riportati in tabella A6.4 sono state scelte come stazioni di riferimento Partinico e Mazara del Vallo sia per le temperature massime giornaliere che per le minime. Anche per le serie relative a tali stazioni è stata verificata la presenza di trend annuo. Infine, si è proceduto alla costruzione delle fasce di confidenza della regressione multipla calcolata sulla base dei dati delle stazioni di riferimento con la metodologia descritta al § 4.4.1.3. 214 G. Rossi, A. Cancelliere, B. Bonaccorso, G. Sciuto (a) (b) Figura A6.7 Serie dei residui delle temperature massime (a) e minime (b) giornaliere osservate nel periodo 1996-2004 nella stazione di Trapani e relative fasce di confidenza (P = 0.005 e 0.995) costruite utilizzando i dati delle stazioni di riferimento di Partinico e Mazara del Vallo In figura A6.7 le serie dei residui delle temperature massime (a) e minime (b) giornaliere osservate nella stazione di Trapani negli ultimi sei anni di comune funzionamento con le stazioni limitrofe, vengono confrontate con le fasce di confidenza costruite a partire dalle serie delle stazioni di Partinico e Mazara del Vallo. In entrambi i casi le fasce di confidenza sono relative al 99% di probabilità. Dalla figura A6.7 si nota che il numero di valori che cadono fuori dalle fasce di confidenza risulta molto più contenuto rispetto alle fasce costruite con i dati della stazione. Infatti le fasce di confidenza della regressione sono variabili negli anni e quindi periodi di caldo generalizzati sulla regione producono un innalzamento di queste. L’ultima fase della validazione consiste nella definizione di un giudizio di qualità sul dato osservato. I risultati complessivi dell’analisi condotta sui dati di temperatura massima e minima giornalieri relativi agli ultimi sei anni disponibili nelle stazioni esaminate sono riassunti in Tabella A6.5. In seguito all’applicazione della procedura proposta sono stati validati automaticamente oltre l’88% di dati di temperatura massima e oltre l’82 % dei dati di temperatura minima. Risulta, di conseguenza, considerevolmente ridotto il numero di osservazioni da sottoporre a controllo manuale. Applicazione della procedura di validazione automatica ai dati di temperatura massima e minima giornalieri 215 Table A6.5 Risultato della validazione delle temperature massime e minime giornaliere osservate nelle stazioni di Trapani, Mazara del Vallo, Acireale e Caltanissetta negli ultimi sei anni di comune funzionamento con le stazioni di riferimento. TRAPANI n° dati % dati Validato T max Non Validato Rifiutato Validato T min Non Validato Rifiutato 1940 242 8 1961 222 7.0 88.6 11.1 0.4 89.5 10.1 0.3 MAZARA DEL n° dati 1942 221 27 1808 332 50 ACIREALE % dati n° dati 88.7 10.1 1.2 82.6 15.2 2.3 2024 165 1 2080 109 1 CALTANISSETTA % dati n° dati % dati 92.4 7.5 0.05 95.0 5.0 0.05 2052 138 1 2063 126 1 93.7 6.3 0.05 94.2 5.8 0.05 A7 ESEMPIO DI APPLICAZIONE DELLA PROCEDURA DI VALIDAZIONE AUTOMATICA (DICA-UniCT) AI DATI PLUVIOMETRICI GIORNALIERI G. ROSSI, A. CANCELLIERE, B. BONACCORSO, G. SCIUTO Dipartimento di Ingegneria Civile e Ambientale, Università di Catania La metodologia di validazione automatica dei dati di precipitazione giornaliera esposta nel paragrafo 4.4.2 è stata applicata a serie di dati rilevati tra il 1950 ed il 2004 in alcune stazioni pluviometriche della rete in telemisura dell’ex Ufficio Idrografico Regionale della Sicilia, oggi Agenzia Regionale per i Rifiuti e le Acque, Settore Osservatorio delle Acque della Regione Siciliana ritenute rappresentative delle diverse zone dell’isola. Si presentano di seguito le elaborazioni effettuate sulle precipitazioni giornaliere rilevate nella stazione pluviometrica di Mirabella Imbaccari, e vengono riportati gli esiti dell’applicazione della procedura ai dati delle stazioni di Sommatino, Pioppo e Messina Ist. Geofisico osservate nel periodo 1951-2004. Il primo passo della metodologia proposta prevede la scelta delle stazioni di riferimento tra le limitrofe che sono ubicate ad una distanza massima Δl = 30 km, e la cui quota differisca al più di un ΔH = ± 200 m. La scelta delle stazioni di riferimento è stata condotta sulla base dell’analisi della contemporanea assenza o presenza di pioggia e dei valori assunti dagli indici di affinità (cfr. par. 4.4.2.2). Nella Figura A7.1 sono riportati sia i box-plot delle probabilità di contemporanea presenza di pioggia P11 e assenza di pioggia P00, sia l’istogramma dell’indice di affinità I. In base ai risultati ottenuti sono state selezionate come stazioni di riferimento Pietraperzia, Mazzarino, Piazza Armerina, Caltagirone e Mineo. La fase successiva consiste nell’implementazione della prima rete neurale denominata “binaria” a partire dal set di dati delle stazioni di riferimento che restituisce, previa trasformazione mediante l’applicazione di un valore soglia, un output in formato binario, in cui 0 sta ad indicare un giorno non piovoso e 1 rappresenta un giorno piovoso. La lunghezza del set di validazione, per tutti i casi selezionati, è stata posta uguale agli ultimi sei anni, mentre la lunghezza del set di calibrazione dipende caso per caso dal numero di anni di funzionamento comune alla stazione in esame e a quelle di riferimento. 218 Pi Butera Piazza Armerina Castel di Judica Caltagirone MIneo Pi Pietraperzia Mazzarino eo ne in M za az 0 az et ra 0.1 M pe rz rin ia 0.2 ro 0.3 I1 ca 0.4 gi 0.5 I2 lt a Values 0.6 Ca 0.7 a 0.8 1 0.9 0.8 0.7 0.6 0.5 0.4 0.3 0.2 0.1 0 di 0.9 in P00 Ju P11 er P00 m P11 di P00 el P11 st P11 P00 Ca P00 ra P11 te P00 Ar P11 za P00 o P11 Bu 1 G. Rossi, A. Cancelliere, B. Bonaccorso, G. Sciuto Figura A7.1 - Boxplot dei valori di P00 e P11 e indici di affinità tra la stazione di Mirabella Imbaccari e le stazioni limitrofe La seconda rete neurale, utilizzata per stimare il valore della precipitazione giornaliera nel caso di giorni piovosi, è stata implementata a partire dal set di dati composto come input dai dati (non nulli e nulli) delle stazioni di riferimento contemporanei ad eventi piovosi registrati nella stazione in esame, e restituisce come output i dati relativi ai soli giorni piovosi della stazione in esame. Anche in questo caso sono stati utilizzati per la validazione gli ultimi sei anni di dati disponibili. Una volta stimato il valore di precipitazione giornaliera attraverso la rete neuronale si può procedere alla costruzione delle fasce di confidenza all’interno delle quali il valore osservato deve ricadere affinché sia considerato validato. In Figura A7.2 sono rappresentati i valori non nulli osservati nella stazione di Mirabella Imbaccari, validati dalla rete binaria, e la relativa fascia di confidenza ottenuta tramite una analisi di frequenza dei residui. Si osserva come solo un numero limitato di valori ricada al di fuori delle fasce di confidenza. Applicazione della procedura di validazione automatica ai dati pluviometrici giornalieri 219 Figura A7.2 - Serie delle precipitazioni giornalieri osservate nella stazione di Mirabella Imbaccari e validate dalla rete binaria e relativa fascia di confidenza (P= 99 %) costruite a partire dai dati delle stazioni di riferimento tramite applicazione di una rete neuronale In base ai risultati ottenuti è, quindi, possibile esprimere un giudizio di qualità del dato osservato. In Tabella A7.1 sono riportati, con riferimento al gruppo di stazioni investigate, sia alcune statistiche (r2 ed RMSE) che descrivono la bontà delle stime prodotte dal modello rispetto ai valori realmente osservati, sia le percentuali di dati nulli e non nulli validati. Dalla tabella si evince come la percentuale complessiva dei dati validati sia dell’ordine dell’85 %; Tabella A7.1 - Statistiche della rete neuronale in fase di calibrazione e validazione e risultati della validazione Calibrazione Stazione Mirabella Imbaccari Sommatino Pioppo Messina Ist. Geofisico r^2 RMSE[mm] 0.52 0.64 0.67 0.67 8.82 6.57 5.49 3.52 Validazione % Nulli % Non nulli r^2 RMSE[mm] Validati Validati 0.43 0.47 0.70 0.67 9.51 5.80 3.91 4.20 85.20 85.88 92.98 88.75 85.22 88.74 92.63 86.24 % Dati (nulli e non) validati 85.20 86.58 92.88 88.03 A8 SELEZIONE DI UNA RETE PER IL MONITORAGGIO DELLA SICCITA’ NELLA REGIONE SICILIANA M.T. NOTO Regione Siciliana - Agenzia Regionale per i Rifiuti e per le Acque – Osservatorio per le Acque Nell’ambito del progetto comunitario Sedemed II, partendo dalla rete di monitoraggio meteo-idropluviometrica gestita dall’Ufficio, caratterizzata da una rete tradizionale “storica” (350 stazioni) e da una rete in telemisura (255 stazioni), è stata utilizzata la procedura esposta al capitolo 5, al fine di poter selezionare un insieme di stazioni che costituirà la rete di monitoraggio per la siccità. Per la progettazione di una rete di qualità a partire da una rete esistente è necessario, in via preliminare, definire l'uso finale dei dati rilevati. Tale obiettivo condiziona la definizione della rete in termini di parametri da rilevare e di scale temporali di riferimento, determinando la scelta delle stazioni da inserire nella rete. La rete in questione, deve certamente garantire un livello di qualità generale, e deve soddisfare le condizioni che permettano di monitorare il fenomeno siccità garantendo la possibilità di elaborazione dell’indice SPI. E’ essenziale sottolineare che la scelta delle stazioni è strettamente legata alla qualità delle serie storiche delle stazioni stesse. Considerata, quindi, l’esiguità delle serie storiche in telemisura, tutti i criteri di selezione sono stati applicati essenzialmente alle serie storiche relative a stazioni di misura di tipo tradizionale, in cui coesiste anche il sensore il TLM, vista la tendenza all’utilizzo delle nuove tecnologie la cui conseguenza sarà, nel tempo, la dismissione delle stazioni tradizionali e l’installazione di stazioni di tipo in telemisura. Per poter ottenere un sottoinsieme di stazioni costituenti la rete di qualità, l’Ufficio, ha eseguito un percorso per step progressivi, adottando la metodologia di seguito esposta, a stazioni di misura per la grandezza Pioggia e per la grandezza Temperatura: 1. Analisi storica per la verifica e/o ricostruzione dei metadati; 2. Assegnazione etichetta di qualità alla stazione di misura della singola grandezza 3. Assegnazione etichetta di qualità alla rete selezionata 4. Assegnazione etichetta di qualità sistema di monitoraggio messo a punto M. T. Noto 222 A8.1 ANALISI STORICA PER LA RICOSTRUZIONE DEI METADATI VERIFICA E/O Il primo step ha previsto la consultazione di tutti gli annali idrologici pubblicati relativi all’intervallo temporale 1918 - 2000 per verifica e/o ricostruzione del metadato associato ad ogni stazione di misura, analizzando i seguenti dati: − Idstaz − codice Zeus − nome della stazione − bacino idrografico di appartenenza della stazione − quota s.l.m. − anno inizio e anno fine funzionamento stazione − tipologia del sensore − altezza strumentale − anno inizio e anno fine funzionamento sensore − osservatore − anno inizio e anno fine osservatore. A questo scopo è stata messa a punto, seguendo quanto dettato dal WMO, una scheda con le caratteristiche della stazione (vedi Figura A8.1). L’obiettivo di questa fase, è stato quello di individuare le possibili variazioni di quota, di posizionamento delle stazioni di misura e del sensore (intendendo per stazione il luogo fisico in cui è istallato il sensore). Durante l’esecuzione di questa fase sono state riscontrate numerose variazioni sia di posizionamento sia del sensore, di conseguenza la serie storica originale è stata parzializzata attribuendo ad ogni sottoserie un nuovo identificativo (Tabella A8.1). Le stesse informazioni acquisite, hanno anche contribuito alla valutazione della qualità del dato e della serie storica. Selezione di una rete per il monitoraggio della siccità in Sicilia Figura A8.1 – Scheda del metadato della stazione 223 M. T. Noto 224 Tabella A8.1 – Esempio di assegnazione di nuovo ID alla serie parzializzata in sottoserie ID Stazione 1 6 348 61 344 345 346 341 343 75 347 114 349 Nome Stazione Nome Bacino Quota [m s.l.m.] Anno Inizio Anno Fine Scillato Pa Ist. Zootecnico Pa Ist. Zootecnico Piana Dei Greci Piana Dei Greci Piana Degli Albanesi Piana Degli Albanesi Enna Enna Pietraperzia Pietraperzia Piazza Armerina Piazza Armerina Imera Settentrionale Bm Oreto - Giancaldara Bm Oreto - Giancaldara Belice Belice Belice Belice Imera Meridionale Imera Meridionale Imera Meridionale Imera Meridionale Gela Gela 376 113 120 900 750 470 740 1100 950 525 467 721 640 1918 1918 1994 1918 1949 1961 1965 1927 1929 1918 1995 1919 1997 1997 1994 1997 1948 1960 1964 1997 1928 1997 1994 1996 1995 1997 Un ulteriore dettaglio è stato ottenuto in seguito alla ricerca di: − possibili variazioni strumentali pluviometriche e termometriche intese sia come sostituizioni del tipo d’apparecchio sia di variazione dell’altezza strumentale; − associazioni di strumentazione di misura nello stesso punto; − variazioni dell’osservatore (responsabile della registrazione dei dati). Tali variazioni possono servire come ulteriore informazioni sui dati climatici registrati da un determinato tipo di strumento associato a una determinata stazione (tabella. A8.2). Selezione di una rete per il monitoraggio della siccità in Sicilia 225 Tabella. A8.2 - relazione stazione-sensore pluviometrico ID_Rel_P ID_Stazione 1 386 392 395 6 387 393 400 61 240 384 388 390 391 394 379 383 386 75 398 399 114 385 389 390 396 397 ID_Sensore 1 1 1 1 6 6 6 348 61 61 61 344 345 346 346 341 343 343 75 75 347 114 114 114 114 114 114 1 386 391 394 6 387 392 392 61 239 384 388 388 388 393 379 383 386 75 397 398 114 385 389 390 395 396 M. T. Noto 226 Tabella A8.3 - Variazioni strumentali sensore pioggia ID_Sensore_P 1 386 391 394 6 387 392 61 239 384 388 393 379 383 384 75 397 398 114 385 389 390 395 396 Sensore U U UR UR U U UR U UR, U UR, UR UR U U,UR UR U UR UR U,UR UR UR UR UR UR H 0,8 3 2 2,3 1,02 1,5 2 1,55 1,55 1,55 10,5 2 1,25 20 20 6,91 6,9 9 13,2 13,2 6 3 2 9 Anno_Inizio 1918 1941 1973 1987 1918 1941 1973 1918 1923 1933 1949 1986 1927 1929 1933 1918 1954 1995 1919 1936 1951 1960 1988 1993 Anno_Fine 1940 1972 1997 1995 1940 1972 1997 1922 1932 1948 1985 1997 1928 1932 1996 1954 1994 1996 1935 1945 1958 1987 1992 1995 Selezione di una rete per il monitoraggio della siccità in Sicilia 227 Tab. A8.4 - relazione stazione-sensore termometrico ID_Rel_T ID_Stazione 43 45 49 40 46 50 44 38 39 42 47 51 41 48 52 A8.2 ID_Sensore 1 1 1 6 6 348 346 343 343 343 343 343 114 114 349 43 45 49 40 46 50 44 38 39 42 47 51 41 48 52 ASSEGNAZIONE ETICHETTA DI QUALITÀ ALLA STAZIONE DI MISURA DELLA SINGOLA GRANDEZZA Sulla base di quanto descritto nel capitolo 5, per l’assegnazione dell’etichetta di qualità, sono state svolte due tipologie di controlli: 1. Controlli basati sullo storico − Anni di funzionamento − Massimo periodo interpolato − Totale dati interpolati − Massimo periodo mancante − Totale dati mancanti − Tracciabilità della posizione dello strumento − Tracciabilità della strumentazione utilizzata M. T. Noto 228 Tali controlli sono stati effettuati estraendo le informazioni direttamente dal database messo a punto per lo scopo e descritto al paragrafo 3.3. 2. Controlli basati su metodi matematici − Superamento test di omogeneità − Presenza outliers (μ ±3σ) Per quanto riguarda il primo punto, i test di omogeneità effettuati nell’ambito del progetto, sono: − Test di omogeneità su singola serie: a. Cumulative deviations b. T-Test c. SNHT Test − Test di omogeneità con serie storica di riferimento: a. Craddock test b. Alexsandesson test c. Double mass curve analysis In particolare, ogni singola serie storica, seguendo le indicazioni dello schema di Figura A8.2, è stata sottoposta a tre differenti analisi di omogeneità,condotte in parallelo: − − − test di omogeneità su singola serie; test di omogeneità con serie storica di riferimento regionale (A); test di omogeneità con serie storica di riferimento locale (B). A differenza di quanto suggerito da studi passati, secondo i quali la serie storica di riferimento va costruita mediando in maniera opportuna i dati omologhi di molte stazioni, possibilmente molto vicine alla stazione da sottoporre al test di omogeneità, la procedura, messa a punto con questo studio, consiste nell’utilizzo di due serie storiche (A) e (B) che serviranno come serie di riferimento per il test. La serie storica di riferimento (A), altro non è che una serie ottenuta mediando i dati relativi ai totali annui di tutte le stazioni, funzionanti o storiche che siano. La serie storica di riferimento (B), invece, è quella costruita mediando in maniera opportuna i dati delle serie storiche relative alle stazioni situate in un intorno di 15 Km dalla stazione da sottoporre al test. La serie storica “candidata” all’analisi di omogeneità, viene definita omogenea, quando supera tutti e tre i test sopraccitati. Selezione di una rete per il monitoraggio della siccità in Sicilia 229 Singola serie storica Serie storica di riferimento (A) Regionale Serie storica di riferimento (B) Locale Test di omogeneità della serie Test di omogeneità della serie Test di omogeneità della serie Superamento test Superamento test Superamento test Giudizio sintetico della serie Figura A8.2 – Schema a blocchi per analisi di omogeneità Le figure che seguono mostrano, a titolo di esempio, alcuni test condotti sulla serie storica della stazione di Palermo Osservatorio Astronomico (sensore pioggia), utilizzando il software Anclim, dai quali si evince facilmente che la serie storica della stazione in esame, può essere considerata omogenea, dopo aver superato tutti i test. Figura A8.3 – Test di omogeneità su singola serie (T-Test) 230 M. T. Noto Figura A8.4 – Andamento dei totali annui della serie storica di riferimento regionale Figura A8.5 – Test di omogeneità con serie di riferimento Regionale (Craddock Test) In Tabella A8.5, a titolo di esempio, sono riportati alcuni dei risultati dei controlli basati sullo storico e di quelli basati su metodi matematici, con la conseguente assegnazione dell’etichetta di qualità, desumibile dalla colorazione associata ad ogni stazione. Tra tutte le stazioni sottoposte a verifica, le 50 stazioni con livello di qualità più elevato sono state selezionate per la rete di qualità. Selezione di una rete per il monitoraggio della siccità in Sicilia 231 Tabella A8.5 – Risultato delle analisi basate su metodi storici e/o matematici max periodo mancante [mesi] cod 1810 1480 2790 2220 2468 984 70 2980 470 2300 660 1270 1960 1060 3210 3400 2240 2410 2580 1490 2200 3120 1118 1144 1340 3380 3060 1680 funzionament o dal 1916-1950 1950-2002 1916 1919 1920 1923 1916 1928 1920 1920 1919 1919 1919 1923 1916 1920 1916 1921 1928 1936 1917 1919 1918 1916 1919 1919 1923 1938 1916 1919 1 4 2 2 1 7 2 2 2 1 48 36 60 20 tot dati mancanti [mesi] max periodo interpolato [mesi] tot dati interpolati [mesi] 1916-1950 1950-2002 1916-1950 1950-2002 1916-1950 1950-2002 5 2 5 1 65 60 60 20 24 24 24 1 11 5 5 5 1 1 2 1 1 12 12 1 12 12 1 18 3 21 1 1 12 12 12 36 30 24 72 36 1 1 13 13 25 66 30 61 136 84 30 9 31 9 Livello 1 (ottimo) 1 46 46 46 2 1 2 2 3 1 2 3 1 1 1 1 1 2 3 1 3 2 1 3 3 1 1 1 5 4 12 3 3 8 3 2 1 1 1 2 9 1 4 2 4 6 4 1 1 1 3 3 4 5 1 3 3 4 Livello 1 (buono) tracciabilità presenza sup test posiz tracciabilità outliers omogeneità strumento strumento 13 13 12 17 15 15 19 23 11 12 12 9 16 15 12 18 14 9 20 10 19 21 19 17 10 7 19 16 SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI SI 3 Livello 3 (sufficiente) Tabella A8.6 – Elenco stazioni selezionate STAZIONE Agrigento Bivona Bronte Butera Castelvetrano Castroreale Catenanuova Cattolica eraclea Cefalu' Chiaramonte gulfi Ciminna Corleone Enna Fastaia Floresta CODICE 1810 1480 2790 2220 1190 70 2980 1760 470 2300 660 1270 1960 1060 3210 232 Ganzirri Gela Ispica Lentini citta' Lercara friddi Licata Linguaglossa Marsala Mazara del vallo Menfi Messina ist.geofisico Mineo Mussomeli Nicosia Noto Palermo oss. Astron. Palma di montechiaro Paterno' Petralia sottana Piazza armerina Pietraperzia Racalmuto Ragusa Ribera Roccamena S. Caterina villarmosa S. Fratello S. Stefano di briga San giuseppe jato San vito lo capo Sommatino Sortino Trapani Tusa Vallelunga Vittoria Zafferana etnea M. T. Noto 3400 2240 2410 2580 1490 2200 3120 1120 1140 1340 3380 3060 1680 2800 2450 880 1850 2910 1860 2250 2040 1700 2370 1460 1300 1600 310 3360 950 1050 2100 2490 1030 360 1660 2350 3110 Selezione di una rete per il monitoraggio della siccità in Sicilia 233 Figura A8.6 – distribuzione spaziale delle stazioni facenti parte della rete per lo studio della siccità A8.3 ASSEGNAZIONE ETICHETTA DI QUALITÀ ALLA RETE SELEZIONATA Le stazioni selezionate per la rete di monitoraggio della siccità, risultano in un numero pari a 50, per quanto riguarda la pluviometria e in un numero pari a 15, per quanto riguarda la termometria, distribuite su tutto il territorio regionale (circa 24.000 Km2), ottenendo una risoluzione spaziale di circa 1/480 [numero di stazioni/Km2] per la rete di stazioni relative alla grandezza pioggia ed una risoluzione spaziale di circa 1/700 [numero di stazioni/Km2] per la rete di stazioni relative alla grandezza temperatura. Pertanto, considerate le tabelle 5.5.6 e 5.5.7, la rete per la misura della pioggia e quella per la misura della temperatura, definite in questo studio, risultano di qualità ottima. M. T. Noto 234 A8.4 ASSEGNAZIONE ETICHETTA DI QUALITÀ SISTEMA DI MONITORAGGIO MESSO A PUNTO Lo studio qui esposto è stato condotto sperimentalmente solo sulle stazioni di misura per la grandezza pioggia e per la grandezza temperatura. Sulla base di quanto esposto al paragrafo 5.6, il sistema di monitoraggio messo a punto, risulterebbe di qualità sufficiente, intendendo per sufficiente, una condizione bastevole per l’espletamento di studi sulla siccità. Un giudizio completo sulla qualità del sistema per il monitoraggio della siccità in funzione, si potrà ottenere estendendo l’analisi alle altre stazioni di grandezze idro-meteo-climatiche e, conseguentemente, alle relative reti per singola grandezza, ricordando che, in base a quanto esposto nel paragrafo 5.6.3, un sistema di monitoraggio per la siccità risulta di ottima qualità se è composta da reti per la misura di pioggia, temperatura, umidità, radiazione solare e portata tutte di qualità ottima, così come precisato sopra, è definita di qualità ottima. BIBLIOGRAFIA Plummer N., Allsopp T., Lopez J.A. (2003) Guidelines on Climate Observation Networks and Systems, WMO/TD N.1185 Aguilar E., Auer I., Brunet M., Peterson T.C., Wieringa J. (2003) Guidelines on Climate Metadata and Homogenization, WMO/TD N.1186 World Meteorological Organization, 1981: Manual on the Global Observing System. Volume 1: Global aspects. WMO-No. 544 Geneva. World Meteorological Organization, 1988: Practical experience of the operation of quality evaluation programs for automated observations both on land and over the sea (M. Field and J. Nash). Papers Presented at the WMO Technical Conference on Instruments and Methods of Observation (TECO-88) Leipzig, 16-20 May 1988, Instruments and Observing Methods Report No. 33, 222, Geneva. Böhm, R., Auer, I., Brunetti, M., Maugeri, M., Nanni, T., Schöner W., 2001: Regional Temperature Variability in the European Alps 1760-1998 from homogenised instrumental time series. Int. J. Climatol., 21, 1779-1801 Štepánek, P. (2005): AnClim - software for time series analysis. Dept. of Geography, Fac. of Natural Sciences, MU, Brno. (http://www.sci.muni.cz/~pest/software.html) A9 LA RICOSTRUZIONE DEI DEFLUSSI ATTRAVERSO IL BILANCIO IDRICO DEGLI INVASI: RISULTATI OTTENUTI PER I LAGHI DELLA SARDEGNA A. ABIS, G. M. SECHI CRIFOR – Università di Cagliari R. SILVANO EAF – Ente Autonomo del Flumendosa – Regione Sardegna Abstract: L’acquisizione dei dati idrometrici per la definizione dei deflussi nei corsi d’acqua è stato negli ultimi decenni, salvo rare eccezioni, trascurata dai Servizi Idrografici. Il bilancio idrico degli invasi artificiali è di seguito esaminato con la finalità della ricostruzione del deflusso in ingresso al lago. Questa procedura per la ricostruzione dei deflussi è di norma caratterizzata da un maggiore livello di incertezza e da difficoltà di carattere generale, rispetto agli usuali metodi di stima dei deflussi. Nell’articolo si fornisce un inquadramento generale del problema per la definizione delle grandezze la cui conoscenza è necessaria per il bilancio idrico in un invaso artificiale che sia gestito ai fini della utilizzazione della risorsa idrica. Si documentano, inoltre, le attività sviluppate dal CRIFOR-UNICA sia nel Progetto SEDEMED II, sia per la redazione del Piano Stralcio di Bacino Regionale per definire il bilancio dei laghi artificiali in Sardegna. Key words: Bilancio idrico degli invasi; deflussi superficiali; serbatoi artificiali. A9.1 INTRODUZIONE E’ ben noto che in Italia questi ultimi anni i Servizi Idrografici regionali hanno sviluppato maggiormente le attività conoscitive relative al settore pluviometrico (che hanno consentito di analizzare i fenomeni siccitosi in relazione alla definizione di indici di siccità meteorologica) mentre il settore di acquisizione dei dati relativi all’idrometria per la definizione dei deflussi nei corsi d’acqua, salvo alcune rare eccezioni, è stato molto trascurato. In specifico, relativamente alla Servizio Idrografico della Regione Sardegna, non si è più proceduto alla regolare osservazione dei livelli idrometrici delle stazioni di misura delle portate ed all’aggiornamento delle relative scale delle portate. Pertanto l’unica possibilità per avere a disposizione serie dei deflussi storici in queste ultime due decadi (peraltro caratterizzate da eventi siccitosi particolarmente critici) è stato quello di stima dei deflussi per via indiretta, valutando nei laghi artificiali l’input idrologico tramite la 236 A. Abis, G. M. Sechi, R. Silvano costruzione del bilancio di invaso con passo mensile. Come si vedrà nel seguito, considerate le incertezze intrinsecamente legate alla stima delle grandezze che intervengono nel bilancio, la stima dei deflussi con passo temporale più stretto non sembra infatti proponibile utilizzando questo approccio per la valutazione dei deflussi. Di seguito si fornirà un inquadramento generale del problema per la definizione delle grandezze la cui conoscenza è necessaria per il bilancio idrico in un invaso artificiale che sia gestito ai fini della utilizzazione della risorsa idrica. Successivamente, si documenteranno le attività sviluppate dal CRIFOR-UNICA sia nel Progetto SEDEMED II, sia per la redazione del Piano Stralcio di Bacino (RASSOGESID, 2005) per definire il bilancio dei laghi artificiali in Sardegna. Si sintetizzeranno, quindi, i risultati delle attività di reperimento dei dati, conseguenti alle fasi di ricognizione presso gli Enti gestori, e delle analisi per la validazione dei dati. Infine, si fornirà un quadro sintetico dei risultati ottenuti e delle successive elaborazioni sui bilanci che hanno consentito, purtroppo solo per un numero limitato di invasi, la ricostruzione dei deflussi in ingresso. A9.2 IL BILANCIO IDRICO DEGLI INVASI ARTIFICIALI Il bilancio idrico degli invasi artificiali è di seguito esaminato con la finalità della ricostruzione dell’input idrologico al lago. Questa procedura per la ricostruzione dei deflussi è di norma caratterizzata da un maggiore livello di incertezza e da difficoltà di carattere generale, rispetto agli usuali metodi di stima dei deflussi. Mentre, infatti, per la stima diretta dei deflussi gli errori possono riguardare essenzialmente due tipologie di variabili: l’altezza idrometrica e la scala delle portate, nel bilancio idrico dell’invaso intervengono numerose grandezze alcune delle quali sono difficilmente misurabili direttamente ed anche la loro stima indiretta è operazione complessa e con elevato livello di incertezza. Inoltre, difficoltà nella ricostruzione del bilancio provengono dalla non omogeneità e sistematicità nelle procedure di acquisizione dei dati utilizzate dai diversi Enti gestori e, in numerosi casi, dalla assoluta carenza nella raccolta di elementi fondamentali per la corretta ricostruzione dei deflussi. In termini generali, si vuole qui richiamare l’attenzione sulla necessità di provvedere alla formulazione di procedure standard di acquisizione, e archiviazione dei dati necessari per la ricostruzione dei bilanci e la necessità di un controllo e verifica in tempi rapidi della correttezza delle informazioni avute dagli Enti gestori in modo da poter procedere tempestivamente, quando necessario, al richiamo di tali Enti agli obblighi di documentazione nella gestione delle opere di regolazione deflussi. Sugli aspetti della necessità di documentazione si tornerà in La ricostruzione dei deflussi attraverso il bilancio idrico degli invasi: risultati ottenuti per i laghi della sardegna 237 modo specifico quando si esamineranno i bilanci degli invasi considerati al paragrafo seguente. Come è usuale, la ricostruzione del bilancio parte dalla conoscenza dei livelli di invaso nei diversi periodi t ai quali, tramite la conoscenza della curva dei volumi di invaso, è possibile associare il volume V(t) che si intende valutato all’inizio del periodo. La procedura di stima dovrà considerare la possibilità che, oltre l’afflusso naturale A(t) all’invaso nel periodo, possa arrivare al serbatoio il rilascio da altri invasi o il trasferimento da opere di derivazione (traverse) su bacini di gronda, che saranno complessivamente indicati con T(t). Si dovrà inoltre considerare l’afflusso meteorico diretto nell’invaso M(t). Nel bilancio dovranno essere considerate le perdite per evaporazione dallo specchio liquido dell’invaso, indicate con E(t), per filtrazione attraverso il corpo dello sbarramento e raccolte dai dreni, che complessivamente indichiamo con P(t). E’ opportuno, inoltre, considerare un ulteriore elemento di perdita che avviene per infiltrazione nel sito di invaso, indicato con F(t). I prelievi tramite le opere di presa destinate alle utenze, considerate nel loro complesso, sono indicate con U(t). I volumi rilasciati a valle dagli organi di scarico sono indicati con R(t). Infine con S(t) sono indicati gli sfiori dalla diga determinati dal superamento del massimo invaso utile di regolazione. Dall’equazione complessivo: di continuità all’invaso si ricava l’input idrologico A(t ) = V (t ) − V (t − 1) − T (t ) − M (t ) + R(t ) + U (t ) + E (t ) + P(t ) + S (t ) + F (t ) t = 1, ..., T La valutazione dei V(t) richiede la conoscenza dei livelli idrici di invaso e della curva dei volumi di invaso. Il primo dato, così come per i livelli idrici delle acque fluenti, è in genere fornito con lettura diretta da idrometro e con apparecchiature idrometrografiche. La conversione altezze-volumi risente, ovviamente, della incertezza di stima della curva dei volumi di invaso, normalmente valutata sulla base di misure topografiche precedenti l’invaso, e dall’incremento del possibile errore che, a parità di ΔH nei livelli idrometrici, si può verificare nella stima dei volumi invasati, ricavati dalla curva. La valutazione di T(t) risulta spesso difficile e, in alcuni casi ottenibile solo per via indiretta. Questo accade, ad esempio, quando all’invaso sono collegati, tramite opere di derivazione, traverse su bacini di gronda che non siano opportunamente monitorate. Quando i trasferimenti T(t) avvengono tra sbarramenti nei quali sono misurati i prelievi ed i deflussi vallivi, è frequentemente opportuno realizzare il bilancio del sistema multi-serbatoio nel suo complesso, valutando quindi l’input idrologico all’insieme degli invasi (si veda di seguito l’esempio dei laghi del Flumendosa). La valutazione di M(t) può essere realizzata con gli usuali pluviometri, essendo 238 A. Abis, G. M. Sechi, R. Silvano nota la superficie media del lago ottenibile utilizzando la curva della superficie dello specchio liquido associata alla quota di invaso. La valutazione della E(t) viene effettuata normalmente sulla base della conoscenza della superficie media di invaso nel periodo e dalla attribuzione al periodo in esame di un altezza di evaporazione da specchio liquido e(t). Questa grandezza può essere valutata attraverso misure evaporimetriche dirette o stimata sulla base delle usuali equazioni che utilizzano le grandezze climatiche (temperatura, ventosità, ecc.) misurate nel periodo ovvero, quando risultano mancanti anche tali osservazioni, sulla base delle caratteristiche medie climatiche della zona. La stima della P(t) deriva dalle misure dei deflussi nei dreni delle opere di sbarramento mentre la stima della F(t) può essere fatta solo su base indiretta, eventualmente utilizzando i dati relativi a periodi, anche di lunghezza ridotta rispetto al mese, nei quali le altre grandezze di bilancio possano risultare definite. La valutazione delle U(t) è, in genere, resa possibile dalle misure effettuate sugli organi di derivazione della risorsa idrica. Più complessa risulta, invece la stima dei valori di deflusso rilasciati a valle attraverso gli organi di scarico R(t) e di sfioro S(T) per i quali è necessario conoscere, oltre alle misure di apertura delle luci e di battente, le curve di taratura. L’applicazione della equazione di bilancio per la ricostruzione dei deflussi deve essere realizzata considerando intervalli temporali sufficientemente estesi per evitare che gli errori nella valutazione delle grandezze che compaiono in bilancio producano stime non attendibili sui deflussi calcolati. D’altra parte, è inevitabile che i diversi fenomeni che devono essere quantificati possano richiedere un diverso passo temporale di integrazione, essenzialmente dipendente dalla tipo di fenomeno e dalla metodologia di misura adottata. Pertanto, operazione usuale nel sviluppare la pratica applicazione dell’equazione di bilancio ai casi reali, è quella di predefinire il passo temporale di stima del deflusso e di calcolare i singoli elementi che intervengono nell’equazione di bilancio con una specifica integrazione per intervalli di tempo individuati con la finalità di ottimizzare la stima dei singoli elementi. Tipicamente, ad esempio, i deflussi sono valutati con scansione mensile mentre le perdite per evaporazione sono integrate sul mese ma valutate con scansione giornaliera e i volumi scaricati considerando intervalli di tempo ancora minori, che assicurino costanza di apertura e di carico idraulico. Ovviamente in alcune situazioni, come ad esempio in occasione di importanti eventi di piena che rendono trascurabili molte forme di perdita, la stima dell’input idrologico al lago può essere realizzata anche per intervalli di tempo limitati, che siano comunque compatibili con la propagazione della piena nell’invaso. Pur in mancanza di specifiche analisi sul problema, si ritiene generalmente che, ai fini della ricostruzione dei deflussi, non si debba scendere al di sotto del giorno mentre la scansione temporale più frequente in questo tipo di ricostruzioni è quella mensile. La ricostruzione dei deflussi attraverso il bilancio idrico degli invasi: risultati ottenuti per i laghi della sardegna A9.3 RICOSTRUZIONE DEI DEFLUSSI AFFLUENTI SERBATOI ARTIFICIALI IN SARDEGNA 239 NEI Come anticipato nell’introduzione, nel paragrafo seguente sarà illustrata l’attività di ricostruzione dei deflussi realizzata sugli invasi artificiali della regione Sardegna. Per ciascun invaso si fornirà preliminarmente una sintesi dei dati grezzi reperiti presso gli Enti gestori, alcune considerazioni sulla significatività e possibilità di utilizzazione di tali dati, commenti sui risultati ottenuti, il grafico con la serie ricostruita dei deflussi ed alcuni dati statistici di sintesi, valutati su base pluriennale. La ricostruzione dei bilanci ha interessato gli undici anni idrologici compresi tra il 1992 ed il 2003. La prima data è quella alla quale ha termine il database idrologico regionale (RAS, 1998). Conformemente con le finalità di SEDEMED II e con le elaborazioni idrologiche contenute nel Piano d’Ambito Regionale (RAS-2002) il periodo per il quale si sono successivamente svolte le analisi di caratterizzazione delle serie idrologiche è stato esteso al 17-ennio 19862003, periodo nel quale sono avvenuti i recenti eventi siccitosi. Con riferimento alle attività di reperimento dei dati, si osserva che in alcuni casi sono addirittura mancanti, nella documentazione fornita al CRIFOR-UNICA le necessarie informazioni sugli elementi caratteristici descrittivi dell’invaso (tipologia di sbarramento, curva d’invaso, curva delle superfici dello specchio liquido, caratteristiche organi di scarico, caratteristiche organi di sfioro, ecc) e sono rare le trascrizioni su supporto informatico dei dati, ancorché gli stessi siano presenti nei registri degli Enti gestori degli invasi. Sulla base di indagini preliminari che hanno riguardato, essenzialmente, la possibilità di acquisizione delle informazione di base e la disponibilità degli Enti gestori a fornire le informazioni richieste, si è potuto operare con riferimento seguenti invasi, la cui numerazione e coerente con l’ubicazione riportata nella Figura 1: 1 - Coghinas a Muzzone 5 - Bidighinzu a Monte Ozzastru 7 - Mannu di Pattada a Monte Lerno 8 - Liscia a Punta Calamaiu 13 - Govossai 14 - Sos Canales 17 - Olai 19 – Torrei 21 - Mannu di Narcao a Bau Pressiu 22 – 25- 26 - Flumendosa Alto e Medio + Mulargia (senza i trasferimenti dal Flumineddu) 23 - Cixerri a Gennai is Abis 240 A. Abis, G. M. Sechi, R. Silvano 24 - Is Barrocus 28 - Leni a Monte Arbus 31 - Corongiu III E’ subito da notare che, rispetto ai 31 invasi che compaiono nella Figura 1, nell’elenco precedente mancano laghi importanti, come il recente invaso del Tirso a Cantoniera. Informazioni che giustificano il numero limitato degli invasi considerati nelle ricostruzioni, a confronto del numero più che doppio presente nella Figura 1, sono forniti nella relazione di commento alle operazioni di ricognizione dei dati (RAS-SOGESID, 2005), Le motivazioni di tale fatto è principalmente da mettere in relazione con la mancanza di una adeguata documentazione che, almeno sulla base delle risultanze delle indagini realizzate per il citato Sudio, non sono risultate disponibile per documentare adeguatamente la gestione degli invasi. Per approfondimenti su tali aspetti si rimanda alle relazioni in (RAS-SOGESID, 2005) descrittive delle operazioni di raccolta dati e di ricostruzione dei bilanci. Le operazioni di ricostruzione dei deflussi è realizzata alle sezioni di interesse che generalmente coincidono con la chiusura di singoli invasi o, in caso di trasferimenti importanti tra gli invasi, con l’aggregazione di essi (caso dei laghi del sistema FlumendosaMulargia). La sistematica carenza di alcune informazioni che sarebbero necessarie per la definizione del bilancio ha reso necessarie, in alcune occasioni, importanti semplificazioni nelle procedure di ricostruzione dei deflussi. In particolare si è accettata la possibilità di ricostruzione delle perdite per evaporazione sulla base di valori medi mensili, sono state trascurate le perdite per infiltrazione dal sito di invaso, per alcuni invasi si è operata una ricostruzione dei volumi prelevati per via indiretta. In alcuni casi, per invasi particolarmente significativi, si sono dovute attivare procedure di ricostruzione specifiche di dati mancanti o inaffidabili. A titolo di esempio, in Appendice si riportano le procedure di stima messe in atto per l’invaso del Coghinas. La ricostruzione dei deflussi attraverso il bilancio idrico degli invasi: risultati ottenuti per i laghi della sardegna Figura 1: Ubicazione e codici degli invasi 241 242 A. Abis, G. M. Sechi, R. Silvano In termini sintetici, la Tabella A9.1 riporta la consistenza dei dati disponibili per gli invasi considerati nelle indagini. X X X X Mannu di Pattada a Monte Lerno X X X Liscia a Punta Calamaiu X X X X Govossai X X X Sos Canales X X X Olai X X X Torrei X X X Mannu di Narcao a Bau Pressiu X Flumendosa e Mulargia X X Cixerri a Gennai s Abis X Is Barrocus X Leni a Monte Arbus X Bidighinzu a Monte Ozzastru Corongiu III X Sfiori X X Scarichi Erogaz. verso utenze X Coghinas a Muzzone Evapor. Volumi di invaso X Curva volum invaso X Denominazione invaso Quote di invaso Curva superf liquida Tabella A9.1: Sintesi dei dati disponibili per gli invasi X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X X Sulla base dell’informazione disponibile e delle prime verifiche sulla congruità dei risultati ottenuti, la ricostruzione dei deflussi è stata considerata accettabile, ai fini delle successive elaborazioni, nei seguenti sette invasi: La ricostruzione dei deflussi attraverso il bilancio idrico degli invasi: risultati ottenuti per i laghi della sardegna − − − − − − − 243 Mannu di Narcao a Bau Pressiu Bidighinzu a Monte Ozzastru Coghinas a Muzzone Flumendosa Alto e Medio + Mulargia (senza i trasferimenti dal Flumineddu) Leni a Monte Arbus Liscia a Punta Calamaiu Mannu di Pattada a Monte Lerno A partire dal bilancio operato sui sette invasi sopra elencati e dai dati storici osservati è stato possibile realizzare una analisi che ha avuto come obiettivo quello della caratterizzazione statistica dei deflussi nel diciassettennio 86-03 nel quale sono avvenute importanti crisi idriche con pesanti restrizioni verso le utenze. A tal fine è stato considerato il data-base del 53-ennio 22-75 (RAS, 1987) nel quale la valutazione dei deflussi su scala regionale era stata effettuata a partire dai bilanci idrologici ricostruiti su 30 bacini idrografici corrispondenti alle stazioni di misura di portata del Servizio Idrografiche che hanno funzionato a partire dal 1922. E’ stato quindi considerato l’undicennio 92-03 (dati di bilancio invasi) ed il diciassettennio 86-03 ottenuto integrando i dati di bilancio con i dati dell’integrazione al 1992 del data-base idrologico regionale (SISS, 1997). Quest’ultimo diciassettennio rappresenta certamente il periodo di indagine più significativo per caratterizzare la criticità dei deflussi osservati a partire dalla crisi idrica di fine anni ottanta. Una verifica preliminare ha riguardato il controllo del coefficiente di deflusso conseguente alla stima dei deflussi da bilancio. In (RAS-SOGESID, 2005), inserendo in un diagramma i valori di afflusso ragguagliato ai bacini sottesi e di deflusso annuo nelle sezioni osservate, si è ricostruito l’andamento del coefficiente di deflusso annuo. Tale diagramma consente di valutare gli effetti della riduzione delle piogge e di quantificare quanto tale riduzione incide sulle risorse superficiali potenzialmente utilizzabili (deflussi superficiali). Tale legame può essere interpretato da una funzione del tipo: Dm1/3= c1 + c2 Log(Am) Il diagramma è riportato nella Figura 2, nella quale sono riportate le curve ottenute sui dati (SISS, 1997), relativi a tutti i bacini osservati nel periodo 19221992 in Sardegna. Tale curva fornisce le caratteristiche medie che nell’isola caratterizza il processo di trasformazione afflussi-deflussi. Sullo stesso diagramma sono state poi riportate le curve relative ai bacini idrografici del Coghinas, del Tirso e del Flumendosa, unitamente a quella del fiume Bradano (Basilicata), riportata solo al fine di osservare la similitudine idrologica di tali relazioni nell’ambito dei bacini idrografici dell’Italia meridionale con clima semiarido 244 A. Abis, G. M. Sechi, R. Silvano mediterraneo. TRASFORMAZIONE AFFLUSSI-DEFLUSSI 800 Sardegna 750 Coghinas 700 Tirso 650 Flume ndosa 600 Bradano (Basilicata) Altezze di deflusso medio annuo (mm) 550 Aff-Def me dio in Sarde gna 1922-1975 500 Aff-Def me dio in Sarde gna attuale 450 Aff-Def me di ai bacini: 1922-1975 400 Aff-Def me di ai bacini: 1922-1992 350 300 250 200 150 100 50 0 300 350 400 450 500 550 600 650 700 750 800 850 900 950 1000 1050 1100 1150 Altezze di afflusso medio annuo (mm) Figura A9.2: Relazione tra afflussi e deflussi nei diversi bacini (estratto da RAS – 2005) I parametri dell’equazione precedente sono riportati di seguito: Tabella A9.2 - parametri della relazione tra afflussi e deflussi Zona idrografica Sardegna Coghinas Tirso Flumendosa Bradano (Basilicata) c1 -40.536 -40.536 -40.536 -40.536 -28.200 c2 16.215 16.285 16.117 16.349 11.980 L’esame dei grafici riportati in Figura A9.2 evidenziano l’andamento non 1200 La ricostruzione dei deflussi attraverso il bilancio idrico degli invasi: risultati ottenuti per i laghi della sardegna 245 lineare della trasformazione afflussi-deflussi stimata su base annua, in particolare al ridursi del valore di deflusso, e l’esistenza di un valore minimo di afflusso meteorico al di sotto del quale, sulla base delle relazioni proposte, non verrebbe prodotto deflusso superficiale. In Figura è inoltre evidenziato come la contrazione delle precipitazioni annue del 18% tra i due periodi esaminati abbia comportato una riduzione dei deflussi di oltre il 50%. Nelle analisi per la validazione dei deflussi ottenuti dalle procedure di bilancio ai laghi si sono verificate le congruità di queste contrazioni percentuali dei deflussi, riportate in Figura 2 per i bacini principali, anche sugli altri bacini sottesi dalle sezioni di sbarramento. In particolare, per impostare la successiva procedura di generazione dei deflussi adottata in (RAS, 2005) è stata verificato se l’andamento del valore percentuale di riduzione dei deflussi tra il 53-ennio 22-75 e ed il diciassettennio 86-03 si è mantenuto sempre prossimo al 50% per tutti i bacini. Di seguito si forniscono alcuni risultati sintetici e commenti sulla attendibilità dei valori ricostruiti. 246 A. Abis, G. M. Sechi, R. Silvano A9.4 SINTESI DEI RISULTATI OTTENUTI Coghinas a Muzzone Il deflusso medio, che nel 53-ennio idrologico 22-75 era stato di 450.6 Mm3/anno si riduce a 235.6 Mm3/anno nel 17-ennio 86-03 con un rapporto di riduzione pari a 0.52. Tra i due periodi storici il coefficiente di variazione si innalza da 0.380 a 0.461. L’andamento dei deflussi nell’intero periodo 22-03 è dato nella figura seguente, nella quale è evidenziato l’ultimo periodo ricostruito col bilancio al lago. Mmc Deflussi storici annui alla sezione di Coghinas Muzzone 875 850 825 800 775 750 725 700 675 650 625 600 575 550 525 500 475 450 425 400 375 350 325 300 275 250 225 200 175 150 125 100 75 50 25 0 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52 54 56 58 60 62 64 66 68 70 72 74 76 78 80 82 84 86 88 90 92 94 96 98 00 02 Figura A9.3 – risultati ottenuti a Coghinas a Muzzone Flumendosa alto e medio + Mulargia Il bilancio è chiuso subito a valle della sezione di immissione del Mulargia nel Flumendosa e pertanto vengono computati i deflussi dell’intero bacino totale del Flumendosa (invasi dell’Alto e Medio Flumendosa) e gli apporti del Mulargia. Sono invece sottratti dal computo i trasferimenti in galleria dal l’invaso del 247 La ricostruzione dei deflussi attraverso il bilancio idrico degli invasi: risultati ottenuti per i laghi della sardegna Flumineddu al lago di Nuraghe Arrubiu e sono stati debitamente tenuti in conto i volumi turbinati dall’Alto Flumendosa per la produzione di energia elettrica. Nella figura è riportato l’andamento dei deflussi per l’intero periodo storico 1922-03 evidenziando l’ultimo periodo valutato sulla base del bilancio ai laghi. Il deflusso medio annuo del periodo 22-75 è per l’insieme dei bacini dominati da questo sistema pari a 423.8 Mm3. Nel diciassettenio 86-03 il deflusso medio scende a 209.11 Mm3 con un coefficiente di riduzione Rm = 0.49. Il valore di CV sale da 0.332 a 0.557. Deflussi storici annui FLUMENDOSA Alto e Medio + Mulargia (senza trasferimenti dal Flumineddu) Mmc 775 750 725 700 675 650 625 600 575 550 525 500 475 450 425 400 375 350 325 300 275 250 225 200 175 150 125 100 75 50 25 0 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52 54 56 58 60 62 64 66 68 70 72 74 76 78 80 82 84 86 88 90 92 94 96 98 00 02 Figura A9.4 – risultati ottenuti a Flumendosa alto e medio e Mulargia Monte Lerno Per questo invaso si passa da un deflusso medio annuo pari a 64 Mm3 nel 53ennio a 28.25 Mm3 nel 17-ennio con una riduzione Rm = 0.44. Il valore di CV sale da 0.390 a 0.583. 248 A. Abis, G. M. Sechi, R. Silvano Deflussi storici annui alla sezione di Monte Lerno 130 125 120 115 110 105 100 95 90 85 80 75 Mmc 70 65 60 55 50 45 40 35 30 25 20 15 10 5 0 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52 54 56 58 60 62 64 66 68 70 72 74 76 78 80 82 84 86 88 90 92 94 96 98 00 02 Figura A9.5 – risultati ottenuti a Monte Lerno Leni Il valore di deflusso medio annuo si riduce da 37.1 a 16.54 passando dal 53ennio al 17-ennio più recente. Sulla base dei deflussi calcolati risulta quindi Rm = 0.45.Il CV si innalza da 0.338 a 0.503 . Deflussi storici annui alla sezione del LENI a Monte Arbus 75 70 65 60 55 50 Mmc 45 40 35 30 25 20 15 10 5 0 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52 54 56 58 60 62 64 66 68 70 Figura A9.6 – risultati ottenuti a Coghinas a Leni 72 74 76 78 80 82 84 86 88 90 92 94 96 98 00 02 249 La ricostruzione dei deflussi attraverso il bilancio idrico degli invasi: risultati ottenuti per i laghi della sardegna Bau Pressiu Per questa sezione nella serie storica 1922-75 era stato valutato un deflusso medio annuo pari a 6.6 Mm3/anno. Nel 17-ennio 86-03 i dati di bilancio forniscono una stima del deflusso medio annuo pari a 4.35 Mm3/anno da cui consegue un valore di Rm = 0.66. Sulla base di quanto si è evidenziato nell’analisi dei dati considerati per realizzare i bilanci, è probabile che nella stima dei deflussi in ingresso all’invaso siano introdotti errori sistematici che tendono a sovrastimare tali deflussi. Deflussi storici annui alla sezione di BAU PRESSIU 18 17 16 15 14 13 12 11 Mmc 10 9 8 7 6 5 4 3 2 1 0 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52 54 56 58 60 62 64 66 68 70 72 74 76 78 80 82 84 86 88 90 92 94 96 98 00 02 Figura A9.7 – risultati ottenuti a Bau Pressiu Bidighinzu Anche per questo lago i risultati che si ottengono risultano condizionati da una probabile sovrastima dei deflussi conseguente alla scarsa affidabilità dei dati di bilancio. Risulta, infatti, per il 53-ennio un deflusso medio annuo pari a 10.2 Mm3/anno mentre per il 17-ennio più recenti si ottiene una stima di deflusso medio pari a 8.23 Mm3/anno, da cui consegue Rm = 0.81. 250 A. Abis, G. M. Sechi, R. Silvano Deflussi storici annui alla sezione del BIDIGHINZU 29 28 27 26 25 24 23 22 21 20 19 18 17 Mmc 16 15 14 13 12 11 10 9 8 7 6 5 4 3 2 1 0 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52 54 56 58 60 62 64 66 68 70 72 74 76 78 80 82 84 86 88 90 92 94 96 98 00 02 Figura A9.8 – Risultati ottenuti a Bidighinzu Liscia a Punta Calamaiu I deflussi medi annui nel 53-ennio erano stati pari a 104.3 Mm3/ anno ed il CV valutato per tale periodo risulta CV = 0.452. Nel 17-ennio 86-03 il deflusso medio si riduce a 52.73 Mm3/ anno; a ciò consegue Rm = 0.52. Per questo invaso risulta anomalo il valore dello scarto ricavato dai bilanci: su base annua esso risulta decisamente modesto e porta ad un valore del CV che si riduce rispetto a quello del 53-ennio assumendo il valore CV=0.394. Questo fatto è probabilmente da imputare ad una palese sovrastima dei deflussi nei periodi più critici, presumibilmente determinata da una attribuzione di valori di erogazione superiori a quelli reali. La ricostruzione dei deflussi attraverso il bilancio idrico degli invasi: risultati ottenuti per i laghi della sardegna 251 Deflussi storici annui alla sezione di Liscia a P.Calamaiu 260 250 240 230 220 210 200 190 180 170 160 150 Mmc 140 130 120 110 100 90 80 70 60 50 40 30 20 10 0 22 24 26 28 30 32 34 36 38 40 42 44 46 48 50 52 54 56 58 60 62 64 66 68 70 72 74 76 78 80 82 84 86 88 90 92 94 96 98 00 02 Figura A9.9 – risultati ottenuti a Punta Calamaiu BIBLIOGRAFIA Mosley M.P. and McKerchar A.I., Streamflow. In D.R. Maidment (ed.) Handbook of Hydrology, Chapter 8. McGraw-Hill, 1993. RAS (2005) Piano Stralcio di Bacino della Regione Sardegna per l’Utilizzo delle Risorse Idriche. Autonomous Region of Sardinia, Convention RAS-UNICA-EAF. SISS (1995) Studio dell’Idrologia Superficiale della Sardegna, Cassa per il Mezzogiorno – Regione Autonoma della Sardegna – Ente Autonomo del Flumendosa, Cagliari.