AGATA ZIRILLI*, ANGELA ALIBRANDI*, TINDARO CICERO°
I MODELLI LINEARI GENERALIZZATI
PER LO STUDIO DELLA DIPENDENZA
DELLA BAGNATURA FOGLIARE
DA VARIABILI ATMOSFERICHE1
* Dipartimento di Scienze Economiche, Finanziarie, Sociali, Ambientali,
Statistiche e del Territorio (S.E.FI.S.A.S.T.), Università degli Studi di Messina
° Dipartimento di Ingegneria dell'Impresa; Laboratorio di Studi sul
Trasferimento Tecnologico e l’Imprenditorialità; Università degli Studi di
Roma "Tor Vergata"
SUMMARY. The duration of leaf wetness is a very significant parameter for
the development of many fungal diseases in plants. In order to make
agriculture more competitive, it's important knowledge resulting from good
information on the use of models and by application of remote sensing of leaf
wetness and other agro-meteorological variables. So it’s possible to reduce
risk and uncertainty in decisions and increase profits. In this study we aim to
estimate a statistical model formalizing the dependence of leaf wetness from
atmospheric variables. In particular we have applied some specific regression
models in three different agro-meteorological stations, located at different
altitudes (Cesarò Vignazza, Pettineo and Patti) in Messina’s province. The
examined agro-meteorological variables are: air temperature, barometric
pressure, precipitation, relative humidity, solar radiation and wind speed at 2
meters. The first approach was the Poisson regression, applied to the count of
minutes of leaf wetness; later, we estimated an ordinal logistic regression
model for classes of leaf wetness duration; after dichotomization of the
response variable, we estimated a binary logistic regression model. Finally, we
perform a comparison of the results obtained by the estimated generalized
linear models. In our analysis, temperature, wind speed, pressure and humidity
significantly influence the leaf wetness. Although the three estimated
regression models provided similar information, specific criteria suggest that
the Poisson regression is the best model.
1. INTRODUZIONE
Il settore agricolo e l’agro-alimentare sono i settori di punta per
l’economia Siciliana; in tale ambito, infatti, questa Regione
rappresenta il primo produttore ed esportatore a livello nazionale.
Il settore della ricerca e dell’innovazione, legato alle produzioni
di qualità, sta introducendo all’interno delle aziende agricole la
cultura della ricerca scientifica. La competitività dell’agricoltura
è legata alla disponibilità di valide informazioni di qualità già
elaborate. È possibile in questo modo limitare rischi e incertezze
nelle decisioni e, di conseguenza, minimizzare gli eccessi di
input ed incrementare i profitti. Un modo per conseguire questi
obiettivi è rappresentato dall’uso dei modelli e dall’applicazione
del tele-rilevamento della bagnatura fogliare e delle altre variabili
agro-meteorologiche; ciò rende possibile un monitoraggio del
1
Il lavoro è frutto di un’elaborazione comune. Tuttavia, i paragrafi 1, 4.1 e 4.2
sono dovuti alla Dott.ssa Zirilli, i paragrafi 2, 3 e 4.3 al Dott. Cicero, i paragrafi
4.4 e 5 alla Dott.ssa Alibrandi.
territorio e, di conseguenza, l’acquisizione di informazioni utili
per effettuare previsioni sul comportamento dei sistemi colturali.
La durata della bagnatura fogliare rappresenta un parametro
fondamentale per lo sviluppo di numerose malattie fungine.
Infatti la presenza di un velo di acqua sulla superficie delle foglie
permette il movimento e la germinazione delle spore dei
microrganismi fungini e la loro penetrazione all'interno dei
tessuti dell'ospite, determinando quindi l’avvio del processo
infettivo (Orlandini et al., 2005). La conoscenza di tali rapporti,
analizzata per mezzo di modelli di simulazione, può
rappresentare un elemento importante per la razionalizzazione
delle tecniche di difesa dalle malattie. La misura della durata
della bagnatura presenta, però, numerose difficoltà legate al
posizionamento del sensore, ai materiali costruttivi, alla tecnica
di rilevazione della presenza di acqua libera. Per superare,
almeno in parte, tali ostacoli, i metodi di stima possono
rappresentare strumenti di sicuro interesse. Questi ultimi, che si
possono basare su modelli fisici od empirici, permettono di
determinare la durata della bagnatura fogliare a partire da altre
variabili climatiche misurate sul campo. In questo ambito anche
il radar può fornire un importante supporto, consentendo di
creare mappe di precipitazioni utilizzabili per la stima dei periodi
di bagnatura fogliare. La stima può essere effettuata attraverso
l’ausilio di metodi classici e di metodi alternativi. Nei metodi
classici i dati di bagnatura fogliare, provenienti da una rete di
stazioni meteorologiche, vengono spazializzati secondo diverse
metodologie geostatistiche. Purtroppo alcuni dati meteorologici,
come la bagnatura fogliare dovuta alla pioggia, sono
spazialmente discontinui e quindi non sempre la loro
spazializzazione fornisce risultati sufficientemente precisi. Un
secondo problema è legato agli standard degli strumenti; infatti,
per il fenomeno della bagnatura non esistono degli strumenti di
riferimento (Sabatini et al., 2002). I metodi “alternativi”
prevedono l’uso congiunto di modelli di simulazione della
bagnatura fogliare, di misure effettuate puntualmente in una rete
di stazioni e di dati ottenuti attraverso strumenti di remote
sensing (radar e/o satellite).
2. CONTRIBUTI SCIENTIFICI SULLA BAGNATURA
FOGLIARE
La stima della bagnatura fogliare è sempre un’operazione che
comporta non pochi errori; infatti la misura del parametro può
essere influenzata negativamente da notevoli fattori, come ad
esempio la vicinanza del mare o di luoghi notevolmente
polverosi. Diversi studi sono stati condotti al fine di ottenere
modelli di simulazione atti a stimare la bagnatura fogliare in
maniera attendibile.
A tal riguardo citiamo il lavoro di Cicogna et al. (2002), che ha
come obiettivo la messa a punto e il confronto di diversi metodi
di stima della durata della bagnatura fogliare. Come input per i
modelli di simulazione sono stati utilizzati i dati provenienti sia
dalle stazioni agrometeorologiche standard sia dal radar
polarimetrico GPM-500 della regione Friuli Venezia Giulia.
In questo modo è stato possibile verificare l’attendibilità e
l’efficacia dei due diversi metodi di misurazione. Gli stessi dati,
inoltre, costituiscono l’input di una rete neurale in grado di
simulare le ore di bagnatura fogliare in base alle interazioni tra i
diversi parametri agrometeorologici. Oltre ai modelli preesistenti,
il lavoro ha previsto la costruzione e la validazione di un nuovo
modello fisico, idoneo alle specifiche condizioni del territorio.
Le ore di bagnatura fogliare, stimate con i diversi metodi, sono
state quindi confrontate con quelle misurate in campo.
Successivamente i dati simulati e i dati reali sono stati utilizzati
per creare i file di input per un modello di simulazione della
peronospora della vite. L’area di studio è stata la pianura del
Friuli Venezia Giulia, dove opera da anni una rete di stazioni
meteorologiche e, dal 1997, il radar meteorologico di Fossalan di
Grado (Bechini et al., 2001).
Il primo passo compiuto per la realizzazione del progetto è stato
quello di valicare i dati provenienti da stazioni meteorologiche e
poi interpolarli, in modo da creare una griglia di valori
agrometeorologici. Anche i dati radar sono stati valicati ma,
essendo già spazializzati, hanno direttamente costituito il
database territoriale finale. Nel progetto di studio è stato
considerato un periodo temporale specifico: 01/04/200030/09/2000 e 01/04/2001-30/09/2001. Si è visto che il radar
presentava una buona precisione nello stimare la bagnatura
fogliare dovuta alla pioggia, con un errore inferiore al 2 %.
Creato il database si è proceduto alla stima della bagnatura
fogliare (BF) attraverso l’utilizzo di 3 modelli:
• “Artificial Neural Networks” (RN) (Patterson, D.W.,
1996);
• “Dropben” (Wittich, 1993);
• “Sweb” (Magarey et al., 2005).
Dal confronto tra questi modelli è emerso che essi non solo
tendevano a sovrastimare la durata della BF e il periodo di
evaporazione, ma fornivano anche un output orario 0/1 (dry, wet)
abbastanza ambiguo. Oltre a testare modelli presenti in
bibliografia, il team di ricerca ha sviluppato un modello “in
proprio” in grado di calcolare la bagnatura fogliare risolvendo
l’equazione del bilancio energetico. Lo sforzo in questo
sottoprogetto è stato quello di riuscire a sviluppare un modello
che potesse funzionare a partire dai dati di una stazione
agrometeorologica standard. Solitamente nelle stazioni
agrometeorologiche non viene misurato un parametro importante
come la radiazione netta e questo rappresenta un grosso limite,
specialmente in condizioni di cielo coperto (Severini et al.,
2002). Infine, una volta realizzate le mappe di bagnatura fogliare
e degli altri dati meteorologici, sono stati stimati dei modelli
epidemiologici, vista l’importanza della coltura della vite in
Friuli Venezia Giulia e della forte pressione, in questo ambiente,
della Plasmopara viticola.
Tramite questo studio si è affermato che il radar polarimetrico
GPM-500 rappresenta uno strumento valido per stimare la
bagnatura fogliare dovuta a pioggia. Esso infatti può fornire delle
mappe, relative alla bagnatura fogliare dovuta alla caduta della
pioggia, molto dettagliate commettendo, verosimilmente, un
errore più piccolo di quello ricavabile spazializzando i dati delle
singole stazioni. Purtroppo, almeno i 4/5 dei casi di bagnatura
fogliare non possono essere stimati dal radar, visto che si tratta di
bagnatura dovuta al deposito della rugiada. In questo senso
diventa molto importante l’utilizzo di modelli di simulazione per
stimare il deposito di rugiada ed i relativi tempi di asciugatura
dell’acqua dalle foglie. Inoltre si rende necessaria la creazione di
un modello di bagnatura fogliare maggiormente “performante” in
presenza di copertura nuvolosa. La bontà della stima della
bagnatura fogliare ha effetti rilevanti negli output di modelli che
simulano il ciclo della Plasmopara viticola.
3. I DATI
Scopo del presente studio è quello di formalizzare, tramite
l’utilizzo dei modelli lineari generalizzati, la dipendenza della
bagnatura fogliare da una serie di variabili agrometeorologiche.
Al fine di tener conto dell’influenza esercitata dall’altitudine, si è
ritenuta opportuna la scelta di stazioni agrometeorologiche
localizzate ad altitudini differenti. Sono stati presi in esame i
sensori di 3 stazioni agrometeorologiche del Sistema Informativo
Agrometeorologico Siciliano (SIAS):
Fontecà in località Pettineo (codice 258)
Vignazza in località Cesarò (codice 246)
Panecastro in località Patti (codice 257)
Fig. 1 – Stazioni agro-meteorologiche del SIAS, fonte SIAS
Nella figura 1 sono riportati tutti i rilevatori del SIAS sul suolo
siciliano, ognuno dei quali contrassegnato da un codice.
Fig. 2 – Area delle stazioni agro-meteorologiche considerate, fonte SIAS
Dalla Fig. 2 è facile individuare le stazioni prese in
considerazione. La loro scelta non è stata casuale; infatti si è
voluto porre l’attenzione su tre località della provincia di
Messina che si trovano all’incirca sulle stesse coordinate
geografiche (latitudine e longitudine) e si collocano a tre diversi
livelli di altezza. Il rilevatore di Patti è quello situato nella zona
pianeggiante (70 mt sul livello del mare), quello di Pettineo in
ambiente collinare (210 mt sul livello del mare), quello di Cesarò
in ambiente montano (820 mt sul livello del mare); in tal modo
risulta possibile anche valutare l’influenza sulla bagnatura
fogliare da parte dell’altitudine. Per quanto riguarda il rilevatore
di Patti bisogna tenere anche in considerazione, data la vicinanza
al mare, il fattore “salsedine”, che potrebbe aver danneggiato in
qualche modo i sensori di rilevazione e alterato i dati.
Per ogni stazione sono state rilevate 7 variabili:
•
Bagnatura fogliare;
•
Temperatura dell’aria (°C media oraria);
•
Precipitazioni totali orarie;
•
Pressione atmosferica istantanea (hPa);
•
Radiazione solare totale oraria (MJ/mq);
•
Umidità relativa (% media oraria);
•
Velocità vento a 2 metri (m/s media oraria).
Esse sono state rilevate per un periodo di tempo compreso tra il
1° aprile 2009 ed il 30 settembre 2009. La scelta di tale periodo
di analisi va ricondotto alla letteratura già esistente (Cicogna et
al., 2002). In un primo luogo è stata effettuata un’analisi
descrittiva del dataset in esame: sono state calcolate misure di
livello e di dispersione (media e deviazione standard), sia relative
all’intero periodo di osservazione, sia differenziate per mese. Per
ogni variabile sono stati anche stimati gli intervalli di confidenza
per la media, al livello di significatività del 95%. Di seguito
(Tab.1) sono state riportate le statistiche descrittive per ogni
variabile rilevata. In un primo confronto tra le tre stazioni agrometeorologiche, emerge che il tempo medio maggiore di
bagnatura fogliare si ha nella stazione di Patti, con una media
pari a 19.15 minuti ogni ora. A Patti si registrano anche i
maggiori valori medi per quel che riguarda la temperatura
dell’aria, con 22.19 °C, la Pressione atmosferica con 1004.7 hPa,
essendo la zona con più bassa altitudine, la radiazione solare con
0.93 MJ/mq. Invece i maggiori valori medi di umidità relativa
(58.46 %) si rilevano nella stazione di Pettineo, mentre i valori
più alti di velocità del vento si registrano a Cesarò, la stazione
con più elevata altitudine (rispettivamente 1.20 e 2.01 m/s).
CESARÒ (VIGNAZZA)
820 mt. s.l.m
I.C. 95 %
Media
d.s.
Bagnatura fogliare
10.61
21.82
9.97
11.26
Temp. aria media oraria °C
19.65
6.71
19.45
19.85
Precipitazioni totali orarie
0.06
0.69
0.04
0.08
Pressione atmosferica istant.
917.50
3.70
917.39
917.60
Radiazione solare tot. orar.
0.90
1.10
0.87
0.93
Umidità relativa media orar.
52.80
23.25
52.11
53.49
Velocità vento 2m media
1.20
0.77
1.17
1.22
Velocità vento 10m media
2.01
1.26
1.97
2.05
Bagnatura fogliare
13.06
23.40
12.39
13.78
Temp. aria media oraria °C
21.93
5.77
21.76
22.10
Precipitazioni totali orarie
0.06
0.74
0.04
0.08
Pressione atmosferica istant.
987.37
3.61
987.27
987.48
Radiazione solare tot. orar.
0.92
1.14
0.89
0.95
Umidità relativa media orar.
58.46
20.05
57.87
59.05
Velocità vento 2m media
1.07
0.95
1.04
1.10
Velocità vento 10m media
1.75
1.24
1.72
1.79
Bagnatura fogliare
19.15
26.43
18.36
19.93
Temp. aria media oraria °C
22.19
5.61
22.03
22.36
Precipitazioni totali orarie
0.05
0.53
0.03
0.07
Pressione atmosferica istant.
1004.7
3.77
1004.6
1004.8
Radiazione solare tot. orar.
0.93
1.16
0.89
0.96
Umidità relativa media orar.
57.78
19.94
57.19
58.37
Velocità vento 2m media
0.44
0.42
0.43
0.45
Inf.
Sup.
PETTINEO (FONTECÀ)
210 mt. s.l.m
PATTI (PANECASTRO)
70 mt. s.l.m
Velocità vento 10m media
0.76
0.75
0.74
0.79
Tab. 1 – Statistiche descrittive delle variabili rilevate per località
Nella Tab. 2 vengono riportati i valori medi mensili delle
variabili rilevate dai sensori di Cesarò, Pettineo e Patti,
rispettivamente.
MESE
B. F.
Temp
Prec. Press.
Rad. Umid.
CESARÒ (VIGNAZZA)
VV2m
Aprile
21,84
11,93
0,18
917,18
0,72
71,03
0,97
Maggio
10,78
15,90
0,03
914,61
0,93
62,01
1,16
Giugno
7,28
22,54
0,06
917,37
0,95
45,92
1,21
Luglio
0,09
24,15
0,00
918,64
1,05
35,51
1,30
Agosto
2,27
24,23
0,00
917,74
0,96
40,20
1,34
Settem.
22,05
18,98
0,11
919,52
0,77 62,81
PETTINEO (FONTECÀ)
1,18
Aprile
3,17
15,33
0,06
988,59
0,79
65,62
1,01
Maggio
12,39
18,56
0,10
985,51
0,98
63,26
1,01
Giugno
14,34
23,59
0,08
986,70
1,04
62,11
0,78
Luglio
6,56
25,34
0,00
987,78
1,07
50,84
1,10
Agosto
17,29
26,32
0,00
986,38
0,89
50,00
1,24
Settem.
24,87
22,27
0,15 989,36
0,76 59,43
PATTI (PANECASTRO)
1,29
Aprile
21,60
15,96
0,04
1006,24
0,78
62,56
0,38
Maggio
19,98
19,05
0,13
1002,99
0,98
63,11
0,30
Giugno
19,55
23,51
0,05
1004,08
1,00
61,46
0,21
Luglio
13,76
25,52
0,00
1004,89
1,12
51,58
0,58
Agosto
18,74
26,36
0,00
1003,50
0,95
52,87
0,57
Settem. 21,41 22,61 0,09 1006,54 0,72 55,28 0,56
Tab. 2 – Medie mensili delle variabili rilevate dai sensori per località
Di seguito (Figg. 3-5) si riportano le percentuali dei tempi di
bagnatura fogliare mensile rilevate nelle tre diverse stazioni.
34%
34%
APRILE
MAGGIO
4%
0%
11%
17%
GIUGNO
LUGLIO
AGOSTO
SETTEMBRE
Fig. 3 – Percentuali dei tempi di bagnatura fogliare mensile – CESARÒ
4%
16%
32%
APRILE
18%
22%
MAGGIO
GIUGNO
8%
LUGLIO
AGOSTO
SETTEMBRE
Fig. 4 – Percentuali dei tempi di bagnatura fogliare mensile – PETTINEO
18%
18%
APRILE
17%
18%
12%
17%
MAGGIO
GIUGNO
LUGLIO
AGOSTO
SETTEMBRE
Fig. 5 – Percentuali dei tempi di bagnatura fogliare mensile – PATTI
4. STIMA DI GLM
4.1 Perché la scelta dei GLM?
L’approccio statistico al presente lavoro è stato finalizzato alla
stima di appropriati modelli lineari generalizzati (GLM), atti a
formalizzare la dipendenza della bagnatura fogliare dalle
variabili atmosferiche. Il ricorso a tali modelli risulta
metodologicamente giustificato in quanto la distribuzione della
variabile risposta (BF) non rispetta le assunzioni che
caratterizzano la distribuzione normale; com’è noto i GLM
consentono di rimuovere l’ipotesi di normalità e, mediante l’uso
di opportune funzioni link, permettono di esprimere la media
come combinazione lineare dei parametri di regressione
(McCullagh and Nelder, 1990). Il modello risulta essere
yi = f ( xi ' .β ) = f ( β 0 + β1 x1i + β 2 x2i + ... + β k xki )
(1)
dove f indica la funzione link utilizzata (caratterizzante ogni
modello) e β 0 + β1 x1i + β 2 x2i + ... + β k xki esprime il predittore lineare
dei parametri di regressione.
4.2 Il modello di regressione di Poisson
Inizialmente si è utilizzato il modello di regressione di Poisson,
in cui la variabile risposta è rappresentata dal conteggio dei
minuti di BF. L’evento “bagnatura fogliare” è stato considerato
come un evento raro, nell’arco della giornata, e per ogni ora sono
stati conteggiati i minuti. Assumendo, quindi, che la variabile
risposta sia una variabile di conteggio, che può assumere solo
valori interi, distribuita secondo la legge di Poisson Y~Po( ), con
P ( yi ) =
λ yi exp(−λ )
yi !
è possibile stimare il modello di regressione di Poisson; si tratta
di un modello lineare generalizzato del tipo (1) in cui la funzione
link utilizzata è il logaritmo dei conteggi, ovvero f=log(yi). In
Tab.3 sono stati riportati i risultati del modello, stimato per
ciascuna località; per ogni modello sono stati, altresì, calcolati il
test di Log-Likelihood ed il test di Shapiro-Wilks con i relativi pvalue.
CESARÒ (VIGNAZZA)
B
ES(B)
Z
Costante
-30.270
1.006
-30.082
Temper.
0.004
0.001
2.964
Press.
0.030
0.001
27.215
Radiaz.
-0.705
0.016
-42.567
Umid.
0.076
0.001
191.695
Vel.V2m
0.038
0.080
4.721
Log – Likelihood = -23312.61
p-value = 0.000
Shapiro – Wilks test: 0.850
p-value = 0.000
PETTINEO (FONTECÀ)
B
ES(B)
Z
Costante
-34.603
1.191
-29.060
Temper.
0.109
0.001
96.551
Press.
0.031
0.001
26.072
Radiaz.
-0.956
0.010
-90.960
Umid.
0.065
0.001
202.723
Vel.V2m
0.106
0.008
14.344
Log – Likelihood = -38621.92
p-value = 0.000
Shapiro – Wilks test: 0.850
p-value = 0.000
PATTI (PANECASTRO)
B
ES(B)
Z
Costante
-0.591
0.972
-0.609
Temper.
0.015
0.010
15.241
Press.
0.000
0.001
-0.042
Radiaz.
-1.808
0.021
-85.474
Umid.
0.051
0.002
171.861
Vel.V2m
0.458
0.015
30.564
Log – Likelihood = -24942.54
p-value = 0.000
Shapiro – Wilks test: 0.963
p-value = 0.000
Tab. 3 – Risultati del modello di regressione di Poisson
P value
0.000
0.003
0.000
0.000
0.000
0.000
P value
0.000
0.000
0.000
0.000
0.000
0.000
P value
0.543
0.000
0.967
0.000
0.000
0.000
per località
I modelli stimati sono tutti significativi; in particolare, per le
stazioni di Cesarò e Pettineo, tutte le variabili considerate sono
significative. Per le tre località, esiste una significativa
dipendenza inversa della bagnatura fogliare dalla radiazione
solare; diretta è, invece, la dipendenza dalla temperatura, dalla
velocità del vento e dall’umidità. In ogni caso il valore del
coefficiente b è sempre molto basso, indicando un legame
significativo ma abbastanza debole tra la bagnatura fogliare e le
covariate.
4.3 Il modello di regressione logistica ordinale
Successivamente, i tempi di bagnatura fogliare sono stati
suddivisi in classi; sono state calcolate le frequenze relative al
fine di ottenere un range di variazione tra 0 ed 1; si è poi
proceduto al calcolo dei percentili per categorizzare la variabile
in classi ordinate:
CATEGORIA 0
Y=0
Assenza di BF
CATEGORIA 1
0 < Y 0.50 Bassa presenza di BF
CATEGORIA 2
0.50 < Y < 1 Alta presenza di BF
CATEGORIA 3
Y=1
Tot. Presenza di BF
In Fig. 6 sono stati riportati gli istogrammi di frequenze per le tre
stazioni in esame; da essi si evince come la maggior parte delle
osservazioni sia più concentrata nelle code e meno addensata in
prossimità di valori centrali.
Fig.6 – Istogramma di frequenza per le categorie di BF per località
Essendo la “bagnatura fogliare” stata ricondotta ad una variabile
di tipo policotomico, è stato stimato un modello di regressione
logistica ordinale, che è del tipo (1) in cui la funzione link è il
logit cumulativo; indicando con y=1,2,…j la categoria di risposta
(in cui l’ordine assume rilevanza statistica), la funzione link è
data da:
f = log
π 1 + π 2 + ...π j
π j +1 + ...π j
In Tab. 4 sono stati riportati i risultati del modello, stimato per
ciascuna località; per ogni modello sono stati, altresì, calcolati il
test di Log-Likelihood con il relativo p-value, l’indice D di
Somers e l’indice Gamma di Goodman-Kruskal per la verifica
della bontà dell’adattamento.
CESARÒ (VIGNAZZA)
B
ES(B)
Z
p
O.R.
B
ES(B)
Z
p
O.R.
B
ES(B)
Z
p
O.R.
I.C. 95 %
Inf.
Sup.
Cost. 1
108.99
12.65
8.62
0.000
Cost. 2
110.07
12.65
8.70
0.000
Cost. 3
110.95
12.65
8.77
0.000
Temper.
0.069
0.017
4.17
0.93
0.90
0.96
0.000
Press.
0.103
0.014
7.50
0.90
0.88
0.93
0.000
Radiaz.
-0.417
0.106
-3.97
1.52
1.24
1.87
0.000
Umid.
0.196
0.006
29.93
0.82
0.81
0.83
0.000
VV2m
0.012
0.091
0.13
0.894
1.01
0.85
1.21
Log – Likelihood = -1575.393 P - value = 0.000
Indice D di Somers = 0.91; Indice Gamma di Goodman – Kruskal = 0.92
PETTINEO (FONTECÀ)
I.C. 95 %
Inf.
Sup.
Cost. 1
50.84
11.65
4.36
0.000
Cost. 2
51.62
11.65
4.43
0.000
Cost. 3
52.30
11.65
4.49
0.000
Temper. 0.276
0.013 21.12 0.000 0.76
0.74
0.78
Press.
0.036
0.011
3.04
0.94
0.99
0.002 0.97
Radiaz.
-1.278 0.075 -16.94 0.000 3.59
3.10
4.16
Umid.
0.149
0.004 33.08 0.000 0.86
0.85
0.87
VV2m
0.285
0.072
3.97
0.75
0.65
0.87
0.000
Log – Likelihood = -2419.011
P - value = 0.000
Indice D di Somers = 0.81; Indice Gamma di Goodman – Kruskal = 0.82
PATTI (PANECASTRO)
I.C. 95 %
Inf.
Sup.
Cost. 1
38.93
13.14
2.96
0.003
Cost. 2
40.58
13.14
3.09
0.002
Cost. 3
42.16
13.14
3.21
0.001
Temper. 0.057
0.014
4.07
0.92
0.97
0.000 0.94
Press.
0.022
0.013
1.68
0.093 0.95
0.95
1.00
Radiaz.
-2.468 0.168 -14.66 0.000 11.80
8.48
16.41
Umid.
0.256
0.008 33.91 0.000 0.77
0.76
0.79
VV2m
2.609
0.177 -14.76 0.000 0.77
0.05
0.10
Log – Likelihood = -1643.812 P - value = 0.000
Indice D di Somers = 0.94; Indice Gamma di Goodman – Kruskal = 0.93
Tab. 4– Risultati del modello di regressione logistica ordinale per località
I risultati ottenuti mostrano come, nelle tre località, tutte le
variabili siano altamente significative (p-value<0.01); fanno
eccezione la velocità del vento per quanto riguarda la stazione di
Cesarò (Vignazza) e la pressione per la stazione di Patti
(Panecastro). In tale modello si evidenzia come, rispetto al
modello di Poisson precedentemente stimato, si mantenga
invariata la direzionalità della dipendenza della variabile risposta
dalle covariate.
Per le tre località il test di Log-Likelihood è risultato
significativo e gli indici di associazione di Somers e di
Goodman-Kruskal hanno fornito valori elevati, indicando quindi
una buon adattamento del modello teorico ai dati empirici.
4.4 Il modello di regressione logistica binaria
Nella ricerca di adeguati modelli statistici atti a formalizzare la
dipendenza della bagnatura fogliare dalle variabili
agrometeorologiche, si è fatto ricorso anche al modello logistico
binario in cui, come è noto, la variabile risposta è di tipo
dicotomico o binomiale; la sua funzione di densità è
riconducibile alla (1) con distribuzione di Y~bin(n; ) e la
funzione link usata è di tipo logit binomiale:
f = ln
πi
ni − π i
La variabile “bagnatura fogliare” è stata opportunamente
dicotomizzata, assumendo valore 0 in caso di totale assenza ed il
valore 1 in caso anche di parziale presenza. I risultati ottenuti
dalla stima del modello per le tre stazioni considerate sono stati
riportati nella Tab. 5.
CESARÒ (VIGNAZZA)
P
I.C. 95 %
B
ES(B)
Z
O.R.
value
Inf.
Sup.
Costante
-71.27
14.99
-4.75
0.000
Temper.
0.065
0.019
3.37
1.07
1.03
1.11
0.001
Press.
0.062
0.016
3.85
1.06
1.03
1.10
0.000
Radiaz.
-0.242
0.103
-2.34
0.79
0.64
0.96
0.019
Umid.
0.181
0.007
24.18
1.20
1.18
1.22
0.000
VV2m
-0.043
0.105
-0.41
0.684
0.96
0.78
1.18
Log – Likelihood = -885.842
p-value = 0.000
Shapiro – Wilks test: 0.757
p-value = 0.000
Indice D di Somers = 0.92; Indice Gamma di Goodman – Kruskal = 0.93
PETTINEO (FONTECÀ)
P
I.C. 95 %
B
ES(B)
Z
O.R.
value
Inf.
Sup.
Costante
-36.55
13.05
-2.80
0.005
Temper.
0.266
0.015
18.11
1.31
1.27
1.34
0.000
Press.
0.021
0.013
1.60
0.109
1.02
1.00
1.05
Radiaz.
-1.151
0.077
-14.97 0.000
0.32
0.27
0.37
Umid.
0.151
0.005
29.05
1.16
1.15
1.17
0.000
VV2m
0.324
0.078
4.13
1.38
1.19
1.61
0.000
Log – Likelihood = -1361.28
p-value = 0.000
Shapiro – Wilks test: 0.892
p-value = 0.000
Indice D di Somers = 0.84; Indice Gamma di Goodman – Kruskal = 0.85
PATTI (PANECASTRO)
P
I.C. 95 %
B
ES(B)
Z
O.R.
value
Inf.
Sup.
Costante
-8.78
18.09
-0.49
0.628
Temper.
-0.008 0.019
-0.45
0.654
0.99
0.96
1.03
Press.
-0.007 0.012
-0.38
0.703
0.99
0.96
1.03
Radiaz.
-1.699 0.149
-11.34 0.000
0.18
0.14
0.25
Umid.
0.254
0.011
23.27
1.29
1.26
1.32
0.000
VV2m
2.335
0.228
10.24
10.33 6.61
16.14
0.000
Log – Likelihood = -689.206
p-value = 0.000
Shapiro – Wilks test: 0.682
p-value: 0.000
Indice D di Somers = 0.96; Indice Gamma di Goodman – Kruskal = 0.97
Tab. 5 – Risultati del modello di regressione logistica binaria per località
Dalla stima del modello di regressione logistica binaria sono stati
ottenuti risultati similari a quelli ottenuti con il precedente
modello. Per la stazione di Cesarò, tutte le variabili considerate
risultano altamente significative, fatta eccezione per la velocità
del vento. La direzionalità dei legami di dipendenza non si
discosta da quella attesa; si ha, infatti, una dipendenza diretta
della bagnatura fogliare dalla temperatura, dalla pressione e
dall’umidità, mentre inversa è quella dalla radiazione solare. Per
la stazioni di Pettineo, tra le variabile agrometeorologiche, solo la
pressione atmosferica risulta non significativamente influente
sulla BF. Nella stazione di Patti, invece, si ha la significatività di
sole tre variabili, la radiazione solare, l’umidità relativa e la
velocità del vento.
Per tutte e tre le località, il modello di regressione logistica
binario risulta adeguato, dato il basso valore del test di Loglikelihood e la sua alta significatività; significativo risulta anche
il test di Shapiro Wilks; inoltre, l’elevato valore assunto dagli
indici di associazione di Somers e di Goodman-Kruskal denotano
un buon grado di adattamento del modello ai dati.
Nell’esaminare i risultati forniti dai differenti modelli va
considerata la presenza di una variabile cosiddetta “latente”,
ossia l’altitudine, che probabilmente gioca un ruolo influente nel
determinare variazioni dei valori di bagnatura fogliare. In
particolare il sensore di Patti è localizzato appena a 70 metri sul
livello del mare e la salsedine potrebbe rappresentare un fattore
di disturbo nella rilevazione delle variabili agrometeorologiche.
Dal confronto dei risultati ottenuti dall’uso dei differenti GLM è
possibile affermare come, dal punto di vista statistico, il modello
migliore sembrerebbe essere quello della regressione logistica
binaria che, relativamente ad ogni località, presenta i valori più
bassi del test di Log-Likelihood, indicando una migliore
adeguatezza ai dati.
5. CONCLUSIONI
Dall’analisi statistica condotta sui dati di bagnatura fogliare
rilevati nelle tre stazioni in esame (Cesarò, Pettineo, Patti),
localizzate a diverse altitudini, sono state riscontrate delle
differenziazioni, riconducibili all’influenza esercitata dal fattore
“altitudine”.
Da un punto di vista statistico descrittivo, la bagnatura fogliare
risulta maggiore a Patti, sul livello del mare, in concordanza con
una maggiore temperatura, una maggiore pressione e una
maggiore umidità; la velocità del vento risulta, invece, maggiore
nella stazione di Cesarò.
L’applicazione e, conseguentemente la stima, di diversi modelli
lineari generalizzati ha condotto ad interessanti risultati. La
temperatura, la velocità del vento e la pressione esercitano una
significativa influenza diretta sulla BF, contrariamente a quanto
accade per la radiazione solare, la cui influenza è inversa. Il
modello che presenta il maggior numero di variabili significative
è il modello di Poisson. Sia per la stazione di Cesarò che per
quella di Pettineo, tutte le covariate inserite nel modello sono
significative ed il test di Shapiro Wilks risulta prossimo all’unità.
Il modello applicato ai dati di Patti, invece, evidenzia la non
significatività della pressione atmosferica ed una maggiore
influenza della radiazione solare, così come si può desumere
dall’elevato valore del coefficiente ad essa associato. Risultati
similari sono stati ottenuti anche dalla stima degli altri due
modelli lineari generalizzati, quello di regressione logistica
ordinale e quello di regressione logistica binaria. Nonostante la
perdita di informazione dovuta al processo di categorizzazione
(logistica ordinale) e di dicotomizzazione (logistica binaria) dei
valori di bagnatura fogliare, i modelli hanno ben fittato i dati.
Nei modelli di regressione logistica, sia ordinale che binaria, la
velocità del vento a 2 metri per la stazione di Cesarò è risultata
non significativamente influente sulla BF. Nella stazione di Patti
la variabile “pressione atmosferica” è risultata un fattore non
significativo, così come evidenziato dall’applicazione dei tre
modelli.
Pertanto, sulla base dei risultati ottenuti, è possibile affermare
che la variabile meno predittiva della BF ad altitudine maggiore è
la temperatura; ad altitudine inferiore è, invece, la pressione
atmosferica. Dal confronto degli indici di Log-Likelihood il
modello migliore essere quello della regressione logistica binaria,
che presenta i valori più bassi, anche se non il maggior numero di
predittori significativi.
Il presente lavoro ha voluto evidenziare come i modelli lineari
generalizzati rappresentino uno strumento idoneo a modellare al
meglio la relazione di dipendenza tra la bagnatura fogliare e le
altre covariate. L’ottica di tale studio va ricondotta
all’importanza che il parametro “bagnatura fogliare” assume
nello sviluppo di numerose malattie fungine; il suo monitoraggio
rappresenta, quindi, un fattore fondamentale per il controllo della
“salute” delle piante. Allo scopo di rendere maggiormente
competitiva l’agricoltura è importante la conoscenza di valide
informazioni, fornite dall’uso di adeguati modelli statistici e
dall’applicazione del telerilevamento della bagnatura fogliare e
delle altre variabili agrometeorologiche.
BIBLIOGRAFIA
• Bechini R., Gorgucci E., Scarchilli G., Dietrich S. (2001), The
operational weather radar of Fossalan di Grado (Gorizia, Italy):
accuracy of reflectivity and differential reflectivity measurements
meteorol. Atmos. phys 79.
• Cicogna, A. Dalla Marta, R.Alilla, S. Dietrich, R. Fabbo, M. Gani,
R. Giovanardi, G. Maracchi, S. Orlandini, M. Sandra, M. Severini
(2002), Uso del parametro di bagnatura fogliare nella previsione delle
malattie delle piante, SIAS Regione Sicilia.
• Magarey, R.D., Russo, J.M., Seem, R.C., Gadoury, D.M. (2005).
Surface wetness duration under controlled environmental conditions.
Agric. For. Meteorol., 128 (1–2), 111–122,
• McCullagh, P., Nelder J. A. (1990), Generalized Linear Models. New
York: Chapman & Hall.
• Patterson D. (1996), Artificial Neural Networks. Singapore: Prentice
Hall.
• Orlandini S., Dietrich S., Magarey r. D., Zanchi C. A. (2005). Leaf
wetness: an agrometeorological variable for the forecasting of plant
diseases. In: Leaf Wetness Duration: analisys of the
agrometeorological requirements and evaluation of new estimation
methods (a cura di. Maracchi G, Kajfez Bogatai L., Orlandini S., Dalla
Marta A., Rossi F.). Cost 718, European Union, 1-8.
• Sabatini F., Dalla Marta, Orlandini S. (2002), Sensori per la misura
della bagnatura fogliare: stato dell’arte e problematiche di impiego, in
II Giornate di studio su Metodi numerici, statistici e informatici nella
difesa delle colture agrarie e delle foreste: ricerca e applicazioni; Pisa,
20-23 maggio 2002.
• Severini M., Alilla R., Dietrich S., Orlandini S., Cossu A (2002),
Calcolo del deposito e della evapotraspirazione tramite le misure di
una stazione agrometeorologica standard. In: II Giornate di studio su
Metodi numerici, statistici e informatici nella difesa delle colture
agrarie e delle foreste: ricerca e applicazioni; Pisa, 20-23 maggio 2002.
• Wittich
K.P.
(1993),
Ansätze
zur
Abschätzung
der
Blattbenetzungsdauer.
DWD
intern
54
(Beitrage
zur
Agrarmeteorologie 1/93), Deutscher Wetterdienst. Offenbach: p.44.
Scarica

I Modelli Lineari Generalizzati per lo Studio della Dipendenza della