CLASSIFICAZIONE DI PESTICIDI ORGANICI NON-IONICI per
la DISTRIBUZIONE AMBIENTALE MEDIANTE DESCRITTORI
STRUTTURALI TEORICI
Paola Gramatica1, Antonio Di Guardo2 ed Ester Papa1
1Unità di ricerca QSAR e di Chimica Ambientale,2Gruppo Ricerche Ambientali, Dipartimento di
Biologia Strutturale e Funzionale,Università degli Studi dell’Insubria , Via J.H. Dunant 3, 21100 Varese
e.mail: [email protected]; web: http://fisio.dipbsf.uninsubria.it/qsar/
INTRODUZIONE
I pesticidi giocano un ruolo molto importante nel mantenere la produttività agricola, ma possono anche essere la causa di inquinamento di aria, acqua
e suolo con possibili effetti nocivi sulla salute di uomini ed animali. Di notevole importanza è la possibilità di conoscere la loro distribuzione
ambientale, cioè la capacità di assorbirsi nel suolo, di percolare nella falda acquifera, di volatilizzare in atmosfera. Il destino dei pesticidi nei diversi
comparti è influenzato dalle proprietà chimico-fisiche degli stessi composti, in particolare la solubilità in acqua (Sw), la tendenza alla volatizzazione
(tensione di vapore Vp e costante di Henry H) ed I vari coefficienti di ripartizione tra l’acqua e la materia organica (del suolo, Koc [1], o del biota, Kow).
Queste proprietà sono state modellate e predette con un approccio matematico di tipo QSPR (Quantitative Structure-Property Relationships).
DATI
DESCRITTORI MOLECOLARI
In questo lavoro è stato utilizzato in una prima fase un gruppo eterogeneo
di 54 pesticidi organici non-ionici, rappresentativo dei pesticidi più diffusi
e di diverse classi chimiche (acetanilidi, carbammati, dinitroaniline,
organoclorurati, organofosfati, feniluree e triazine), per i quali sono stati
ricavati dalla letteratura i dati sperimentali di cinque proprietà chimicofisiche di interesse ambientale (LogKoc [1], LogKow, LogH, LogVP,
LogSol). Nella seconda fase del lavoro si è esteso lo studio ad un più
consistente numero di pesticidi organici (135), analizzandone la
distribuzione ambientale secondo le 5 proprietà chimico fisiche mediante
l’analisi delle componenti principali.
La struttura molecolare dei composti studiati viene descritta calcolando per ciascun composto un
numero elevato di descrittori molecolari (oltre 1400) utilizzando il software DRAGON [2] di
Todeschini et al. I descrittori con valori costanti e una coppia di variabili correlate ( correlazione = 1)
vengono esclusi dalla matrice dei descrittori. La tipologia delle variabili considerate per la
descrizione delle caratteristiche chimiche dei composti è:
OD: Descrittori Costituzionali (conteggio degli atomi)
1D: Descrittori empirici, frammenti, proprietà e gruppi funzionali
2D: Descrittori di autocorrelazione, topologici, walk count, BCUT e indici Galvez
3D: Descrittori geometrici, di carica, di aromaticità, profili molecolari di Randic, WHIM, GETAWAY,
RDF e 3D-MoRSE
CLUSTER ANALISI sulle PROPRIETA’ CHIMICO FISICHE
ANALISI ESPLORATIVA, RANKING E CLASSIFICAZIONE
P
C
A
S
U
L
L
E
P
R
O
P
R
IE
T
A
'C
H
IM
IC
O
F
IS
IC
H
E
D
I5
4P
E
S
T
IC
ID
I
C
u
m
.E
.V
.=9
4
.6
%
(P
C
1=7
0
.1
%
)
L’analisi esplorativa delle proprietà chimico fisiche dei 54 pesticidi è stata effettuata con
2 diverse tecniche di analisi multivariata: l’analisi dei Clusters e
4
l’Analisi delle
1=S
o
lu
b
leco
m
p
.
2=M
ed
iu
mco
m
p
.
3=V
o
latileco
m
p
.
4=S
o
rb
edco
m
p
.
1
0
3
1
5
4
C
L
A3
4
2
2
4
0
Componenti Principali (PCA). Queste tecniche consentono di raggruppare i composti
1
2
2
1
PC2
studiati in 4 classi a priori (assorbiti, solubili, volatili, intermedi) in funzione della loro
1
1
3
3
3
1
6
N. OBJ. NOMODEL E.R.%
CART
KNN (K=1)
LDA
RDA (=0.25 =0)
54
54
54
54
E.R.% cv E.R.%
62.96
62.96
62.96
62.96
11.11
/
16.67
14.81
2
1
2
2
2
4
2
9 2
5
3
5
2
6
C
L
A2
5
2
-3
2
3
C
L
A4
-1
1
3
5
P
C
1
MOLEC. DESCRIPTORS
MW – BAL - nHD
MW – BAL - nHD
MW – BAL - nHD
MW – BAL - nHD
22.22
16.67
24.07
16.67
1
8
5
4
3
6
5
0
2
8
7
5
44
64
PRESTAZIONI DEI MODELLI DI CLASSIFICAZIONE
METHOD
3
8
4
8
4
5
5
1
-3
-5
1: Soluble comp. 2: Medium comp. 3: Volatile comp. 4: Sorbed comp.
1
7
3
0
14
3
9
6
-2
molecole.
2
01
9
3
1
2
7
7
3
7
3
4
95
-1
1
4
3
2
1
3
0
L
A1
4
1 C
diversa distribuzione nei comparti ambientali definita dalle proprietà chimico fisiche di tali
3
4
9
8
4
3
MW : Peso Molecolare
ALBERO DI CLASSIFICAZIONE
BAL : Indice di connettività di Balaban
nHD : Numero di atomi donatori di legami idrogeno
Con diversi metodi di classificazione come CART (Classification and regression Tree) e l’ Analisi Discriminante regolarizzata
(RDA), si ottengono semplici modelli di classificazione, basati su tre soli descrittori strutturali 1D e 2D, e con buone capacità
predittive ( cioè un basso errore in predizione, validato con leave-one-out, del 17-19% rispetto ad un errore del 63% in assenza di
modello).
Il primo scopo di questo lavoro è quello di proporre un semplice modello di classificazione che permetta di predire la
distribuzione ambientale di pesticidi anche diversi da quelli in esame o addirittura non ancora sintetizzati, utilizzando
descrittori molecolari teorici e metodi chemiometrici di classificazione predittivi.
MW
BAL
317.69
2.53
nHD
2
0.50
3
1
4
CLASSI ASSEGNATE
DETERMINAZIONE degli INDICI di RIPARTIZIONE AMBIENTALE LIN e VIN
La combinazione lineare mediante PCA delle proprietà chimico fisiche in esame permette di effettuare un ranking delle molecole.
5
L’analisi dei loadings evidenzia che la tendenza alla ripartizione tra acqua e materia organica del suolo o del biota appare chiaramente
3
4
lo
g
V
P
2
4
3
misurabile dalla prma componente principale (PC1score), mentre la tendenza a volatilizzare dalla seconda componente (PC2 score). I
lo
g
H
5
5
1
4
9
VIN
assorbiti dal terreno (o biota), nel caso di PC1 denominata LIN, e indice di tendenza alla volatilizzazione nel caso di PC2, denominata
g
K
o
w
0 lo
5
0
5
2
lo
g
K
o
c
-1
5
1
-2
VIN. Il modellamento dei due indici in un approccio QSPR (Quantitative Structure-Property Relationship) [3] si ottiene effettuando una
9
2
1
2
2
2
6
1
6
2
2
due scores vengono quindi considerati come indice della tendenza a percolare in acque di falda (leaching) o viceversa ad essere
1
9
1
1
3
0
3
6
8
4
7
0
9
1
8
9
3
7 2
0
7
5 8
53
3
1
0
9
7
63
7
8
6
6
1
86
5
8
4
0
7
2
4
2
7
9
1
0
2
5
6
4
7
3
7
0
5
6
5
6
7
39 1
9
4
4
8
6
3
lo
g
S
w
4
4
1
6
4
1 3
2
9
92
3
8
7
4
2
7
6
7
4
5
6
2
3
4
8
7
3
8
1
5
9
6
1
4
2
1
8
2
9
0
8
1
1
2
2
6
1
8
3
1
1
0
3
9
2
5
3
5
9
8 1
1
1
3
7
7
3
2
1
8
1
2
6
8
9
7 5
1
1
9
1
2
3
1
2
1
0
3
9
3
1
1
1
1
1
6
1
2
97
1
0
09
8
8 1
8
6 1
1
0
4 1
1
7
5
46
3
1 1
1
2
7
1
2 1
1
4
3
1
5
7
2
0
8
59
1
2
0
8
6
0
1
3
0
1
3
5
1
0
7
0
61
1
5
1
2
1 1
4
6
9
5
1
3
4
4
3
4
4
1
0
1
1
2
4 1
1
2
8
7
1
2
5
1
0
8
1
3
3
1
0
1
3
2
9
-3
2
5
Regressione Lineare Multipla ai minimi quadrati ordinari (MLR-OLS), utilizzando un ampio set di descrittori molecolari teorici, ed un
-5
-5
efficace metodo di selezione delle variabili veramente predittive, l’Algoritmo Genetico (GA).
-3
-2
-1
0
del composto (ASP, asphericity). In paricolar modo nel modello LIN la polarizzabilità della
3
6 8
4 7
0
9
1
8
9
2
3
8
05
7
5
3
3 2
1
0
9
97
7
6
8
6
6
5
55
1
8
4
0 3
6
8
7
2
4
2
9
9
1
0
2
4
73
5
6 7
7
1
0
5
6
5
6
7
3
9
4
4
8 6
3
4 1
9
4
1 9
6
44
3
2
9
2
8
3
7
4 2
7
6
7
4
5
6
2
3
4
8
7
3
8
9
6
5
1
41
2
1
8
2
9
0
8
1
1
2
2 1
6
1
8
3
1
0
5
0
3
9
5
3
2
5
95
21
8 7
1
3
7
1
3
2
1
1
1
2
8
6
9
7
5
8
1
1
9
1
2
3
1
2
1
0
3
9
31
1
1
1
1
6
1
2
9
Y
r
e
sp
o
n
7
1 1
6
9
8
8
8
6 1
0
4
5
4
1
1
7
3
1
2
7
1
2
4 1
3
1 1
5
7
2
0
8
5
1
2
0
9
8
01
1
3
0 6
5
1
0
73
5
1
1
0
6
1
1
5 4
1
2
1
6
9
5
4
1
3
4
4
4
1
0
1
1
2
4
1
2
8
1
2
51
0
8
1
3
3
1
0
1
3
molecola rappresentata dal descrittore Ms sembra essere un parametro determinante nel
definire la tendenza della molecola all’assorbimento o al leaching nel terreno, come pure la
dimensione molecolare rappresentata invece dai contatori. Nel modello VIN la variabile
0
-2
5
5
5
0
predominante è HY, correlata alla presenza di gruppi OH, di conseguenza la possibilità di creare
2
5
5
6
7
7
8
2
3 6
6
2
1
1
0
2
6
3
3
2
1
1
7
9
11
2
7
3
4
1
1
58
1
0
5
1
0
4
1
3
1
3
5
9
6
1
4
1
0
6
3
69
1
0
0
3
1
0
90
7
3 1
6
461
3
1
1
8
1
3
4 3
1
2
1
2
1
3
2
1
0
7
5
7
1
1
1
3
4
3
4
7
01
1
1
3
2
02
5
0
1
1
2
8
1
8
6
7
7
9
4
1
2
2
2
2
5
9
1
2
9
1
2
0
1
1
1
1
71
3
5
1
1
2
6
1
5
1
2
6
7
6
1
1
9
1
9
8
3
1
2
3
1
3
1 1
1
2
4
4
7
2
2
7
6
5
4
3 1
0
8
1
1
6
9
8
1
6
8
4
3
0
82
8
8 2
1
1
2
8
58
0
9
9
2
48
7
4
5
6
6
8
7
5
9
38
1
8
9
6
1
3
3
0
3
92
9
4
5
6
9
6
2
4
1
4
64
8
23
1
0
0
5
4
6
0
4
0
5
7
4
8
5
3
3
7
4
7
9
5
2
LIn experimental
VIn experimental
1
7
-2
4
9
7
1
2
5
7
3
5
8
8
7
1
6
0
2
8
1
4
2
6
2
1
6
presenza di gruppi funzionali (nNO2), di anelli nella struttura molecolare (nCIC) e alla geometria
2
4
1
9
9
2
1
1
3
0
2
2
-4
L
IN
In entrambi i modelli i descrittori selezionati sono relativi a parametri strutturali (nS, nX), alla
4
4
-4
9
0
7
7
9
3
1
9
2
2
4
95
5
1
-4
-4
-4
-2
0
2
4
dei legami idrogeno intermolecolari sembra essere una proprietà correlata alla volatilizzazione
-4
-2
0
2
4
6
L
Inc
a
lc
u
la
te
d
V
Incalcu
lated
VIN= 2.35-1.58HY-0.230Cv-0.28nBM-0.40nCIC
-1.42ASP+0.971IVDE
R2=77.1% Q2=74.1% Q2LMO=72.6%
potenziale delle molecole.
LIN= -3.04--0.96nX-2.28nNO2+3.42Ms-1.74ICR--0.45nS
CONCLUSIONI
R2=87.0% Q2=85.8% Q2LMO=85.7%
L’applicazione di questi semplici modelli QSPR consente di prevedere dalla sola struttura molecolare , quindi prima ancora della sintesi, la tendenza dei
pesticidi (ma anche di altri composti organici) a ripartirsi nei diversi comparti ambientali e costituisce quindi un valido metodo di approccio
modellistico alla stima del rischio. Il lavoro è stato realizzato con i fondi della Comunità Europea (progetto BEAM-EVK1-CT-1999-00012).
RIFERIMENTI BIBLIOGRAFICI:
[1] Gramatica, P., Corradi, M. and Consonni, V., 2000. Modeling and prediction of soil sorption coefficients of non-ionic organic pesticides by molecular descriptors. Chemosphere, 41, 763-777.
[2] Todeschini, R. and Consonni, V., 2000. DRAGON – Milano Chemometrics and QSAR Research Group. Free download available at: http://www.disat.unimib.it/chm.
[3] Gramatica, P. e Di Guardo, A., 2002. Screening of pesticides for environmental partitioning tendency, Chemosphere 47,947-956.
Scarica

No Slide Title - Università dell`Insubria