CLASSIFICAZIONE DI PESTICIDI ORGANICI NON-IONICI per la DISTRIBUZIONE AMBIENTALE MEDIANTE DESCRITTORI STRUTTURALI TEORICI Paola Gramatica1, Antonio Di Guardo2 ed Ester Papa1 1Unità di ricerca QSAR e di Chimica Ambientale,2Gruppo Ricerche Ambientali, Dipartimento di Biologia Strutturale e Funzionale,Università degli Studi dell’Insubria , Via J.H. Dunant 3, 21100 Varese e.mail: [email protected]; web: http://fisio.dipbsf.uninsubria.it/qsar/ INTRODUZIONE I pesticidi giocano un ruolo molto importante nel mantenere la produttività agricola, ma possono anche essere la causa di inquinamento di aria, acqua e suolo con possibili effetti nocivi sulla salute di uomini ed animali. Di notevole importanza è la possibilità di conoscere la loro distribuzione ambientale, cioè la capacità di assorbirsi nel suolo, di percolare nella falda acquifera, di volatilizzare in atmosfera. Il destino dei pesticidi nei diversi comparti è influenzato dalle proprietà chimico-fisiche degli stessi composti, in particolare la solubilità in acqua (Sw), la tendenza alla volatizzazione (tensione di vapore Vp e costante di Henry H) ed I vari coefficienti di ripartizione tra l’acqua e la materia organica (del suolo, Koc [1], o del biota, Kow). Queste proprietà sono state modellate e predette con un approccio matematico di tipo QSPR (Quantitative Structure-Property Relationships). DATI DESCRITTORI MOLECOLARI In questo lavoro è stato utilizzato in una prima fase un gruppo eterogeneo di 54 pesticidi organici non-ionici, rappresentativo dei pesticidi più diffusi e di diverse classi chimiche (acetanilidi, carbammati, dinitroaniline, organoclorurati, organofosfati, feniluree e triazine), per i quali sono stati ricavati dalla letteratura i dati sperimentali di cinque proprietà chimicofisiche di interesse ambientale (LogKoc [1], LogKow, LogH, LogVP, LogSol). Nella seconda fase del lavoro si è esteso lo studio ad un più consistente numero di pesticidi organici (135), analizzandone la distribuzione ambientale secondo le 5 proprietà chimico fisiche mediante l’analisi delle componenti principali. La struttura molecolare dei composti studiati viene descritta calcolando per ciascun composto un numero elevato di descrittori molecolari (oltre 1400) utilizzando il software DRAGON [2] di Todeschini et al. I descrittori con valori costanti e una coppia di variabili correlate ( correlazione = 1) vengono esclusi dalla matrice dei descrittori. La tipologia delle variabili considerate per la descrizione delle caratteristiche chimiche dei composti è: OD: Descrittori Costituzionali (conteggio degli atomi) 1D: Descrittori empirici, frammenti, proprietà e gruppi funzionali 2D: Descrittori di autocorrelazione, topologici, walk count, BCUT e indici Galvez 3D: Descrittori geometrici, di carica, di aromaticità, profili molecolari di Randic, WHIM, GETAWAY, RDF e 3D-MoRSE CLUSTER ANALISI sulle PROPRIETA’ CHIMICO FISICHE ANALISI ESPLORATIVA, RANKING E CLASSIFICAZIONE P C A S U L L E P R O P R IE T A 'C H IM IC O F IS IC H E D I5 4P E S T IC ID I C u m .E .V .=9 4 .6 % (P C 1=7 0 .1 % ) L’analisi esplorativa delle proprietà chimico fisiche dei 54 pesticidi è stata effettuata con 2 diverse tecniche di analisi multivariata: l’analisi dei Clusters e 4 l’Analisi delle 1=S o lu b leco m p . 2=M ed iu mco m p . 3=V o latileco m p . 4=S o rb edco m p . 1 0 3 1 5 4 C L A3 4 2 2 4 0 Componenti Principali (PCA). Queste tecniche consentono di raggruppare i composti 1 2 2 1 PC2 studiati in 4 classi a priori (assorbiti, solubili, volatili, intermedi) in funzione della loro 1 1 3 3 3 1 6 N. OBJ. NOMODEL E.R.% CART KNN (K=1) LDA RDA (=0.25 =0) 54 54 54 54 E.R.% cv E.R.% 62.96 62.96 62.96 62.96 11.11 / 16.67 14.81 2 1 2 2 2 4 2 9 2 5 3 5 2 6 C L A2 5 2 -3 2 3 C L A4 -1 1 3 5 P C 1 MOLEC. DESCRIPTORS MW – BAL - nHD MW – BAL - nHD MW – BAL - nHD MW – BAL - nHD 22.22 16.67 24.07 16.67 1 8 5 4 3 6 5 0 2 8 7 5 44 64 PRESTAZIONI DEI MODELLI DI CLASSIFICAZIONE METHOD 3 8 4 8 4 5 5 1 -3 -5 1: Soluble comp. 2: Medium comp. 3: Volatile comp. 4: Sorbed comp. 1 7 3 0 14 3 9 6 -2 molecole. 2 01 9 3 1 2 7 7 3 7 3 4 95 -1 1 4 3 2 1 3 0 L A1 4 1 C diversa distribuzione nei comparti ambientali definita dalle proprietà chimico fisiche di tali 3 4 9 8 4 3 MW : Peso Molecolare ALBERO DI CLASSIFICAZIONE BAL : Indice di connettività di Balaban nHD : Numero di atomi donatori di legami idrogeno Con diversi metodi di classificazione come CART (Classification and regression Tree) e l’ Analisi Discriminante regolarizzata (RDA), si ottengono semplici modelli di classificazione, basati su tre soli descrittori strutturali 1D e 2D, e con buone capacità predittive ( cioè un basso errore in predizione, validato con leave-one-out, del 17-19% rispetto ad un errore del 63% in assenza di modello). Il primo scopo di questo lavoro è quello di proporre un semplice modello di classificazione che permetta di predire la distribuzione ambientale di pesticidi anche diversi da quelli in esame o addirittura non ancora sintetizzati, utilizzando descrittori molecolari teorici e metodi chemiometrici di classificazione predittivi. MW BAL 317.69 2.53 nHD 2 0.50 3 1 4 CLASSI ASSEGNATE DETERMINAZIONE degli INDICI di RIPARTIZIONE AMBIENTALE LIN e VIN La combinazione lineare mediante PCA delle proprietà chimico fisiche in esame permette di effettuare un ranking delle molecole. 5 L’analisi dei loadings evidenzia che la tendenza alla ripartizione tra acqua e materia organica del suolo o del biota appare chiaramente 3 4 lo g V P 2 4 3 misurabile dalla prma componente principale (PC1score), mentre la tendenza a volatilizzare dalla seconda componente (PC2 score). I lo g H 5 5 1 4 9 VIN assorbiti dal terreno (o biota), nel caso di PC1 denominata LIN, e indice di tendenza alla volatilizzazione nel caso di PC2, denominata g K o w 0 lo 5 0 5 2 lo g K o c -1 5 1 -2 VIN. Il modellamento dei due indici in un approccio QSPR (Quantitative Structure-Property Relationship) [3] si ottiene effettuando una 9 2 1 2 2 2 6 1 6 2 2 due scores vengono quindi considerati come indice della tendenza a percolare in acque di falda (leaching) o viceversa ad essere 1 9 1 1 3 0 3 6 8 4 7 0 9 1 8 9 3 7 2 0 7 5 8 53 3 1 0 9 7 63 7 8 6 6 1 86 5 8 4 0 7 2 4 2 7 9 1 0 2 5 6 4 7 3 7 0 5 6 5 6 7 39 1 9 4 4 8 6 3 lo g S w 4 4 1 6 4 1 3 2 9 92 3 8 7 4 2 7 6 7 4 5 6 2 3 4 8 7 3 8 1 5 9 6 1 4 2 1 8 2 9 0 8 1 1 2 2 6 1 8 3 1 1 0 3 9 2 5 3 5 9 8 1 1 1 3 7 7 3 2 1 8 1 2 6 8 9 7 5 1 1 9 1 2 3 1 2 1 0 3 9 3 1 1 1 1 1 6 1 2 97 1 0 09 8 8 1 8 6 1 1 0 4 1 1 7 5 46 3 1 1 1 2 7 1 2 1 1 4 3 1 5 7 2 0 8 59 1 2 0 8 6 0 1 3 0 1 3 5 1 0 7 0 61 1 5 1 2 1 1 4 6 9 5 1 3 4 4 3 4 4 1 0 1 1 2 4 1 1 2 8 7 1 2 5 1 0 8 1 3 3 1 0 1 3 2 9 -3 2 5 Regressione Lineare Multipla ai minimi quadrati ordinari (MLR-OLS), utilizzando un ampio set di descrittori molecolari teorici, ed un -5 -5 efficace metodo di selezione delle variabili veramente predittive, l’Algoritmo Genetico (GA). -3 -2 -1 0 del composto (ASP, asphericity). In paricolar modo nel modello LIN la polarizzabilità della 3 6 8 4 7 0 9 1 8 9 2 3 8 05 7 5 3 3 2 1 0 9 97 7 6 8 6 6 5 55 1 8 4 0 3 6 8 7 2 4 2 9 9 1 0 2 4 73 5 6 7 7 1 0 5 6 5 6 7 3 9 4 4 8 6 3 4 1 9 4 1 9 6 44 3 2 9 2 8 3 7 4 2 7 6 7 4 5 6 2 3 4 8 7 3 8 9 6 5 1 41 2 1 8 2 9 0 8 1 1 2 2 1 6 1 8 3 1 0 5 0 3 9 5 3 2 5 95 21 8 7 1 3 7 1 3 2 1 1 1 2 8 6 9 7 5 8 1 1 9 1 2 3 1 2 1 0 3 9 31 1 1 1 1 6 1 2 9 Y r e sp o n 7 1 1 6 9 8 8 8 6 1 0 4 5 4 1 1 7 3 1 2 7 1 2 4 1 3 1 1 5 7 2 0 8 5 1 2 0 9 8 01 1 3 0 6 5 1 0 73 5 1 1 0 6 1 1 5 4 1 2 1 6 9 5 4 1 3 4 4 4 1 0 1 1 2 4 1 2 8 1 2 51 0 8 1 3 3 1 0 1 3 molecola rappresentata dal descrittore Ms sembra essere un parametro determinante nel definire la tendenza della molecola all’assorbimento o al leaching nel terreno, come pure la dimensione molecolare rappresentata invece dai contatori. Nel modello VIN la variabile 0 -2 5 5 5 0 predominante è HY, correlata alla presenza di gruppi OH, di conseguenza la possibilità di creare 2 5 5 6 7 7 8 2 3 6 6 2 1 1 0 2 6 3 3 2 1 1 7 9 11 2 7 3 4 1 1 58 1 0 5 1 0 4 1 3 1 3 5 9 6 1 4 1 0 6 3 69 1 0 0 3 1 0 90 7 3 1 6 461 3 1 1 8 1 3 4 3 1 2 1 2 1 3 2 1 0 7 5 7 1 1 1 3 4 3 4 7 01 1 1 3 2 02 5 0 1 1 2 8 1 8 6 7 7 9 4 1 2 2 2 2 5 9 1 2 9 1 2 0 1 1 1 1 71 3 5 1 1 2 6 1 5 1 2 6 7 6 1 1 9 1 9 8 3 1 2 3 1 3 1 1 1 2 4 4 7 2 2 7 6 5 4 3 1 0 8 1 1 6 9 8 1 6 8 4 3 0 82 8 8 2 1 1 2 8 58 0 9 9 2 48 7 4 5 6 6 8 7 5 9 38 1 8 9 6 1 3 3 0 3 92 9 4 5 6 9 6 2 4 1 4 64 8 23 1 0 0 5 4 6 0 4 0 5 7 4 8 5 3 3 7 4 7 9 5 2 LIn experimental VIn experimental 1 7 -2 4 9 7 1 2 5 7 3 5 8 8 7 1 6 0 2 8 1 4 2 6 2 1 6 presenza di gruppi funzionali (nNO2), di anelli nella struttura molecolare (nCIC) e alla geometria 2 4 1 9 9 2 1 1 3 0 2 2 -4 L IN In entrambi i modelli i descrittori selezionati sono relativi a parametri strutturali (nS, nX), alla 4 4 -4 9 0 7 7 9 3 1 9 2 2 4 95 5 1 -4 -4 -4 -2 0 2 4 dei legami idrogeno intermolecolari sembra essere una proprietà correlata alla volatilizzazione -4 -2 0 2 4 6 L Inc a lc u la te d V Incalcu lated VIN= 2.35-1.58HY-0.230Cv-0.28nBM-0.40nCIC -1.42ASP+0.971IVDE R2=77.1% Q2=74.1% Q2LMO=72.6% potenziale delle molecole. LIN= -3.04--0.96nX-2.28nNO2+3.42Ms-1.74ICR--0.45nS CONCLUSIONI R2=87.0% Q2=85.8% Q2LMO=85.7% L’applicazione di questi semplici modelli QSPR consente di prevedere dalla sola struttura molecolare , quindi prima ancora della sintesi, la tendenza dei pesticidi (ma anche di altri composti organici) a ripartirsi nei diversi comparti ambientali e costituisce quindi un valido metodo di approccio modellistico alla stima del rischio. Il lavoro è stato realizzato con i fondi della Comunità Europea (progetto BEAM-EVK1-CT-1999-00012). RIFERIMENTI BIBLIOGRAFICI: [1] Gramatica, P., Corradi, M. and Consonni, V., 2000. Modeling and prediction of soil sorption coefficients of non-ionic organic pesticides by molecular descriptors. Chemosphere, 41, 763-777. [2] Todeschini, R. and Consonni, V., 2000. DRAGON – Milano Chemometrics and QSAR Research Group. Free download available at: http://www.disat.unimib.it/chm. [3] Gramatica, P. e Di Guardo, A., 2002. Screening of pesticides for environmental partitioning tendency, Chemosphere 47,947-956.