ANALISI CONFORMAZIONALE Analisi conformazionale Le proprietà chimiche, fisiche e biologiche di una molecola dipendono spesso dalle strutture tridimensionali, o conformazioni, che questa può adottare. L’analisi conformazionale è lo studio delle conformazioni di una molecola e della loro influenza sulle sue proprietà. Le conformazioni di una molecola sono tradizionalmente definite come arrangiamenti dei suoi atomi nello spazio che si possono interconvertire fra loro semplicemente con la rotazione attorno ad uno o più legami. Questa definizione è spesso utilizzata in maniera meno stringente perché piccole distorsioni negli angoli di legame e nelle lunghezze di legame spesso accompagnano cambiamenti conformazionali. Inoltre tali rotazioni possono avvenire intorno a legami che si trovano in sistemi coniugati e che hanno un ordine tra il primo e il secondo. Un componente chiave dell’analisi conformazionale è conformazionale, che ha come obiettivo l’identificazione “preferite” di una molecola, quelle conformazioni che comportamento. Questo di solito richiede l’individuazione corrispondenti a punti di minimo della superficie d’energia. la ricerca (search) delle conformazioni ne determinano il delle conformazioni Analisi conformazionale I metodi di minimizzazione dell’energia giocano quindi un ruolo cruciale nell’analisi conformazionale. Abbiamo già visto che un’importante caratteristica dei metodi di minimizzazione dell’energia è la loro capacità di muoversi verso il punto di minimo più vicino alla struttura iniziale. Per questa ragione è necessario avere un algoritmo separato che generi le strutture di partenza per le successive minimizzazioni. Anche se teoricamente è possibile identificare tutte le conformazioni a minima energia sulla superficie, il numero dei minimi può essere così grande che è praticamente impossibile considerarli tutti. Inoltre nessun algoritmo ci garantisce che abbiamo realmente trovato il minimo globale. Ma vogliamo solo il minimo globale? Struttura attiva Minimo più popolato Minimo globale Analisi conformazionale In queste circostanze di solito si cerca di trovare il maggior numero di minimi accessibili. L’insieme delle conformazioni ottenute mediante la ricerca può essere ulteriormente caratterizzato mediante metodi statistici. In questo caso la frazione xi della conformazione i in una miscela all’equilibrio è data dalla distribuzione di Boltzmann: Ei exp ni RT xi N N Ej exp j 1 RT R= costante dei gas ni = numero di molecole aventi conformazione i-esima N = numero totale di molecole Ei = energia molare della conformazione i-esima T = temperatura Le proprietà molecolari all’equilibrio possono essere ottenute facendo la media in base alla distribuzione di Boltzmann delle proprietà delle conformazioni individuali. Se p è la proprietà che vogliamo: n p xi pi i 1 Esempio: momento di dipolo Conformero 1 2 3 4 Energia relativa (kJ/mol) 0 1 2 3 % 41 28 19 12 momento di dipolo (debye) 1,4 2,7 3,8 1,9 momento di dipolo 0.41 1.4 0.28 2.7 0.19 3.8 0.12 1.9 2.28 Media di Boltzmann e ricerca conformazionale La media di Boltzmann è esatta Le approssimazioni vengono dal set di conformazioni che viene preso in considerazione Per avere una buona analisi conformazionale dobbiamo prendere in considerazione almeno tutte le conformazioni energeticamente accessibili Analisi conformazionale I metodi di ricerca conformazionale possono essere divisi in varie categorie: 1. algoritmi di ricerca sistematica 2. metodi di costruzione di modelli (model-building) 3. approcci stocastici random 4. dinamica molecolare Analisi conformazionale Metodi sistematici Come suggerisce il nome, una ricerca sistematica esplora lo spazio conformazionale facendo regolari e prevedibili cambiamenti sulle conformazioni. La più semplice ricerca conformazionale sistematica, chiamata anche grid search (ricerca su griglia), consiste nei seguenti passi: 1. 2. 3. 4. si identificano tutti i legami che possono ruotare nella molecola: le lunghezze di legame e gli angoli rimangono fissi. ognuno di questi legami viene sistematicamente ruotato usando un incremento fisso fino a raggiungere i 360°. tutte le conformazioni così generate sono soggette a minimizzazione dell’energia. la ricerca termina quando tutte le possibili combinazioni degli angoli di torsione sono state generate e minimizzate Analisi conformazionale: metodi sistematici Metodi sistematici: esempio Alanina di-Peptide: Minimizzazione vincolata Analisi conformazionale: metodi sistematici Il maggior inconveniente della ricerca su griglia è che il numero delle strutture generate e minimizzate cresce esponenzialmente con il numero dei legami che possono ruotare, un fenomeno conosciuto come esplosione combinatoriale. Il numero di strutture generate è dato da: 360 360 Numero di combinazio ni θ i 1 θ i N N Se l’incremento è lo stesso per ogni angolo dove i è l’incremento del diedro che è scelto per i legami ed N è il numero dei torsionali. 5 legami con 30° di incremento 248832 strutture 69 ore 7 legami con 30° di incremento circa 36 milioni di strutture 415 giorni Analisi conformazionale: metodi sistematici Eliminazione delle strutture ad alta energia 1 Torsione 1 3 valori 2 Torsione 2 2 valori Torsione 3 3 valori 3 5 11 12 6 13 14 15 4 7 16 17 18 8 19 20 21 9 22 23 Torsione 3 Torsione 1 Torsione 2 24 10 25 26 27 28 Analisi conformazionale: metodi sistematici Eliminazione delle strutture ad alta energia 1 Torsione 1 3 valori 2 Torsione 2 2 valori Torsione 3 3 valori 3 5 11 12 6 13 14 15 4 7 16 17 18 8 19 20 21 Se, ad esempio, il secondo valore della torsione 1 combinato con il primo valore della torsione 2 porta a strutture con problemi (es. ad alta energia sterica), possiamo eliminare (“potare”) tutti i nodi corrispondenti a tale combinazione. 9 22 23 24 10 25 26 27 28 Analisi conformazionale: metodi sistematici Esempio 13 torsioni: 11 nella catena lunga 2 nella catena corta Consideriamo per ogni angolo un incremento di 120° Piperonil-butossido 1.595.323 conformazioni Tagliamo quelle conformazioni in cui la distanza fra 2 idrogeni è minore di 1.5 Å e la distanza fra due atomi più pesanti (non legati) è 3 Å. 53.494 conformazioni Analisi conformazionale: metodi sistematici Eliminazione di alcune strutture in molecole cicliche Le molecole cicliche sono spesso abbastanza difficili da analizzare usando una ricerca sistematica. La strategia comune è quella di rompere l’anello, ottenendo una molecola “pseudo-aciclica” che può quindi essere trattata come una normale molecola aciclica. Quando si fa la ricerca conformazionale di molecole cicliche deve essere inclusa una verifica addizionale (lunghezze e angoli di chiusura ciclica) in grado di garantire che gli anelli siano correttamente costruiti. Esempio: cicloesano cis La chiusura ciclica non può avvenire trans Analisi conformazionale: metodi sistematici Campionamento della griglia Analisi conformazionale Metodi model-building Una maniera di limitare, almeno parzialmente, l’esplosione combinatoriale della ricerca sistematica è di usare frammenti molecolari a partire dai quali costruire le conformazioni. Con gli approcci a “costruzione da modello” all’analisi conformazionale si costruiscono le conformazioni di una molecola unendo insieme strutture tridimensionali di frammenti molecolari. Tali metodi possono essere più efficaci poiché ci sono molte meno combinazioni di valori di angoli torsionali. Ciò è particolarmente vero per frammenti ciclici che possono creare problemi nella ricerca conformazionale. Analisi conformazionale Metodi model-building . Per usare questi metodi vanno fatte alcune assunzioni: 1. 2. 3. Ogni frammento deve essere conformazionalmente indipendente dal resto della molecola. Le conformazioni a disposizione per ogni frammento devono coprire il range di strutture osservate in molecole completamente costruite. Ovviamente si possono solo analizzare molecole i cui frammenti siano disponibili. Metodi Casuali (Random) Come suggerisce il nome, in tali metodi si esplora lo spazio conformazionale partendo da una data conformazione e facendo cambiamenti del tutto casuali su di essa in una serie di step successivi che portano alla generazione di nuove conformazioni in un ordine impredittibile. Uno schema generale di ricerca conformazionale casuale consiste nei seguenti passi: 1. 2. 3. 4. 5. 6. Si sceglie una data conformazione di partenza e si inizia un ciclo iterativo. Si varia in maniera casuale la geometria di tale conformazione. Ciò può essere fatto sia variando le coordinate atomiche degli atomi che gli angoli di torsione dei legami che possono ruotare. La nuova struttura è soggetta a minimizzazione dell’energia e genera una nuova conformazione Si confronta tale conformazione con quelle dei cicli precedenti (RMSD) e se essa non è stata già trovata viene aggiunta alla lista delle conformazioni. Si sceglie una conformazione di partenza per il ciclo successivo e si torna al punto 2. La ricerca termina quando viene verificato un opportuno criterio di terminazione. Schema generale di ricerca casuale Conformazione di partenza Prendi conformazione iniziale Genera una nuova struttura aggiungendo valori casuali (x,y,z) a ciuascuna coordinata cartesiana Genera una nuova struttura ruotando casualmente attorno ad angoli di torsione scelti a caso Minimizza No Già generata? Aggiungi alla lista delle conformazioni Si Finito? Si Stop No Determina la conformazione per la prossima iterazione Vari approcci possibili Scelta della conformazione per l’iterazione successiva • • • • • Conformazione dell’ultimo ciclo Scelta casualmente fra quelle generate nei cicli precedenti La meno utilizzata fra quelle generate nei cicli precedenti Quella di più bassa energia fra le generate nei cicli precedenti Scelta col criterio Monte Carlo - Metropolis Criterio di terminazione • Dopo un numero di cicli predefinito • Fino a che nessuna nuova struttura viene generata In un metodo sistematico la procedura ha una fine definita In un metodo casuale non la procedura non ha termine e non si è mai assolutamente certi che tutte le conformazioni di bassa energia siano state trovate Monte Carlo Multiple Minimum (MCMM) La scelta della conformazione per l’iterazione successiva è basata sul criterio Monte Carlo Metropolis La conformazione dell’ultimo ciclo, n ,è accettata come conformazione di partenza del ciclo successivo, n+1, se: • La sua energia è inferiore a quella del ciclo precedente En < En-1 • La sua energia è superiore a quella del ciclo precedente En > En-1 ma il fattore di Boltzmann della differenza di energia: exp[-(En - En-1 )/RT] è maggiore di un numero scelto casualmente fra 0 e 1 In caso contrario per il ciclo successivo si mantiene come conformazione iniziale quella del ciclo precedente (già usata per l’ultimo ciclo n) Systematic Unbound Multiple Minimum (SUMM) Combinazione di ricerca sistematica e casuale Si procede come segue: 1. 2. 3. 4. 5. Si seleziona una conformazione iniziale Si variano casualmente gli angoli torsionali di valori predefiniti, dapprima grandi (120o) e poi in successione sempre più piccoli (60o, 30o,...) Si minimuzza la nuova geometria ottenendo una nuova conformazione Si controlla l’eventuale duplicazione della conformazione ottenuta con quelle dei cicli precedenti Si torna al punto 1 fino a che si trovano nuove conformazioni Analisi conformazionale Geometrie di partenza generate sistematicamente o casualmente Minimizzazione dell’energia Eliminazione dei duplicati Scelta di una struttura rappresentativa per ogni minimo Analisi conformazionale Confrontro tra diversi conformeri: RMSD Il fitting è la procedura attraverso cui due o più conformazioni della stessa o di diverse molecole sono orientate nello spazio in maniera che atomi o gruppi funzionali particolari siano sovrapposti uno sull’altro in maniera ottimale. Un algoritmo di fitting molecolare richiede una misura numerica della “differenza” tra due strutture disposte nello spazio. La misura più usata è quella della root-mean-square-distance (RMSD) tra coppie di atomi: N atomi RMSD 2 d i i 1 N atomi dove Natomi è il numero di atomi totale e di è la distanza tra le coordinate dell’atomo i nelle due strutture sovrapposte. Occorre trovare l’orientazione relativa delle due conformazioni tale che la RMSD sia minima. Analisi conformazionale Confrontro tra diversi conformeri. A volte occorre prendere in considerazione anche possibili strutture che apparentemente differiscono per ragioni di simmetria. 1 1 2 3 3 2 4 5 5 4 CH 2 CH 2 H2N CH C O OH H2N CH C O OH Analisi conformazionale Confrontro tra diversi conformeri. In maniera alternativa si può misurare la distanza tra due conformazioni in termini di angoli di torsione. Questa distanza si può calcolare come distanza Euclidea d ij N tors 2 ( ) m ,i m , j m 1 I set prodotti usando la RMSD e la distanza Euclidea possono essere abbastanza diversi. Infatti piccoli cambiamenti negli angoli di torsione nel centro della molecola possono dar luogo a grosse differenze nelle posizioni degli atomi terminali di una molecola. La RMSD produce cluster in cui le molecole hanno forma simile. Analisi conformazionale Raggruppamento di strutture simili: algoritmi di clustering La ricerca conformazionale può generare un gran numero di dati che devono essere analizzati. Molte delle conformazioni generate sono molto simili, è quindi preferibile essere in grado di selezionare dal set di dati un set di conformazioni rappresentative più piccolo. Questo può essere fatto con l’analisi di cluster che raggruppa insieme oggetti simili da cui estrarre i più rappresentativi. Raggruppare insieme oggetti simili Selezionare un componente Richiede una misura di similarità Analisi conformazionale Geometrie di partenza generate sistematicamente o casualmente Minimizzazione dell’energia Eliminazione dei duplicati Scelta di una struttura rappresentativa per ogni minimo Analisi conformazionale Metodi di clustering Agglomerative Gerarchici Divisive Relocation Nearest neighbours Non-Gerarchici Altri Single-pass Analisi conformazionale Cluster gerarchici C’è un ordine preciso in base al quale i cluster sono formati e amalgamati. Sono semplici da programmare e sono indipendenti dall’ordine in cui le conformazioni vengono assegnate ad ogni cluster. Metodi agglomerativi 1. 2. 3. 4. All’inizio ogni conformazione fa parte di un cluster diverso Si calcolano tutte le distanze fra ogni cluster. Si fondono i due cluster più simili in un unico cluster. Si ripete il punto 3 fino a che: La distanza tra tutte le coppie di cluster è maggiore di un valore prefissato. Tutti I cluster sono stati uniti in un unico cluster. Analisi conformazionale Calcolo della distanza tra due cluster Distanza minima (single linkage) Distanza massima (Complete linkage) Distanza media (Average linkage) – la più comune Analisi conformazionale Esempio 2 1 6 3 8 4 7 5 1 2 3 4 5 6 7 8 1 0.0 7.2 19.3 21.4 26.9 6.6 19.4 14.2 2 7.2 0.0 24.6 26.3 31.1 5.3 23.6 17.9 3 19.3 24.6 0.0 2.7 8.8 19.9 4.5 8.1 4 21.4 26.3 2.7 0.0 6.1 21.4 3.7 8.9 5 26.9 31.1 8.8 6.1 0.0 26.0 7.6 13.2 6 6.6 5.3 19.9 21.4 26.0 0.0 18.5 12.8 7 19.4 23.6 4.5 3.7 7.6 18.5 0.0 5.7 8 14.2 17.9 8.1 8.9 13.2 12.8 5.7 0.0 Analisi conformazionale Esempio (cont.) 2 1 6 3 8 7 Sequenza di clustering 4 5 (tra parentesi la distanza fra i cluster formati) Step number Single linkage Complete linkage Average linkage 1 2 3 4 5 6 7 3-4 (2.7) 3-4-7 (4.5) 2-6 (5.3) 2-6-1 (7.2) 3-4-7-5 (8.8) 3-4-7-5-8 (13.2) 2-6-1-3-4-7-5-8 (31.1) 3-4 (2.7) 3-4-7 (4.1) 2-6 (5.3) 2-6-1 (6.9) 3-4-7-5 (7.5) 3-4-7-5-8 (9.0) 2-6-1-3-4-7-5-8 (21.3) 3-4 (2.7) 3-4-7 (3.7) 2-6 (5.3) 3-4-7-8 (5.7) 3-4-7-8-5 (6.1) 2-6-1 (6.6) 2-6-1-3-4-7-8-5 (12.8) Analisi conformazionale Esempio (cont.) 12 Dendrogramma Numero di cluster ad ogni livello di similarità Appartenenza a ciascun cluster 2 3 8 7 8 6 1 6 10 4 5,8 4 2 5 0 3 4 7 8 5 2 6 1 Analisi conformazionale Metodi di clustering non gerarchici: “nearest neighbours” Lo svantaggio dei metodi gerarchici consiste nel fatto che occorre calcolare la matrice di similarità che ha dimensioni NxN, dove N è il numero di conformazioni trovate. Questo ne limita l’applicabilità per numeri di conformazioni molto grandi. I metodi non gerarchici superano questo problema. Il metodo “nearest neighbours” (Jarvis-Patrick) consiste nei seguenti punti: Per ogni conformazione si genera una lista delle m conformazioni ad essa più simili. Due conformazioni sono nello stesso cluster se: 1. Sono ognuno nella lista dei vicini dell’altro. 2. Hanno p (p < m) conformazioni nella lista dei vicini in comune Analisi conformazionale Esempio 2 1 6 3 8 7 4 5 Si richiede che 2 (=p) su 3 (=m) della lista dei vicini siano comuni Conformazione neighbours Si 1 2 3 4 5 6 7 8 No Nearest 2, 6, 8 1, 6, 8 4, 7, 8 3, 5, 7 3, 4, 7 1, 2, 8 3, 4, 8 3, 4, 7 Analisi conformazionale Caratteristiche del metodo Parametri Numero dei vicini nella lista. Numero dei vicini comuni. Vantaggi Computazionalmente poco pesante. Svantaggi Le conformazioni esterne in zone poco popolate tendono a raggrupparsi insieme anche se sono lontane. Cluster grandi compatti possono essere suddivisi in maniera arbitraria.