ANALISI
CONFORMAZIONALE
Analisi conformazionale
Le proprietà chimiche, fisiche e biologiche di una molecola dipendono spesso
dalle strutture tridimensionali, o conformazioni, che questa può adottare.
L’analisi conformazionale è lo studio delle conformazioni di una molecola e
della loro influenza sulle sue proprietà.
Le conformazioni di una molecola sono tradizionalmente definite come
arrangiamenti dei suoi atomi nello spazio che si possono interconvertire fra loro
semplicemente con la rotazione attorno ad uno o più legami. Questa
definizione è spesso utilizzata in maniera meno stringente perché piccole
distorsioni negli angoli di legame e nelle lunghezze di legame spesso
accompagnano cambiamenti conformazionali. Inoltre tali rotazioni possono
avvenire intorno a legami che si trovano in sistemi coniugati e che hanno un
ordine tra il primo e il secondo.
Un componente chiave dell’analisi conformazionale è
conformazionale, che ha come obiettivo l’identificazione
“preferite” di una molecola, quelle conformazioni che
comportamento. Questo di solito richiede l’individuazione
corrispondenti a punti di minimo della superficie d’energia.
la ricerca (search)
delle conformazioni
ne determinano il
delle conformazioni
Analisi conformazionale
I metodi di minimizzazione dell’energia giocano quindi un ruolo cruciale
nell’analisi conformazionale. Abbiamo già visto che un’importante caratteristica
dei metodi di minimizzazione dell’energia è la loro capacità di muoversi verso il
punto di minimo più vicino alla struttura iniziale. Per questa ragione è
necessario avere un algoritmo separato che generi le strutture di partenza per
le successive minimizzazioni.
Anche se teoricamente è possibile identificare tutte le conformazioni a minima
energia sulla superficie, il numero dei minimi può essere così grande che è
praticamente impossibile considerarli tutti. Inoltre nessun algoritmo ci
garantisce che abbiamo realmente trovato il minimo globale. Ma vogliamo solo
il minimo globale?
Struttura attiva
Minimo più popolato
Minimo globale
Analisi conformazionale
In queste circostanze di solito si cerca di trovare il maggior numero di minimi
accessibili. L’insieme delle conformazioni ottenute mediante la ricerca può
essere ulteriormente caratterizzato mediante metodi statistici.
In questo caso la frazione xi della conformazione i in una miscela all’equilibrio è
data dalla distribuzione di Boltzmann:
  Ei 
exp 

ni
 RT 
xi 

N
N
  Ej 

exp 

j 1
 RT 
R= costante dei gas
ni = numero di molecole aventi conformazione
i-esima
N = numero totale di molecole
Ei = energia molare della conformazione i-esima
T = temperatura
Le proprietà molecolari all’equilibrio possono essere ottenute facendo la media
in base alla distribuzione di Boltzmann delle proprietà delle conformazioni
individuali. Se p è la proprietà che vogliamo:
n
p   xi pi
i 1
Esempio: momento di dipolo
Conformero
1
2
3
4
Energia relativa
(kJ/mol)
0
1
2
3
%
41
28
19
12
momento di
dipolo (debye)
1,4
2,7
3,8
1,9
momento di dipolo  0.41  1.4  0.28  2.7  0.19  3.8
 0.12  1.9  2.28
Media di Boltzmann e ricerca conformazionale
La media di Boltzmann è esatta
Le approssimazioni vengono dal set di conformazioni
che viene preso in considerazione
Per avere una buona analisi conformazionale dobbiamo
prendere in considerazione almeno tutte le
conformazioni energeticamente accessibili
Analisi conformazionale
I metodi di ricerca conformazionale possono essere divisi in varie
categorie:
1. algoritmi di ricerca sistematica
2. metodi di costruzione di modelli (model-building)
3. approcci stocastici random
4. dinamica molecolare
Analisi conformazionale
Metodi sistematici
Come suggerisce il nome, una ricerca sistematica esplora lo spazio
conformazionale facendo regolari e prevedibili cambiamenti sulle
conformazioni. La più semplice ricerca conformazionale sistematica,
chiamata anche grid search (ricerca su griglia), consiste nei seguenti
passi:
1.
2.
3.
4.
si identificano tutti i legami che possono ruotare nella molecola: le
lunghezze di legame e gli angoli rimangono fissi.
ognuno di questi legami viene sistematicamente ruotato usando un
incremento fisso fino a raggiungere i 360°.
tutte le conformazioni così generate sono soggette a minimizzazione
dell’energia.
la ricerca termina quando tutte le possibili combinazioni degli angoli di
torsione sono state generate e minimizzate
Analisi conformazionale: metodi sistematici
Metodi sistematici: esempio
Alanina di-Peptide:
Minimizzazione
vincolata
Analisi conformazionale: metodi sistematici
Il maggior inconveniente della ricerca su griglia è che il numero delle
strutture generate e minimizzate cresce esponenzialmente con il
numero dei legami che possono ruotare, un fenomeno conosciuto
come esplosione combinatoriale. Il numero di strutture generate è
dato da:
360
 360 
Numero di combinazio ni  
 

θ
i 1
 θ 
i
N
N
Se l’incremento è lo stesso per ogni angolo
dove i è l’incremento del diedro che è scelto per i legami ed N è il
numero dei torsionali.
5 legami con 30° di incremento  248832 strutture  69 ore
7 legami con 30° di incremento  circa 36 milioni di strutture  415 giorni
Analisi conformazionale: metodi sistematici
Eliminazione delle strutture ad alta energia
1
Torsione 1
3 valori
2
Torsione 2
2 valori
Torsione 3
3 valori
3
5
11
12
6
13
14
15
4
7
16
17
18
8
19
20
21
9
22
23
Torsione 3
Torsione 1
Torsione 2
24
10
25
26
27
28
Analisi conformazionale: metodi sistematici
Eliminazione delle strutture ad alta energia
1
Torsione 1
3 valori
2
Torsione 2
2 valori
Torsione 3
3 valori
3
5
11
12
6
13
14
15
4
7
16
17
18
8
19
20
21
Se, ad esempio, il secondo valore della torsione 1
combinato con il primo valore della torsione 2 porta
a strutture con problemi (es. ad alta energia
sterica), possiamo eliminare (“potare”) tutti i nodi
corrispondenti a tale combinazione.
9
22
23
24
10
25
26
27
28
Analisi conformazionale: metodi sistematici
Esempio
13 torsioni: 11 nella catena lunga
2 nella catena corta
Consideriamo per ogni angolo un
incremento di 120°
Piperonil-butossido
1.595.323 conformazioni
Tagliamo quelle conformazioni in cui la distanza fra 2 idrogeni è minore di 1.5 Å
e la distanza fra due atomi più pesanti (non legati) è 3 Å.
53.494 conformazioni
Analisi conformazionale: metodi sistematici
Eliminazione di alcune strutture in molecole cicliche
Le molecole cicliche sono spesso abbastanza difficili da analizzare usando una
ricerca sistematica. La strategia comune è quella di rompere l’anello, ottenendo
una molecola “pseudo-aciclica” che può quindi essere trattata come una
normale molecola aciclica.
Quando si fa la ricerca conformazionale di molecole cicliche deve essere
inclusa una verifica addizionale (lunghezze e angoli di chiusura ciclica) in grado
di garantire che gli anelli siano correttamente costruiti.
Esempio: cicloesano
cis
La chiusura ciclica non può avvenire
trans
Analisi conformazionale: metodi sistematici
Campionamento della griglia
Analisi conformazionale
Metodi model-building
Una maniera di limitare, almeno parzialmente, l’esplosione combinatoriale
della ricerca sistematica è di usare frammenti molecolari a partire dai quali
costruire le conformazioni. Con gli approcci a “costruzione da modello”
all’analisi conformazionale si costruiscono le conformazioni di una
molecola unendo insieme strutture tridimensionali di frammenti molecolari.
Tali metodi possono essere più efficaci poiché ci sono molte meno
combinazioni di valori di angoli torsionali. Ciò è particolarmente vero per
frammenti ciclici che possono creare problemi nella ricerca
conformazionale.
Analisi conformazionale
Metodi model-building
.
Per usare questi metodi vanno fatte alcune assunzioni:
1.
2.
3.
Ogni frammento deve essere conformazionalmente indipendente dal resto
della molecola.
Le conformazioni a disposizione per ogni frammento devono coprire il
range di strutture osservate in molecole completamente costruite.
Ovviamente si possono solo analizzare molecole i cui frammenti siano
disponibili.
Metodi Casuali (Random)
Come suggerisce il nome, in tali metodi si esplora lo spazio
conformazionale partendo da una data conformazione e facendo
cambiamenti del tutto casuali su di essa in una serie di step successivi che
portano alla generazione di nuove conformazioni in un ordine impredittibile.
Uno schema generale di ricerca conformazionale casuale consiste nei
seguenti passi:
1.
2.
3.
4.
5.
6.
Si sceglie una data conformazione di partenza e si inizia un ciclo iterativo.
Si varia in maniera casuale la geometria di tale conformazione. Ciò può
essere fatto sia variando le coordinate atomiche degli atomi che gli angoli
di torsione dei legami che possono ruotare.
La nuova struttura è soggetta a minimizzazione dell’energia e genera una
nuova conformazione
Si confronta tale conformazione con quelle dei cicli precedenti (RMSD) e se
essa non è stata già trovata viene aggiunta alla lista delle conformazioni.
Si sceglie una conformazione di partenza per il ciclo successivo e si torna
al punto 2.
La ricerca termina quando viene verificato un opportuno criterio di
terminazione.
Schema generale di ricerca casuale
Conformazione di partenza
Prendi conformazione iniziale
Genera una nuova struttura
aggiungendo valori casuali (x,y,z) a
ciuascuna coordinata cartesiana
Genera una nuova struttura
ruotando casualmente attorno ad
angoli di torsione scelti a caso
Minimizza
No
Già generata?
Aggiungi alla lista delle
conformazioni
Si
Finito?
Si
Stop
No
Determina la conformazione per la prossima iterazione
Vari approcci possibili
 Scelta della conformazione per l’iterazione successiva
•
•
•
•
•
Conformazione dell’ultimo ciclo
Scelta casualmente fra quelle generate nei cicli precedenti
La meno utilizzata fra quelle generate nei cicli precedenti
Quella di più bassa energia fra le generate nei cicli precedenti
Scelta col criterio Monte Carlo - Metropolis
 Criterio di terminazione
• Dopo un numero di cicli predefinito
• Fino a che nessuna nuova struttura viene generata
In un metodo sistematico la procedura ha una fine definita
In un metodo casuale non la procedura non ha termine e non si è mai
assolutamente certi che tutte le conformazioni di bassa energia siano
state trovate
Monte Carlo Multiple Minimum (MCMM)
 La scelta della conformazione per l’iterazione successiva è basata sul
criterio Monte Carlo Metropolis
 La conformazione dell’ultimo ciclo, n ,è accettata come conformazione
di partenza del ciclo successivo, n+1, se:
• La sua energia è inferiore a quella del ciclo precedente En < En-1
• La sua energia è superiore a quella del ciclo precedente En > En-1 ma il
fattore di Boltzmann della differenza di energia:
exp[-(En - En-1 )/RT]
è maggiore di un numero scelto casualmente fra 0 e 1
 In caso contrario per il ciclo successivo si mantiene come conformazione
iniziale quella del ciclo precedente (già usata per l’ultimo ciclo n)
Systematic Unbound Multiple Minimum (SUMM)

Combinazione di ricerca sistematica e casuale

Si procede come segue:
1.
2.
3.
4.
5.
Si seleziona una conformazione iniziale
Si variano casualmente gli angoli torsionali di valori predefiniti,
dapprima grandi (120o) e poi in successione sempre più piccoli
(60o, 30o,...)
Si minimuzza la nuova geometria ottenendo una nuova
conformazione
Si controlla l’eventuale duplicazione della conformazione
ottenuta con quelle dei cicli precedenti
Si torna al punto 1 fino a che si trovano nuove conformazioni
Analisi conformazionale
Geometrie di partenza generate
sistematicamente o casualmente
Minimizzazione dell’energia
Eliminazione dei duplicati
Scelta di una struttura
rappresentativa per ogni minimo
Analisi conformazionale
Confrontro tra diversi conformeri: RMSD
Il fitting è la procedura attraverso cui due o più conformazioni della stessa o di
diverse molecole sono orientate nello spazio in maniera che atomi o gruppi
funzionali particolari siano sovrapposti uno sull’altro in maniera ottimale.
Un algoritmo di fitting molecolare richiede una misura numerica della
“differenza” tra due strutture disposte nello spazio.
La misura più usata è quella della root-mean-square-distance (RMSD) tra
coppie di atomi:
N atomi
RMSD 
2
d
 i
i 1
N atomi
dove Natomi è il numero di atomi totale e di è la distanza tra le coordinate
dell’atomo i nelle due strutture sovrapposte.
Occorre trovare l’orientazione relativa delle due conformazioni tale che la
RMSD sia minima.
Analisi conformazionale
Confrontro tra diversi conformeri.
A volte occorre prendere in considerazione anche possibili strutture che
apparentemente differiscono per ragioni di simmetria.
1
1
2
3
3
2
4
5
5
4
CH 2
CH 2
H2N
CH
C
O
OH
H2N
CH
C
O
OH
Analisi conformazionale
Confrontro tra diversi conformeri.
In maniera alternativa si può misurare la distanza tra due conformazioni in
termini di angoli di torsione.
Questa distanza si può calcolare come distanza Euclidea
d ij 
N tors
2
(



)
 m ,i m , j
m 1
I set prodotti usando la RMSD e la distanza Euclidea possono essere
abbastanza diversi. Infatti piccoli cambiamenti negli angoli di torsione nel
centro della molecola possono dar luogo a grosse differenze nelle posizioni
degli atomi terminali di una molecola. La RMSD produce cluster in cui le
molecole hanno forma simile.
Analisi conformazionale
Raggruppamento di strutture simili: algoritmi di
clustering
La ricerca conformazionale può generare un gran numero di dati che devono
essere analizzati. Molte delle conformazioni generate sono molto simili, è
quindi preferibile essere in grado di selezionare dal set di dati un set di
conformazioni rappresentative più piccolo. Questo può essere fatto con l’analisi
di cluster che raggruppa insieme oggetti simili da cui estrarre i più
rappresentativi.
Raggruppare insieme oggetti simili
Selezionare un componente
Richiede una misura di similarità
Analisi conformazionale
Geometrie di partenza generate
sistematicamente o casualmente
Minimizzazione dell’energia
Eliminazione dei duplicati
Scelta di una struttura
rappresentativa per ogni minimo
Analisi conformazionale
Metodi di clustering
Agglomerative
Gerarchici
Divisive
Relocation
Nearest neighbours
Non-Gerarchici
Altri
Single-pass
Analisi conformazionale
Cluster gerarchici
C’è un ordine preciso in base al quale i cluster sono formati e amalgamati.
Sono semplici da programmare e sono indipendenti dall’ordine in cui le
conformazioni vengono assegnate ad ogni cluster.
Metodi agglomerativi
1.
2.
3.
4.
All’inizio ogni conformazione fa parte di un cluster diverso
Si calcolano tutte le distanze fra ogni cluster.
Si fondono i due cluster più simili in un unico cluster.
Si ripete il punto 3 fino a che:
La distanza tra tutte le coppie di cluster è maggiore di un valore
prefissato.
Tutti I cluster sono stati uniti in un unico cluster.
Analisi conformazionale
Calcolo della distanza tra due cluster
Distanza minima (single linkage)
Distanza massima (Complete linkage)
Distanza media (Average linkage) – la più comune
Analisi conformazionale
Esempio
2
1
6
3
8
4
7
5
1
2
3
4
5
6
7
8
1
0.0
7.2
19.3
21.4
26.9
6.6
19.4
14.2
2
7.2
0.0
24.6
26.3
31.1
5.3
23.6
17.9
3
19.3
24.6
0.0
2.7
8.8
19.9
4.5
8.1
4
21.4
26.3
2.7
0.0
6.1
21.4
3.7
8.9
5
26.9
31.1
8.8
6.1
0.0
26.0
7.6
13.2
6
6.6
5.3
19.9
21.4
26.0
0.0
18.5
12.8
7
19.4
23.6
4.5
3.7
7.6
18.5
0.0
5.7
8
14.2
17.9
8.1
8.9
13.2
12.8
5.7
0.0
Analisi conformazionale
Esempio (cont.)
2
1
6
3
8
7
Sequenza di clustering
4
5
(tra parentesi la distanza fra i cluster
formati)
Step number Single linkage
Complete linkage
Average linkage
1
2
3
4
5
6
7
3-4 (2.7)
3-4-7 (4.5)
2-6 (5.3)
2-6-1 (7.2)
3-4-7-5 (8.8)
3-4-7-5-8 (13.2)
2-6-1-3-4-7-5-8 (31.1)
3-4 (2.7)
3-4-7 (4.1)
2-6 (5.3)
2-6-1 (6.9)
3-4-7-5 (7.5)
3-4-7-5-8 (9.0)
2-6-1-3-4-7-5-8 (21.3)
3-4 (2.7)
3-4-7 (3.7)
2-6 (5.3)
3-4-7-8 (5.7)
3-4-7-8-5 (6.1)
2-6-1 (6.6)
2-6-1-3-4-7-8-5 (12.8)
Analisi conformazionale
Esempio (cont.)
12
Dendrogramma
Numero di cluster ad ogni
livello di similarità
Appartenenza a ciascun
cluster
2
3
8
7
8
6
1
6
10
4
5,8
4
2
5
0
3 4 7 8 5 2 6 1
Analisi conformazionale
Metodi di clustering non gerarchici:
“nearest neighbours”
Lo svantaggio dei metodi gerarchici consiste nel fatto che occorre calcolare la
matrice di similarità che ha dimensioni NxN, dove N è il numero di
conformazioni trovate. Questo ne limita l’applicabilità per numeri di
conformazioni molto grandi.
I metodi non gerarchici superano questo problema.
Il metodo “nearest neighbours” (Jarvis-Patrick) consiste nei seguenti punti:
Per ogni conformazione si genera una lista delle m conformazioni
ad essa più simili.
Due conformazioni sono nello stesso cluster se:
1. Sono ognuno nella lista dei vicini dell’altro.
2. Hanno p (p < m) conformazioni nella lista dei vicini in
comune
Analisi conformazionale
Esempio
2
1
6
3
8
7
4
5
Si richiede che 2 (=p) su 3 (=m)
della lista dei vicini siano
comuni
Conformazione
neighbours
Si
1
2
3
4
5
6
7
8
No
Nearest
2, 6, 8
1, 6, 8
4, 7, 8
3, 5, 7
3, 4, 7
1, 2, 8
3, 4, 8
3, 4, 7
Analisi conformazionale
Caratteristiche del metodo
Parametri
Numero dei vicini nella lista.
Numero dei vicini comuni.
Vantaggi
Computazionalmente poco pesante.
Svantaggi
Le conformazioni esterne in zone poco popolate tendono
a raggrupparsi insieme anche se sono lontane.
Cluster grandi compatti possono essere suddivisi in
maniera arbitraria.
Scarica

Analisi Conformazionale