ANALISI
CONFORMAZIONALE
Analisi conformazionale
Le proprietà chimiche, fisiche e biologiche di una molecola dipendono spesso
dalle strutture tridimensionali, o conformazioni, che questa può adottare.
L’analisi conformazionale è lo studio delle conformazioni di una molecola e
della loro influenza sulle sue proprietà.
Le conformazioni di una molecola sono tradizionalmente definite come
arrangiamenti dei suoi atomi nello spazio che si possono interconvertire fra loro
semplicemente con la rotazione attorno ad uno o più legami. Questa
definizione è spesso utilizzata in maniera meno stringente perché piccole
distorsioni negli angoli di legame e nelle lunghezze di legame spesso
accompagnano cambiamenti conformazionali. Inoltre tali rotazioni possono
avvenire intorno a legami che si trovano in sistemi coniugati e che hanno un
ordine tra il primo e il secondo.
Un componente chiave dell’analisi conformazionale è
conformazionale, che ha come obiettivo l’identificazione
“preferite” di una molecola, quelle conformazioni che
comportamento. Questo di solito richiede l’individuazione
corrispondenti a punti di minimo della superficie d’energia.
la ricerca (search)
delle conformazioni
ne determinano il
delle conformazioni
Analisi conformazionale
I metodi di minimizzazione dell’energia giocano quindi un ruolo cruciale
nell’analisi conformazionale. Abbiamo già visto che un’importante caratteristica
dei metodi di minimizzazione dell’energia è la loro capacità di muoversi verso il
punto di minimo più vicino alla struttura iniziale. Per questa ragione è
necessario avere un algoritmo separato che generi le strutture di partenza per
le successive minimizzazioni.
Anche se teoricamente è possibile identificare tutte le conformazioni a minima
energia sulla superficie, il numero dei minimi può essere così grande che è
praticamente impossibile considerarli tutti. Inoltre nessun algoritmo ci
garantisce che abbiamo realmente trovato il minimo globale. Ma vogliamo solo
il minimo globale?
Struttura attiva
Minimo più popolato
Minimo globale
Analisi conformazionale
In queste circostanze di solito si cerca di trovare il maggior numero di minimi
accessibili. L’insieme delle conformazioni ottenute mediante la ricerca può
essere ulteriormente caratterizzato mediante metodi statistici.
In questo caso la frazione xi della conformazione i in una miscela all’equilibrio è
data dalla distribuzione di Boltzmann:
  Ei 
exp 

ni
 RT 
xi 

N
N
  Ej 

exp 

j 1
 RT 
R= costante dei gas
ni = numero di molecole aventi conformazione
i-esima
N = numero totale di molecole
Ei = energia molare della conformazione i-esima
T = temperatura
Le proprietà molecolari all’equilibrio possono essere ottenute facendo la media
in base alla distribuzione di Boltzmann delle proprietà delle conformazioni
individuali. Se p è la proprietà che vogliamo:
n
p   xi pi
i 1
Esempio: momento di dipolo
Conformero
1
2
3
4
Energia relativa
(kJ/mol)
0
1
2
3
%
41
28
19
12
momento di
dipolo (debye)
1,4
2,7
3,8
1,9
momento di dipolo  0.41  1.4  0.28  2.7  0.19  3.8
 0.12  1.9  2.28
Media di Boltzmann e ricerca conformazionale
La media di Boltzmann è esatta
Le approssimazioni vengono dal set di conformazioni
che viene preso in considerazione
Per avere una buona analisi conformazionale dobbiamo
prendere in considerazione almeno tutte le
conformazioni energeticamente accessibili
Analisi conformazionale
I metodi di ricerca conformazionale possono essere divisi in varie
categorie:
1. algoritmi di ricerca sistematica
2. metodi di costruzione di modelli (model-building)
3. approcci stocastici random
4. dinamica molecolare
Analisi conformazionale
Metodi sistematici
Come suggerisce il nome, una ricerca sistematica esplora lo spazio
conformazionale facendo regolari e prevedibili cambiamenti sulle
conformazioni. La più semplice ricerca conformazionale sistematica,
chiamata anche grid search (ricerca su griglia), consiste nei seguenti
passi:
1.
2.
3.
4.
si identificano tutti i legami che possono ruotare nella molecola: le
lunghezze di legame e gli angoli rimangono fissi.
ognuno di questi legami viene sistematicamente ruotato usando un
incremento fisso fino a raggiungere i 360°.
tutte le conformazioni così generate sono soggette a minimizzazione
dell’energia.
la ricerca termina quando tutte le possibili combinazioni degli angoli di
torsione sono state generate e minimizzate
Analisi conformazionale: metodi sistematici
Metodi sistematici: esempio
Alanina di-Peptide:
Minimizzazione
vincolata
Analisi conformazionale: metodi sistematici
Il maggior inconveniente della ricerca su griglia è che il numero delle
strutture generate e minimizzate cresce esponenzialmente con il
numero dei legami che possono ruotare, un fenomeno conosciuto
come esplosione combinatoriale. Il numero di strutture generate è
dato da:
360
 360 
Numero di combinazio ni  
 

θ
i 1
 θ 
i
N
N
Se l’incremento è lo stesso per ogni angolo
dove i è l’incremento del diedro che è scelto per i legami ed N è il
numero dei torsionali.
5 legami con 30° di incremento  248832 strutture  69 ore
7 legami con 30° di incremento  circa 36 milioni di strutture  415 giorni
Analisi conformazionale: metodi sistematici
Eliminazione delle strutture ad alta energia
1
Torsione 1
3 valori
2
Torsione 2
2 valori
Torsione 3
3 valori
3
5
11
12
6
13
14
15
4
7
16
17
18
8
19
20
21
9
22
23
Torsione 3
Torsione 1
Torsione 2
24
10
25
26
27
28
Analisi conformazionale: metodi sistematici
Eliminazione delle strutture ad alta energia
1
Torsione 1
3 valori
2
Torsione 2
2 valori
Torsione 3
3 valori
3
5
11
12
6
13
14
15
4
7
16
17
18
8
19
20
21
Se, ad esempio, il secondo valore della torsione 1
combinato con il primo valore della torsione 2 porta
a strutture con problemi (es. ad alta energia
sterica), possiamo eliminare (“potare”) tutti i nodi
corrispondenti a tale combinazione.
9
22
23
24
10
25
26
27
28
Analisi conformazionale: metodi sistematici
Esempio
13 torsioni: 11 nella catena lunga
2 nella catena corta
Consideriamo per ogni angolo un
incremento di 120°
Piperonil-butossido
1.595.323 conformazioni
Tagliamo quelle conformazioni in cui la distanza fra 2 idrogeni è maggiore di
1.5 Å e la distanza fra due atomi più pesanti (non legati) è 3 Å.
53.494 conformazioni
Analisi conformazionale: metodi sistematici
Eliminazione di alcune strutture in molecole cicliche
Le molecole cicliche sono spesso abbastanza difficili da analizzare usando una
ricerca sistematica. La strategia comune è quella di rompere l’anello, ottenendo
una molecola “pseudo-aciclica” che può quindi essere trattata come una
normale molecola aciclica.
Quando si fa la ricerca conformazionale di molecole cicliche deve essere
inclusa una verifica addizionale (lunghezze e angoli di chiusura ciclica) in grado
di garantire che gli anelli siano correttamente costruiti.
Esempio: cicloesano
cis
La chiusura ciclica non può avvenire
trans
Analisi conformazionale
Metodi model-building
Una maniera di limitare, almeno parzialmente, l’esplosione combinatoriale
della ricerca sistematica è di usare frammenti molecolari a partire dai quali
costruire le conformazioni. Con gli approcci a “costruzione da modello”
all’analisi conformazionale si costruiscono le conformazioni di una
molecola unendo insieme strutture tridimensionali di frammenti molecolari.
Tali metodi possono essere più efficaci poiché ci sono molte meno
combinazioni di valori di angoli torsionali. Ciò è particolarmente vero per
frammenti ciclici che possono creare problemi nella ricerca
conformazionale.
Per usare questi metodi vanno fatte alcune assunzioni:
1.
2.
3.
Ogni frammento deve essere conformazionalmente indipendente dal resto
della molecola.
Le conformazioni a disposizione per ogni frammento devono coprire il
range di strutture osservate in molecole completamente costruite.
Ovviamente si possono solo analizzare molecole i cui frammenti siano
disponibili.
Analisi conformazionale
Caratteristiche comuni ai metodi di analisi
conformazionale
Geometrie di partenza generate
sistematicamente o casualmente
Minimizzazione dell’energia
Eliminazione dei duplicati
Scelta di una struttura
rappresentativa per ogni minimo
Analisi conformazionale
Confrontro tra diversi conformeri: RMSD
Il fitting è la procedura attraverso cui due o più conformazioni della stessa o di
diverse molecole sono orientate nello spazio in maniera che atomi o gruppi
funzionali particolari siano sovrapposti uno sull’altro in maniera ottimale.
Un algoritmo di fitting molecolare richiede una misura numerica della
“differenza” tra due strutture disposte nello spazio.
La misura più usata è quella della root-mean-square-distance (RMSD) tra
coppie di atomi:
N atomi
RMSD 
2
d
 i
i 1
N atomi
dove Natomi è il numero di atomi totale e di è la distanza tra le coordinate
dell’atomo i nelle due strutture sovrapposte.
Occorre trovare l’orientazione relativa delle due conformazioni tale che la
RMSD sia minima.
Analisi conformazionale
Confrontro tra diversi conformeri.
A volte occorre prendere in considerazione anche possibili strutture che
apparentemente differiscono per ragioni di simmetria.
1
1
2
3
3
2
4
5
5
4
CH 2
CH 2
H2N
CH
C
O
OH
H2N
CH
C
O
OH
Analisi conformazionale
Raggruppamento di strutture simili: algoritmi di
clustering
La ricerca conformazionale può generare un gran numero di dati che devono
essere analizzati. Molte delle conformazioni generate sono molto simili, è
quindi preferibile essere in grado di selezionare dal set di dati un set di
conformazioni rappresentative più piccolo. Questo può essere fatto con l’analisi
di cluster che raggruppa insieme oggetti simili da cui estrarre i più
rappresentativi.
Raggruppare insieme oggetti simili
Selezionare un componente
Richiede una misura di similarità
Analisi conformazionale
Raggruppamento di strutture simili: algoritmi di
clustering
Una misura di similarità può essere la RMSD vista prima.
In maniera alternativa si può misurare la distanza tra due conformazioni in
termini di angoli di torsione.
Questa distanza si può calcolare come distanza Euclidea
d ij 
N tors
2
(



)
 m ,i m , j
m 1
I cluster prodotti usando la RMSD e la distanza Euclidea possono essere
abbastanza diversi. Infatti piccoli cambiamenti negli angoli di torsione nel
centro della molecola possono dar luogo a grosse differenze nelle posizioni
degli atomi terminali di una molecola. La RMSD produce cluster in cui le
molecole hanno forma simile.
Analisi conformazionale
Metodi di clustering
Agglomerative
Gerarchici
Divisive
Relocation
Nearest neighbours
Non-Gerarchici
Altri
Single-pass
Analisi conformazionale
Cluster gerarchici
C’è un ordine preciso in base al quale i cluster sono formati e amalgamati.
Sono semplici da programmare e sono indipendenti dall’ordine in cui le
conformazioni vengono assegnate ad ogni cluster.
Metodi agglomerativi
1.
2.
3.
4.
All’inizio ogni conformazione fa parte di un cluster diverso
Si calcolano tutte le distanze fra ogni cluster.
Si fondono i due cluster più simili in un unico cluster.
Si ripete il punto 3 fino a che:
La distanza tra tutte le coppie di cluster è maggiore di un valore
prefissato.
Tutti I cluster sono stati uniti in un unico cluster.
Analisi conformazionale
Calcolo della distanza tra due cluster
Distanza minima (single linkage)
Distanza massima (Complete linkage)
Distanza media (Average linkage) – la più comune
Analisi conformazionale
Esempio
2
1
6
3
8
4
7
5
1
2
3
4
5
6
7
8
1
0.0
7.2
19.3
21.4
26.9
6.6
19.4
14.2
2
7.2
0.0
24.6
26.3
31.1
5.3
23.6
17.9
3
19.3
24.6
0.0
2.7
8.8
19.9
4.5
8.1
4
21.4
26.3
2.7
0.0
6.1
21.4
3.7
8.9
5
26.9
31.1
8.8
6.1
0.0
26.0
7.6
13.2
6
6.6
5.3
19.9
21.4
26.0
0.0
18.5
12.8
7
19.4
23.6
4.5
3.7
7.6
18.5
0.0
5.7
8
14.2
17.9
8.1
8.9
13.2
12.8
5.7
0.0
Analisi conformazionale
Esempio (cont.)
2
1
6
3
8
7
Sequenza di clustering
4
5
(tra parentesi la distanza fra i cluster
formati)
Step number Single linkage
Complete linkage
Average linkage
1
2
3
4
5
6
7
3-4 (2.7)
3-4-7 (4.5)
2-6 (5.3)
2-6-1 (7.2)
3-4-7-5 (8.8)
3-4-7-5-8 (13.2)
2-6-1-3-4-7-5-8 (31.1)
3-4 (2.7)
3-4-7 (4.1)
2-6 (5.3)
2-6-1 (6.9)
3-4-7-5 (7.5)
3-4-7-5-8 (9.0)
2-6-1-3-4-7-5-8 (21.3)
3-4 (2.7)
3-4-7 (3.7)
2-6 (5.3)
3-4-7-8 (5.7)
3-4-7-8-5 (6.1)
2-6-1 (6.6)
2-6-1-3-4-7-8-5 (12.8)
Analisi conformazionale
Esempio (cont.)
12
Dendrogramma
Numero di cluster ad ogni
livello di similarità
Appartenenza a ciascun
cluster
2
3
8
7
8
6
1
6
10
4
5,8
4
2
5
0
3 4 7 8 5 2 6 1
Analisi conformazionale
Metodi di clustering non gerarchici:
“nearest neighbours”
Lo svantaggio dei metodi gerarchici consiste nel fatto che occorre calcolare la
matrice di similarità che ha dimensioni NxN, dove N è il numero di
conformazioni trovate. Questo ne limita l’applicabilità per numeri di
conformazioni molto grandi.
I metodi non gerarchici superano questo problema.
Il metodo “nearest neighbours” (Jarvis-Patrick) consiste nei seguenti punti:
Per ogni conformazione si genera una lista delle m conformazioni
ad essa più simili.
Due conformazioni sono nello stesso cluster se:
1. Sono ognuno nella lista dei vicini dell’altro.
2. Hanno p (p < m) conformazioni nella lista dei vicini in
comune
Analisi conformazionale
Esempio
2
1
6
3
8
7
4
5
Si richiede che 2 (=p) su 3 (=m)
della lista dei vicini siano
comuni
Conformazione
neighbours
Si
1
2
3
4
5
6
7
8
No
Nearest
2, 6, 8
1, 6, 8
4, 7, 8
3, 5, 7
3, 4, 7
1, 2, 8
3, 4, 8
3, 4, 7
Analisi conformazionale
Caratteristiche del metodo
Parametri
Numero dei vicini nella lista.
Numero dei vicini comuni.
Vantaggi
Computazionalmente poco pesante.
Svantaggi
Le conformazioni esterne in zone poco popolate tendono
a raggrupparsi insieme anche se sono lontane.
Cluster grandi compatti possono essere suddivisi in
maniera arbitraria.
Scarica

Analisi conformazionale - Dipartimento di Farmacia