Docking
Il problema del docking molecolare
Date due molecole di cui sono note le geometrie
3D il docking si pone di rispondere a:
• Le due molecole si legano tra di loro?
• Quanto vale l’energia di interazione? (binding energy)
• Qual’è la geometria del complesso fra le due molecole?
Problemi di docking in biochimica:
•
•
•
•
Docking proteina-molecola
Docking DNA-molecola
Docking proteina-proteina
Docking proteina-DNA
Importanza del docking
Il docking permette di studiare come una molecola si lega
ad una macromolecola biologica (enzima, proteina, DNA,
recettore) processo alla base del riconoscimento molecolare
Il riconoscimento molecolare è un fenomeno di enorme
importanza in biologia
•
•
•
Enzima  substrato
Anticorpo  antigene
Recettore  ligando (agonista, antagonista, inibitore)
Strutture di complessi proteina-ligando
•
•
raggi X
NMR
Importanza in chimica farmaceutica
•
Ligando = Molecola con azione farmacologica!
Generalità sul docking
L’associazione fra le due molecole è basata su interazioni:
• Van der Waals
• Elettrostatiche
• Legami idrogeno
Le interazioni corrispondenti sono deboli e a corto raggio
• L’associazione implica complementarietà geometrica
Nel docking si cerca di determinare la geometria del
complesso intermolecolare formato fra le due molecole
L’energia di binding è la differenza di energia fra il
complesso e le due molecole separate
• Il solvente (acqua) gioca un ruolo importante
• L’entropia ha un impatto significativo sul binding.
Aspetti Energetici
Interazioni a corto raggio implicano elevata complementarietà
geometrica fra le supefici a contatto: “docking geometrici”
Ligando e proteina sono conformazionalmente flessibili
La stima dell’energia è difficoltosa (energie conformazionali,
effetto del solvente, effetto entropico, energia elettrostatica,..)
Applicazioni
Stima dell’energia di binding
• Ricerca di capostipiti di nuove classi di farmaci che agiscano
interagendo con un recettore (screening virtuale)
• Stima dell’influenza di modifiche della struttura della molecola
capostipite per sviluppare farmaci sempre più efficaci
• Progettazione ex-novo di un farmaco
Predizione del complesso molecolare
• Comprensione delle modalità di binding
• Ottimizzazione della struttura del farmaco
Interazioni coinvolte nel docking
Energia di interazione: somma di interazione VdW e elettrostatica fra gli
atomi di una molecola e quelli dell’altra
12
6
 Cij 
 Dij  qi q j
 
Eint      




r
rij
i
j  rij 
ij


i=1,2,3
j=1,2
1
Se fra i e j c’è un legame idrogeno si deve
aggiungere anche un contributo di tipo
VdW con potenze 12-10 e non 12-6
12
Aij 
 __
 rij 
_
10
Bij 
 __
 rij 
1
2
3
2
Algoritmi di docking
• Lo scopo è di predirre la struttura e l’energia del complesso
intermolecolare fra due molecole (proteina e ligando)
• Gli algoritmi di docking sono basati sulla ricerca del minimo
globale per l’energia di interazione fra la proteina e il ligando
• Il docking può essere distinto in:
• docking rigido
• docking flessibile (solo il ligando)
• Le variabili da minimizzare sono:
• Tre coordinate cartesiane del centro di massa del ligando
• Tre angoli che descrivono l’orientamento del ligando
• N angoli di torsione del ligando (solo docking flessibile)
Esempio ligando con due legami rotabili
xcm, ycm, zcm
, , 
1, 2
Docking rigido
Assunzioni
• Proteina rigida
• Ligando rigido
Applicazioni
• Docking of molecole piccole e poco flessibili
• Docking di data base di molti conformeri
Esempi
• Programma DOCK basato su complementarietà geometrica
Docking rigido
Matching delle caratteristiche geometriche delle due molecole
(proteina ligando) nello spazio
A
B
c
a
D
b
C
receptor
ligando
Docking Flessibile
Assunzioni
• La flessibilità del ligando è limitata agli angoli di torsione e
alle conformazioni di anello
• Insieme delle possibili conformazioni
• Docking rigido di ciascuna delle possibili
conformazioni del ligando
• Frammentazione del ligando
• Costruzione incrementale (FlexX)
• Search conformazionale esplicito
• Monte Carlo (LigandFit)
• Algoritmo genetico (AutoDock, GOLD)
• La proteina è considerata rigida
• Modelli di proteina multipli (FlexE)
Algoritmi Genetici (GA)
• Sono algoritmi di ricerca del minimo globale basati
sull’analogia con la genetica e l’evoluzione
• Nel docking la posizione relativa del ligando rispetto
alla proteina è descritta dalle seguenti variabili:
- tre coordinate del centro di massa
- tre angoli che descrivono l’orientamento nello spazio
- angoli di torsione dei legami rotabili
• Nell’analogia genetica lo stato del ligando corrisponde
al genotipo, le sue coordinate al fenotipo
• Nel docking la “fitness” è rappresentata dall’energia di
interazione del ligando con la proteina
• Nell’algoritmo genetico lo stato del ligando corriponde
al cromosoma e ogniuna delle variabili ad un gene
• In genere le variabili sono rappresentate in cifre binarie
• Si parte da una certo numero di stati del ligando
(insiemi di coordinate angoli di rotazione e angoli di
torsione) cioè di cromosomi ovvero individui che
costituiscono una popolazione
• Coppie di individui (stati del ligando) vengono
accoppiate mediante processi di crossover e variazione
casuale di una cifra
• Si passa così ad una generazione successiva che
corrisponde ad una nuova popolazione
• Si procede così ottenendo tante nuove popolazioni
successive sempre più “sane” cioè con energia minore
• Dopo un certo numero di generazioni si valuta
l’individuo con l’energia più bassa
Si crea una popolazione initiale di m conformazioni:
Ciascuna conformazione è rappresentata da un cromosoma
O
OH
10100101001000101001
1
2
3
4
Nel cromosoma, ciascuna torsione può essere rappresentata da
uno dei 25=32 valori corrispondenti a numeri binari a 5 cifre
Si calcola la funzione di fitness ( l’energia) per ciascun
cromosoma
Si applicano alla nuova popolazione gli operatori genetici:
Sono propagati gli individui col miglior fitness
Crossover:
00100011110001
11000011001100
00100011001100
11000011110001
Mutazione puntuale:
00100011110001
00100010110001
Si ripete la procedura su nuove popolazione
Gold
Fitness evaluation of individual with chromosome c:
•
•
•
Build conformation according to c.
Superimpose matching interacting groups.
Calculate docking score: -Ehydrogen bond – (Einternal + EVdW-complex)
Genetic operators
•
•
•
Cross over
Mutation
Migration
Operators randomly selected.
20-50 runs, each with up to 100000 genetic operations.
Gold Validation: Good
4PHV - A peptide-like ligand docked into HIV protease
Gold Validation: Close
1GLQ - A nitrophenyl-substituted peptide ligand docked
into glutathione-S-transferase
Scarica

Which Molecule Should We Test Next?