Docking
Il problema del docking molecolare
Date due molecole di cui sono note le geometrie
3D il docking si pone di rispondere a:
• Le due molecole si legano tra di loro?
• Quanto vale l’energia di interazione? (binding energy)
• Qual’è la geometria del complesso fra le due molecole?
Problemi di docking in biochimica:
•
•
•
•
Docking proteina-molecola
Docking DNA-molecola
Docking proteina-proteina
Docking proteina-DNA
Importanza del docking
Il docking permette di studiare come una molecola si lega
ad una macromolecola biologica (enzima, proteina, DNA,
recettore) processo alla base del riconoscimento molecolare
Il riconoscimento molecolare è un fenomeno di enorme
importanza in biologia
•
•
•
Enzima  substrato, inibitore
Anticorpo  antigene
Recettore  ligando (agonista, antagonista)
Strutture di complessi proteina-ligando
•
•
raggi X
NMR
Importanza in chimica farmaceutica
•
Ligando = Molecola con azione farmacologica?
Generalità sul docking
L’associazione fra le due molecole è basata su interazioni:
• Van der Waals
• Elettrostatiche
• Legami idrogeno
Le interazioni corrispondenti sono deboli e a corto raggio
• Complementarietà geometrica
• Complementarietà chimica
Nel docking si cerca di determinare la geometria del
complesso intermolecolare formato fra le due molecole
L’energia di binding è la differenza di energia fra il
complesso e le due molecole separate
• Il solvente (acqua) gioca un ruolo importante
• L’entropia ha un impatto significativo sul binding.
Aspetti Energetici
Interazioni a corto raggio implicano elevata complementarietà
geometrica fra le superfici a contatto: “docking geometrici”
Ligando e proteina sono conformazionalmente flessibili
La stima dell’energia è difficoltosa (energie conformazionali,
effetto del solvente, effetto entropico, energia elettrostatica,..)
Energia di binding
ERLbind
R(aq)
L(aq)
ERfit+ELfit
R*(aq)
E
R
R*L*(aq)
ERLsolv
L*(aq)
R*L*(g)
ERLint
L
+

E
solv
solv)
R*(g)
ERLbind = ERfit
Esolv =
ERLsolv
L*(g)
ELfit
ERLint
E
L
solv+E solv)
R
Esolv
Applicazioni
Stima dell’energia di binding target-ligando
Predizione della geometria del complesso target-ligando
Principale campo di applicazione delle tecniche di docking è
lo studio delle proprietà (energia e geometria) di binding
di potenziali nuovi farmaci:
- Modalità di binding di farmaci già noti
- Ricerca di molecole potenzialmente attive su nuovi target
recettoriali (virtual screening)
- Previsione “in silico” della potenziale attività
farmacologica di nuove molecole
Peculiarità del docking
La ricerca farmaceutica richiede elevate prestazioni
(arrivare a risultati plausibili in poco tempo), per cui tutte
le tecniche di docking impiegate in questo ambito puntano
a:
- Sfruttare al meglio tutte quello che si conosce del sistema
target-ligando in oggetto
- Impiegare algoritmi specializzati per la ricerca della
geometria di binding
- Impiegare funzioni parametrizzate per la stima
dell’affinità target-ligando e per la previsione della
geometria di binding
Condizioni iniziali
Lo studio di docking può essere effettuato quando:
- È nota la struttura 3D del target recettoriale
- Sono note le principali interazioni target-ligando
- La struttura di target e ligando sono compatibili con la
parametrizzazione dei modelli impiegati
- Le dimensioni e la complessità del sistema possono essere
trattati dai modelli impiegati
Quasi tutte le condizioni citate sono soddisfatte quando è
possibile trovare la struttura di complessi co-cristallizzati
del target con molecole simili al ligando in oggetto.
Protein Data Bank (PDB)
Un organismo che si occupa di raccogliere, catalogare,
classificare e rendere disponibile a chiunque i dati
cristallografici relativi ad enzimi, recettori, acidi nucleici e,
in generale, macromolecole biologiche.
Tutti possono accedere, consultare e scaricare strutture Xray
dall’archivio PDB, www.pdb.org
Esistono anche siti o applicazioni specifiche per la
consultazione guidata del dati presenti sul PDB.
Tutti i programmi di modelling sono in grado di leggere i
files depositati nell’archivio PDB.
Funzioni di score
L’ enorme mole di dati strutturali disponibili tramite
l’archivio PDB, è stata ed è fondamentale per lo sviluppo di
metodi di docking validi.
L’obiettivo più importante è sviluppare metodi di docking in
grado di prevedere la geometria di binding tramite una
funzione che stima l’affinità tra target e ligando.
Questa funzione viene generalmente indicata con il nome di
funzione di score.
Effettivamente, i diversi programmi di docking finora
sviluppati si differenziano proprio in base alla funzione di
score e all’algoritmo di ricerca.
Finora sono state implementate diversi tipi di funzioni di
score e, quasi certamente, negli anni la lista è destinata ad
aumentare.
Attualmente, possiamo distiguere tra classi principali:
• Force field based: la stima dell’affinità target-ligando
viene effettuata tramite la meccanica molecolare.
• Knowledge based: funzioni che stimano la probabilità di
“avvicinamento” tra atomi del ligando ed atomi del target.
•
• Consensus scoring: lo scoring complessivo è dato dalla
combinazione di più funzioni di score.
Approcci al docking
Target
• Rigido: gli atomi del target sono fissi durante la ricerca della
geometria di binding ( cruciale la scelta della struttura
inziale del target)
• Semi-rigido: alcuni atomi del sito di binding possono
adattarsi al binding del ligando
• Flessibile: le conformazioni di target e ligando si adattano
reciprocamente( attualmente si può fare solo con la
dinamica molecolare, non con il docking)
Ligando
• Rigido: nel docking sono ricercate la posizione e
l’orientamento di una conformazione fissa del ligando nel
sito recettoriale.
• Flessibile: nel docking sono ricercate la posizione,
l’orientamento e la conformazione del ligando nel sito
recettoriale.
Variabili del docking
Una combinazione delle 6+n variabili definisce la posa di un ligando.
xcm, ycm, zcm
, , 
1, 2
Algoritmi Genetici (GA)
•
•
•
•
•
•
Sono algoritmi di ricerca del minimo globale basati sull’analogia con la
genetica e l’evoluzione
Genotipo: ogni posa è individuata da un cromosoma, a sua volta formato
da 6+n geni:
- 3  coordinate del centro di massa
- 3  angoli di Eulero
- n  angoli di torsione dei legami rotabili
Fenotipo: l’affinità con il target (score) è l’unico fattore che viene
considerato nell’evoluzione e si identifica con la fitness.
Questi algoritmi di ricerca creano popolazioni di pose che di generazione
in generazione evolvono trasmettendosi i caratteri ereditari sotto una
costante pressione selettiva.
Il meccanismo di trasmissione dei caratteri avviene in base a processi che
mimano il rimescolamento dell’informazione genica che si osservano in
natura: mutazioni puntiformi e crossing-over.
I parametri di controllo di questi algoritmi sono tipicamente il numero di
generazioni, la pressione selettiva, il tasso di mutazione e crossing-over, il
numero di nicchie evolutive, etc.
Popolazione initiale di m conformazioni:
Ciascuna conformazione è rappresentata da un cromosoma
O
OH
10100101001000101001
1
2
3
4
Nel cromosoma, ciascuna torsione può essere rappresentata da
uno dei 25=32 valori corrispondenti a numeri binari a 5 cifre
Si calcola la funzione di fitness ( l’energia) per ciascun
cromosoma
Nuova popolazione ottenuta tramite gli operatori genetici:
Selezione: solo gli individui con miglior fitness si riproducono
Crossover:
00100011110001
11000011001100
00100011001100
11000011110001
Mutazione puntuale:
00100011110001
00100010110001
Gold
Fitness evaluation of individual with chromosome c:
•
•
•
Build conformation according to c.
Superimpose matching interacting groups.
Calculate docking score: -Ehydrogen bond – (Einternal + EVdW-complex)
Genetic operators
•
•
•
Cross over
Mutation
Migration
Operators randomly selected.
20-50 runs, each with up to 100000 genetic operations.
Gold Validation: Good
4PHV - A peptide-like ligand docked into HIV protease
Gold Validation: Close
1GLQ - A nitrophenyl-substituted peptide ligand docked
into glutathione-S-transferase
Algoritmi a ricerca gerarchica
• L’algoritmo effettua un search conformazionale
preliminare allo scopo di generare un numero elevato
di conformeri del ligando.
• La popolazione di conformeri viene sottoposta ad una
serie di test, via via più restrittivi, per individuare un
numero ristretto di candidati.
• Viene effettuato lo scoring dei conformeri così ottenuti;
quelli corrispondenti alle pose migliori vengono
considerati per una fase successiva di rescoring, in cui
viene stimata in maniera più accurata l’interazione tra
target e ligando.
Docking con Glide
• Preparazione della proteina ed del ligando: la funzione
di score implementata in Glide usa il campo di forze
OPLS  il programma deve assegnare i parametri del
FF agli atomi del target e del ligando.
• Calcolo dei campi molecolari di interazione: il sito di
binding del target viene mappato con griglie
tridimensionali (Grid Generation). Il mapping renderà
lo scoring (eseguito nella succesiva fase di docking)
molto più rapido ed efficiente.
• Docking: le pose del ligando vengono calcolate, filtrate
ed i risultati vengono elaborati per renderli disponibili
all’utente.
Scarica

Docking - Dipartimento di Farmacia