Docking Il problema del docking molecolare Date due molecole di cui sono note le geometrie 3D il docking si pone di rispondere a: • Le due molecole si legano tra di loro? • Quanto vale l’energia di interazione? (binding energy) • Qual’è la geometria del complesso fra le due molecole? Problemi di docking in biochimica: • • • • Docking proteina-molecola Docking DNA-molecola Docking proteina-proteina Docking proteina-DNA Importanza del docking Il docking permette di studiare come una molecola si lega ad una macromolecola biologica (enzima, proteina, DNA, recettore) processo alla base del riconoscimento molecolare Il riconoscimento molecolare è un fenomeno di enorme importanza in biologia • • • Enzima substrato Anticorpo antigene Recettore ligando (agonista, antagonista, inibitore) Strutture di complessi proteina-ligando • • raggi X NMR Importanza in chimica farmaceutica • Ligando = Molecola con azione farmacologica! Generalità sul docking L’associazione fra le due molecole è basata su interazioni: • Van der Waals • Elettrostatiche • Legami idrogeno Le interazioni corrispondenti sono deboli e a corto raggio • L’associazione implica complementarietà geometrica Nel docking si cerca di determinare la geometria del complesso intermolecolare formato fra le due molecole L’energia di binding è la differenza di energia fra il complesso e le due molecole separate • Il solvente (acqua) gioca un ruolo importante • L’entropia ha un impatto significativo sul binding. Aspetti Energetici Interazioni a corto raggio implicano elevata complementarietà geometrica fra le supefici a contatto: “docking geometrici” Ligando e proteina sono conformazionalmente flessibili La stima dell’energia è difficoltosa (energie conformazionali, effetto del solvente, effetto entropico, energia elettrostatica,..) Applicazioni Stima dell’energia di binding • Ricerca di capostipiti di nuove classi di farmaci che agiscano interagendo con un recettore (screening virtuale) • Stima dell’influenza di modifiche della struttura della molecola capostipite per sviluppare farmaci sempre più efficaci • Progettazione ex-novo di un farmaco Predizione del complesso molecolare • Comprensione delle modalità di binding • Ottimizzazione della struttura del farmaco Interazioni coinvolte nel docking Energia di interazione: somma di interazione VdW e elettrostatica fra gli atomi di una molecola e quelli dell’altra 12 6 Cij Dij qi q j Eint r rij i j rij ij i=1,2,3 j=1,2 1 Se fra i e j c’è un legame idrogeno si deve aggiungere anche un contributo di tipo VdW con potenze 12-10 e non 12-6 12 Aij __ rij _ 10 Bij __ rij 1 2 3 2 Algoritmi di docking • Lo scopo è di predirre la struttura e l’energia del complesso intermolecolare fra due molecole (proteina e ligando) • Gli algoritmi di docking sono basati sulla ricerca del minimo globale per l’energia di interazione fra la proteina e il ligando • Il docking può essere distinto in: • docking rigido • docking flessibile (solo il ligando) • Le variabili da minimizzare sono: • Tre coordinate cartesiane del centro di massa del ligando • Tre angoli che descrivono l’orientamento del ligando • N angoli di torsione del ligando (solo docking flessibile) Esempio ligando con due legami rotabili xcm, ycm, zcm , , 1, 2 Docking rigido Assunzioni • Proteina rigida • Ligando rigido Applicazioni • Docking of molecole piccole e poco flessibili • Docking di data base di molti conformeri Esempi • Programma DOCK basato su complementarietà geometrica Docking rigido Matching delle caratteristiche geometriche delle due molecole (proteina ligando) nello spazio A B c a D b C receptor ligando Docking Flessibile Assunzioni • La flessibilità del ligando è limitata agli angoli di torsione e alle conformazioni di anello • Insieme delle possibili conformazioni • Docking rigido di ciascuna delle possibili conformazioni del ligando • Frammentazione del ligando • Costruzione incrementale (FlexX) • Search conformazionale esplicito • Monte Carlo (LigandFit) • Algoritmo genetico (AutoDock, GOLD) • La proteina è considerata rigida • Modelli di proteina multipli (FlexE) Algoritmi Genetici (GA) • Sono algoritmi di ricerca del minimo globale basati sull’analogia con la genetica e l’evoluzione • Nel docking la posizione relativa del ligando rispetto alla proteina è descritta dalle seguenti variabili: - tre coordinate del centro di massa - tre angoli che descrivono l’orientamento nello spazio - angoli di torsione dei legami rotabili • Nell’analogia genetica lo stato del ligando corrisponde al genotipo, le sue coordinate al fenotipo • Nel docking la “fitness” è rappresentata dall’energia di interazione del ligando con la proteina • Nell’algoritmo genetico lo stato del ligando corriponde al cromosoma e ogniuna delle variabili ad un gene • In genere le variabili sono rappresentate in cifre binarie • Si parte da una certo numero di stati del ligando (insiemi di coordinate angoli di rotazione e angoli di torsione) cioè di cromosomi ovvero individui che costituiscono una popolazione • Coppie di individui (stati del ligando) vengono accoppiate mediante processi di crossover e variazione casuale di una cifra • Si passa così ad una generazione successiva che corrisponde ad una nuova popolazione • Si procede così ottenendo tante nuove popolazioni successive sempre più “sane” cioè con energia minore • Dopo un certo numero di generazioni si valuta l’individuo con l’energia più bassa Si crea una popolazione initiale di m conformazioni: Ciascuna conformazione è rappresentata da un cromosoma O OH 10100101001000101001 1 2 3 4 Nel cromosoma, ciascuna torsione può essere rappresentata da uno dei 25=32 valori corrispondenti a numeri binari a 5 cifre Si calcola la funzione di fitness ( l’energia) per ciascun cromosoma Si applicano alla nuova popolazione gli operatori genetici: Sono propagati gli individui col miglior fitness Crossover: 00100011110001 11000011001100 00100011001100 11000011110001 Mutazione puntuale: 00100011110001 00100010110001 Si ripete la procedura su nuove popolazione Gold Fitness evaluation of individual with chromosome c: • • • Build conformation according to c. Superimpose matching interacting groups. Calculate docking score: -Ehydrogen bond – (Einternal + EVdW-complex) Genetic operators • • • Cross over Mutation Migration Operators randomly selected. 20-50 runs, each with up to 100000 genetic operations. Gold Validation: Good 4PHV - A peptide-like ligand docked into HIV protease Gold Validation: Close 1GLQ - A nitrophenyl-substituted peptide ligand docked into glutathione-S-transferase