Università degli Studi di Milano Facoltà di Farmacia Impiego di metodiche computazionali nella progettazione di farmaci Alessandro Pedretti Drug discovery Il termine di drug discovery viene utilizzato per indicare tutti quei processi che portano all’identificazione o allo sviluppo di un nuovo farmaco. Identificazione di un bersaglio (target) a cui è correlata una certa patologia su cui intervenire con un farmaco. Identificazione di una molecola attiva (hit compound) mediante: screening; approccio razionale; fortuna (serendipty). Studio della molecola attiva al fine di realizzare derivati con un più definito profilo di attività, metabolismo e tossicità (lead compounds). Studi pre-clinici (animali). Studi clinici (uomo). Interazione farmaco-recettore Perché un farmaco possa esplicare la propria azione deve interagire con un bersaglio chiamato recettore. Affinità Potenza Effetto biologico Farmaco Recettore Complesso farmaco-recettore Tipologie di recettori: Enzimi Inibizione •Proteine Recettori per mediatori chimici •Acidi nucleici Attivazione Inibizione Forze coinvolte nell’interazione Forze d’interazione Lipofilia Interazioni elettrostatiche legami ionici interazioni di trasferimento di carica Forze ioniche interazioni interazioni ione - dipolo (permanente o indotto) legami di idrogeno rinforzati legami di idrogeno normali Polarità forze di orientazione Forze di Van der Waals (dipolo permanente - dipolo permanente) forze di induzione (dipolo permanente - dipolo indotto) Forze di dispersione (dipolo indotto - dipolo indotto) Interazioni idrofobiche Idrofobicità Progettazione razionale di molecole bioattive Può avvenire secondo: • Approccio indiretto: - la struttura del recettore è ignota; - utilizzo di metodiche QSAR (relazioni struttura-attività quantitative). • Approccio diretto: - la struttura del recettore è nota; - utilizzo di metodiche di docking molecolare. L’obiettivo di entrambi gli approcci è quello di ottenere un modello chiamato farmacoforo sulla base del quale verranno progettate le nuove molecole. Il farmacoforo E’ l’insieme delle sottostrutture della molecola di un farmaco necessarie all’interazione col recettore. Tasca recettoriale Farmaco Gruppo carico negativamente Gruppo accettore di legami d'idrogeno Spaziatore Gruppo idrofobico QSAR - Relazioni struttura-attività quantitative E’ il processo col quale le proprietà chimico-fisiche sono messe in relazione con l’attività biologica o la reattività chimica. Attività = f(proprietà chimico-fisiche) Assunzione fondamentale: molecole con proprietà chimico-fisiche simili fra loro avranno anche attività simile. Identificazione delle proprietà (descrittori) adatte al problema che si vuole affrontare (es. peso molecolare, area, volume, momento dipolare, flessibilità, capacità di formare legami d’idrogeno, ecc). Calcolo dei descrittori per un set di molecole per cui è nota sperimentalmente l’attività biologica. Calcolo dell’equazione correlativa (es. mediante PLS). Utilizzo dell’equazione per predire l’attività di composti la cui attività sperimentale è ignota. QSAR – Analisi dei risultati 10 9.5 Attività 9 8.5 8 7.5 7 -50 -40 -30 -20 Descrittore pEC50 = 6.06 (0.35) – 0.070 (0.01) x Descrittore n = 35; r2 = 0.57; q2 = 0.51 s = 0.29; F = 44.30 3D-QSAR1 Si basa sull’impiego di descrittori chiamati campi calcolati proiettando una proprietà della molecola su una griglia 3D. Prerequisiti: • Struttura 3D delle molecole. • Allineamento ottimale delle strutture 3D di tutte le molecole, necessario all’allineamento dei campi. Tipologie di campi: • Sterici • Elettrostatici • Lipofilici • Basati su legami d’idrogeno 3D-QSAR – Visualizzazione dei campi Interazioni elettrostatiche sfavorevoli Interazioni steriche favorevoli Farmaco Interazioni elettrostatiche favorevoli Interazioni steriche sfavorevoli Il docking molecolare Si tratta di un approccio computazionale per lo studio delle interazioni fra un generico ligando e una biomacromolecola bersaglio. E’ necessario conoscere la struttura tridimensionale sia del ligando, sia della biomacromolecola bersaglio. Le informazioni estrapolabili da uno studio di docking possono servire per: l’identificazione degli elementi strutturali chiave per l’interazione sia del ligando, sia del recettore (modello farmacoforico); la progettazione di nuovi ligandi con conseguentemente con maggiore potenza; ipotizzare un plausibile meccanismo d’azione. maggiore affinità e, Applicazioni del docking molecolare Il docking molecolare permette lo studio di complessi: • Recettore macromolecolare - ligando a basso PM* recettore/enzima – attivatore/inibitore • Recettore macromolecolare - ligando a basso PM* proteina – proteina, DNA – proteina, DNA – DNA. • Recettore a basso PM – ligando a basso PM* inclusi (es. beta-ciclodestrine), sali binari. Il primo caso è quello più frequente in chimica farmaceutica poiché la stragrande maggioranza dei farmaci è a basso PM. *PM = peso molecolare Struttura 3D del ligando C19H23NO5 1D COc1cccc(OC)c1OCCNCC3COc2ccccc2O3 MeO O O H N 2D O OMe Conversione 2D →3D: • Meccanica molecolare (MD, conformational search) • Quantomeccanica 3D Struttura 3D del recettore Può trattarsi di un problema estremamente complesso soprattutto se non si dispongono di informazioni sperimentali sufficienti, viste le elevate dimensioni che un recettore presenta (> 50.000 atomi). Difrattometria a raggi X Accuratezza della struttura 3D Risonanza magnetica nucleare Predizione della struttura 3D •Metodica sperimentale •Metodica computazionale Difrattometria a raggi X E’ la miglior metodica attualmente disponibile per la risoluzione di strutture tridimensionali. E’ necessario disporre del cristallo della molecola da analizzare, cosa non sempre facile da ottenere. Il cristallo si deteriora durante l’analisi per via dell’alta energia dei raggi X. Fornisce un’immagine statica di una realtà fisica (cristallo) che non coincide con quella biologica. I cristalli delle macromolecole possono contenere un elevato numero di molecole d’acqua. Struttura secondaria Molecole d’acqua Risonanza magnetica nucleare - NMR Si basa sul fatto che i nuclei atomici essendo costituiti da protoni e neutroni hanno un intrinseco momento magnetico ed angolare. Non permette di risolvere completamente la struttura 3D di una macromolecola. E’ possibile eseguire l’analisi in soluzione, quindi in un ambiente più simile a quello biologico. Come risultato fornisce dei parametri geometrici (distanze interatomiche) che possono essere usate per creare il modello 3D mediante l’impiego della meccanica molecolare (MM) e della dinamica molecolare (MD). Predizione della struttura 3D Si può parlare anche di predizione del folding di una proteina. Assunzione: Proteine con sequenza aminoacidica simile (struttura primaria) hanno anche una disposizione spaziale degli atomi simile (sequenza secondaria e terziaria). Ciò è comprovato da un’evidenza sperimentale: Proteina allo stato nativo Denaturazione Proteina denaturata Rinaturazione Proteina allo stato nativo pH Temperatura Forza ionica Le informazioni per il folding sono contenute nella struttura primaria della proteina. Predizione del folding proteico Ab-initio Comparative modelling Sequenza aminoacidica …AYDKLATT… Uso di parametri e “regole” dedotte da strutture 3D Confronto con modelli a struttura 3D risolta Etot=WVdWEVdW+WhbEhb+… Funzione di score Funzione di score Predizione del folding Docking manuale L’operatore è guidato dalla grafica computerizzata. E’ necessario postulare un’ipotesi sulla modalità d’interazione. Si posiziona il ligando mediante rototraslazioni manuali. Docking manuale Ligando Recettore Docking manuale – visualizzazione del recettore Visualizzazione wireframe Sito di legame Superficie DEEP Docking manuale – visualizzazione del recettore Zone cariche - Superficie MEP Accettori di HB Zone cariche + Superficie accettrice di HB Docking manuale – visualizzazione del ligando Zona carica + Zona carica - Donatore di HB Superficie di Van der Waals Superficie MEP Superficie donatrice di HB Il docking automatico Non richiede particolari manualità da parte dell’operatore. Il ligando è posizionato nel recettore in modo automatico. La validità del complesso (o orientamento) risultante è stimata mediante un punteggio chiamato score: Lo score è un valore numerico che permette di stabilire a priori, cioè senza l’ausilio della grafica, se un orientamento è di potenziale interesse: score interazione ligando recettore All’operatore resta il compito di giudicare la validità delle soluzioni proposte dal punto di vista chimico-farmaceutico-biologico. Caratteristiche ideali del docking automatico Accuratezza dell’attribuzione dello score per ciascun orientamento ligando-recettore calcolato. Pertinenza delle proprietà considerate nell’attribuzione dello score in relazione allo specifico sistema ligando-recettore. Rapidità nella generazione dei complessi. Interfaccia con banche dati di molecole per il virtual screening. Ligando Recettore Algoritmo di docking Complesso ligando-recettore Valutazione dello score Classificazione del complesso Funzione di score Permette di valutare la complementarità chimico-fisica e geometrica fra ligando e recettore in un complesso. E’ l’elemento più critico di un metodo di docking. Score = Cs + Ci + ENB + EDes + ... Cs Ci ENB EDes = complementarità sterica; = contributo idrofobico; = energia di non legame; = energia di desolvatazione. Calcolo dell’energia di una molecola Indispensabile per: • ottimizzazione energetica); delle geometrie di una molecola (minimizzazione • analisi conformazionale (evasione dai minimi locali); • dinamica molecolare; • docking molecolare. Calcoli quantomeccanici Accuratezza Calcoli semi-empirici Calcoli di meccanica molecolare Velocità Meccanica molecolare Approssima gli atomi a delle sfere rigide e i legami a delle molle. Energia di non-legame Etot = Eb + Ea + Et + Ei + EVdW + Ec+ EHB Energia di legame Eb Ea Et Ei EVdW Ec EHB = energia di legame = energia angolare = energia torsionale = energia degli angoli impropri = energia di Van der Waals = energia elettrostatica (coulombiana) = energia dei legami d’idrogeno Energia di non legame ENL = EVdW + Ec+ EHB Nel caso del campo di forze AMBER: E NB ij 6 A 12 B ij 2. ij r rij ij Cij Dij ij .r ij r12 r10 ij ij ij qi q j Riduzione dei tempi di calcolo Computo dello score mediante meccanica molecolare o altri metodi empirici. Riduzione del numero di parametri che costituiscono la funzione di score. Riduzione delle dimensioni dell’area da esplorare. Conformazione bloccata del recettore. Conformazione bloccata del ligando. Inaccuratezza del complesso generato. Lo screening virtuale1 Strumento basato su metodiche computazionali atto all’identificazione di composti biologicamente attivi a partire da banche dati di strutture reali o puramente virtuali. Virtuale Reale Database di composti Sintesi chimica (milioni) (decine) Modello farmacoforico Test farmacologico Molecole potenzialmente attive (decine) Molecole attive (alcune unità) Lo screening virtuale2 Virtuale Database di composti reali (migliaia) Reale Modello farmacoforico Test farmacologico Molecole potenzialmente attive (decine) Molecole attive (alcune unità) Situazione tipica di un’industria farmaceutica. Vantaggi: risparmio di tempo nello sviluppo = risparmio di denaro. Nuove frontiere per la modellistica molecolare QSAR 2D½ Le molecole non sono rappresentate come un insieme di atomi ma da dei vettori che ne descrivono le proprietà chimico fisiche (es. momento dipolare, momento di lipofilia, legami d’idrogeno, ecc). Con i vettori è possibile tener conto della flessibilità della molecola calcolandoli come una media dei diversi conformeri. Relativa facilità di sovrapposizione dei vari modelli vettoriali. Possibilità di rappresentare graficamente sia le molecole, sia il farmacoforo in modo comprensibile. Attualmente non esiste una soluzione accademica di QSAR che possa competere con i programmi commerciali. Analisi delle dinamiche molecolari Premessa: • Le simulazioni di dinamica molecolare permettono di studiare come evolve nel tempo un sistema sottoposto all’effetto dell’energia cinetica. • Durante la simulazione vengono campionate le coordinate atomiche a salvate in un file di traiettoria (trajectory). • Il quantitativo di informazioni contenute nella traiettoria è talmente elevato che spesso quelle più importanti sono “coperte” da quelle secondarie. Analisi dei risultati: • Si potrebbero considerare i movimenti degli atomi alla stessa stregua di onde e applicare la teoria di del campionamento Shannon. • I segnali più importanti potrebbero essere filtrati per evidenziarli al meglio (es. FFT, DFT, ecc). • Analisi dei movimenti dei domini di una proteina. Fingerprint per il de novo drug design Fingerprint e similarità: • Le fingerprint sono stringe di bit comunemente utilizzate per comparare fra loro molecole e nel caso più specifico per il virtual screening. • La codifica delle strutture in fingerprint comporta un notevole incremento della velocità di interrogazione di una database (indice di similarità di Tanimoto). Fingerprint e progettazione di nuovi farmaci: Codifica di strutture biologicamente attive in fingerprint. Combinazione dei bit (es. mediante operatori logici o algoritmi genetici). Nuova molecola Predizione del folding proteico Si è ben lontani dall’aver compreso le regole codificate nella struttura primaria che determinano la disposizione spaziale degli atomi. Il campo meno esplorato è quello della predizione ab-initio. Predizione dei loop. Ottimizzazione della catene laterali degli aminoacidi. Automatizzazione della generazione di modelli in forma apo (enzima) ed olo (enzima + cofattore). Meccanica molecolare E’ già stato fatto molto ma mancano algoritmi realmente veloci. Calcolo dell’interazione di non-legame. Problema della costante dielettrica. Parallelizzazione del codice. Rilevamento delle collisioni degli atomi (bump-check) in tempo reale. GPGPU e stream processing Vantaggi: Campo ancora poco esplorato (es. SETI@Home, Folding@home). Permette di avere prestazioni di calcolo eccezionali a costi bassissimi: - 8x AMD Opteron 750 2.4 GHz (16 core totali) ~ 20 GFlops (20.000 €) - 1x AMD/ATI HD3870 (320 stream processor) ~ 60 GFlops (~1.200 €) Programmazione relativamente semplice grazie al compilatore C/C++ like Brook+ (AMD). Non esiste ancora alcun programma di meccanica molecolare. Svantaggi: Due standard incompatibili: • CAL (AMD). • CUDA (NVIDIA). Ringraziamenti Giulio Vistoli Roberto Cordone www.ddl.unimi.it