Università degli Studi di Milano
Facoltà di Farmacia
Impiego di metodiche computazionali
nella progettazione di farmaci
Alessandro Pedretti
Drug discovery
Il termine di drug discovery viene utilizzato per indicare tutti quei processi
che portano all’identificazione o allo sviluppo di un nuovo farmaco.
Identificazione di un bersaglio (target) a cui è correlata una certa
patologia su cui intervenire con un farmaco.
Identificazione di una molecola attiva (hit compound) mediante:
screening;
approccio razionale;
fortuna (serendipty).
Studio della molecola attiva al fine di realizzare derivati con un più definito
profilo di attività, metabolismo e tossicità (lead compounds).
Studi pre-clinici (animali).
Studi clinici (uomo).
Interazione farmaco-recettore
Perché un farmaco possa esplicare la propria azione deve interagire con un
bersaglio chiamato recettore.
Affinità
Potenza
Effetto
biologico
Farmaco
Recettore
Complesso
farmaco-recettore
Tipologie di recettori:
Enzimi
Inibizione
•Proteine
Recettori per mediatori chimici
•Acidi nucleici
Attivazione
Inibizione
Forze coinvolte nell’interazione
Forze d’interazione
Lipofilia
Interazioni elettrostatiche
 legami ionici
 interazioni di trasferimento di carica
Forze
ioniche  interazioni 
 interazioni ione - dipolo
(permanente o indotto)
 legami di idrogeno rinforzati
 legami di idrogeno normali
Polarità
 forze di orientazione
Forze di
Van der
Waals

(dipolo permanente - dipolo permanente)
forze di induzione
(dipolo permanente - dipolo indotto)
 Forze di dispersione
(dipolo indotto - dipolo indotto)
Interazioni idrofobiche
Idrofobicità
Progettazione razionale di molecole bioattive
Può avvenire secondo:
• Approccio indiretto:
- la struttura del recettore è ignota;
- utilizzo di metodiche QSAR (relazioni struttura-attività quantitative).
• Approccio diretto:
- la struttura del recettore è nota;
- utilizzo di metodiche di docking molecolare.
L’obiettivo di entrambi gli approcci è quello di ottenere un modello chiamato
farmacoforo sulla base del quale verranno progettate le nuove molecole.
Il farmacoforo
E’ l’insieme delle sottostrutture della molecola di un farmaco necessarie
all’interazione col recettore.
Tasca recettoriale
Farmaco
Gruppo carico
negativamente
Gruppo accettore
di legami d'idrogeno
Spaziatore
Gruppo idrofobico
QSAR - Relazioni struttura-attività quantitative
E’ il processo col quale le proprietà chimico-fisiche sono messe in relazione
con l’attività biologica o la reattività chimica.
Attività = f(proprietà chimico-fisiche)
Assunzione fondamentale:
molecole con proprietà chimico-fisiche simili fra loro avranno anche attività
simile.
Identificazione delle proprietà (descrittori) adatte al problema che si vuole
affrontare (es. peso molecolare, area, volume, momento dipolare,
flessibilità, capacità di formare legami d’idrogeno, ecc).
Calcolo dei descrittori per un set di molecole per cui è nota
sperimentalmente l’attività biologica.
Calcolo dell’equazione correlativa (es. mediante PLS).
Utilizzo dell’equazione per predire l’attività di composti la cui attività
sperimentale è ignota.
QSAR – Analisi dei risultati
10
9.5
Attività
9
8.5
8
7.5
7
-50
-40
-30
-20
Descrittore
pEC50 = 6.06 (0.35) – 0.070 (0.01) x Descrittore
n = 35; r2 = 0.57; q2 = 0.51 s = 0.29; F = 44.30
3D-QSAR1
Si basa sull’impiego di descrittori chiamati campi calcolati proiettando una
proprietà della molecola su una griglia 3D.
Prerequisiti:
• Struttura 3D delle molecole.
• Allineamento ottimale delle strutture 3D di tutte le molecole, necessario
all’allineamento dei campi.
Tipologie di campi:
• Sterici
• Elettrostatici
• Lipofilici
• Basati su legami d’idrogeno
3D-QSAR – Visualizzazione dei campi
Interazioni elettrostatiche
sfavorevoli
Interazioni steriche
favorevoli
Farmaco
Interazioni elettrostatiche
favorevoli
Interazioni steriche
sfavorevoli
Il docking molecolare
Si tratta di un approccio computazionale per lo studio delle interazioni fra
un generico ligando e una biomacromolecola bersaglio.
E’ necessario conoscere la struttura tridimensionale sia del ligando, sia
della biomacromolecola bersaglio.
Le informazioni estrapolabili da uno studio di docking possono servire per:
l’identificazione degli elementi strutturali chiave per l’interazione sia del
ligando, sia del recettore (modello farmacoforico);
la progettazione di nuovi ligandi con
conseguentemente con maggiore potenza;
ipotizzare un plausibile meccanismo d’azione.
maggiore
affinità
e,
Applicazioni del docking molecolare
Il docking molecolare permette lo studio di complessi:
• Recettore macromolecolare - ligando a basso PM*
recettore/enzima – attivatore/inibitore
• Recettore macromolecolare - ligando a basso PM*
proteina – proteina, DNA – proteina, DNA – DNA.
• Recettore a basso PM – ligando a basso PM*
inclusi (es. beta-ciclodestrine), sali binari.
Il primo caso è quello più frequente in chimica farmaceutica poiché la
stragrande maggioranza dei farmaci è a basso PM.
*PM = peso molecolare
Struttura 3D del ligando
C19H23NO5
1D
COc1cccc(OC)c1OCCNCC3COc2ccccc2O3
MeO
O
O
H
N
2D
O
OMe
Conversione 2D →3D:
• Meccanica molecolare
(MD, conformational search)
• Quantomeccanica
3D
Struttura 3D del recettore
Può trattarsi di un problema estremamente complesso soprattutto se non si
dispongono di informazioni sperimentali sufficienti, viste le elevate
dimensioni che un recettore presenta (> 50.000 atomi).
Difrattometria a raggi X
Accuratezza
della struttura 3D
Risonanza magnetica nucleare
Predizione della struttura 3D
•Metodica sperimentale
•Metodica computazionale
Difrattometria a raggi X
E’ la miglior metodica attualmente disponibile per la risoluzione di
strutture tridimensionali.
E’ necessario disporre del cristallo della molecola da analizzare, cosa non
sempre facile da ottenere.
Il cristallo si deteriora durante l’analisi per via dell’alta energia dei raggi X.
Fornisce un’immagine statica di
una realtà fisica (cristallo) che
non coincide con quella biologica.
I cristalli delle macromolecole
possono contenere un elevato
numero di molecole d’acqua.
Struttura secondaria
Molecole d’acqua
Risonanza magnetica nucleare - NMR
Si basa sul fatto che i nuclei atomici essendo costituiti da protoni e
neutroni hanno un intrinseco momento magnetico ed angolare.
Non permette di risolvere completamente la struttura 3D di una
macromolecola.
E’ possibile eseguire l’analisi in soluzione, quindi in un ambiente più
simile a quello biologico.
Come risultato fornisce dei parametri geometrici (distanze interatomiche)
che possono essere usate per creare il modello 3D mediante l’impiego
della meccanica molecolare (MM) e della dinamica molecolare (MD).
Predizione della struttura 3D
Si può parlare anche di predizione del folding di una proteina.
Assunzione:
Proteine con sequenza aminoacidica simile (struttura primaria) hanno anche
una disposizione spaziale degli atomi simile (sequenza secondaria e
terziaria).
Ciò è comprovato da un’evidenza sperimentale:
Proteina
allo stato nativo
Denaturazione
Proteina
denaturata
Rinaturazione
Proteina
allo stato nativo
pH
Temperatura
Forza ionica
Le informazioni per il folding sono contenute nella struttura primaria della
proteina.
Predizione del folding proteico
Ab-initio
Comparative modelling
Sequenza aminoacidica
…AYDKLATT…
Uso di parametri e
“regole” dedotte
da strutture 3D

Confronto con
modelli a struttura
3D risolta
Etot=WVdWEVdW+WhbEhb+…
Funzione di score
Funzione di score
Predizione del folding
Docking manuale
L’operatore è guidato dalla grafica computerizzata.
E’ necessario postulare un’ipotesi sulla modalità d’interazione.
Si posiziona il ligando mediante rototraslazioni manuali.
Docking
manuale
Ligando
Recettore
Docking manuale – visualizzazione del recettore
Visualizzazione wireframe
Sito di legame
Superficie DEEP
Docking manuale – visualizzazione del recettore
Zone cariche -
Superficie MEP
Accettori di HB
Zone cariche +
Superficie accettrice di HB
Docking manuale – visualizzazione del ligando
Zona carica +
Zona carica -
Donatore di HB
Superficie di
Van der Waals
Superficie MEP
Superficie donatrice di HB
Il docking automatico
Non richiede particolari manualità da parte dell’operatore.
Il ligando è posizionato nel recettore in modo automatico.
La validità del complesso (o orientamento) risultante è stimata mediante
un punteggio chiamato score:
Lo score è un valore numerico che permette di stabilire a priori, cioè
senza l’ausilio della grafica, se un orientamento è di potenziale
interesse:
 score   interazione ligando recettore
All’operatore resta il compito di giudicare la validità delle soluzioni
proposte dal punto di vista chimico-farmaceutico-biologico.
Caratteristiche ideali del docking automatico
Accuratezza dell’attribuzione dello score per ciascun orientamento
ligando-recettore calcolato.
Pertinenza delle proprietà considerate nell’attribuzione dello score in
relazione allo specifico sistema ligando-recettore.
Rapidità nella generazione dei complessi.
Interfaccia con banche dati di molecole per il virtual screening.
Ligando
Recettore
Algoritmo di
docking
Complesso
ligando-recettore
Valutazione
dello score
Classificazione
del complesso
Funzione di score
Permette di valutare la complementarità chimico-fisica e geometrica fra
ligando e recettore in un complesso.
E’ l’elemento più critico di un metodo di docking.
Score = Cs + Ci + ENB + EDes + ...
Cs
Ci
ENB
EDes
= complementarità sterica;
= contributo idrofobico;
= energia di non legame;
= energia di desolvatazione.
Calcolo dell’energia di una molecola
Indispensabile per:
• ottimizzazione
energetica);
delle
geometrie
di
una
molecola
(minimizzazione
• analisi conformazionale (evasione dai minimi locali);
• dinamica molecolare;
• docking molecolare.
Calcoli quantomeccanici
Accuratezza
Calcoli semi-empirici
Calcoli di meccanica molecolare
Velocità
Meccanica molecolare
Approssima gli atomi a delle sfere rigide e i legami a delle molle.
Energia di non-legame
Etot = Eb + Ea + Et + Ei + EVdW + Ec+ EHB
Energia di legame
Eb
Ea
Et
Ei
EVdW
Ec
EHB
= energia di legame
= energia angolare
= energia torsionale
= energia degli angoli impropri
= energia di Van der Waals
= energia elettrostatica (coulombiana)
= energia dei legami d’idrogeno
Energia di non legame
ENL = EVdW + Ec+ EHB
Nel caso del campo di forze AMBER:
E NB  ij
6
 A 12



B
 ij   2. ij   
r  
 rij 
 ij  

 Cij Dij 
ij  .r  ij  r12  r10 
 ij
ij
ij 

qi q j
Riduzione dei tempi di calcolo
Computo dello score mediante meccanica molecolare o altri metodi
empirici.
Riduzione del numero di parametri che costituiscono la funzione di score.
Riduzione delle dimensioni dell’area da esplorare.
Conformazione bloccata del recettore.
Conformazione bloccata del ligando.
Inaccuratezza del complesso generato.
Lo screening virtuale1
Strumento basato su metodiche computazionali atto all’identificazione di
composti biologicamente attivi a partire da banche dati di strutture reali o
puramente virtuali.
Virtuale
Reale
Database di composti
Sintesi chimica
(milioni)
(decine)
Modello farmacoforico
Test farmacologico
Molecole potenzialmente
attive (decine)
Molecole attive
(alcune unità)
Lo screening virtuale2
Virtuale
Database di composti
reali (migliaia)
Reale
Modello farmacoforico
Test farmacologico
Molecole potenzialmente
attive (decine)
Molecole attive
(alcune unità)
Situazione tipica di un’industria farmaceutica.
Vantaggi: risparmio di tempo nello sviluppo = risparmio di denaro.
Nuove frontiere
per la modellistica molecolare
QSAR 2D½
Le molecole non sono rappresentate come un insieme di atomi ma da dei
vettori che ne descrivono le proprietà chimico fisiche (es. momento
dipolare, momento di lipofilia, legami d’idrogeno, ecc).
Con i vettori è possibile tener conto della flessibilità della molecola
calcolandoli come una media dei diversi conformeri.
Relativa facilità di sovrapposizione dei vari modelli vettoriali.
Possibilità di rappresentare graficamente sia le molecole, sia il
farmacoforo in modo comprensibile.
Attualmente non esiste una soluzione accademica di QSAR che possa
competere con i programmi commerciali.
Analisi delle dinamiche molecolari
Premessa:
• Le simulazioni di dinamica molecolare permettono di studiare come
evolve nel tempo un sistema sottoposto all’effetto dell’energia cinetica.
• Durante la simulazione vengono campionate le coordinate atomiche a
salvate in un file di traiettoria (trajectory).
• Il quantitativo di informazioni contenute nella traiettoria è talmente elevato
che spesso quelle più importanti sono “coperte” da quelle secondarie.
Analisi dei risultati:
• Si potrebbero considerare i movimenti degli atomi alla stessa stregua di
onde e applicare la teoria di del campionamento Shannon.
• I segnali più importanti potrebbero essere filtrati per evidenziarli al meglio
(es. FFT, DFT, ecc).
• Analisi dei movimenti dei domini di una proteina.
Fingerprint per il de novo drug design
Fingerprint e similarità:
• Le fingerprint sono stringe di bit comunemente utilizzate per comparare fra
loro molecole e nel caso più specifico per il virtual screening.
• La codifica delle strutture in fingerprint comporta un notevole incremento
della velocità di interrogazione di una database (indice di similarità di
Tanimoto).
Fingerprint e progettazione di nuovi farmaci:
Codifica di strutture biologicamente attive in fingerprint.
Combinazione dei bit (es. mediante operatori logici o algoritmi genetici).
Nuova molecola
Predizione del folding proteico
Si è ben lontani dall’aver compreso le regole codificate nella struttura
primaria che determinano la disposizione spaziale degli atomi.
Il campo meno esplorato è quello della predizione ab-initio.
Predizione dei loop.
Ottimizzazione della catene laterali degli aminoacidi.
Automatizzazione della generazione di modelli in forma apo (enzima) ed
olo (enzima + cofattore).
Meccanica molecolare
E’ già stato fatto molto ma mancano algoritmi realmente veloci.
Calcolo dell’interazione di non-legame.
Problema della costante dielettrica.
Parallelizzazione del codice.
Rilevamento delle collisioni degli atomi (bump-check) in tempo reale.
GPGPU e stream processing
Vantaggi:
Campo ancora poco esplorato (es. SETI@Home, Folding@home).
Permette di avere prestazioni di calcolo eccezionali a costi bassissimi:
- 8x AMD Opteron 750 2.4 GHz (16 core totali) ~ 20 GFlops (20.000 €)
- 1x AMD/ATI HD3870 (320 stream processor) ~ 60 GFlops (~1.200 €)
Programmazione relativamente semplice grazie al compilatore C/C++ like Brook+ (AMD).
Non esiste ancora alcun programma di meccanica molecolare.
Svantaggi:
Due standard incompatibili:
• CAL (AMD).
• CUDA (NVIDIA).
Ringraziamenti
Giulio Vistoli
Roberto Cordone
www.ddl.unimi.it
Scarica

Presentation (PowerPoint format, italian).