Il file PDB http://www.rcsb.org/pdb Esempio: Deossiemoglobina umana (1a3n) HEADER TITLE COMPND COMPND COMPND COMPND SOURCE SOURCE SOURCE SOURCE SOURCE KEYWDS EXPDTA AUTHOR REVDAT REMARK REMARK REMARK REMARK fisica24ore OXYGEN TRANSPORT 22-JAN-98 1A3N DEOXY HUMAN HEMOGLOBIN MOL_ID: 1; 2 MOLECULE: HEMOGLOBIN; 3 CHAIN: A, B, C, D; 4 BIOLOGICAL_UNIT: ALPHA-BETA-ALPHA-BETA TETRAMER MOL_ID: 1; 2 ORGANISM_SCIENTIFIC: HOMO SAPIENS; 3 ORGANISM_COMMON: HUMAN; 4 TISSUE: BLOOD; 5 CELL: RED CELL OXYGEN TRANSPORT, HEME, RESPIRATORY PROTEIN, ERYTHROCYTE X-RAY DIFFRACTION J.TAME,B.VALLONE 1 29-APR-98 1A3N 0 1 2 2 RESOLUTION. 1.8 ANGSTROMS. 3 […] Biofisica tipo di atomo ATOM ATOM ATOM ATOM ATOM ATOM ATOM ATOM ATOM ATOM ATOM ATOM ATOM ATOM ATOM ATOM ATOM ATOM ATOM ATOM ATOM 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 fisica24ore tipo di amminoacido N CA C O CB CG1 CG2 N CA C O CB CG CD1 CD2 N CA C O CB OG VAL VAL VAL VAL VAL VAL VAL LEU LEU LEU LEU LEU LEU LEU LEU SER SER SER SER SER SER A A A A A A A A A A A A A A A A A A A A A 1 1 1 1 1 1 1 2 2 2 2 2 2 2 2 3 3 3 3 3 3 coordinate X Y Z 10.720 10.228 8.705 8.164 10.602 10.307 12.065 8.091 6.624 6.176 6.567 6.020 6.386 5.998 5.730 5.380 4.831 3.725 3.095 4.308 3.076 19.523 20.761 20.714 20.005 22.000 23.296 21.951 21.453 21.451 22.578 23.730 21.707 20.649 21.119 19.337 22.237 23.237 24.027 23.717 22.429 21.786 6.163 6.807 6.878 6.015 5.966 6.700 5.544 7.775 7.763 6.821 7.022 9.129 10.198 11.577 9.795 5.852 4.928 5.568 6.591 3.727 3.991 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 1.00 21.36 24.26 18.62 19.87 27.19 31.86 31.74 16.19 17.31 18.55 18.72 18.34 17.39 17.99 16.96 15.02 16.59 14.84 14.40 16.47 14.91 N C C O C C C N C C O C C C C N C C O C O … Biofisica 1a3n catena A C O N S EME Fe fisica24ore Biofisica RASMOL v 2.7 http://www.umass.edu/microbio/rasmol/index2.htm fisica24ore Biofisica Tecniche computazionali L’utilizzo complementare di tecniche di tipo sperimentale e di tipo computazionale è l’approccio ottimale per lo studio dei sistemi e dei processi biologici. Questa considerazione riguarda in particolare gli aspetti strutturali del problema, ovvero la conoscenza della conformazione, o variazione di conformazione, di una molecola biologica in relazione alla sua attività. fisica24ore Biofisica Limiti delle tecniche sperimentali risoluzione spaziale strutture molecolari relativamente rigidi misure ad alta risoluzione di sono possibili solo per sistemi risoluzione energetica analisi delle energie di interazione atomica difficoltosa risoluzione temporale i primissimi eventi dei processi biologici sono di difficile misurazione fisica24ore Biofisica Limiti delle tecniche computazionali Sistemi biomolecolari troppo complessi meccanica classica con funzioni di interazione semi-empiriche per descrivere le interazioni tra gli atomi di un sistema molecolare Simulazione del comportamento di un sistema molecolare su un computer solo un numero limitato (<NA) atomi o di gradi di libertà (di solito 102-105 atomi), per un limitato periodo di tempo (102-104 picosecondi) può essere simulato piccoli sistemi, con tempi di rilassamento brevi Campionatura limitata dello spazio delle conformazioni di una macromolecola utilizzo dei dati sperimentali per restringerlo fisica24ore Biofisica importanza della COMPLEMENTARITA’ DELL’APPROCCIO TEORICOSPERIMENTALE fisica24ore Biofisica Alcune Applicazioni In primis: conoscere la struttura tridimensionale a risoluzione atomica della molecola per comprendere, spiegare, e a volte anche modificare ed utilizzare, la sua attività biologica. fisica24ore Biofisica Monitorare i cambiamenti strutturali indotti su peptidi o proteine da parte di MEMBRANE BIOLOGICHE, i quali sembrano essere fondamentali per il riconoscimento con il recettore o per oltrepassare la fase lipidica e raggiungere zone altrimenti inaccessibili. fisica24ore Biofisica Effettuare MUTAZIONI puntiformi, che possono fornire indicazioni utili per il riconoscimento del sito attivo o di strutture indispensabili all'attività della molecola o dirette ad una certa funzione. fisica24ore Biofisica Studiare le variazioni conformazionali provocate dall’interazione della proteina con uno o più LIGANDI, la quale fornisce l’attivazione (o inattivazione) necessaria per compiere la propria funzione biologica (o per impedirla). fisica24ore Biofisica Comprendere il processo di FOLDING delle proteine, ovvero il meccanismo di ripiegamento con cui raggiungono la confomazione biologicamente attiva. fisica24ore Biofisica Applicazioni FARMACOLOGICHE: viene fornita un’indicazione specifica, o quanto meno restrittiva, della struttura opportuna in funzione del bersaglio del farmaco. In questo campo, la costruzione di strutture calibrate permette di ridurre la ricerca ad un ristretto raggio d’azione. fisica24ore Biofisica Modellizzazione molecolare fisica24ore Biofisica Ipotesi termodinamica di Anfinsen (per proteine a singolo dominio) L’informazione codificata nella amminoacidica di una proteina completamente la sua struttura nativa sequenza determina Lo stato nativo è il minimo assoluto dell’energia libera della proteina fisica24ore Biofisica Diagramma di flusso della modellizzazione proteica Sequenza proteica Allineamento multiplo di sequenza Proteina omologa nella banca dati PDB? Dati sperimentali Ricerca nelle banchedati No Sì Modellizzazione comparativa Modello tridimensionale della proteina fisica24ore Assegnazione dei domini Predizione della struttura secondaria Predizione del fold Analisi della famiglia del fold Allineamento delle strutture secondarie Allineamento della sequenza alla struttura Sì E’ stato predetto un fold? No Predizione della struttura terziaria Biofisica Permette di costruire la struttura tridimensionale di una proteina sulla base della SIMILARITÀ DI SEQUENZA con un’altra proteina di struttura NOTA che viene usata come STAMPO. fisica24ore Biofisica Passi fondamentali 1. Allineamento di sequenza con la/le proteina/e “stampo” * aa identici . aa simili fisica24ore 4mdh.aa 11BMD 1 1 SEPIRVLVTG AAGQIAYSLL YSIGNGSVFG KDQPIILVLL DITPMMGVLD KAPVRVAVTG AAGQIGYSLL FRIAAGEMLG KDQPVILQLL EIPQAMKALE *.** *** *****.**** . *. * ..* ****.** ** .* * *. 4mdh.aa 11BMD 51 51 GVLMELQDCA LPLLKDVIAT DKEEIAFKDL DVAILVGSMP RRDGMERKDL GVVMELEDCA FPLLAGLEAT DDPDVAFKDA DYALLVGAAP RKAGMERRDL **.***.*** .*** . ** * ..**** * *.***. * *. ****.** 4mdh.aa 11BMD 101 101 LKANVKIFKC QGAALDKYAK KSVKVIVVGN PANTNCLTAS KSAPSIPKEN LQVNGKIFTE QGRALAEVAK KDVKVLVVGN PANTNALIAY KNAPGLNPRN * * *** ** ** ** * ***.**** ***** * * *.**.. * 4mdh.aa 11BMD 151 151 FSCLTRLDHN RAKAQIALKL GVTSDDVKNV IIWGNHSSTQ YPDVNHAKVK FTAMTRLDHN RAKAQLAKKT GTGVDRIRRM TVWGNHSSTM FPDLFHAEVD *. .****** *****.* * * * .. . .******* .**. ** * 4mdh.aa 11BMD 201 201 LQAKEVGVYE AVKDDSWLKG EFITTVQQRG AAVIKARKLS SAMSAAKAIC GRP----ALE LVDME-WYEK VFIPTVAQRG AAIIQARGAS SAASAANAAI .. * * . * ** ** *** **.* ** * ** ***.* 4mdh.aa 11BMD 251 246 DHVRDIWFGT PEGEFVSMGI ISDGNSYGVP DDLLYSFPVT IKDKTWKIVE EHIRDWALGT PEGDWVSMAV PSQGE-YGIP EGIVYSFPVT AKDGAYRVVE .*.** .** ***. ***.. *.*. **.* . ..****** ** . ..** 4mdh.aa 11BMD 301 295 GLPINDFSRE KMDLTAKELA EEKETAFEFL SSA GLEINEFARK RMEITAQELL DEMEQVKALG LI ** **.*.* .*..** ** .*.* . Biofisica 2. Costruzione dello scheletro fisica24ore Biofisica 3. Inserimento delle catene laterali fisica24ore Biofisica 4. Inserimento dei loop corrispondenti a “buchi” nell’allineamento fisica24ore Biofisica 5. Ottimizzazione del modello Regolarizzazione di legami, angoli e torsioni Eliminazioni di clash strutturali Minimizzazione energetica fisica24ore Biofisica 6. Controllo della qualità del modello fisica24ore Biofisica Meccanica molecolare Comprende la DINAMICA MOLECOLARE, la RICERCA DELL’ENERGIA CONFORMAZIONALE, e il RICONOSCIMENTO MOLECOLARE (DOCKING). fisica24ore Biofisica Ad ogni conformazione molecolare è associata un’ENERGIA fisica24ore Biofisica La meccanica molecolare considera gli atomi come sfere e i legami come molle. La forma più semplice dell’energia potenziale di una molecola è : ENERGIA pot = Energia di ALLUNGAMENTO dei legami + Energia di PIEGAMENTO degli angoli di legame + Energia di TORSIONE degli angoli diedri + Energia delle interazioni di NONLEGAME: repulsioni steriche, interazioni di Van der Waals, interazioni elettrostatiche fisica24ore Forma equazione + parametri = force field Biofisica Ricerca dell’energia conformazionale Ipotesi termodinamica di Anfinsen (per proteine a singolo dominio) L’informazione codificata nella amminoacidica di una proteina completamente la sua struttura nativa sequenza determina Fi V ri Lo stato nativo è il minimo assoluto dell’energia libera della proteina fisica24ore Biofisica La superficie dell'energia libera configurazionale di una proteina è tipicamente "rugosa", poichè esistono molti stati metastabili, alcuni dei quali hanno un'energia molto vicina al minimo globale (problema della ricerca del minimo assoluto) fisica24ore Biofisica Conformazione energeticamente preferita minimo globale dell'energia potenziale risultante delle forze nulla Fi V ri equilibrio stato più popolato fisica24ore Biofisica Minimizzazione dell’energia Minimizzare l'energia potenziale di una molecola significa trovare un percorso (costituito dalle variazioni dei gradi di libertà intramolecolari) che conduca da una conformazione iniziale alla conformazione a minima energia più vicina (MINIMO LOCALE), usando il minor numero di calcoli possibile. fisica24ore Biofisica Campionamento energetico sistematico: L’energia viene campionata ad intervalli regolari sull’intera estensione di ciascun grado di libertà (tipicamente rotazioni dei legami). fisica24ore Biofisica Annealing simulato: riscaldamento ad alta temperatura che modifica la struttura superando le barriere energetiche, seguito da un raffreddamento lento. fisica24ore Biofisica Ricerca casuale: campionamento che genera strutture in maniera casuale, le quali vengono poi minimizzate Dinamica molecolare: superamento delle barriere energetiche conformazionali (più basse dell'annealing) e analisi della stabilità strutturale. fisica24ore Biofisica Dinamica molecolare Permette lo studio di processi dinamici complessi che avvengono nei sistemi biologici. Studia sia transizioni conformazionali che vibrazioni locali, ad esempio: stabilità delle proteine variazioni conformazionali folding proteico trasporto ionico fisica24ore Biofisica Calcola la TRAIETTORIA di un sistema molecolare = la configurazione molecolare in funzione del tempo, ovvero come variano nel tempo le posizioni, le velocità e le accelerazioni degli atomi della molecola. fisica24ore Biofisica La traiettoria è generata da integrazioni simultanee dell’ equazione del moto di Newton Fi = mi ai per tutti gli atomi del sistema molecolare Tenendo presente che la forza si può esprimere come gradiente dell'energia potenziale: Fi = - dV/dri si combinano le due equazioni e si ottiene: - dV/dri = mi d2ri/dt2 che collega la derivata dell'energia potenziale alle variazioni di posizione in funzione del tempo ed è quella che viene integrata. fisica24ore Biofisica Perciò per calcolare una traiettoria c'è bisogno: 1. delle posizioni iniziali degli atomi (coordinate atomiche) 2. delle velocità iniziali 3. delle accelerazioni 1. le posizioni inziali ri si ricavano da strutture sperimentali (cristallografia raggi X, NMR ecc.) o ottenute con modeling; 2. le velocità iniziali vi si ottengono dalla distribuzione delle velocità ad una data temperatura; 3. le accelerazioni sono dell'energia potenziale. fisica24ore determinate dal gradiente Biofisica Le posizioni e le velocità iniziali (t = 0) determinano le posizioni e le velocità a tutti gli altri tempi t. In pratica si considerano intervalli di integrazione finiti Dt. Dt tipicamente va da 0.1 a 10 fs per i sistemi molecolari una simulazione di 100 ps coinvolge 105106 intervalli di integrazione. fisica24ore Biofisica Sistema allo zero assoluto Riscaldamento lento alla temperatura di simulazione Riequilibrazione dell’energia tra gli atomi Temperatura di simulazione desiderata Energia cinetica totale del sistema Distribuzione iniziale di velocità vi fisica24ore Biofisica Struttura iniziale Minimizzazione dell’ energia rimuove interazioni di Van der Waals forti che porterebbero a distorsioni locali Solvatazione della proteina nel caso si usi un solvente esplicito, aggiungere le molecole d’acqua Minimizzazione dell’ energia in presenza del solvente Fase di riscaldamento Fase di equilibrazione per equilibrarlo con la struttura si lancia la MD con velocità iniziali a bassa temperatura nuove velocità riassegnate periodicamente a T leggermente più alta e così via fino al raggiungimento della T di simulazione desiderata. la simulazione prosegue finchè sono stabili nel tempo la struttura, la pressione, la temperatura (si riscalano le velocità), l'energia Fase di simulazione vera e propria fisica24ore Biofisica Analisi dei risultati Campionamento periodico di coordinate (e velocità) Calcolo dell’energia potenziale media in funzione del tempo Calcolo della differenza con la struttura di partenza in funzione del tempo Energia potenziale (Kcal/mol) 200 100 0 -100 -200 -300 -400 -500 -600 -700 -800 -900 0 500 1000 1500 2000 tempo (ps) media 1700ps 1600ps 1500ps 1400ps 1300ps 1200ps 1100ps 1000ps 900ps Calcolo della superficie accessibile al solvente e del raggio di girazione, in funzione del tempo 800ps 700ps 600ps 500ps 400ps -strand 300ps -helix 200ps S1 H1 H2 S2 S3 S4 S5 S6 S7 S8 S9 S10 100ps 10 20 30 40 50 60 70 80 90 100 110 120 130 Residue number Calcolo della struttura media fisica24ore Biofisica Riconoscimento molecolare E’ il punto di partenza per quasi tutti i processi biologici. Le molecole interagiscono in una maniera altamente specifica: modello CHIAVE-SERRATURA (Fisher e Ehrilch) fisica24ore Biofisica La complementarità geometrica e chimica fra piccole molecole biologiche (LIGANDI) e le strutture dei loro bersagli macromolecolari (RECETTORI) gioca un ruolo molto importante all’interno dei processi biologici. fisica24ore Biofisica Elemento chiave: scoperta di composti guida nuovi e innovativi Composto guida = composto che mostra affinità per un dato recettore, che ha attività biologica e che può essere strutturalmente modificato per migliorare la bioattività fisica24ore Biofisica tempi per lo sviluppo di un nuovo farmaco 1. 2. 3. 4. 5. 6. Ricerca del composto guida (1-2 anni) Ottimizzazione del composto guida (1-2 anni) Saggi di attività in vitro e in vivo (1-2 anni) Test tossicologici (1-3 anni) Test per la sicurezza sull’uomo (1 anno) Test per l’efficacia sull’uomo (1-2 anni) Tempo totale per lo sviluppo di un nuovo farmaco: 6-12 anni Costo totale: circa $ 500 000 000 è di grande importanza l’identificazione RAPIDA E AFFIDABILE di ligandi ad alta affinità fisica24ore Biofisica Screening sperimentale: test in vitro di grandi librerie di composti. Ignora, in genere, le proprietà strutturali del recettore fisica24ore Metodi computazionali detti Rational Design: si basano su informazioni strutturali del recettore e/o del ligando Biofisica Metodi computazionali Struttura 3D del recettore NON nota QSAR (Quantitaive Structure-Activity Relationship) Stabilisce una relazione tra la struttura molecolare e l’attività biologica di una serie di composti attivi. Predice la attività e la affinità di composti non noti dall’analisi delle loro similitudini e differenze strutturali, fornendo informazioni sui requisiti strutturali del recettore. fisica24ore Struttura 3D del recettore nota Structure Based Drug Design De Novo Design I nuovi composti vengono generati nel sito di legame a partire da atomi o frammenti preposizionati nel sito e che successivamente vengono trasformati in molecole intere da softwares specifici. Screening Virtuale Librerie di molecole (esistenti o ipotetiche) vengono analizzate cercando ligandi con caratteristiche in accordo con i requisiti del sito di legame Docking Biofisica Predice la struttura 3D di complessi proteina-ligando. Trova il corretto modo di legame di un composto, tramite il campionamento dello spazio conformazionale nel sito di legame, attraverso la valutazione di funzioni che stimano l’energia di ogni combinazione confomazionale ligandorecettore. Tali funzioni valutano: •Complementarità fra superficie •Energia libera di solvatazione •Interazioni elettrostatiche e idrofobiche fisica24ore Biofisica fisica24ore Biofisica fisica24ore Biofisica Le tecniche computazionali rappresentano uno strumento molto utile per: •la modellazione di sistemi proteici •la comprensione dei processi biologici •la comprensione della relazione struttura-attività •la scoperta e ottimizzazione dei composti guida farmacologici Vantaggio dal punto di vista biologico, chimico e farmaceutico, riducendo i tempi e completando e indirizzando le conoscenze sperimentali fisica24ore Biofisica