Sequenze nucleotidiche Sequenze proteiche TRADUZIONE Esercizio relativo alla traduzione di una sequenza nucleotidica in una sequenza amminoacidica Data la sequenza del gene della b-emoglobina umana: … ctggcccacaagtatcactac… 1)Scrivere la traduzione di questa sequenza in una sequenza amminoacidica 2)Scrivere la sequenza nucleotidica per un cambiamento di una singola base che produca una mutazione silente in questa regione (la mutazione silete è quella che lascia invariata la sequenza amminoacidica) 3)Scrivere la sequenza nucleotidica e la traduzione in sequenza amminoacidica per un cambiamento di una singola base che produca una mutazione di un amminoacido. Ricerca di pattern e di motivi funzionali Qualche definizione necessaria ……. Un motivo di interesse biologico è costituito da un insieme di caratteri (nucleotidi o amminoacidi) non necessariamente contigui nella sequenza ma che si trovano sempre o sono spesso associati ad una precisa struttura e funzione biologica (ad esempio: promotori o hanno la stessa capacità di legare nucleotidi) La bioinformatica si occupa di sviluppare metodi per il riconoscimento di pattern di interesse biologico e di curare banche dati in cui tali pattern siano organizzati e resi disponibili per l’analisi strutturale e funzionale di nuove sequenze. Ciò deriva dal fatto che nel corso dell’evoluzione la natura ha sviluppato uno o pochi modi per erealizzare una nuova funzione (ad es. attività catalitica o altro) Per quanto riguarda la Ricerca di pattern e motivi funzionali in sequenze nucleotidiche Ricercare i siti di giunzione tra introni ed esoni Un gene è costituito da una sequenza codificante interrotta da sequenze non codificanti (dette introni). I geni sono combinazioni di corti esoni ed introni di lunghezza variabile. Il termine esoni si applica a tutte le regioni che non sono eliminate nel corso di maturazione del RNA [cioè le regioni non tradotte al 5’ dei geni, quelle codificanti vere e proprie (CDS) e le regioni non tradotte al 3’]. Identificare i siti di giunzione tra introni ed esoni per una corretta predizione della struttura di un gene. NetGene: http://genome.cbs.dtu.dk/services/NetGene2/ GenScan: http://genes.mit.edu/GENSCAN.html GenScan è il programma più usato per predire la struttura di un gene Esercizio 1: Predizioni dei geni codificanti proteine in sequenze genomiche mediante GenScan Ricerchiamo i geni in una sequenza genomica prodotta nell’ambito del progetto di sequenziamento del genoma di Fugu. Collegandosi al sito: http://fugu.hgmp.mrc.ac.uk/fugu-bin/clonesearch/ si effettua la ricerca della sequenza scaffold S004519. La sequenza così estratta può essere utilizzata per la predizione utilizzando il programma GenScan. La sequenza estratta viene incollata nella box clicca su Run GenScan Nell’output di GenScan sono indicati tutti i geni predetti, per ciascuno dei quali viene riportata la corrispondente ipotetica sequenza amminoacidica. Queste sequenze possono essere caratterizzati: o effettuando una ricerca con BLAST contro la banca dati delle proteine o ricercando i domini o motivi funzionali attraverso il sistema InterPro Esercizio 2: Stabilire con precisione la struttura di uno specifico gene usando GenomeScan (http://genes.mit.edu/genomescan.html) A partire dalla sequenza genomica (S004519) e dalla proteina omologa selezionata con la più alta percentuale di identità di sequenza RunGenomeScan PSORT (http://psort.nibb.ac.jp/form2.html) è una procedura per la predizione della localizzazione delle proteine nella cellula. Riceve informazioni sottoforma di sequenze proteiche associate a localizzazioni subcellulari e ne ricava regole di associazione empiriche. Applicando queste regole ad una sequenza proteica di localizzazione ignota, PSORT giunge a predire la localizzazione, fornendo anche un indice di affidabilità della predizione. Inserire Sequenza Predizione della Struttura terziaria delle proteine Funzione Strutture Sequenze From Tramontano (2004) Predizione della struttura tridimensionale delle proteine Esistono proteine con sequenza simile e struttura 3D nota ? NO Informazione minima necessaria: Sequenza della proteina SI Fold recognition ? La sequenza in esame è compatibile con una struttura 3D nota? Modellamento per omologia Allineamento sequenze SI Costruzione del modello sul riferimento della struttura nota Verifica della qualità del modello NO Modellamento “ab initio” From Costantini et al., 2006 Modellamento Comparativo SEQUENZA ………AQYSKRREVQCSVTDSEKRSLVLVPNSME LHAVMLQGGSDRCKVQL…… BLAST RICERCA DEL TEMPLATO CLUSTALW VALUTAZIONE DEL MODELLO TARGET-TEMPLATE PROSA MODELLO ALLINEAMENTO PROCHECK MODELLER Modellamento Comparativo Modellamento delle Regioni strutturalmente conservate (SCR) Modellamento delle Regioni Loop Modellamento delle Catene Laterali Raffinamento del modellamento Modellamento dei loop Modellamento per omologia SWISSMODEL MODELER Server automatici: SPARKS 2 SP3 3D-JIGSAW Metodi per valutare un modello ottenuto per omologia Server che utilizza Modeller 3D-JIGSAW Metodi per valutare modelli di proteine http://nihserver.mbi.ucla.edu/SAVS/ Per confrontare due strutture in termini di RMSD: http://www.ebi.ac.uk/DaliLite/ PROSA: https://prosa.services.came.sbg.ac.at/prosa.php Fold Recognition Fold noti…… Programmi per costruire modelli per riconoscimento del fold: 3D-PSSM Based on sequence profiles, solvatation potentials and secondary structure http://www.sbg.bio.ic.ac.uk/~3dpssm/index2.html FUGUE uses environment-based fold profiles that are created from structural alignments http://www-cryst.bioc.cam.ac.uk/fugue/ SAMT02 http://www.soe.ucsc.edu/research/compbio/HMM-apps/T02-query.html The query is checked against a library of hidden Markov models. This is NOT a threading technique, it is sequence based. FFAS03 (http://ffas.ljcrf.edu/ffas-cgi/cgi/ffas.pl)This is a variant of FFAS, which aligns profile to profile. Profiles are generated differently from PSI-BLAST THREADER può essere scaricato sul proprio computer ANFINSEN Anfinsen ha dimostrato che alcune proteine in vitro possono essere sottoposte, introducendo agenti denaturanti quali la guanidina e l’urea, ad un processo reversibile di denaturazione, durante il quale perdono la loro struttura tridimensionale. Rimuovendo questi agenti denaturanti si riottiene la struttura tridimensionale attiva caratterizzata da una struttura tridimensionale compatta. PARADOSSO DI LEVINTHAL Levinthal, che si pose il problema del tempo necessario affinché un sistema potesse raggiungere il suo stato di equilibrio. Infatti, supponendo che il numero di conformazioni accessibili al singolo amminoacido sia uguale a due (elica e foglietto beta), per una catena polipeptidica di 100 amminoacidi il numero totale di conformazioni possibili è 2100, che corrisponde a più di 1030. Se noi assumiamo che il tempo di interconversione da una conformazione alla sua alternativa è pari a 10-11 secondi, il tempo necessario per una ricerca casuale di tutte le conformazioni è di 1011 anni. La soluzione di Levinthal a questo paradosso è stata che il meccanismo di folding è sottoposto ad un controllo di tipo cinetico, ovvero che esistono dei veri e propri percorsi definiti, che conducono dalla struttura casuale e lineare (U) alla struttura nativa e funzionale (N) Robetta server (http://robetta.bakerlab.org) HMMSTR: http://www.bioinfo.rpi.edu/~bystrc/hmmstr/server.php DOCKING RIGIDO DOCK AUTO-DOCK DOCKING FLESSIBILE Ci sono vari programmi di docking: Dock, AutoDock, FlexX Questi programmi si basano sulla complementarietà geometrica e chimico-fisica tra le strutture, considerando spesso anche termini energetici ed entropici. ClusPro: http://nrc.bu.edu/cluster/ Z-Dock (http://zlab.bu.edu/zdock/) può essere scaricato sul proprio computer Z-Dock su server: http://zdock.bu.edu/ http://bioinfo3d.cs.tau.ac.il/PatchDock/ http://vakser.bioinformatics.ku.edu/resources/gramm/grammx http://www.csd.abdn.ac.uk/hex_server/ Protein Protein Server valuta gli amminoacidi all’interfaccia Il programma DCOMPLEX valuta l’affinità di legame tra molecole complessate http://sparks.informatics.iuoui.edu/czhang/complex.html ESERCIZIO Prendendo come input il file del recettore e del ligando sul sito, provare ad eseguire un docking con i programmi visti prima.