Fisica Computazionale applicata alle Macromolecole Struttura e funzione delle proteine 2 Pier Luigi Martelli Università di Bologna [email protected] 051 2094005 338 3991609 Classificazione strutturale: Proteine globulari e di membrana Outer Membrane proteins (all b-Transmembrane proteins) Inner Membrane proteins (all a-Transmembrane proteins) Classificazione strutturale: Domini Porzione di struttura “strutturalmente indipendente” Fattore XIII della coagulazione (1F13) Dominio 2 Dominio 1 Dominio 3 Dominio 4 Classificazione strutturale: Domini Porzione di struttura “strutturalmente indipendente” Alcool deidrogenasi (2OHX) Dominio 1 Dominio 2 N C Dominio 1 non contiguo un sequenza Confronto tra strutture Possiamo confrontare domini strutturali di diverse proteine? Similarità strutturale tra Acetilcolinesterasi e Calmodulina (Tsigelny et al, Prot Sci, 2000, 9:180) Sovrapposizione e allineamento strutturale A D c E d a B b C Sovrapposizione strutturale Allineamento strutturale tra le sequenze ABCDE-abcde e Misure di sovrapposizione RMSD d ( X , x) N 2 Confronto tra strutture CE http://cl.sdsc.edu/ce.html CE: Sovrapposizione strutturale Rosso: 1KEV: Alcool deidrogenasi di Clostridium beijerinckii Blu: 2OHX: Alcool deidrogenasi E di Cavallo CE: Allineamento strutturale Sovrapposizione a “grana grossa”: solo il backbone viene considerato Classificazioni gerarchiche Possiamo classificare “tassonomicamente i domini” ? CATH http://www.biochem.ucl.ac.uk/bsm/cath_new/index.html C: Class Composizione in struttura secondaria A: Architecture Forma complessiva, ignora connettività della catena T: Topology Si tiene in considerazione la connettività H: Homologous Famiglie di omologia (famiglie derivanti da un ancestore comune) CATH Stessa architettura, diversa topologia Halorodospina: 1E12 Acquaporina: 1FQY Classificazioni gerarchiche La classificazione più affidabile NON è automatica SCOP http://scop.mrc-lmb.cam.ac.uk/scop/ Quanti fold esistono? Nuovi fold (azzurro) e vecchi fold (arancio) depositati ogni anno Quanti fold esistono? Percentuale di fold unici sul totale delle strutture depositate Predizione comparativa E’ possibile invertire il procedimento? Date due sequenze: 1) E’ possibile capire se hanno struttura simile? 2) Se hanno struttura simile, è possibile allinearle (senza informazioni strutturali) in modo da riprodurre l’allineamento strutturale? Se sì, e se una delle due sequenze è a struttura risolta, possiamo predire la struttura dell’altra sequenza SOVRAPPONENDO i residui secondo l’allineamento Fold Recognition e Threading Fold Recognition: è possibile capire se due proteine hanno struttura simile? >Protein XY MSTLYEKLGGTTAVDLAV DKFYERVLQDDRIKHFFA DVDMAKQRAHQKAFLTYA FGGTDKYDGRYMREAHKE LVENHGLNGEHFDAVAED LLATLKEMGVPEDLIAEV AAVAGAPAHKRDVLNQ ? Threading: se sì, è possibile allinearle in modo corretto? Modelling comparativo (Omologia/Threading) A D E B C ABCDE-abcde E per nuovi fold? Predizioni ab initio MNIFEMLRID HLLTKSPSLN DEAEKLFNQD LDAVRRCALI LQQKRWDEAA TTFRTGTWDA EGLRLKIYKD AAKSELDKAI VDAAVRGILR NMVFQMGETG VNLAKSRWYN YKNL TEGYYTIGIG GRNCNGVITK NAKLKPVYDS VAGFTNSLRM QTPNRAKRVI Classificazione funzionale Relativamente semplice per enzimi: EC: http://us.expasy.org/enzyme/ Enzyme Classisication Molto complicato in casi più generali GeneOntology: http://www.geneontology.org/ Vengono adottati differenti criteri classificativi: Molecular Function Biological Process Cellular Component Alcune proteine possono esplicare più funzioni a seconda delle condizioni cellulari (Moonlight proteins) E’ possibile inferire la funzione dal fold? Histidase [1B8F] Aspartase [1JSW] 2-Crystallin [1AUW] Avian eye lens protein Dati: Torsten Schwede Università di Basilea E’ possibile inferire la funzione dal fold? •I 5 fold più rappresentati (TIM-barrel, alpha-beta hydrolase, Rossmann, P-loop containing NTP hydrolase, ferredoxin fold), sono associabili a un numero di funzioni differenti da 5 a 16 •Attenzione: NON significa che la struttura non determina la funzione (“grana del confronto”) E’ possibile inferire il fold dal funzione? •Le due funzionipiù rappresentate (idrolasi e Oglicosil-glucosidasi) sono associate a 7 fold ognuna NON ESISTE RELAZIONE FUNZIONE E FOLD BIUNIVOCA TRA Dati: Torsten Schwede Università di Basilea PREDIZIONE DI STRUTTURA e FUNZIONE DI PROTEINE Che fare? Possibili risposte derivano da ipotesi sul come hanno avuto origine le sequenze proteiche di ogni organismo. IDEE?