Università degli studi di Milano-Bicocca Facoltà di Scienze MFN LA LAUREA MAGISTRALE IN BIOINFORMATICA Che cos'è la BIOINFORMATICA? Il termine BIOINFORMATICS è stato inventato da P. Hogeweg nel 1978 La BIOINFORMATICA è una applicazione della INFORMATION TECHNOLOGY al campo della BIOLOGIA. Il primo scopo della bioinformatica è CONTRIBUIRE AD AUMENTARE IL LIVELLO DI CONOSCENZA DEI SISTEMI BIOLOGICI Un altro scopo è quello di far progredire tutte le metodologie caratteristiche della bioinformatica stessa. La Bioinformatica si occupa di * SEQUENCE ANALYSIS * GENE FINDING * GENOME ASSEMBLY * PROTEIN STRUCTURE PREDICTION * PROTEIN-LIGAND INTERACTION * ANALYSIS OF GENE EXPRESSION * MODELLING OF METABOLIC NETWORKS * MODELLING OF EVOLUTION * SYSTEMS BIOLOGY Nei primi anni della bioinformatica i temi di studio erano essenzialmente quelli in 1-4 (analisi di sequenze) Gli sviluppi successivi e le espansioni della bioinformatica a settori diversificati sono dovuti essenzialmente ai seguenti fattori i) Aumento delle potenze di calcolo (in trent'anni di almeno TRE ordini di grandezza) ii) Sviluppo delle metodologie numeriche e degli algoritmi per studiare sistemi complessi iii) Sviluppo della teoria dei sistemi Allo sviluppo della BIOINFORMATICA concorrono le discipline Informatica Biologia Molecolare Biochimica Genetica Chimica Fisica Matematica Proprio per il carattere INTERDISCIPLINARE della BIOINFORMATICA e’ importante che laureati in diverse discipline scientifiche abbiano accesso alla LAUREA MAGISTRALE La laurea magistrale è stata modificata proprio a tale scopo, per l'anno accademico 2009-2010 Sedi italiane : Milano-Bicocca, Bologna, Roma (Tor Vergata) Comparazione di sequenze proteiche. Evoluzione molecolare e funzione Primary sequence (PE and SE, ~ 210-250 aa ): 68.2% identity 76 amino acidic substitutions (45 completely unrelated aa). Maiale Bovina MerluzzoB Salmone Maiale Bovina MerluzzoB Salmone Maiale Bovina MerluzzoB Salmone VVGGTEAQRNSWPSQISLQYRSGSSWAHTCGGTLIRQNWVMTAAHCVDRELTFRVVVGEH VVGGTAVSKNSWPSQISLQYKSGSSWYHTCGGTLIKQKWVMTAAHCVDSQMTFRVVLGDH VVGGEDVRVHSWPWQASLQYKSGNSFYHTCGGTLIAPQWVMTAAHCIGSR-TYRVLLGKH VVGGRVAQPNSWPWQISLQYKSGSSYYHTCGGSLIRQGWVMTAAHCVDSARTWRVVLGEH **.* . ::** * *** .. : *.***:*: **:*****:. :** :* * NLNQ-NNGTEQYVGVQKIVVHPYWNTDDVAAGYDIALLRLAQSVTLNSYVQLGVLPRAGT NLSQ-NDGTEQYISVQKIVVHPSWNSNNVAAGYDIAVLRLAQSATLNSYVQLGVLPQSGT NMQDYNEAGSLAISPAKIIVHEKWD—-SSRIRNDIALIKLASPVDVSAIITPACVPDAEV NLNT-NEGKEQIMTVNSVFIHSGWNSDDVAGGYDIALLRLNTQASLNSAVQLAALPPSNQ .: : .:.:* *: *:*:::: . . : . :* ILANNSPCYITGWGLTRTNGQLAQTLQQAYLPTVDYAICSSSSYWGSTVKNSMVCAGGDG ILANNTPCYITGWGRTKTNGQLAQTLQQAYLPSVDYATCSSSSYWGSTVKTTMVCAGGDG LLANGAPCYVTGWGRLWTGGPIADALQQALLPVVDHAHCSRYDWWGSLVTTSMVCAGGDG ILPNNNPCYITGWGKTSTGGPLSDSLKQAWLPSVDHATCSSSGWWGSTVKTTMVCAGG-G :*.. **:**** *.* . *:*. : .: ** :*** : . *:*.** * Predizione della struttura 3D delle proteine con tecniche di homology modelling Templati utilizzati per la generazione del modello Modello per omologia Analisi della struttura delle proteine (relazioni tra struttura e funzione) Secondary Structure (SS) content Solvent accessible surface Individuazione dei siti recettoriali Individuazione di cavità e probabili siti di legame • Le sfere evidenziano delle cavità nella proteina, inoltre ci forniscono informazioni sulle caratteristiche di idrofobicità e idrofilia del ligando Sito principale Siti secondari Docking Molecular modelling, MM, MD, site_finder 106 compounds In silico ADME MOO Library generation, QM, 350 Molecular Descriptors, Docking 102 compounds potentilally LEADS Yeast protein interaction network[Jeong et al., Nature (2001)] I network proteici possiedono delle proprietà computazionali, che derivano dal fatto che le proteine sono parte di “moduli” la cui funzione dipende dalla struttura della proteina e dalla topologia del network in cui e’ coinvolta Problemi: • network molto complicati dove e’ difficile individuare moduli • network solo parzialmente noti Bioinformatica Reti regolatorie e reti metaboliche Reti regolatorie e reti metaboliche Reti regolatorie e reti metaboliche