Genoma La determinazione e la conoscenza dell’intera sequenza genomica è la condizione necessaria per comprendere la biologia di un determinato organismo Il genoma contiene le istruzioni (geni) per la realizzazione di un organismo. Fibrillina a Sindrome di Marfan (nome inglese Marfan Sindrome) è un’alterazione del tessuto connettivo a trasmissione autosomica dominante: L’incidenza della patologia è di un soggetto affetto su 5.000 – 10.000 nati vivi, e va detto anche che un certo numero di pazienti (il 25% circa) è rappresentato da casi sporadici, ossia da soggetti che non hanno storia familiare e quindi sono portatori di una mutazione “fresca”. Tra gli apparati colpiti dalla sindrome di Marfan vi è anzitutto quello cardiovascolare, con problemi di aneurisma, di disseccazione dell’aorta e di prolasso della valvola mitrale. Risultano poi coinvolti anche gli occhi (ectopia della lente, miopia) e lo scheletro (scoliosi, anomalie della gabbia toracica). La malattia può infine interessare anche il sistema nervoso centrale, i polmoni, la pelle e i legamenti. Nel 1992 è stato identificato uno dei geni principali che causano la sindrome di Marfan: si tratta del gene fibrillina 1 (FBN1), localizzato sul cromosoma 15 in posizione 21.1, il quale codifica per un microfilamento che è un importante costituente del tessuto elastico. Tale gene – e la proteina che viene da esso codificata- risultano mutati nel 60% dei pazienti con Sindrome di Marfan. Una mancata diagnosi e prevenzione cardiovascolare può portare alla morte improvvisa: . Fibrillina 1 Glicoproteina del tessuto connettivo, che interagisce con le altre proteine della matrice extracellulare; Importante per la normale costituzione della parete dei vasi e dello scheletro. La fibrillina è alla base del difetto molecolare di altre patologie quali: Fenotipo MASS; Ectopia della lente; Aneurisma aorticotoracico familiare; Dissezione aortica toracica familiare. Il gene per la fibrillina 1 è sul cromosoma 15q21. Motori di ricerca dei genomi Ensembl è una banca dati bioinformatica allestita con lo scopo di fornire informazioni aggiornate sui principali genomi eucariotici. http://www.ensembl.org/Homo_sapiens/Info/Index Gene fibrillina Genomica Studio del genoma degli organismi viventi • Il genoma di un organismo contiene l’informazione biologica necessaria per la vita. • Il genoma e’ rappresentato dai cromosomi e dal DNA mitocondriale (negli eucarioti) di una cellula • Ciascun cromosoma contiene le unità funzionali del DNA, denominate geni. La biologia nell’era post-genomica • • • • • • Bioinformatica Genomica funzionale Genomica comparata Proteomica Trascrittomica Biologia dei sistemi (metabolomica, trasduttomica, interactoma, ecc…) • Farmacogenomica Identificazione delle regioni codificanti meantnfmcosarjthyuyifkfmnsbzvcaxqswthyujuk bnpyoitjguryrtefdgvcbxnservejkamnsbegdfvrtty ghjukiolmmlabnvbcvxcsdfergrtbioinformatica?g jyiuoljpgkbidhgrtfydhsn meantnfmcosarjthyuyifkfmnsbzvcaxqswthyujuk bnpyoitjguryrtefdgvcbxnservejkamnsbegdfvrtty ghjukiolmmlabnvbcvxcsdfergrtbioinformatica? gjyiuoljpgkbidhgrtfydhsn Genomica Ogni persona rappresenta la realizzazione di un progetto genomico specifico, condiviso tra gli altri esseri umani. Pur mantenendo costante il numero e la tipologia di geni, il nostro genoma è costituito da una sequenza di nucleotidi diversa da individuo ad individuo. Ciascun individuo è geneticamente unico. Tipologie di sequenze nel genoma umano Bioinformatica e Genomica APPLICAZIONI DELLA BIOINFORMATICA IN BIOMEDICINA Modelli molecolari funzionali Farnacogenomica Progettazione di nuovi farmaci Reti neurali di apprendimento Genomica funzionale: proteomica Modelli interattivi delle vie metaboliche Maria Grazia Romanelli COMPLESSITA’ BIOLOGICA METODI DI STUDIO DELLA COMPLESSITA’ BIOLOGICA 30.000? Progetti (30.000-100.000) Genoma Gene mRNA Splicing alternativo precursore proteico ?? 150.000?? Taglio della eventuale sequenza segnale Eventuali modificazioni post-traduzionali proteina matura (FUNZIONE) Interazioni proteina-proteina Network complessi ?? N.B. Il delicato equilibrio di un organismo dipende da una moltitudine di funzioni finemente organizzate e regolate da una moltitudine di proteine diverse che interagiscono tra loro in network complessi di interazioni reversibili OMICS Genomica: si occupa dello studio del genoma degli organismi viventi. In particolare si occupa della struttura, contenuto, funzione ed evoluzione del genoma. Trascrittomica si occupa dell'espressione dei geni negli RNA messaggeri di un intero organismo o di un particolare organo, tessuto o cellula in un particolare momento dello sviluppo dell'organismo o in risposta ad un stimolo Proteomica si occupa dell'insieme di tutte le proteine di un organismo di un tessuto o di una cellula, con l'obbiettivo di determinarne la sequenza, la funzione, la struttura tecnologie tridimensionale e Le le interazioni Genomica OMICS • Genomica funzionale • Genomica comparata Trascittomic a Proteomica • Profili di espressione degli RNAm (microarray) • RNAi/miRNA (interferomica/microRNA omica • Interattomica • Epigenomica • metabolomica applicate alle “omiche” richiedono l’analisi bioinformatica 11 Linguaggio biologico • Lingua italiana • Genoma Alfabeto: 21 lettere 4 lettere Libretto di istruzioni biologiche • DNA : 3.3 miliardi di nucleotidi distribuiti in 23 cromosomi • Le informazioni sono rappresentate da sequenze nucleotidiche in cui si ripetono in numero e ordine diverso 4 tipi di basi azotate Adenina (A) , guanina (G) citosina ( C) timina (T) A caccia del gene Genoma Specie Homo sapiens Saccharomyces cerevisiae Drosophila melanogaster Dimensioni del genoma (milioni di basi) 3200 12.1 Numero di geni N° geni teorico in proporzione al genoma umano 28 000 5800 98 180 13 600 1576 Paradosso del valore C: non equivalenza tra le dimensioni del genoma e il numero di geni nel confronto tra gli eucarioti. DNA codificante e non % 4.7 Mb 12.1 Mb 100 Mb 3000 Mb Genoma Umano 3000 Mb Geni e sequenze associate 900 Mb Non codificante 810 Mb Introni Codificante 90 Mb Pseudogeni Regioni di controllo DNA extragenico 2100 Mb DNA unico e a basso numero di copie 1680 Mb Ripetuto in tandem Minisatelliti Microsatelliti Satellite DNA ripetitivo 420 Mb Disperso SINE LINE Retroposoni Il DNA spazzatura è veramente tale? Il cariogramma umano Centromero = geni ribosomiali Eterocromatina costitutiva Alberts et al. 2005 Sequenza nucleotidica del gene della globina beta dell’uomo. • Le sequenze geniche si possono scrivere e leggere come un testo. • ORF: open reading frame, cornice di lettura del gene. Organizzazione in esoni ed introni I geni degli eucarioti sono interrotti • Esoni sono le sequenze tradotte, introni sono le sequenze che interrompono in segmenti di numero variabile il gene.