Adriana Maggi DOCENTE DI BIOTECNOLOGIE FARMACOLOGICHE CORSO DI LAUREA SPECIALISTICA IN BIOTECNOLOGIE DEL FARMACO AA 2011/2012 Lezione 4 Le sfide per il futuro del progetto genoma umano • comprendere le componenti strutturali e funzionali del genoma • capire come le reti di geni e proteine contribuiscono alla definizione del fenotipo • comprendere cosa determina le variazione nella trasmissione dei caratteri genetici • identificare le varianti genetiche che contribuiscono al mantenimento dello stato di salute • determinare strategie per identificare il rischio di malattia • stabilire strategie per l’identificazione del contributo del genoma nella determinazione delle patologie e delle risposte alla terapia • utilizzare le conoscenze genetiche per lo sviluppo di farmaci innovativi Il progetto Genoma Umano si è focalizzato sulla generazione di mappe genomiche tramite mappe di concatenazione e mappe fisiche. Una mappa genomica indica l’ordine in cui i geni e i marcatori genici si trovano nei singoli cromosomi Nella ricerca del gene malattia, i ricercatori in genere trovano un marcatore specifico che indica il segmento di DNA nelle vicinanze del gene di interesse, con clonaggi posizionali e analisis di sequenze si possono individuare I geni responsabili della patologia GENOMATICA FUNZIONALE Studio di funzione genica LA RICERCA DELLA FUNZIONE DEI GENI La tradizione: ricerca di di mutazioni per identificare perdite o acquisizione di funzioni I metodi della genetica all’incontrario: Analisi mutazionale in organismi modello: Generare nuovi organismi geneticamente modificati per studiare perdita o acquisizione di funzioni Metodologie innovative: Studio comparativo di popolazioni di prodotti genici La tradizione: ricerca e analisi di mutazioni e polimorfismi (es RFLP; SNP) del genoma stesso Siti polimorfici • 99.99 % della sequenza del DNA di due individui e’ identica • la maggioranza delle differenze (0.01%) coinvolgono singole sostituzioni Polimorfismi al taglio con enzimi di restrizione (RFLP) Single nucleotide polymorphysm (SNP) Polimorfismi al taglio con enzimi di restrizione (RFLP) Allele 1 * Allele 2 Polimorfismi al taglio con enzimi di restrizione (RFLP) associazione RLFP-patologia variab nella popol. Famiglia Patol. sani The Lod (log of odds) score is used to calculate the probability of a pedigree arising randomly or by genetic linkage. The test was developed by Newton and Morton LOD = log Probability of birth sequence with a given linkage value Probability of birth sequence with no linkage In practice, linkage is declared if the LOD score is equal to or greater than 3 (i.e. the likelihood of observing the result if the two loci are not linked is less than 1 in 1000). On the other hand, linkage can be completely excluded if the LOD score is strictly below -2. Studio di funzione genica Localizzazione posizionale di geni/malattia Studio di linkage familiare con polimorfismi Huntington, la malattia ideale per position cloning Ereditarietà – autosomica dominante : penetranza 100% Frequenza - circa 1/10,000 nati Manifestazione clinica: 35 - 45 anni di età La manifestazione in età adulta ne ha causato l’espandersi della malattia Gli studi delle basi molecolari della malattia sono iniziati con la identificazione di famiglie di grandi dimensioni i cui membri fossero viventi: questo è stato possibile grazie al registro Nazionale dei Pazienti con Huntington USA presso l’Università dell?Indiana e alla scoperta di una famiglia presso il lago Maracaibo in Venezuela in cui diversi membri erano affetti dalla malattia Da diverse famiglie sono state prelevate cellule ematiche per la Generazione di cellule immortalizzate Ogni famiglia è stata seguita da neurologi e la paternità dei pazienti è stata opportunamente verificata 1981 - Gusella's group started with a group of anonymous probes that uncovered RFLPs - very few available. the 12th probe they tried -called G8 - indicated linkage. Disease associated with the A haplotype in the American family and the C haplotype in the Venezuelan family. LOD Scores 1983 - G8 (also called D4S10) mapped approximately 4 cM from the HD locus. It took 10 more years to clone the gene. 1986-87 DNA markers were used and D4S10 was localized by in situ hybridization and somatic cell genetics to chromosome region 4p16.3; Further linkage studies for isolating HD Identification of Putative Coding Sequences Exon Trapping; Use trapped exons to identify candidate genes from cDNAs; Four transcripts were analyzed; IT15 - Huntingtin Dall’osservazione: Gusella JF, Wexler NS, Conneally PM, Naylor SL, Anderson MSA, Tanzi RE, Walkins PC, et al (1983) A polymorphic DNA marker genetically linked to Huntington's disease. Nature 306:234-238 Al brevetto: Huntingtin DNA, protein and uses thereof US Patent Issued on November 11, 1997 Inventor(s): Marcy E. MacDonald; Christine M. Ambrose; Mabel P. Duyao; James F. Gusella Assignee: The General Hospital Corporation Application: No. 246982 filed on 1994-05-20 Metodologie innovative: Studio comparativo di popolazioni di prodotti genici • genomatica comparativa • generazione di arrays per lo studio comparato di espressione genica Genomatica comparata: analisi basata sulla omologia di geni codificanti proteine a funzione nota Genomatica comparata Utile per: • • • • Identificare similarità/dissimilarità tra speci diverse Studiare evoluzione della specie Identificare geni codificanti e loro funzione Identificare regioni funzionali nei genomi Ortologo e paralogo • Ortologhi – geni omologi con la stessa funzione in organismi diversi • Paraloghi – geni all’interno dello stesso organismo derivanti da duplicazione genica Geni ortologhi o paraloghi Allineamento di sequenze generazione di arrays per lo studio comparato di espressione genica ARRAY MACROARRAY MICROARRAY DNA microarray (o gene/genome chip, DNA chip, o gene array) è una collezione di depositi puntiformi di DNA, ciascun punto rapresentante un singolo gene immobilizzati su un supporto (vetro, plastica o silicone) mediante legami di tipo irreversibile. Esempio di microarray con 40.000 oligo immobilizzati su supporto solido e ibridati con cDNA mRNA or gene expression profiling Genes x Cells Drugs x Cells Clustered Image Maps Genes x Drugs I LIMITI DELLA ANALISI GENOMICA: RIPRODUCIBILITA’ ANALISI NON QUANTITATIVA I mRNA NON RIFLETTONO ESATTAMENTE LE PROTEINE PRESENTI NELLA CELLULA Come classificare la materia vivente per comprenderla? Il progetto GENE ONTOLOGY Gene Ontology http://www.geneontology.org/index.shtml Un progetto atto a costruire un vocabolario strutturato pensato per descrivere i geni e i loro prodotti in qualsiasi tipo di organismo Questo vocabolario serve per dare un unico nome a un specifico prodotto in modo che questi così compaia nelle diverse banche dati e possa venire rapidamente ritrovato L'ontologia, una delle branche fondamentali della filosofia, è lo studio dell'essere in quanto tale, nonché delle sue categorie fondamentali. Il termine deriva dal greco ὄντος, òntos (genitivo singolare del participio presente ὤν di εἶναι, èinai, il verbo essere) più λόγος, lògos, letteralmente "discorso sull'essere” Gene Ontology (GO, ontologia genica): un vocabolario controllato e strutturato per la descrizione di prodotti genici in termini • di funzione molecolare, • di ruolo biologico e • di ubicazione cellulare Le Ontologie differiscono dalle terminologie controllate (Lexicon) poiché si tratta di una struttura dati gerarchica che contiene tutte le entità rilevanti, le relazioni esistenti fra di esse, le regole, gli assiomi, ed i vincoli specifici del dominio; mentre le terminologie controllate semplicemente restringono l’insieme di parole usate per descrivere il dominio. Gene Ontology http://www.geneontology.org/index.shtml Ogni gene/proteina si contraddistingue per un numero identificativo unico (GO:nnnnnnn) e un nome (es: cellula, fibroblasto, fattore di crescita, trasduttore del segnale). Ogni termine viene assegnato a una o più delle tre suddivisioni della banca (ontology): 1. Funzioni molecolari 2. Componenti cellulari 3. Componenti I processi biologici Esempio di annotazione: Il prodotto genico della citocromo-C-ossidasi puo’ essere descritto in GENE ONTOLOGY tramite: La sua funzione molecolare: attività ossidoreduttasica Il componente cellulare nel quale è presente: la matrice mitocondriale o la membrana interna del mitocondrio Il processo biologico che causa: fosforilazione ossidativa e induzione di morte cellulare DAG (Grafico Acilico Diretto) Il grafico Acilico Diretto è la forma rappresentativa usata in GO. Il DAG è una forma di grafico che differisce da una normale gerarchia poichè ogni termine può avere più padri e in cui possono esistere molteplici percorsi da un termine qualsiasi al termine radice Ciascun vocabolo della GO rappresenta un nodo del DAG al quale è associato un identificativo (GO ID). Grafico Acilico Diretto un termine di gene ontology molto “generico” contiene al suo interno” più termini di gene ontology via via più specifici. Questo fa sì che man mano che si va “verso il basso” le definizioni diventino sempre più precise ed i geni che soddisfano a quella descrizione sempre meno. Questo albero può quindi essere “letto” a più livelli, da quelli più generali, che stanno alla radice, a quelli via via sempre più specifici che stanno sulle foglie. POSSIBILI UTILIZZI DI GENE ONTOLOGY La categorizzazione con GENE ONTOLOGY può avere diversi scopi finali: 1) comprendere in che processo/funzione/componente in cui è coinvolto un gene 2) categorizzazione di un set di dati (gene e proteine); in formato normale o usando un Goslim per avere una visione d'insieme dei dati 3) categorizzare un set di dati e valutare eventuali sovrarappresentazioni (“gene enrichment”) che non siano fruttto del caso 4) estrazione dei geni (sequenze) che sono coinvolte in un processo, funzione, componente