Corso di genomica a.a.2011-2012 Corso di laurea magistrale di Biotecnologia industriale e Bioinformatica Lezione in aula 6a martedì ore 14.00-16.00 giovedì ore 13.00-15.00 p.s. uso bianco e nero perché si vede meglio ed eventualmente per passare al cartaceo Di cosa si sta parlando? Esiste una definizione di genomica? abbiamo molte informazioni e dobbiamo organizzarle in maniera sistematica Il problema della catalogazione dell’informazione forse già è stato posto dalle prime biblioteche, chissà i bibliotecari di Alessandria come si erano organizzati uso dell’informazione col sequenziamento c’è stata l’illusione di poter sapere veramente tutto dei genomi e dell’informazione genetica, ma è nata la genomica perchè si capiva che il problema era più complesso È vero che l’informazione c’è tutta ma va decodificata. Ci sono altri codici genetici? definizione Non si può dare una definizione, però si può catalogare cosa fare rientrare in questa materia Si può anche dire cosa non fare rientrare in questa materia per evitare confusioni Se parliamo di genomica non possiamo parlare di faccende che non riguardino l’organizzazione del genoma. Solo indirettamente possiamo vedere la ricaduta sulla epi-genetica e sulla regolazione Vedere le strutture che determinano le funzioni Come in ogni campo la cosa essenziale è porsi le domande giuste e vedere se ci sono metodi per rispondere. Per studiare i neutrini dal ministero ci hanno fatto sapere che hanno scavato un tunnel dall’accelleratore di Ginevra al Laboratorio del Gran Sasso, (per fortuna i neutrini viaggiano anche senza il tunnel e l’esperimento è stato possibile senza il tunnel) Però generalmente con tecniche nuove si possono fare esperimenti più complessi ed avere nuove informazioni. Utilità delle tecniche Con la sperimentazione uno dei grandi passi è stato fatto grazie all’uso o alla costruzione di prove indirette accumulando evidenze che univocamente portino ad un significato unico rispetto alla domanda fatta A volte ci sono evidenze parziali ma che corroborano una ipotesi e non sono contraddittorie A volte le risposte contraddittorie indicano che un problema è più complesso di come sia stato ipotizzato ed in biologia capita molto spesso I esempio Da quando esistono i microscopi siamo abituati a vedere il materiale biologico in maniera bidimensionale Con i microscopi elettronici si vede molto più ingrandito fino ad arrivare a macromolecole “electron microscopy grids, dehydrated, and then critical point-dried before shadow-coating with carbon/platinum alloy at a fixed angle” Si ottiene una figura bidimensionale in cui l’ombreggiatura crea una differenza facendo risaltare la terza dimensione che comunque non è quella nativa shadowing QuickTime™ e un decompressore TIFF (Non compresso) sono necessari per visualizzare quest'immagine. QuickTime™ e un decompressore TIFF (Non compresso) sono necessari per visualizzare quest'immagine. QuickTi me™ e un decomp resso re TIFF (Non co mpres so) son o ne ces sari per vis uali zzare que st'imma gine . QuickTi me™ e un decomp resso re TIFF (Non co mpres so) son o ne ces sari per vis uali zzare que st'imma gine . II esempio Cercando le tre dimensioni al microscopio o con altri strumenti si può provare con la ricostruzione delle immagini ottenute su piani diversi (3D) Tomografie con rx o risonanza magnetica ed anche col microscopio confocale La novità (avanzamento della tecnica) è stata la possibilità di avere programmi che ricostruiscono le immagini prese in successione sulla terza dimensione asse “z” Immagini al confocale QuickTime™ e un decompressore TIFF (Non compresso) sono necessari per visualizzare quest'immagine. Simultaneous co-detection of DNA replication and specific histone H1.5/H1.2 phosphorylation sites using confocal microscopy. Replication sites were detected by incorporating 5-ethynyl-2'deoxyuridine (EdU; 10-min pulse). Histone H1.5 phosphorylation Il genoma come si vede? Cromosomi politenici di drosofila Colorazione con DAPI cromosoma In metafase avvolgimenti fantasiosi della cromatina QuickTime™ e un de com press ore TIFF (No n compre sso) so no n ece ssari per vi sual izza re qu est'imm agin e. Cromosomi alla metafase nella maggior parte del tempo il crms come sta? QuickTime™ e un decompressore TIFF (Non compresso) sono necessari per visualizzare quest'immagine. AFM microscopio a forza atomica AFM views of human metaphasic chromosomes from asynchronous fibroblast cultures. Left panel (47 µm x 47 µm field) and inset (9 µm x 18 µ field): air-imaging of the cell monolayer upon KCl hypotonic shock, methanol/acetic acid fixation and air drying. Central right panel (6 µm x 6 µm field): hypotonic shock/fixation as for left panel; imaging in liquid upon rehydration in PBS (lower inset shows a 3D-view of the same field). Upper right inset (20 µm x 20 µm): imaging in liquid of an unfixed metaphasic plate. DNA Piccole molecole di plasmidi al microscopio elettronico QuickTime™ e un de com press ore TIFF (No n compre sso) so no n ece ssari per vi sual izza re qu est'imm agin e. QuickTime™ e un decompressore TIFF (Non compresso) sono necessari per visualizzare quest'i mmagine. È stata visualizzata la replicazione e la trascrizione Ma il DNA non è statico Avevano capito che c’era associazione tra fenotipo e genoma a partire dall’inizio del ‘900 con gli studi su Drosofila e con la teoria cromosomica (vedi file sul sito della didattica: chromosomal theory) I genomi si visualizzavano bene su Dorsofila perché sono politenici nelle ghiandole salivarie I cromosomi di altre specie richiedono miglior risoluzione però si vedono solo nella condizione condensata in metafase ed è la condizione “anomala” di “passività”! QuickTime™ e un decompressore TIFF (Non compresso) sono necessari per visualizzare quest'immagine. QuickTime™ e un decompressore TIF F (Non compresso) sono necessari per visualizzare quest'immagine. colorazione e bandeggi Le uniche analisi dirette sui cromosomi erano le anomalie come rotture, traslocazioni, inversioni, duplicazioni ecc. associate ai possibili fenotipi Sempre e solo su cromosomi metafasici La materia si chiama però “Citogenetica” Come si studiava la genetica? Come Mendel Però Mendel non conosceva il “linkage” http://linkage.rockefeller.edu/ Dal linkage alle mappe genetiche Allora il genoma sta allineato e sta nei cromosomi C’è il gap tra mappe genetiche - “markers” e cromosomi Quindi come si è arrivati alle genomica ? Teniamo presente che l’organizzazione dei cromosomi è stata scoperta con tutti gli studi a partire dalla citogenetica e meccanismi di mitosi e meiosi, istoni, metilazione (J Mol Biol.1965 Dec;14(2):603-7. On methylation of DNA during development of the sea urchin embryo. Scarano E, Iaccarino M, Grippo P, Winckelmans D.) L’epigenetica è già ultra quarantenne. 2011-1965= 46 Serve una mappa completa per sapere cosa corrisponde a cosa sequenziamento dei genomi interi partendo dalle mappe e dai clonaggi =corrispondenza geni-crms Come sono i genomi ? Rapporto n.geni / grandezza del genoma = densità Genomi in banche dati : arrivano gli -omi proteoma, metaboloma Coding sequences : ~ trascrittoma (traduttoma non esiste) Regioni trascritte sono molte rispetto a quelle codificanti ma corrispondono a regioni di cromatina attivata Forse solo il 5% del genoma corrisponde a geni Il 95% cosa fa? Cosa deve fare il genoma ? Quali sono i compiti e le funzioni che il genoma deve svolgere ? Secondo il ciclo cellulare:- obbedire alle necessità per la mitosi e della meiosi - obbedire alle necessità di tutto quello che succede prima e dopo mitosi e meiosi (interfasi) Siccome in interfase il genoma non si vede direttamente, c’era solo lo studio della genetica classica e molecolare (mappe e poi con la restrizione e clonaggi) per capire qualcosa Le immagini illusorie cariotipo QuickTime™ e un de com press ore TIFF (No n compre sso) so no n ece ssari per vi sual izza re qu est'imm agin e. Formazione del Complesso della RNA poly II Quic kTime™ e un dec ompres sore TIFF (Non c ompres so) s ono nec es sari per visualiz zare ques t'immagine. Electron microscopy of the TBP-IIB-IIFRNAPII-promoter complex. (A) Representative images (upstream DNA segment at left in top two panels; downstream DNA segment at left in bottom two panels;). The bar represents 500 Å. (B) Observed positions of upstream and downstream edges of protein mass on DNA fragment. Open bars, positions of upstream edge (determined from protein-free contour lengths of upstream DNA segments). Solid bars, positions of downstream edge (determined from protein-free contour lengths of downstream DNA segments). Arrow, expected position of the TATA element. (C) Observed DNA bend angles (bend angle defined as angle of deviation from linear DNA trajectory). (D) Observed DNA bend centers (bend center defined as intersection of projected upstream and downstream DNA segments). Open bars, diameters of protein mass. Solid bars, distances between bend center and upstream edge of protein mass. (E) Observed contour lengths. Open bars, DNA alone. Hatched bars, protein-free DNA in complexes. Solid bars, protein-free DNA plus diameter of protein mass in complexes. Dati funzionali Finchè si tratta di dati descrittivi poco si può capire di come funziona il genoma e le foto anche belle del DNA non spiegano il complesso del genoma e la sua dinamica Nella genomica si vuole mettere insieme le informazioni derivate da analisi globali con varie metodologie sulla struttura e funzione del genoma La struttura dei geni è già nota da un pezzo e come si attivano a partire dalla trascrizione col promotore anche Non si sa come avviene il coordinamento tra i geni per la loro espressione, si conoscono solo alcuni induttori dati descrittivi necessari L’unificazione delle informazioni è avvenuta sulla base descrittiva a partire dalle mappe geniche che però erano state fatte su dati funzionali I genotipi erano ricavati dai fenotipi (mutazioni o polimorfismi), sulla base del linkage venivano associati i geni e però studiati per la loro funzione singola è chiaro che le interazioni sono complesse e multiple, anche solo per la divisione cellulare è stato evidente, coinvolgono veramente tante funzioni La conoscenza dei genomi interi Dati descrittivi permettono solo di individuare le sequenze codificanti e non, parti esoniche ed introniche, la distribuzione dei geni: il trascrittoma Il trascrittoma varia per i vari tipi di cellule Compaiono molti trascritti non tradotti È un’analisi con descrizione parziale e variabile Come si può analizzare il genoma più in dettaglio Visone del genoma non più statico Il genoma plastico e dinamico Si consideravano i singoli geni e le interazioni tra proteine a volte con il DNA I geni sono parte del genoma e non si possono considerare avulsi dal loro contesto Comprendere completamente la funzione dei geni è possibile considerando tutte le interazioni e si arriva a comprendere come funziona e perché il genoma ha quella organizzazione come invia informazioni come le riceve fino agli anni 80 la biologia molecolare sui microrganismi la genetica sul fenotipo e gli incroci obbiettivo : le mappe genetiche creano il collegamento con il genoma ed i cromosomi la struttura dei cromosomi era eucromatina ed eterocromatina sequenze ripetute, strutture selfish, l’evoluzione solo sulle strutture codificanti Troppo generica la “regolazione” Sotto il nome della regolazione si comprendeva tutto, è un’idea generale che deve essere circostanziata, era nata riferita o ad un gene o ad un operone (cluster genico) Che percorso segue il genoma col destino della cellula ? QuickTime™ e un de com press ore TIFF (No n compre sso) so no n ece ssari per vi sual izza re qu est'imm agin e. Focalizzazione sulla parte più passiva della funzione del genoma: la replicazione e divisione cellulare (sistema già assai complesso per genetica e biochimica) La funzione vera dove sta? È chiaro che meiosi e mitosi negli eucarioti hanno condizionato il genoma per l’organizzazione in cromosoma eucariotico QuickTime™ e un decompressore TIFF (Non compresso) sono necessari per visualizzare quest'i mmagine. Però dal lievito al riccio di mare o alla drosofila il differenziamento pare impressionante Nel lievito c’è già quasi tutto, cioè tutti i meccanismi che poi servono anche al differenziamento dai singoli meccanismi in avanti QuickTime™ e un decompressore TIFF (Non compresso) sono necessari per visualizzare quest'immagine. Le cellule eucariotiche differenziate e quiescenti stanno in G0 Riempire il gap tra struttura e funzione del genoma limitato ancora allo studio dei singoli geni la struttura del crms per la mitosi ma anche per le altre funzioni che non si conoscono Riunificare : genoma-cromatina-cromosoma La replicazione del DNA e la divisione dei cromosomi sono eventi eccezionali anche in fase di alta moltiplicazione cellulare però in queste fasi si riescono a vedere i cromosomi e sono stati studiati più facilmente ma durante queste fasi i cromosomi sembra che siano passivamente duplicati e trasportati In GO cosa fa il genoma? È la fase in cui immaginiamo si attivino le funzioni propriamente dette non più solo passive come ipotizzate quelle della replicazione e divisione Che vuol dire funzionare ? deve rispondere ai segnali che riceve dandone altri si basa tutto sulle interazioni che può avere solo all’interno del nucleo i segnali devono entrare ed uscire dal nucleo si tratta di capire quali e quanti sono questi meccanismi metodi di analisi Così come per l’evoluzione naturale anche per lo studio si usano i mezzi disponibili Adattamenti ed invenzioni Da quando è stato inventato come sequenziare il DNA non c’erano limiti alla applicazione però nei suoi limiti Il metodo si può applicare a qualunque tipo di DNA ma analizzando un pezzo alla volta la cui lunghezza è limitata Non si può sequenziare il DNA intero di un intero crms si lavora “a pezzi e bocconi” era necessario avere i frammenti ed in ordine, questo è stato il vero limite andare sulla luna è diverso da andare su Marte QuickTime™ e un decompressore TIFF (Non compresso) sono necessari per visualizzare quest'immagine. Sequenziare il genoma di un virus è più semplice che sequenziare quello del lievito Le difficoltà per sequenziare il genoma di lievito hanno insegnato (imparato a Roma) come sequenziare genomi complessi e finalmente è toccato ai mammiferi Adesso stanno uscendo nuovi metodi di seconda e terza generazione banche dati e gestione Contemporaneamente sono nate nuove banche dati I links ed i motori di ricerca - le banche date storiche avevano i DNA totali e divisi per specie, i cDNA e le proteine dedotte, essenzialmente sono rimaste le stesse ma con banche dati molto articolate - i programmi di ricerca e di confronto si sono articolati per gestire masse di dati enormemente più grandi, per cercare geni ortologhi si corrono le sequenze su banche di varia provenienza tipo di banche dati Derivate da metodologie nuove di sequenziamento A partire dai sequenziamenti “shotgun” di “cDNA libraries” ci sono sequenze assegnate e ignote Per i genomi analogamente ci sono sequenze allineate e non A questi tipi di sequenze corrispondono delle banche dati con corrispondenza ai genomi allineati e non per il genoma umano dall’annuncio del sequenziamento totale alla chiusura di tutte le regioni cromosomiche con i contigs allineati e col verso giusto sono passati quasi 10 anni Procedure di routine Da quando si possono fare sequenze in modi diversi esistono banche dati corrispondenti Per lunghezza dei frammenti da 100 a 800 bp BAC assemblati Genomi indipendenti per cercare polimorfismi Analisi di SNPs e VNTR (single nucleotides e copy number variants) I polimorfismi sono all’interno della specie quello che in tempi più lunghi succede tra specie e a secondo del tipo di gene o di regione sono più o meno variabili o conservati Confronti di sequenze genomiche metodo di display semplificante l’occhio vuole la sua parte: si individuano le regioni conservate e le estensioni dall’intensità del colore, L’istogramma sotto le sequenze da il pattern di conservazione, A sinistra delle sequenze il n. per individuare e trovare l’intera sequenza con le specifiche nella banca dati, Si individuano le regioni mancanti nei cloni delle varie specie e si ottiene una informazione sulla conservazione di una data regione genomica Le nuove sequenze umane e di primati vengono allineate sulla prima sequenza totale, da cui la possibile perdita di polimorfismi più vasti e mantenimento di errori eredità conservazione e variabilità geologia ed evoluzione mondo vivente iniziale c’è stato un ancestrale comune ? Curiosità per sapere se gli inizi sono un mondo ad RNA evidenze molto interessanti più solide ? dell’ipotesi del mondo primordiale di amminoacidi Perché si parla di evoluzione? trasformazione (evoluzione) il contenuto di valore presente nella parola evoluzione non è facile giudicare se il mondo vivente ancestrale fosse migliore o peggiore lana caprina, evoluzione non ha un contenuto finalistico concetto evolutivo trasformazione, cambiamento, evoluzione è una parola che esisteva da prima delle teorie della evoluzione biologica Riferimenti umani ed esempi : i modi di costruzione rispondono ad esigenze diverse dalla capanna al cemento armato esigenze intrinseche ed ambientali esterne