Riassumendo Ci sono diverse modalità con cui un gene può produrre trascritti alternativi Inizi alternativi della trascrizione Terminazioni alternative della trascrizione Splicing alternativi: Introni trattenuti Siti di splicing alternativi Esoni cassetta (exon skipping) Esoni mutualmente esclusivi Gli esoni che invece sono sempre presenti in tutti i trascritti sono detti “esoni costitutivi” 1) Gli introni “trattenuti” DNA (doppio filamento) Trascritti che mappano sul filamento positivo 1) Gli introni “trattenuti” DNA (doppio filamento) Trascritti che mappano sul filamento NEGATIVO 2) Segnali “in competizione” Trascritti maturi: 3) Esoni “a cassetta” Trascritti maturi: 4) Esoni mutualmente esclusivi Trascritti maturi: ... l’eccezione, oppure la regola? Philip Sharp (premio Nobel 1993): circa il 5% dei geni umani è soggetto a splicing alternativi.. Roberts & Smith (Curr. Op. in Chemical Biology, 2002): circa il 45% Progetti trascrittoma... stima: circa, anzi più del 75%! Nostra stima… praticamente tutti, purché abbiano più di un esone! Stima “ufficiale” - come la nostra! Definire gli splicing alternativi Avendo a disposizione sia la sequenza genomica che quella dei trascritti, mappando i differenti trascritti sulla sequenza genomica si osservano a “colpo d’occhio” le differenze Mentre eventi sul primo (ultimo) esone probabilmente lasciano la proteina inalterata, eventi negli esoni interni cambieranno anche la sequenza codificante del trascritto maturo Inizi della trascrizione alternativi Cosa può succedere alla regione codificante quando un gene mostra inizi della trascrizione alternativi? ATG In questo caso, nulla alla CDS: semplicemente si allunga/ accorcia la 5’UTR Ma... ... oltre che a “bordare” la CDS, le UTR al 5’ e al 3’ servono a qualcosa? ...sì! Produrre un trascritto non implica, necessariamente, che il trascritto venga automaticamente tradotto La 5’UTR di solito interagisce con il ribosoma, ma anche con specifiche proteine che si legano al DNA, e che regolano l’efficienza della traduzione La 3’UTR, di solito, viene “attaccata” per degradare l’mRNA, e quindi regola l’efficienza della degradazione (che può avvenire prima che la traduzione sia completa) MORALE: 5’ e 3’ UTR possono influenzare se/quando/come un trascritto viene tradotto Splicing e proteine Un gene (visto classicamente) non produce UN trascritto, ma MOLTI trascritti, che differiscono tra loro per: Inizio/fine della trascrizione Splicing alternativi (esoni “cassetta”, esoni alternativi, segnali di splicing alternativi, introni ritenuti) Un gene, quante proteine “produce”? Le proteine “concettuali” Abbiamo a nostra disposizione genomi, e centinaia di migliaia di trascritti/EST In realtà, le sequenze proteiche “note” (sequenziate) sono poche ... la maggior parte derivano da traduzioni “plausibili” dell’RNA, oppure della sequenza genomica Come si predicono, “concettualmente”, le sequenze di proteine? Tradurre i nucleotidi Se la traduzione avviene a “triplette”, allora ci sono tre modi possibili di tradurre in amminoacidi una sequenza nucleotidica (sempre da 5’ a 3’!!) 5’- GATCAGTATGAGGTTAACATAACG - 3’ Tradurre i nucleotidi La traduzione avviene SEMPRE leggendo la sequenza dal 5’ al 3’ I tre diversi modi di tradurre una sequenza sono detti “frame” di lettura E su un doppio filamento di DNA, quanti modi possibili di tradurre la sequenza ci sono? 5’- GATCAGTATGAGGTTAACATAACG - 3’ 3’- CTAGTCATACTCCAATTGTATTGC - 5’ Tre per filamento, quindi SEI in tutto (indicate con +1,+2,+3 e -1,-2,-3) Le frame di lettura “aperte” Ovviamente, a noi interessa trovare un codone di start (ATG) e tradurre a partire da quello La frame che inizia con ATG e termina con un codone di stop è detta “frame di lettura aperta” (oppure “open reading frame”, oppure ORF) Quindi, si cerca innanzitutto un codone ATG Le ORF frame +2 5’- GATCAGTATGAGGTTAACATAACG -3’ ... e si traduce fino a quando non si trova un codone di STOP nello stesso frame… Le ORF frame +2 5’- GATCAGTATGAGGTTAACATAACG -3’ |||||||||||||||||||||||| 3’- CTAGTCATACTCCAATTGTATTGC -5’ frame -2 ... e si traduce fino a quando non si trova un codone di STOP nello stesso frame… Annotare un gene I parte Supponiamo di avere a disposizione solo mRNA e genoma (situazione tipica) Primo passo: dato un mRNA, predire una regione codificante “plausibile” Si procede sempre da 5’ a 3’, quindi solo 3 frame di lettura possibili Si cerca una frame (ORF) che inizi con ATG, finisca con un codone di stop, e che abbia una lunghezza plausibile (di solito, più di 100 aa) Annotare un gene, I parte http://www.ncbi.nlm.nih.gov/projects/gorf/ 6 possibili frame di lettura E’ un mRNA, qual è la soluzione? Annotare un gene II parte Solitamente, va abbastanza bene: si trova un’unica regione codificante “sensata” Poi, si mappa il trascritto sul genoma, e se ne determina la struttura esoni/introni, nonché dove vanno a cadere codone di start e di stop Ma, tornando ai trascritti “multipli” e agli “splicing”, cosa succede alla regione codificante? Splicing e ORF Da “anomalia” la produzione di trascritti alternativi si è scoperto essere la “normalità” nei geni degli eucarioti superiori Trascritti alternativi, tramite: Inizi alternativi della trascrizione Terminazioni alternative della trascrizione Splicing alternativi che coinvolgono gli esoni interni Quale effetto ha la produzione di trascritti alternativi sul proteoma di un organismo? A ogni trascritto alternativo, corrisponde una “proteina alternativa” (della tecnicamente “isoforma”)? Isoforme A grandi linee gli effetti possono essere riassunti come segue: Inizi trascrizione alternativi: Terminazioni trascrizione alternative: Allungano o accorciano la 5’UTR Aggiungono, rimuovono o modificano l’N terminale della proteina codificata Allungano o accorciano la 3’UTR Aggiungono, rimuovono o modificano il C terminale della proteina codificata Splicing alternativi esoni interni: Modificano la regione codificante ATG alternativi 5’ ATG In questo caso, ai 3 inizi di trascrizione alternativi corrispondono 3 ATG alternativi ATG 3’ ATG ..... Ovviamente, le tre proteine codificate saranno diverse COME, dipende dal frame di lettura ATG alternativi 5’ Consideriamo il secondo esone: se nel primo e secondo trascritto mantiene lo stesso frame, allora la traduzione varia solo nella parte iniziale 3’ ..... ATG alternativi IDEM, per il terzo trascritto: se l’ATG nel secondo esone è nello stesso frame degli altri due, la traduzione da lì in poi sarà uguale 5’ 3’ ..... Ovvero Parte uguale in tutti i trascritti Dipende dal frame di lettura, e come si arriva nella parte uguale per tutti. Potenzialmente, può essere tradotta in 3 modi diversi. Per avere la stessa cosa, in pratica, la parte codificante variabile all’inizio deve essere lunga... Ovvero Parte uguale in tutti i trascritti UN MULTIPLO DI 3!!!!!! In questo modo, le 3 proteine avranno un inizio diverso... ma una fine uguale! Gli “spostamenti” di frame (frameshift) 5’- ATGCAGTCTGAGGTTAACATAACG - 3’ immaginiamo di avere una sequenza tradotta in questo modo.... 5’- ATGCTCCAAATGCAGTCTGAGGTTAACATAACG se aggiungo un multiplo di 3 di nucleotidi la traduzione non cambia... 5’- ATGCTCCAATGCAGTCTGAGGTTAACATAACG ..ma se non è un multiplo di 3... sposto “shift” tutto il frame di lettura che avevo prima!!!! Gli “spostamenti” di frame (frameshift) 5’- ATGCAGTCTGAGGTTAACATAACG - 3’ ... e se cancello un po’ di nucleotidi? 5’- ATGCAG...GAGGTTAACATAACG - 3’ se ne cancello 3 (o multiplo) in frame, cancello esattamente un amminoacido 5’- ATGCA...TGAGGTTAACATAACG - 3’ ... se ne cancello 3 (o multiplo) NON in frame, cancello un amminoacido e cambio quello adiacente I “frameshift” 5’- ATGCAGTCTGAGGTTAACATAACG - 3’ 5’- ATGCAG..TGAGGTTAACATAACG - 3’ ... se ne cancello NON 3 (o multiplo) dal punto di cancellazione in avanti la traduzione è COMPLETAMENTE DIFFERENTE Gli esoni “cassetta” Le considerazioni appena viste si applicano a inserzioni/cancellazioni dovute ai “cassette exon” se la lunghezza dell’esone giallo è un multiplo di 3, allora il suo inserimento causeràsoltanto un inserimento di amminoacidi nella proteina codificata altrimenti, la traduzione dell’esone verde sarà DIVERSA a seconda della presenza o meno di quello giallo Siti di splicing alternativi Idem, quando si usano segnali di splicing alternativi in questo caso, se la lunghezza del frammento aggiuntivo (in blu) è un multiplo di 3, allora il suo inserimento causeràsoltanto un inserimento di amminoacidi nella proteina codificata altrimenti, la traduzione dell’esone giallo e verde sarà DIVERSA a seconda della presenza del frammento aggiuntivo in blu (analogamente quando si accorciano esoni) Gli esoni alternativi Generalmente (ma con moltissime eccezioni) gli esoni altertativi (cassetta et similia) hanno proprio lunghezza multipla di tre e frame +1, quindi aggiungono/tolgono pezzi alla proteina codificata La “modularità” nella costruzione della regione codificante, d’altra parte, si sposa bene con la modularità che si osserva nella proteine I domini delle proteine Una sequenza proteica può essere suddivisa in “domini” Ogni dominio forma la propria struttura “indipendente”, ed è responsabile di una delle funzioni della proteina: si può legare ad altre proteine, a ligandi, al DNA/RNA, ecc. In pratica, proteine diverse possono contenere lo/gli stessi domini Il gene più famoso del mondo Dominio di legame al DNA Dominio di “tetramerizzazione” Di solito, 4 catene di p53 sono assemblate insieme Il gene più famoso del mondo Visualizzare gli splicing alternativi Visualizzare gli splicing alternativi Sempre il gene più famoso del mondo Domanda!!!! Disegna la struttura di un mRNA, indicandone gli elementi che conosci. Immaginando che l’mRNA sia prodotto da un gene con 4 esoni, sul filamento negativo, con codone di start nel secondo esone e stop nell’ultimo, “mappa” il trascritto e tutti gli elementi mappabili sulla sequenza genomica Morale... Il dogma iniziale: ... è ora diventato.. UN GENE UN TRASCRITTO UNA PROTEINA UN GENE TANTI TRASCRITTI (POTENZIALMENTE) TANTE PROTEINE Potenzialmente, perché... non è assolutamente detto che tutti i trascritti prodotti da un gene siano necessariamente codificanti Morale... (2) In “origine” gli RNA erano o Codificanti (mRNA) Coinvolti nella traduzione dei mRNA (tRNA, rRNA) In realtà, esistono centinaia di RNA non codificanti prodotti da un genoma (miRNA, snoRNA, smallRNA) e così via, con svariate funzioni Per cosa si vince un Nobel, negli anni 2000? Fire & Mello, 1998 Morale... (3) Da un trascritto per gene, a molti trascritti per geni... ok? Ma, in realtà, ci si è resi conto che la trascrizione non sembra essere limitata a quelli canonicamente annotati come geni “Foreste” di trascritti provenienti da regioni genomiche non limitate solo ai geni (es : RNA antisenso) Morale... (4) ... il tutto ha portato a fare un ulteriore passo indietro... ora, molti si chiedono... Dopotutto, che cos’è un gene??