Riassumendo





Ci sono diverse modalità con cui un gene può
produrre trascritti alternativi
Inizi alternativi della trascrizione
Terminazioni alternative della trascrizione
Splicing alternativi:
 Introni trattenuti
 Siti di splicing alternativi
 Esoni cassetta (exon skipping)
 Esoni mutualmente esclusivi
Gli esoni che invece sono sempre presenti in
tutti i trascritti sono detti “esoni costitutivi”
1) Gli introni “trattenuti”
DNA
(doppio
filamento)
Trascritti che mappano
sul filamento positivo
1) Gli introni “trattenuti”
DNA
(doppio
filamento)
Trascritti che mappano
sul filamento NEGATIVO
2) Segnali “in competizione”
Trascritti maturi:
3) Esoni “a cassetta”
Trascritti maturi:
4) Esoni mutualmente esclusivi
Trascritti maturi:
... l’eccezione, oppure la regola?





Philip Sharp (premio Nobel 1993): circa il 5%
dei geni umani è soggetto a splicing alternativi..
Roberts & Smith (Curr. Op. in Chemical Biology,
2002): circa il 45%
Progetti trascrittoma... stima: circa, anzi più del
75%!
Nostra stima… praticamente tutti, purché
abbiano più di un esone!
Stima “ufficiale” - come la nostra!
Definire gli splicing alternativi


Avendo a disposizione sia la sequenza
genomica che quella dei trascritti,
mappando i differenti trascritti sulla
sequenza genomica si osservano a
“colpo d’occhio” le differenze
Mentre eventi sul primo (ultimo) esone
probabilmente lasciano la proteina
inalterata, eventi negli esoni interni
cambieranno anche la sequenza
codificante del trascritto maturo
Inizi della trascrizione alternativi

Cosa può succedere alla regione
codificante quando un gene mostra
inizi della trascrizione alternativi?
ATG
In questo caso,
nulla alla CDS:
semplicemente
si allunga/
accorcia
la 5’UTR
Ma...

... oltre che a “bordare” la CDS, le UTR al
5’ e al 3’ servono a qualcosa?
...sì!




Produrre un trascritto non implica,
necessariamente, che il trascritto venga
automaticamente tradotto
La 5’UTR di solito interagisce con il ribosoma,
ma anche con specifiche proteine che si legano
al DNA, e che regolano l’efficienza della
traduzione
La 3’UTR, di solito, viene “attaccata” per
degradare l’mRNA, e quindi regola l’efficienza
della degradazione (che può avvenire prima
che la traduzione sia completa)
MORALE: 5’ e 3’ UTR possono influenzare
se/quando/come un trascritto viene tradotto
Splicing e proteine

Un gene (visto classicamente) non
produce UN trascritto, ma MOLTI
trascritti, che differiscono tra loro
per:
Inizio/fine della trascrizione
 Splicing alternativi (esoni “cassetta”,
esoni alternativi, segnali di splicing
alternativi, introni ritenuti)


Un gene, quante proteine
“produce”?
Le proteine “concettuali”




Abbiamo a nostra disposizione genomi,
e centinaia di migliaia di trascritti/EST
In realtà, le sequenze proteiche “note”
(sequenziate) sono poche
... la maggior parte derivano da
traduzioni “plausibili” dell’RNA, oppure
della sequenza genomica
Come si predicono, “concettualmente”,
le sequenze di proteine?
Tradurre i nucleotidi

Se la traduzione avviene a
“triplette”, allora ci sono tre modi
possibili di tradurre in amminoacidi
una sequenza nucleotidica (sempre
da 5’ a 3’!!)
5’- GATCAGTATGAGGTTAACATAACG - 3’
Tradurre i nucleotidi



La traduzione avviene SEMPRE
leggendo la sequenza dal 5’ al 3’
I tre diversi modi di tradurre una
sequenza sono detti “frame” di
lettura
E su un doppio filamento di DNA,
quanti modi possibili di tradurre la
sequenza ci sono?
5’- GATCAGTATGAGGTTAACATAACG - 3’
3’- CTAGTCATACTCCAATTGTATTGC - 5’
Tre per filamento, quindi
SEI in tutto
(indicate con +1,+2,+3 e
-1,-2,-3)
Le frame di lettura “aperte”



Ovviamente, a noi interessa trovare un
codone di start (ATG) e tradurre a
partire da quello
La frame che inizia con ATG e termina
con un codone di stop è detta “frame di
lettura aperta” (oppure “open reading
frame”, oppure ORF)
Quindi, si cerca innanzitutto un codone
ATG
Le ORF
frame +2
5’- GATCAGTATGAGGTTAACATAACG -3’
... e si traduce fino a quando non si trova un codone di STOP
nello stesso frame…
Le ORF
frame +2
5’- GATCAGTATGAGGTTAACATAACG -3’
||||||||||||||||||||||||
3’- CTAGTCATACTCCAATTGTATTGC -5’
frame -2
... e si traduce fino a quando non si trova un codone di STOP
nello stesso frame…
Annotare un gene I parte




Supponiamo di avere a disposizione solo mRNA
e genoma (situazione tipica)
Primo passo: dato un mRNA, predire una
regione codificante “plausibile”
Si procede sempre da 5’ a 3’, quindi solo 3
frame di lettura possibili
Si cerca una frame (ORF) che inizi con ATG,
finisca con un codone di stop, e che abbia una
lunghezza plausibile (di solito, più di 100 aa)
Annotare un gene, I parte
http://www.ncbi.nlm.nih.gov/projects/gorf/
6 possibili
frame
di lettura
E’ un mRNA,
qual è la
soluzione?
Annotare un gene II parte



Solitamente, va abbastanza bene: si
trova un’unica regione codificante
“sensata”
Poi, si mappa il trascritto sul genoma, e
se ne determina la struttura
esoni/introni, nonché dove vanno a
cadere codone di start e di stop
Ma, tornando ai trascritti “multipli” e
agli “splicing”, cosa succede alla regione
codificante?
Splicing e ORF


Da “anomalia” la produzione di trascritti alternativi si è
scoperto essere la “normalità” nei geni degli eucarioti
superiori
Trascritti alternativi, tramite:





Inizi alternativi della trascrizione
Terminazioni alternative della trascrizione
Splicing alternativi che coinvolgono gli esoni interni
Quale effetto ha la produzione di trascritti alternativi sul
proteoma di un organismo?
A ogni trascritto alternativo, corrisponde una “proteina
alternativa” (della tecnicamente “isoforma”)?
Isoforme


A grandi linee gli effetti possono essere
riassunti come segue:
Inizi trascrizione alternativi:



Terminazioni trascrizione alternative:



Allungano o accorciano la 5’UTR
Aggiungono, rimuovono o modificano l’N terminale
della proteina codificata
Allungano o accorciano la 3’UTR
Aggiungono, rimuovono o modificano il C terminale
della proteina codificata
Splicing alternativi esoni interni:

Modificano la regione codificante
ATG alternativi

5’
ATG
In questo caso, ai 3 inizi di
trascrizione alternativi
corrispondono 3 ATG alternativi
ATG
3’
ATG
.....
Ovviamente,
le tre proteine
codificate
saranno
diverse
COME,
dipende
dal frame
di lettura
ATG alternativi

5’
Consideriamo il secondo esone: se
nel primo e secondo trascritto
mantiene lo stesso frame, allora la
traduzione varia solo nella parte
iniziale
3’
.....
ATG alternativi

IDEM, per il terzo trascritto: se
l’ATG nel secondo esone è nello
stesso frame degli altri due, la
traduzione da lì in poi sarà uguale
5’
3’
.....
Ovvero
Parte uguale in tutti i trascritti
Dipende dal frame di lettura, e
come si arriva nella parte uguale per tutti. Potenzialmente, può essere tradotta
in 3 modi diversi. Per avere la stessa cosa, in pratica, la parte codificante
variabile all’inizio deve essere lunga...
Ovvero
Parte uguale in tutti i trascritti
UN MULTIPLO DI 3!!!!!!
In questo modo, le 3 proteine
avranno un inizio diverso... ma una fine uguale!
Gli “spostamenti” di frame
(frameshift)
5’- ATGCAGTCTGAGGTTAACATAACG - 3’
immaginiamo di avere una sequenza tradotta in questo modo....
5’- ATGCTCCAAATGCAGTCTGAGGTTAACATAACG se aggiungo un multiplo di 3 di nucleotidi la traduzione non cambia...
5’- ATGCTCCAATGCAGTCTGAGGTTAACATAACG ..ma se non è un multiplo di 3... sposto “shift” tutto il frame di lettura che
avevo prima!!!!
Gli “spostamenti” di frame
(frameshift)
5’- ATGCAGTCTGAGGTTAACATAACG - 3’
... e se cancello un po’ di nucleotidi?
5’- ATGCAG...GAGGTTAACATAACG - 3’
se ne cancello 3 (o multiplo) in frame, cancello esattamente un amminoacido
5’- ATGCA...TGAGGTTAACATAACG - 3’
... se ne cancello 3 (o multiplo) NON in frame,
cancello un amminoacido e cambio quello adiacente
I “frameshift”
5’- ATGCAGTCTGAGGTTAACATAACG - 3’
5’- ATGCAG..TGAGGTTAACATAACG - 3’
... se ne cancello NON 3 (o multiplo) dal punto di cancellazione in avanti
la traduzione è COMPLETAMENTE DIFFERENTE
Gli esoni “cassetta”

Le considerazioni appena viste si applicano a
inserzioni/cancellazioni dovute ai “cassette exon”
se la lunghezza dell’esone giallo è un multiplo di 3, allora il suo inserimento
causeràsoltanto un inserimento di amminoacidi nella proteina codificata
altrimenti, la traduzione dell’esone verde sarà DIVERSA a
seconda della presenza o
meno di quello giallo
Siti di splicing alternativi

Idem, quando si usano segnali di splicing
alternativi
in questo caso, se la lunghezza del frammento aggiuntivo (in blu) è un multiplo di 3,
allora il suo inserimento causeràsoltanto un inserimento di amminoacidi
nella proteina codificata
altrimenti, la traduzione dell’esone giallo e verde sarà DIVERSA a seconda della
presenza del frammento aggiuntivo in blu
(analogamente quando si accorciano esoni)
Gli esoni alternativi


Generalmente (ma con moltissime
eccezioni) gli esoni altertativi (cassetta
et similia) hanno proprio lunghezza
multipla di tre e frame +1, quindi
aggiungono/tolgono pezzi alla proteina
codificata
La “modularità” nella costruzione della
regione codificante, d’altra parte, si
sposa bene con la modularità che si
osserva nella proteine
I domini delle proteine



Una sequenza proteica può essere suddivisa in
“domini”
Ogni dominio forma la propria struttura
“indipendente”, ed è responsabile di una delle
funzioni della proteina: si può legare ad altre
proteine, a ligandi, al DNA/RNA, ecc.
In pratica, proteine diverse possono contenere
lo/gli stessi domini
Il gene più famoso del mondo
Dominio di legame al
DNA
Dominio di “tetramerizzazione”
Di solito, 4 catene
di p53 sono
assemblate insieme
Il gene più famoso del mondo
Visualizzare gli splicing alternativi
Visualizzare gli splicing alternativi
Sempre il gene più famoso del
mondo
Domanda!!!!

Disegna la struttura di un mRNA,
indicandone gli elementi che
conosci. Immaginando che l’mRNA
sia prodotto da un gene con 4
esoni, sul filamento negativo, con
codone di start nel secondo esone
e stop nell’ultimo, “mappa” il
trascritto e tutti gli elementi
mappabili sulla sequenza genomica
Morale...

Il dogma iniziale:




... è ora diventato..




UN GENE
UN TRASCRITTO
UNA PROTEINA
UN GENE
TANTI TRASCRITTI
(POTENZIALMENTE) TANTE PROTEINE
Potenzialmente, perché... non è assolutamente
detto che tutti i trascritti prodotti da un gene
siano necessariamente codificanti
Morale... (2)

In “origine” gli RNA erano o
Codificanti (mRNA)
 Coinvolti nella traduzione dei mRNA
(tRNA, rRNA)


In realtà, esistono centinaia di RNA
non codificanti prodotti da un
genoma (miRNA, snoRNA,
smallRNA) e così via, con svariate
funzioni
Per cosa si vince un Nobel, negli
anni 2000?
Fire & Mello, 1998
Morale... (3)



Da un trascritto per gene, a molti
trascritti per geni... ok?
Ma, in realtà, ci si è resi conto che la
trascrizione non sembra essere limitata
a quelli canonicamente annotati come
geni
“Foreste” di trascritti provenienti da
regioni genomiche non limitate solo ai
geni (es : RNA antisenso)
Morale... (4)

... il tutto ha portato a fare un
ulteriore passo indietro... ora, molti
si chiedono...
Dopotutto, che cos’è un gene??
Scarica

Dalla Genetica alla Genomica