Teorie sull’origine degli
introni e dei geni
Francesco Piva
Istituto di Biologia e Genetica
Semplici mutazioni non
costituiscono eventi di
ricombinazione molto
efficienti
La probabilità che nel DNA si crei una
certo motivo di lunghezza N è di 1/4^N,
ovvero occorrono 4^N mutazioni
puntiformi diverse per creare una
parola di lunghezza N
Es: ACCGT comparirebbe dopo in
media 1024 mutazioni puntiformi
casuali
Se consideriamo un esone lungo 120
basi, questo dovrebbe essere
comparso dopo circa 1,7^72 mutazioni
Considerando che il tasso di mutazione
nell’uomo è di 10^-8 per sito per
generazione, si deve ammettere che o
gli esoni erano preesistenti nelle prime
specie o la ricombinazione non si è
basata solamente sulle mutazioni
puntiformi.
La presenza degli introni
migliorerebbe la
ricombinazione
Se non ci fossero introni, il massimo
effetto di una mutazione singola sarebbe
quello di sostituire un amminoacido.
In presenza di introni, mutazioni che
cadono nei siti di splicing possono alterare
lo schema dello splicing, aggiungendo,
sostituendo o eliminando molti
amminoacidi alla volta.
In questo modo, a parità di eventi di
mutazione, si genererebbero nuove
proteine con più rapidità.
(Gilbert W. Why genes in pieces?
NATURE 1978 271:501)
Ulteriori vantaggi della presenza degli introni
A parità di eventi di crossing over durante la meiosi, se un gene non avesse introni esso avrebbe
un’occupazione cromosomica molto limitata. Solo se il crossing over avvenisse in modo da tagliare il gene
genererebbe variabilità. Se il gene fosse diviso in esoni e quindi questi si trovassero distribuiti lungo il
cromosoma, aumenterebbe la probabilità di scambio fra gli esoni.
Consideriamo un evento di crossing over che coinvolga un tratto di 30Kb su un tratto di 100Kb
Se il gene senza introni, si trovasse all’interno della zona scambiata,
non ci sarebbe ricombinazione tra parti interne del gene.
Se il gene avesse una struttura interrotta, ci sarebbe maggior probabilità di avere ricombinazioni tra gli esoni.
Ricombinazione e splicing alternativo
In presenza di una struttura interrotta, mutazioni neutre possono originare nuove forme di alternative
splicing senza distruggere le forme funzionali già esistenti. Questa rappresenta un’opportunità per
l’evoluzione di esplorare nuovi schemi aggiungendoli eventualmente a quelli precedenti.
(Pagani F, Raponi M, Baralle FE. Synonymous mutations in CFTR exon 12 affect splicing and are not
neutral in evolution Proc Natl Acad Sci U S A. 2005 May 3;102(18):6368-72.)
Ricombinazione in Drosophila
Ricordiamo che il centiMorgan o unità di mappa è l’unità di misura in
base alla quale viene espressa la distanza di due geni su un cromosoma
e la lunghezza dei cromosomi nelle mappe genetiche. Un'unità di mappa
corrisponde alla distanza di due geni che presentano una frequenza di
crossing over dell'1%, e, quindi, ad un tratto di cromosoma nel quale in
media si verifica un crossing-over ogni 50 meiosi.
Assumiamo che la selezione naturale sia meno efficace in zone a
basso tasso di ricombinazione.
Analizzando la relazione tra le dimensioni degli introni in
Drosophila e il tasso di ricombinazione delle zone in cui si trovano,
si è evidenziata una correlazione. In generale si osserva che
introni di dimensioni maggiori si trovano in zone di minor tasso di
ricombinazione. Questo è spiegato con il fatto che introni lunghi
hanno una maggior difficoltà nel subire splicing.
Successivamente gli introni sono stati divisi in tre classi a seconda
delle dimensioni, precisamente quelli aventi lunghezza minore di
60bp, quelli compresi tra 60 bp e 80 bp e quelli maggiori di 80bp.
Si evidenzia che la classe di dimensioni intermedie si trova in zone
ad alto tasso di ricombinazione e nella classe di sequenze di minor
dimensione, la lunghezza degli introni e il tasso di ricombinazione
sono proporzionali. Quindi anche introni molto corti si trovano in
zone a bassa ricombinazione. (è meglio non toccare gli introni
molto corti e quelli molto lunghi)
Questi risultati sono in accordo con l’osservazione che in
Drosophila introni di dimensioni minori di 60 bp e maggiori di 80
bp, non hanno una buona efficienza di splicing.
(ANTONIO BERNARDO CARVALHO, ANDREW G. CLARK
Genetic recombination: Intron size and natural selection Nature
1999 - 401, 344)
Questi risultati sono in accordo con
l’osservazione che in Drosophila introni di
dimensioni minori di 60 bp e maggiori di 80
bp, non hanno una buona efficienza di
splicing.
Secondo questa osservazione, geni che si
trovano in zone a basso tasso di
ricombinazione dovrebbero essere penalizzati
dal punto di vista dell’evoluzione, ma questo è
compensato dalla presenza di introni più
lunghi, che rendono il gene più sparso e
ristabiliscono un buon tasso di ricombinazione.
Teoria degli introni antichi (intron early)
Originariamente esistevano piccole porzioni di genoma codificanti per altrettanto piccoli peptidi aventi funzioni semplici.
Queste sequenze erano gli esoni e si trovavano molto lontane tra loro e all’interno di sequenze introniche. Eventi di
ricombinazione non omologa a carico degli introni, avrebbero portato con se gli esoni, avrebbero avvicinato più esoni
portandoli sotto il controllo dello stesso promotore.
Questi eventi di rimescolamento (exon shuffling) avrebbero originato proteine più lunghe e complesse unendo i domini
codificati dai singoli esoni.
Evidenze a favore della teoria
Il primo esempio di rimescolamento esonico è quello del gene che codifica per il recettore delle lipoproteine a bassa
densità (LDL).
La natura multifunzionale di questa proteina corrispondeva alla presenza di domini multipli, infatti dei 18 esoni che
compongono questo gene, molti sono omologhi a sequenze di altre proteine. Precisamente 5 esoni codificano per
domini simili a quelli della proteina del complemento C9, 3 producono domini simili a quelli del gene del precursore per il
fattore di crescita dell’epidermide (EGF), 3 generano domini simili alle proteine di coagulazione del sangue (fattore IX, X
e proteina C). La proteina di questo recettore sembra essere generata da un mosaico di esoni condivisi con diverse
proteine quindi appartiene a molte famiglie supergeniche.
(Südhof, T C; Goldstein, J L; Brown, M S; Russell, D W The LDL receptor gene: a mosaic of exons shared with different
proteins Science Vol 228, Issue 4701, 1985)
Conservazione tra gli amminoacidi in
tre specie nel gene LR11, le
percentuali indicano le identità tra i vari
domini
(Sonja Mörwald; Hiroyuki Yamazaki; Hideaki
Bujo; Jun Kusunoki; Tatsuro Kanaki; Kouichi
Seimiya; Nobuhiro Morisaki; Johannes Nimpf;
Wolfgang Johann Schneider; Yasushi Saito. A
Novel Mosaic Protein Containing LDL
Receptor Elements Is Highly Conserved in
Humans and Chickens. Arteriosclerosis,
Thrombosis, and Vascular Biology.
1997;17:996-1002)
Sono state individuate altre proteine di
struttura modulare che hanno sostenuto
l’ipotesi dell’exon shuffling.
Precisamente tra tutte le proteine di una
specie, sono state selezionate quelle i
cui esoni corrispondevano a singoli e
ben definiti domini proteici, inoltre tali
esoni dovevano essere fiancheggiati da
introni che non interrompevano la fase.
Infatti solo questi introni potevano
partecipare al rimescolamento degli
esoni. I gruppi di proteine che
corrispondevano a questi criteri erano
principalmente: le selettine, il recettore
dell’interleuchina 2, una subunità del
fattore di coagulazione XIIIb, follistatina
e alcune proteine inibitrici della
coagulazione
Evidenze che minano la teoria
Confrontando i geni di proteine modulari tra specie diverse, si nota che l’uomo rispetto a Drosophila e
Caenorhabditis, ha un maggior numero di introni. In questi casi, gli autori, pur attribuendo ancora all’exon
shuffling l’origine di tali proteine, giustificano la mancanza di introni delle specie non umane con la perdita
dovuta a pressione selettiva durante l’evoluzione
I blocchi colorati costituiscono i domini proteici e non gli esoni, la barra nera verticale corrisponde al dominio transmembrana. I
numeri indicano la fase degli introni presenti nel gene. (László Patthy Genome evolution and the evolution of exon-shuffling —
a review GENE vol 238, 1999)
Diffusione tra i Phyla dei resti dei possibili eventi di exon shuffling
Analizzando le proteine modulari (definite come quelle aventi almeno un esone coincidente con un modulo proteico
fiancheggiato da almeno un altro modulo, e il cui esone nel gene si trova tra introni inseriti in fase 1) tra tutti i genomi
possibili, si nota che queste sono presenti in differenti phyla tra cui: le spugne, gli idrozoi, i nematodi, i molluschi, gli
artropodi e gli echinodermi. Questo indica che il meccanismo dell’exon shuffling era funzionante prima della
divergenza del phylum dei metazoi. Inoltre la maggior frequenza di exon shuffling coincide con l’aumento del numero
di specie che si è avuto al tempo della radiazione dei metazoi, attribuendo ad accelerare l’evoluzione dei metazoi.
Al contrario esistono proteine a struttura modulare presenti solamente nella linea dei cordati, ma anche in questo caso
buona parte dei domini corrispondono agli esoni, e tali domini sono ritrovati in proteine di specie più antiche. Queste
osservazioni sono ben giustificate dall’exon shuffling.
La maggior parte delle proteine modulari che sarebbero state prodotte dall’exon shuffling, sono legate a
funzioni essenziali alla multicellularità dei metazoi, come ad esempio alcuni costituenti della matrice
extracellulare, mediatori e recettori per la comunicazione tra cellule, proteine per l’interazione matrice-cellula.
Quindi l’exon shuffling avrebbe permesso e accelerato l’evoluzione dei metazoi multicellulari.
Una più ampia valenza
Eventi di exon shuffling si possono
osservare anche in alcune piante, così da
assegnargli una valenza generale tra le
specie per la creazione di nuovi geni.
Come sarebbe avvenuto l’exon
shuffling
Sono stati proposti due meccanismi per
spiegare come possa avvenire l’exon
shuffling. Uno consiste nella
ricombinazione illegittima, cioè nella
ricombinazione di sequenze di DNA sia
omologhe che non omologhe o meglio
nella saldatura, a seguito di rotture, di
lembi di DNA che non erano
originariamente uniti insieme. L’altro
consiste in una ricombinazione mediata
dalle LINE-1, questi elementi, molto
abbondanti nei genomi dei mammiferi,
sono in grado di duplicarsi con un
meccanismo copia e incolla. E’ stato
dimostrato che tali elementi possono
trascrivere oltre a se stessi anche una
zona genomica a valle di essi, portandola
con se anche nella retrotrasposizione.
Esso sarebbe responsabile del
rimescolamento di parti del genoma e
quindi anche di esoni.
Un esempio di origine di un gene per retroposizione è dato dal gene BC200 del
cromosoma 2 che si trova espresso nel cervello dei primati. In questo gene si possono
riconoscere tre parti: quella in 5’ corrisponde ad un ALU, la parte centrale è una
ripetizione di molte A e la parte in 3’ coincide con parte di una sequenza LINE.
5’
3’
ALU FLAM-C1
Poly A
LINE L1
(Tiedge H, Chen W, Brosius J Primary structure, neural-specific expression, and dendritic
location of human BC200 RNA J Neurosci. 1993 Jun;13(6))
Tracce caratteristiche di eventi di retroposizione sono la perdita di introni, la presenza di tratti di poly A e la presenza di
ripetizioni corte. Riportiamo un esempio relativo a un evento di retroposizione che ha duplicato un intero gene conservando la
struttura introni-esoni. E’ il caso del gene PMCHL1 che corrisponde come posizione ad un introne del gene AROM (antisenseRNA-overlapping-MCH) ma si trova nel filamento opposto.
Mostriamo la locazione
originale del gene
PMCHL1 (cromosoma
5 posizione 22.170.113
– 22.195.445), si nota
che nell’altro filamento
è presente un introne
di un altro gene.
mostriamo la
retroposizione nello
stesso cromosoma
ma alla posizione
70.699.719 –
70.730.470
In generale riportiamo uno schema che riassume il meccanismo di retroposizione, mediante
retrotrascrizione, per cui un gene viene copiato e incollato in un’altra posizione portando con se un altro
gene che conserva ancora la struttura introni-esoni.
Meccanismo generale di retroposizione che conserva la struttura introni-esoni mediante retrotrascrizione.
Le frecce e le bandierine ovali indicano rispettivamente l’inizio e la fine della trascrizione
La teoria dell’intron late
Secondo la teoria dell’intron late, geni piuttosto lunghi esistevano già nel passato, gli introni si
sarebbero inseriti successivamente, il loro inserimento sarebbe avvenuto in fasi e posizioni casuali
quindi tali da non definire moduli proteici, ovvero non si dovrebbe trovare una corrispondenza tra
esone e dominio proteico (o tra introni e confini dei moduli proteici).
Al contrario l’exon shuffling produce geni più complessi se il rimescolamento avviene aggiungendo
un esone avente la stessa fase dei fiancheggianti e lunghezza multipla di tre. Questo significa trovare
esoni fiancheggiati da introni di fase identica. Se l’inserimento di un esone alterasse il frame di lettura
proprio o dei successivi esoni, si potrebbero produrre codoni di STOP prematuri e originare proteine
tronche anziché allungate e presumibilmente più complesse.
Situazione originale prima che lo shuffling inserisca l’esone 2
2
2
E1
E3
E1 + E3
Caso in cui l’esone 2 ha la stessa fase degli esoni tra i quali si inserisce
2
E2
E1
E1 + E2 + E3
2 2
2
La prima situazione si riferisce ad un gene composto dagli
esoni E1 e E3. Si suppone che tramite exon shuffling avvenga
l’inserzione di un esone (E2) tra i due esoni preesistenti.
Nel caso in cui l’esone inserito, abbia la stessa fase del punto
in cui avviene l’inserimento, esso contribuirà a creare un
prodotto proteico più lungo e presumibilmente più complesso.
Nel caso in cui l’esone inserito abbia fase diversa rispetto
all’inserzione, poiché cambierebbe il frame di lettura
dell’esone 2, questo potrebbe manifestare un codone di STOP
prematuro e troncare la proteina anziché allungarla. In
aggiunta, se la lunghezza dell’esone 2 è tale per cui viene
cambiata anche il frame di lettura degli esoni a valle
dell’inserzione, aumenta la probabilità di trovare un codone di
STOP prematuro. Questo spiega perché esoni fiancheggiati
da introni di fase identica, sono più probabilmente dovuti
all’exon shuffling.
E3
Caso in cui l’esone 2 ha fase diversa rispetto agli esoni tra i quali si inserisce
2
E1
0
STOP
E1 + E2 tronco
n n
E2
E3
Un’altra prova a sostegno dell’exon shuffling
In un lavoro che ha utilizzato tecniche bioinformatiche, sono stati raccolti molti geni antichi, definendo come
antichi quelli condivisi tra più specie. Viene osservata la fase di tutti gli introni ottenendo che la percentuale
di introni in fase 0 era il 48%, quelli in fase 1 del 30% e quelli in fase 2 del 22%.
Applicando la formula dell’abbondanza relativa alle associazioni tra due fasi introniche, si riesce ad
evidenziare se certe associazioni di fasi introniche sono favorite o sfavorite.
Precisamente definiamo ad esempio R(12) come l’abbondanza relativa di introni fiancheggianti lo stesso
esone, rispettivamente in fase 1 e 2
F (12)
R(12) 
F (1) * F ( 2)
dove F(1) è la frequenza osservata di tutti gli introni in fase 1 nel campione di geni analizzati, F(12) è la
frequenza osservata della coppia di introni (fiancheggianti lo stesso esone) in fase 1 e 2.
Questa formula presenta a numeratore la frequenza osservata e a denominatore quella attesa. Ci
aspettiamo valori di R tanto più diversi da 1 quanto più esistono associazioni non casuali tra due introni
vicini.
Applicando questa formula a tutte le 6 possibili combinazioni di fase intronica gli autori osservano una
prevalenza di coppie di introni di fase identica rispetto a quella aspettata.
Inoltre si osserva che l’associazione in cui entrambi gli introni si trovano in fase 1 è quella favorita su tutte.
Tale studio rafforzerebbe la validità dell’exon shuffling, affermando che le coppie di introni con la stessa
fase sarebbero i residui dell’exon shuffling mentre le altre sarebbero derivate da eventi di inserzione
intronica.
(Long M, Rosenberg C, Gilbert W. Intron phase correlations and the evolution of the intron/exon structure
of genes Proc Natl Acad Sci U S A. 1995 Dec 19;92(26))
Proviamo a mettere in discussione quello appena detto
Una spiegazione alternativa a queste osservazioni è che i siti di proto-splice, cioè quei siti nei quali gli
introni si possono inserire, si trovino già essi stessi distribuiti nelle tre fasi con diversa probabilità.
Quindi se gli introni avessero una distribuzione casuale tra i siti di proto-splice, la loro distribuzione
seguirebbe quella dei siti di proto-splice.
Definendo la tripletta AG|G come sito di proto splice, è stata indagata la distribuzione degli introni su
tutti i possibili siti AG|G.
Si è osservato che gli introni non sono
equamente distribuiti tra i siti di proto-splice, rendendo così ancora valida l’ipotesi dell’exon shuffling.
(N.J. Dibb and A.J. Newman , Evidence that introns arose at proto-splice sites. EMBO J 8 (1989))
(N.J. Dibb , Proto-splice site model of intron origin. J Theor Biol 151 (1991))
(J.M. Logsdon, Jr , The recent origins of spliceosomal introns revisited. Curr Opin Genet Dev 8 (1998))
(J.M. Logsdon, Jr, A. Stoltzfus and W.F. Doolittle , Molecular evolution: recent cases of spliceosomal
intron gain?. Curr Biol 8 (1998))
(M. Long, S.J. de Souza, C. Rosenberg and W. Gilbert , Relationship between ‘proto-splice sites’ and
intron phases: evidence from dicodon analysis. Proc Natl Acad Sci USA 95 (1998))
(M. Long and C. Rosenberg , Testing the ‘proto-splice sites’ model of intron origin: evidence from
analysis of intron phase correlations. Mol Biol Evol 17 (2000))
Pseudo geni come punti di partenza per esplorare nuove proteine
Il modello classico per spiegare l’origine di nuove strutture proteiche prevede che da un gene si possano
originare delle copie così mentre una copia mantiene la funzione originale, l’altra è libera di accumulare
mutazioni e poter evolvere.
Naturalmente la copia di un gene potrebbe subire vari destini: perdere funzionalità e diventare uno
pseudo-gene, rimanere immutata e quindi costituire la ridondanza del gene originale oppure evolvere
verso nuove e più complesse funzioni.
Gli pseudo-geni si dividono in processati e non processati. Quelli processati si trovano su diversi
cromosomi rispetto alla copia originale, non hanno introni, terminano spesso con delle adenine, sono
fiancheggiati da ripetizioni e si trovano solo nei mammiferi. Quelli non processati, si trovano sullo stesso
cromosoma del gene originale, hanno introni, hanno delle mutazioni che fanno comparire dei codoni di
STOP prematuri o eliminare codone di inizio della traduzione originale, possono produrre un mRNA
tronco o intero e si possono trovare in varie specie.
Un esempio di nuovi geni funzionali evoluti da un gene originale è quello dell’emoglobina umana, infatti
ne esistono varie copie ma espresse in diversi stadi dello sviluppo.
(L. J. Gibson PSEUDOGENES AND ORIGINS Origins 21(2):91-108 (1994)
Fattore di trascrizione
dell’RNA polimerasi
II, gene originale che
si trova nel
cromosoma X.
P.J. Wang, D.C. Page,
Functional substitution
for TAFII250 by a
retroposed homolog
that is expressed in
human
spermatogenesis.
Human Molecular
Genetics, 2002, Vol.11,
No.19, 2341-2346
Questo gene
viene detto ‘TAF I
like’ e può
sostituire TAF I
durante la meiosi
maschile quando
i cromosomi
sessuali sono
trascrizionalmete
silenti. Si trova
nel cromosoma 9.
Critiche all’exon shuffling
Altrettanti geni antichi come quelli dell’alcool deidrogenasi, globine, piruvato chinasi non mostrano una
coincideza tra gli esoni e i moduli della struttura delle proteine.
(Stoltzfus A, Spencer DF, Zuker M, Logsdon JM Jr, Doolittle WF - Testing the exon theory of genes: the
evidence from protein structure Science. 1994 Jul 8;265(5169))
fugu
canis
rat
human
mouse
gallus
Xenopus
danio
anopheles
drosophila
scerevisiae
celegans
ATGTGTGACGACGACGAGACCACTGCCCTTGTGTGTGATAATGGCTCTGGCCTGGTCAAG
ATGGATGACGA------TATCGCTGCGCTTGTGGTCGACAACGGCTCCGGCATGTGCAAG
ATGTGTGACGAGGACGAGACCACCGCTCTTGTGTGTGACAACGGCTCTGGCCTGGTGAAA
ATGTGTGAAGAAGAGGACAGCACTGCCTTGGTGTGTGACAATGGCTCTGGGCTCTGTAAG
ATGTGTGAAGAGGAAGACAGCACAGCCCTGGTGTGCGACAATGGCTCTGGGCTCTGTAAG
ATGTGTGAGGAGGAGGACAGCACTGCCCTTGTTTGTGACAATGGCTCAGGGCTCTGTAAA
ATGTGTGACGATGAAGAGACTACCGCACTTGTGTGTGACAATGGCTCCGGACTTGTAAAA
ATGTGTGACGACGACGAGACTACCGCCCTTGTGTGCGACAACGGTTCCGGCCTGGTGAAG
ATGTG---CGACGAAGAGGTTGCTGCGCTGGTTGTCGACAACGGATCCGGTATGTGCAAG
ATGTGT---GACGAAGAAGTTGCTGCTCTGGTTGTCGACAACGGCTCTGGCATGTGCAAG
ATGTGT---GACGACGATGTTGCCGCTCTCGTAGTTGACAATGGATCCGGAATGTGCAAA
ATGTGT---GACGACGATGTTGCCGCTCTCGTAGTTGACAATGGATCCGGAATGTGCAAA
fugu
canis
rat
human
mouse
gallus
Xenopus
danio
anopheles
drosophila
scerevisiae
celegans
GCTGGCTTTGCAGGCGATGATGCCCCCAGGGCTGTGTTCCCCTCCATTGTGGGACGCCCC
GCCGGCTTCGCAGGCGACGACGCCCCCCGGGCCGTCTTCCCCTCCATCGTGGGGCGCCCC
GCTGGCTTTGCCGGGGATGATGCCCCCAGGGCTGTGTTCCCATCCATCGTGGGTCGGCCC
GCCGGCTTTGCTGGGGACGATGCTCCCAGGGCTGTTTTCCCATCCATTGTGGGACGTCCC
GCCGGCTTCGCTGGTGATGATGCTCCCAGGGCTGTTTTCCCATCCATCGTGGGACGTCCC
GCTGGCTTCGCCGGGGATGATGCTCCAAGAGCAGTTTTCCCTTCCATCGTGGGTCGTCCC
GCTGGGTTCGCTGGAGATGATGCTCCAAGAGCAGTGTTTCCATCTATTGTTGGACGCCCC
GCTGGCTTTGCTGGTGATGACGCCCCCAGAGCCGTCTTCCCCTCCATCGTTGGTCGCCCC
GCCGGCTTTGCTGGGGATGACGCACCACGTGCCGTCTTCCCGTCCATCGTTGGACGCCCC
GCCGGATTTGCCGGAGACGATGCTCCCCGCGCCGTCTTCCCATCGATTGTGGGACGTCCC
GCTGGATTCGCTGGAGACGACGCTCCACGCGCCGTGTTCCCATCCATTGTCGGAAGACCT
GCTGGATTCGCTGGAGACGACGCTCCACGCGCCGTGTTCCCATCCATTGTCGGAAGACCT
fugu
canis
rat
human
mouse
gallus
Xenopus
danio
anopheles
drosophila
scerevisiae
celegans
CGTCACCAG-X-GGTGTAATGGTCGGCATGGGCCAGAAAGATTCCTATGTGGGCGACGAG
CGGCACCAG-X-GGCGTGATGGTGGGCATGGGCCAGAAGGACTCCTACGTGGGCGATGAG
CGTCACCAG-X-GGTGTCATGGTCGGTATGGGTCAGAAGGATTCCTACGTGGGCGACGAG
AGACATCAG-X-GGGGTGATGGTGGGAATGGGACAAAAAGACAGCTACGTGGGTGACGAA
AGACATCAG-X-GGAGTAATGGTTGGAATGGGCCAAAAAGACAGCTATGTGGGGGATGAA
AGGCACCAG-X-GGTGTGATGGTTGGTATGGGTCAAAAAGACAGCTATGTAGGTGATGAG
CGCCACCAG-X-GGTGTCATGGTTGGTATGGGTCAAAAGGACTCCTATGTAGGTGATGAA
CGTCACCAG---GGTGTCATGGTGGGTATGGGTCAGAAGGACTCATACGTAGGAGATGAA
CGCCACCAG---GGTGTGATGGTCGGCATGGGCCAGAAGGACTCGTACGTCGGCGACGAG
CGTCACCAG---GGTGTGATGGTCGGCATGGGCCAGAAGGACTCGTACGTGGGTGATGAG
CGTCATCAA---GGAGTCATGGTCGGTATGGGACAGAAAGACTCGTACGTCGGAGACGAG
CGTCATCAA---GGAGTCATGGTCGGTATGGGACAGAAAGACTCGTACGTCGGAGACGAG
fugu
canis
rat
human
mouse
gallus
Xenopus
danio
anopheles
drosophila
scerevisiae
celegans
GCCCAGAGCAAAAGGG---GTATCCTGACCCTGAAATACCCCATTGAGCATGGCATCATC
GCCCAGAGCAAGAGGG---GCATCCTGACCCTGAAGTACCCCATTGAGCACGGCATCGTC
GCCCAGAGCAAGCGAG---GTATCCTGACCCTGAAGTACCCCATTGAACACGGCATTATC
GCACAGAGCAAAAGAG---GAATCCTGACCCTGAAGTACCCGATAGAACATGGCATCATC
GCCCAGAGCAAGAGAG---GGATCCTGACGCTGAAGTATCCGATAGAACACGGCATCATC
GCTCAAAGCAAGAGAG---GAATCCTGACCTTGAAATACCCCATAGAACATGGCATCATT
GCACAGAGCAAGAGAG---GTATTCTTACACTAAAGTATCCAATTGAACATGGTATTATC
GCTCAGAGCAAGAGGG---GTATCCTCACTCTGAAATATCCCATCGAGCACGGCATCATT
GCCCAGAGCAAACGTG---GTATCCTCACGCTGAAATACCCGATCGAGCACGGTATCGTC
GCGCAGAGCAAGCGTG---GTATCCTCACCCTGAAGTACCCCATTGAGCACGGTATCGTG
GCCCAATCCAAGAGAG---GTATCCTTACCCTTAAGTACCCAATTGAGCATGGTATCGTT
GCCCAATCCAAGAGAG-X-GTATCCTTACCCTTAAGTACCCAATTGAGCATGGTATCGTT
fugu
canis
rat
human
mouse
gallus
Xenopus
danio
anopheles
drosophila
scerevisiae
celegans
ACCAACTGGGATGACATGGAGAAG---ATCTGGCACCACACCTTCTACAATGAGCTACGT
ACCAACTGGGACGACATGGAGAAG---ATCTGGCACCACACCTTCTACAACGAGCTGCGC
ACCAACTGGGACGACATGGAGAAG---ATCTGGCACCACACCTTCTACAATGAGCTGCGT
ACCAACTGGGACGACATGGAAAAG-X-ATCTGGCACCACTCTTTCTACAATGAGCTTCGT
ACCAACTGGGACGACATGGAAAAG-X-ATCTGGCACCACTCTTTCTATAACGAGCTTCGT
ACCAACTGGGATGACATGGAGAAG-X-ATCTGGCATCACTCCTTCTATAATGAGCTCCGT
ACTAACTGGGATGATATGGAGAAG---ATTTGGCATCACACCTTCTACAATGAACTGCGT
ACCAACTGGGACGACATGGAGAAG---ATCTGGCACCACACCTTCTACAATGAGCTCCGT
ACAAACTGGGACGACATGGAGAAA---ATCTGGCACCACACGTTCTACAACGAGCTGCGA
ACCAACTGGGACGATATGGAGAAG---ATCTGGCACCACACCTTCTACAATGAGCTGCGT
ACCAACTGGGACGACATGGAAAAA---ATCTGGCATCACACTTTCTACAACGAGCTTCGC
ACCAACTGGGACGACATGGAAAAA---ATCTGGCATCACACTTTCTACAACGAGCTTCGC
fugu
canis
rat
human
mouse
gallus
Xenopus
danio
anopheles
drosophila
scerevisiae
celegans
GTGGCCCCTGAGGAACACCCCACCCTGCTGACGGAGGCCCCACTCAACCCCAAAGCCAAC
GTGGCCCCCGAGGAGCACCCGGTGCTGCTGACCGAGGCCCCCCTGAACCCCAAGGCCAAC
GTGGCCCCCGAGGAGCACCCGACCCTGCTCACTGAGGCCCCTTTGAACCCCAAAGCTAAC
GTTGCCCCTGAAGAGCATCCCACCCTGCTCACGGAGGCACCCCTGAACCCCAAGGCCAAC
GTGGCCCCTGAAGAGCATCCGACACTGCTGACAGAGGCACCACTGAACCCTAAGGCCAAC
GTTGCACCTGAGGAGCACCCAACTCTGCTGACTGAAGCACCACTGAATCCCAAAGCCAAT
GTAGCCCCTGAAGAGCATCCCACCCTGCTTACTGAGGCTCCACTGAACCCTAAAGCTAAC
GTTGCCCCTGAAGAGCACCCAACTCTGCTGACTGAGGCCCCTCTGAACCCCAAGGCTAAC
GTCGCGCCAGAAGAGCACCCGGTCCTGCTGACGGAGGCCCCGCTCAACCCGAAGGCTAAC
GTGGCACCCGAGGAGCACCCCGTGCTGCTGACCGAGGCCCCGCTGAACCCCAAGGCCAAC
GTTGCCCCAGAAGAGCACCCAGTACTTCTCACTGAAGCCCCACTCAATCCAAAGGCTAAC
GTTGCCCCAGAAGAGCACCCAGTACTTCTCACTGAAGCCCCACTCAATCCAAAGGCTAAC
fugu
canis
rat
human
mouse
gallus
Xenopus
danio
anopheles
drosophila
scerevisiae
celegans
AGGGAGAAGATGACCCAG---ATAATGTTTGAGACCTTCAATGTACCCGCCATGTATGTG
CGTGAGAAGATGACCCAG-X-ATCATGTTCGAGACTTTCAACACCCCAGCCATGTACGTG
CGGGAGAAGATGACTCAA---ATCATGTTTGAGACCTTCAACGTGCCTGCTATGTATGTG
CGGGAGAAAATGACTCAA-X-ATTATGTTTGAGACTTTCAATGTCCCAGCCATGTATGTG
CGGGAGAAAATGACCCAG-X-ATTATGTTTGAGACCTTCAATGTCCCCGCCATGTATGTG
CGAGAGAAAATGACCCAG-X-ATTATGTTTGAGACTTTCAATGTGCCAGCCATGTATGTA
CGTGAAAAGATGACTCAA---ATAATGTTTGAGACTTTCAACGTCCCAGCTATGTATGTT
CGTGAGAAGATGACCCAG---ATCATGTTTGAGACCTTCAACGTCCCAGCCATGTATGTG
CGCGAGAAGATGACACAG---ATCATGTTCGAGACGTTCAACACACCGGCAATGTACGTC
CGTGAGAAGATGACCCAG---ATCATGTTCGAGACCTTCAACACACCCGCCATGTATGTG
CGTGAAAAGATGACCCAA---ATCATGTTCGAGACCTTCAATACCCCAGCCATGTATGTC
CGTGAAAAGATGACCCAA---ATCATGTTCGAGACCTTCAATACCCCAGCCATGTATGTC
fugu
canis
rat
human
mouse
gallus
Xenopus
danio
anopheles
drosophila
scerevisiae
celegans
GCCATTCAGGCCGTACTGTCCCTCTATGCCTCTGGTCGTACCACTG-X-GTATTGTGTTG
GCCATCCAGGCTGTGCTGTCCCTGTACGCCTCTGGCCGCACCACTG---GCATCGTGATG
GCTATTCAGGCGGTGCTGTCTCTCTATGCCTCCGGCCGTACCACCG-X-GCATCGTGTTG
GCTATCCAGGCGGTGCTGTCTCTCTATGCCTCTGGACGCACAACTG-X-GCATCGTGCTG
GCTATTCAGGCTGTGCTGTCCCTCTATGCCTCTGGACGTACAACTG-X-GTATTGTGCTG
GCTATTCAAGCTGTTCTGTCCCTGTATGCTTCTGGGCGTACTACAG-X-GGATTGTGCTT
GCAATCCAGGCAGTGCTTTCTCTATACGCCTCTGGCCGTACAACTG-X-GGATTGTGCTC
GCCATTCAGGCTGTGCTGTCCCTCTACGCTTCTGGCCGTACCACTG---GTATCGTGCTG
GCCATCCAGGCCGTGCTGTCGCTGTACGCCTCCGGTCGCACCACCG---GTATCGTGCTG
GCCATCCAGGCTGTGCTCTCGCTGTACGCCTCCGGTCGTACCACCG---GTATCGTTCTG
GCCATCCAAGCTGTCCTCTCCCTCTACGCTTCCGGACGTACCACCG---GAATCGTCCTC
GCCATCCAAGCTGTCCTCTCCCTCTACGCTTCCGGACGTACCACCG---GAATCGTCCTC
Pan troglodytes
average nucleotide divergence of just 1.2%
Scarica

X - Introni.it