Il genoma umano LEZIONE 6 By NA Genoma Umano ~70% ~30% ~80% ~10% By NA ~90% ~20% Il DNA mitocondriale 0.0005% del genoma umano - doppio filamento a diversa composizione: filamento heavy (H) e light (L) - contiene 37 geni, 28 su filamento H e 9 su filamento L - dei 37 geni, 24 codificano per prodotti maturi ad RNA e 13 per polipeptidi dei complessi multimerici del mitocondrio (concetto di semiautonomia) - i geni sono estremamente compatti: privi di introni sovrapposti parzialmente (subunita’ 6 e 8 dell’ATPasi) trascritti privi di codoni di stop - eredita’ matroclina By NA Il DNA NUCLEARE Si distingue in: DNA codificante (3%) DNA non codificante (97%) By NA Il DNA codificante (per RNA e proteine) - Numero di geni stimato nel genoma umano (30000), stimato utilizzando il sequenziamento genomico e CpG - Utilizzando sonde per CpG (56% dei geni umani hanno nei loro promotori questi elementi di sequenza) si e’ visto una differenziale densita’ genica sui cromosomi: a. cromosoma 19 ricco in geni b. cromosomi 4 e 18 poveri in geni - di solito in unica copia - possono appartenere a famiglie geniche originatesi per duplicazione. In questo caso possono mantenere funzioni correlate e possono mappare nella stessa regione genomica By NA Il DNA codificante GENI CHE CODIFICANO ORGANIZZAZIONE Stesso prodotto Spesso raggruppati Isoforme proteiche o isoenzimi tessuto-specifici Talvolta raggruppati talvolta non sintenici Isoenzimi specifici per differenti comparti cellulari Di solito non sintenici Enzimi della stessa via metabolica Di solito non sintenici Subunita’ della stessa molecola Di solito non sintenici Ligando e recettore Di solito non sintenici By NA ESEMPI geni per tRNA, istoni ... amilasi pancreatica e salivare a-actina epatica e cardiaca Aldeide deidrogenasi citoplasmatica e mitocondriale (chr9q e chr12q) Ferritina: cat pesante chr11q cat leggera chr22q Geni dentro i geni Geni all’interno di altri geni sono descritti per i genomi di organismi semplici e nei mitocondri Nei mammiferi sono descritti geni contenuti nei grandi introni di alcuni geni. A differenza dei genomi piu’ semplici in questi casi spesso viene utilizzato il filamento opposto al gene “canonico” NF1: introne 27 (40Kb) contiene tre piccoli geni (2 esoni) che vengono trascritti dal filamento opposto Fattore VIII della coagulazione F8C: introne 22 contiene due geni che utilizzano la stessa isola CpG nelle due direzioni. Il gen F8A viene trascritto utilizzando il filamento opposto al F8C, mentre F8B non solo va nella stessa direzione, ma sintetizza un corto mRNA che ha un esone nuovo + gli esoni dal 23 al 26 di F8C. RB1: introne 17 (72Kb) contiene il gene per il recettore della proteina G, che viene trascritto in senso opposto By NA Geni dentro i geni NF1 Filamento di senso 5’ Filamento antisenso 3’ Introne 26 esone 26 2.2KB EVI2B 1 EVI2A 10 KB F8C 4 KB CpG F8B 22 F8A By NA 3’ 5’ OGMP F8 esone 27 23 26 Famiglie multigeniche 40% del genoma e’ composto da gruppi di sequenze non alleliche che mappano percio’ in locus diversi, ma sono strettamente correlate, sono presenti cioe’ sequenze con un numero di copie multiple. Tradizionalmente sulla base della cinetica di riassociazione il genoma DNA DNA DNA By NA umano e’ suddiviso in: a singola copia o con un numero di copie molto basso moderatamente ripetitivo altamente ripetuto Famiglie multigeniche La definizione di famiglia e’ operativa, e’ indipendente dalla natura delle sequenze Due sequenze vengono definite come appartenenti alla stessa famiglia quando presentano omologia di sequenza anche in una regione ristretta della sequenza Famiglie multigeniche: DNA ripetuto che contiene geni funzionali Famiglie By NA di sequenze di DNA non genico Famiglie multigeniche Famiglie multigeniche: DNA ripetuto che contiene geni funzionali Le famiglie presentano variabilita’ nell’omologia con la sequenza di riferimento e nel grado con cui le sequenze conservate definiscono la famiglia. Ne deriva che l’appartenenza ad una famiglia e’ data non solo dall’omologia complessiva, ma dal presentare un dominio condiviso o organizzazione simile. Si possono presentare raggruppati o distribuiti nel genoma. Alcuni membri possono essere non funzionali: pseudogeni By NA Pseudogeni I Pseudogeni non processati: convenzionali ed espressi Copie non funzionali del DNA genomico di un gene. Contengono esoni, introni e spesso le sequenze fiancheggianti. Data la loro somiglianza nell’organizzazione genomica, la loro natura non funzionale puo’ essere riconosciuta, a livello di sequenza, dalla presenza di codoni di stop nella regione corrispondente alla porzione codificante del gene funzionale o dalla presenza di un’elevato numero di mutazioni ognuna della quali originerebbe una molecola mutante. Sono comuni nelle famiglie di geni raggruppati Talvolta possono venir espressi a livello di RNA o addirittura come polipeptide, che non viene utilizzato nella molecola funzionale: gene della globina-, sicuramente viene espresso, ma non se ne riscontra la presenza nell’emoglobina funzionale By NA Pseudogeni II Pseudogeni processati : sono copie non funzionali degli esoni di un gene espresso e si ritrovano nelle famiglie dei geni interspersi. La loro origine sembrerebbe dovuta all’integrazione di una sequenza di DNA originatesi per azione di una trascrittasi inversa. se sono copie di trascritti dalla RNApolimerasi II di solito non sono espressi perche’ privi del promotore. Possono venir espressi se integrati vicino ad un promotore, in questo caso l’espressione potrebbe non essere nello spazio e nel tempo quella originaria (espressione selettiva in un tessuto specifico e/o in uno specifico momento nello sviluppo: geni espressi nel testicolo, SRY) se sono copie di trascritti dalla RNApolimerasi III possono avere al loro interno il promotore ed essere espressi. Possono raggiungere un elevato numero di copie (sequenze Alu) By NA I cluster globinici Le LCR si trovano a monte dei raggruppamenti e la loro funzione sarebbe quella di organizzare il raggruppamento in un dominio di cromatina attiva, agendo come enhancer. La cromatina attiva si presenta sensibile alla Dnasi I e grazie a questa caratteristica sono state identificate le LCR per i due aggruppameni globinici. E’ stato anche possibile riconoscere che questa ipersensibilita’ e’ modulata nei diversi stadi di sviluppo HS-40 1 2 2 1 2 1 globina HS-4 HS-3 HS-2 globina By NA G A Controllo dei cluster globinici Gli enhancer sono brevi sequenze che agiscono in cis. Nel caso dei geni globinici sono costituiti da sequenze di riconoscimento per fattori di trascrizione eritroido-specifici. Si ritiene che l’alternanza delle emoglobine sia legata oltre che a fenomeni di competizione dei geni per interagire con le LCR , anche all’intervento di silenziatori gene-specifici, modulati durante lo sviluppo. DNA nell’embrione G A DNA nel feto G A DNA nell’adulto G A By NA Struttura del DNA codificante relazione inversa tra lunghezza del gene e percentuale del contenuto esonico By NA Gli introni Entita’ eterogenee con differenti capacita’ funzionali. Sono coinvolti nello splicing con modalita’ differenti e pertanto classificabili in gruppi. La posizione all’interno delle sequenze codificanti (fase intronica) ne permette un’ulteriore suddivisione in tipi: Introni ancestrali: presenti nei geni dei tRNA e dei r RNA degli archeobatteri. Introni di gruppo I e II:presenti nel genoma degli eubatteri e degli eucarioti Introni “spliceosomici”:introni convenzionali presenti nel genoma degli eucarioti By NA Gli introni Taglio in esone1GU------------A-----AG esone2 Eliminato GU-----------------AG esone1 RNA maturo esone1 snRNP U1 Splicing esone2 esone2 GU--------AG esone3 GU--------AG Eliminato esone3 esone3 snRNP U2 CA esone1 GU------------A-----AG esone1 By NA esone2 esone2 GT--------AG esone3 Gli introni Fase degli introni: posizione in cui l’introne interrompe una sequenza di DNA codificante (non si definisce la fase quando l’introne interrompe una sequenza non tradotta).. Esistono tre tipi: fase 0, fase 1, fase2 Fase 0: interrompono la sequenza codificante fra due codoni adiacenti, sono i piu’ numerosi e potrebbero rappresentare la situazione ancestrale Fase 1: interrompono la sequenza codificante fra la prima e la seconda base Fase 2: interrompono la sequenza codificante fra la seconda e la terza base By NA Gli introni Fase degli introni: posizione in cui l’introne interrompe una sequenza di DNA codificante (non si definisce la fase quando l’introne interrompe una sequenza non tradotta). Esistono tre tipi: fase 0, fase 1, fase2 1 5’ UTS HBB Val 29 30 Gly Ar 2 ATG GTG --- GGC AG 5’UTS Fase 2 1 31 104 2 g Leu Arg G CTG --- AGG 80 gt--------ag 146 Leu His 3’UTS CCC --- CAC TAA 110 1 al ATG ------------- CAG G 3’UTS TG ------------ AACTAG Fase 1 By NA 0 Fase 0 81 V 1 INS 0 105 Famiglie di DNA ripetuto non genico DNA RIPETUTO IN TANDEM: i blocchi possono mappare su piu’ cromosomi a seconda delle dimensioni medie delle unita si suddivide in: DNA satellite DNA minisatellite DNA microsatellite DNA RIPETUTO INTERSPERSO: Le singole unita’ sono sparse nel genoma. Contengono sequenze che possono essere retrotrasposte attraverso un intermedio di RNA. By NA DNA ripetuto intersperso DNA RIPETUTO INTERSPERSO: Le singole unita’ sono sparse nel genoma. Contengono sequenze che possono essere retrotrasposte attraverso un intermedio di RNA. SINE (Short Interspersed Nuclear Elements). Nell’uomo e negli altri primati la famiglia piu’ rappresentativa e’ costituita dalle Alu LINE (Long Interspersed Nuclear Elements). Sono condivisi anche da altri mammiferi By NA Classificazione elementi trasponibili nell’uomo ELEMENTI TRASPONIBILI TRAMITE RNA (comune) Incapace di codificare la trascrittasi inversa Famiglia non virale Retropseudogeni (pseudogeni processati) TRAMITE DNA (rara) Capace di codificare la trascrittasi inversa Famiglia virale Posseggono le LTR e caratteristiche dei retrovirus Retrovirus endogeni e elementi simil-retrovirali FAMIGLIA Alu By NA TRASPOSONI FAMIGLIA HERV/RTLV FAMIGLIA THE-1 Privi delle LTR e di altre caratteristiche dei retrovirus Retrotrasposoni FAMIGLIA LINE-1(Kpn) Elementi trasponibili I membri delle famiglie di ripetizioni intersperse sono considerati elementi trasponibili ELEMENTI TRASPONIBILI: segmenti di DNA in grado di muoversi nel genoma. Gli elementi trasponibili umani sono di regola retrotrasposoni. La sequenza trasposta si trova ,dopo la duplicazione, ad essere fiancheggiata da corte unita’ ripetute By NA 5’ AAAANn AAAAA 3’ TTTTNn TTTTT TTTTTn AAAANn 3’ 5’ Elementi trasponibili tramite RNA FAMIGLIA Alu SINE di mammifero con elevato numero di copie, famiglie Alu nell’uomo e B1 nel topo Derivano da geni trascritti dalla RNA polimerasi III utilizzando un promotore interno. Le Alu si trovano circa ogni 4 kb , la sequenza completa e’ lunga 280pb, fiancheggiata da corte unita’ (6-18pb) ripetute dirette, e’ un dimero ripetuto in tandem le cui unita’ presentano entrambe sequenza (A )/ (T ), uno dei monomeri e’ deleto di 32pb. n n Sono presenti nel genoma anche come monomeri interi o tronchi. Sarebbero pseudogeni processati del gene dell’RNA 7SL RNA7SL +1 +10 A mRNA7SL Promotore bipartito 5’ 130 AAAAA TTTTT AAAAA TTTTT B AAAAA TTTTT delezione delezione 32pb By NA +52 AAAAA TTTTT 160 AAAAA TTTTT 3’