c). Chimica del DNA i). Forze che influenzano la stabilità della doppia elica del DNA •interazioni idrofobiche - stabilizzano dentro idrofobiche e fuori idrofiliche relativamente deboli ma aggiuntive forze di Van de Waals • legami idrofobi – stabilizzano • legami idrogeno - stabilizzano relativamente deboli ma aggiungono e facilitano impilamento • interazioni elettrostatiche - destabilizzano contribuiti primariamente dai fosfati (negativi) interessano interazioni intrafilamento e interfilamento repulsione può essere neutralizzata da cariche positive (es, ioni Na+ o proteine cariche positivamente) 1 3’ Fosfati idrofilici Fosfati idrofobici 5’ 3’ 5’ Regione del core idrofobica 2 Cariche repulsione Interactions Sovrapposte Cariche di repulsione 3 • Le nucleasi idrolizzano i legami fosfodiesterei Esonucleasi tagliano i nucleotidi terminali 5’ 3’ es, esonucleasi proofreading Endonucleasi tagliano interna mente e possono tagliare su entrambi i lati del fosfato lasciando estremità 5’ fosfato o 3’ fosfato in dipendenza della particolare endonucleasi. es, endonucleasi restrizione 3’ 5’ 4 5 ii). Denaturazione del DNA DNA a doppio-filamento pH estremi o alte temperature Separazione dei filamenti e formazione di un singolo-filamento avvolto a caso Regioni ricche A-T denaturano prima Svolgimento cooperativo dei filamenti del DNA 6 Percento di ipercromicità • curva di melting del DNA 100 50 0 50 70 90 Temperature oC • Tm è la temperatura al punto-medio della transizione 7 Micrografia elettronica di DNA parzialmente fuso DNA a doppio-filamento, ricco in G-C che non è ancora fuso Regioni di DNA ricche A-T fondono (si separano) in una bolla a singolofilamento • regioni ricche in ricche in G-C A-T fondono prima, seguite da regioni 8 Assorbanza • Ipercromicità Singolo-filamento Doppio-filamento 220 260 300 L’assorbanza a 260 nm di una soluzione di DNA aumenta quando la doppia elica è separata in singoli filamenti. 9 Percent o ipercromicità • Tm è dipendente dal contenuto in G-C del DNA DNA di E. coli, che ha 50% G-C, ha una Tm di 69 o C. 50 60 70 80 Temperature oC •Composizione media di basi (conteuto G-C) può essere determinata dalla temperatura melting DNA 10 11 12 a). Complessità del DNA cromosomico DNA riassociazione (rinaturazione) DNA a doppio-filamento Denaturazione, DNA a singolo-filamento k2 Lenta, processo di secondo-ordine a velocità limitante, per trovare sequenze di basi complementari Più veloce, reazione “zippering” per formare lunghe molecole di DNA a doppio filamento 13 Cinetiche di riassociazione di DNA (per una singola specie di DNA Cot1/2 = 1 / k2 k2 = constante di velocità di secondo-ordine Co =concentrazione di DNA t1/2 = tempo di metà reazione log Cot % DNA riassociato 0 A metà della reazione (cioè a t ½) il 50% è riassociato Questo punto è il Cot al t ½ cioè quelle condizioni che danno metà della totale rinaturazione 50 100 Cot1/2 Ideale curva (curva Cot) di riassociazione di DNA di secondo-ordin 14 10,000 1 k2 >>>>>>>>>> k2 15 Complessità espressa come coppie di basi (bp) 100 1 101 102 103 2 104 105 106 3 107 108 109 4 1010 5 Cot1/2 10-6 10-5 10-4 10-3 10-2 10-1 100 Cot 101 102 1 = poly(dT)-poly(dA) 2 = DNA satellite umano purificato 3 = DNA batteriofago T4 4 = DNA genomico di E. coli 5 = DNA umano a singola-copia purificato 103 104 C’è una relazione diretta tra Cot1/2 e la complessità Tipo di DNA % of Genoma Include la maggior parte dei geni 1 Singola-copia (unica) Disseminato attraverso il genoma tra e entro i geni; include sequenze Alu 2 e VNTRs o mini (micro) satelliti Ripetitivo (intersparso) Satellite (tandem) 0 Caratteristiche Altamente ripetuto, sequenze a bassa complessità di solito localizzate nei centromeri e telomeri veloce 2 intermedio 50 lento (singola-copia) 100 1 Alcuni I I I I I I I I I Le sequenze Alu sono circa 300 bp in lunghezza e sono ripetute circa 300,000 volte nel genoma. Esse possono trovarsi negli introni, adiacenti entro i geni, o in regioni non tradotte. geni sono ripetuti da poche a migliaia di volte e così sono presenti nella 17 frazione di DNA ripetitivo Cinetiche di riassociazione di DNA da una miscela di specie di DNA Cot1/2 = 1 / k2 k2= constante di velocità di secondo-ordine Co = concentrazione DNA t1/2 = tempo di metà reazione % DNA riassociato 0 50 100 Frazioni cinetiche : veloce intermedia lenta veloce (ripetute) intermedia (ripetute) Cot1/2 Cot1/2 lenta (singola-copia) Cot1/2 I I I I I I log Cot I I I DNA genomico umano 18 Classi di DNA ripetitivo Ripetizioni Intersparse (disperse) (e.g., Alu sequences) GCTGAGG GCTGAGG GCTGAGG Ripetizioni Tandem (e.g., microsatelliti) TTAGGGTTAGGGTTAGGGTTAGGG 19 Proprietà del genoma umano Nucleare • il genoma umano aploide ha ~3 X 109 bp di DNA • DNA a singola-copia comprende ~75% del genoma umano • il genoma umano contiene ~30,000 a 40,000 geni • la maggior parte dei geni sono a singola-copia nel genoma ap • i geni sono composti da 1 a >75 esoni • i geni variano in lunghezza da <100 a >2,300,000 bp • le sequenze Alu sono presenti attraverso il genoma Mitocondriale •genoma circolare di ~17,000 bp • contiene <40 geni 20 b). Struttura del Gene promoter region esoni (regioni nel box riempite e nonriempite) +1 introni (tra gli esoni) regioni tradotte mRNA structure 5’ 3’ regione tradotta 21 (esone-introne-esone)n struttura di diversi geni istone totale = 400 bp; 1 solo esone = 400 bp b-globina totale = 1,660 bp; 3 esoni = 990 bp; 2 introni HGPRT (HPRT) ipoxantina-guanina totale = 42,830 bp; 9 esoni = 1263 bp factor VIII totale = ~186,000 bp; molti esoni = ~9,000 bp 22 Familial hypercholesterolemia • autosomal dominant • LDL receptor deficiency 23 Gene del recettore LDL Ripetizioni Alu presenti entro gli introni 4 5 6 Ripetizioni Alu in esoni crossing over ineguale 4 Alu 5 Alu 6 X 4 Alu 4 5 Alu Alu 6 6 1 prodotto ha un esone 5 deleto (l’altro prodotto non è mostrato) 24 25 Struttura genoma umano Si divide in: 1,5% quello 25% GENICO che esprime 23,5% introni e pseudogeni 50% sequenze ripetute 75% INTRAGENICO 25% DNA spaziatore Sequenza di nucleotidi simile a un gene ma non in grado di produrre proteine funzionali 45% ripetizioni intersperse 5% Segmenti Duplicati 26 Nel genoma umano le sequenze ripetute costituiscono almeno il 50% del totale e sono suddivise in 5 classi: • sequenze ripetute derivate da trasposoni (intersperse) • copie inattive di geni • ripetizioni di sequenze semplici (minisatelliti e microsatelliti): (A)n, (CA)n, (CGG)n • duplicazioni segmentali • sequenze ripetute in tandem (centromeri, telomeri, cluster ribosomali) Il 45% delle ripetizioni intersperse è dato da trasposoni e retrotrasposoni. I trasposoni sono elementi ripetuti in grado di muoversi nel genoma, costituiti tra le 80 e le 3.000 paia di basi Le differenze tra queste due classi risiedono nella differente modalità di inserimento della molecola di DNA: il trasposone copia gli elementi direttamente in DNA,il retrotrasposone utilizza come intermedio una molecola di RNA convertendola in DNA (questo processo, cioè il passaggio da una molecola di RNA ad una di DNA, nel 1975 non sembrava possibile). I RETROTRASPOSONI si dividono in •NON VIRALI LINE S(Long Interdispersed Elements (6-7 kb) SINES ( Short Interdispersed Elements (300-400 bp) ES. Alu •VIRALI RIPETIZIONI LTR (Long Terminal Repeats) Le ripetizioni LTR dei retroasposoni virali sono sequenze ripetute che permettono lo spostamento della molecola di DNA mobile, e rappresentano le porzioni terminali sia destra che sinistra della molecola. 27 28 29 30 31 32