“Sperimenta il BioLab” Da un albero genealogico al DNA e ritorno Università degli Studi di Milano Indice 1. Conoscenze propedeutiche • 1.1 Le mutazioni • 1.2 Mutazioni geniche • 1.3 Alcuni concetti base e terminologia essenziale riguardanti le malattie monogeniche e le leggi di Mendel p. 3 p. 3 2. Malattie genetiche monogeniche e analisi del pedigree p. 7 • • • • • 2.1 Che cosa è il pedigree 2.2 Principali modalità di trasmissione di malattie o caratteri monogenici 2.2.1 Trasmissione autosomica recessiva 2.2.2 Trasmissione autosomica dominante 2.2.3 Trasmissione di caratteri recessivi associati al cromosoma X 2.2.4 Trasmissione di caratteri dominanti associati al cromosoma X 2.2.5 Trasmissione di caratteri associati al cromosoma Y 2.3 La banca dati OMIM 2.4 Eterogeneità genetica 2.5 Pleiotropia 3. I polimorfismi di restrizione (RFLP) e il loro utilizzo nella diagnostica delle malattie genetiche • 3.1 Gli enzimi di restrizione • 3.2 I polimorfismi del DNA • 3.3 I polimorfismi di sequenza del DNA • 3.4 I polimorfismi di lunghezza dei frammenti di restrizione (RFLP) 3.4.1 La tecnica della PCR per l’analisi degli RFLP • 3.5 I polimorfismi di restrizione (RFLP) nella diagnosi delle malattie genetiche 3.5.1 Utilizzo di un polimorfismo di restrizione (RFLP) nella diagnosi diretta. Diagnosi di anemia falciforme 3.5.2 Utilizzo di un polimorfismo di restrizione (RFLP) nella diagnosi indiretta. Ricerca di un RFLP associato a un allele malattia p. 4 p. 7 p. 8 p. 8 p. 8 p. 8 p. 9 p. 9 p. 9 p.10 p.10 p.11 p.11 p.12 p.12 p.12 p.13 p.14 p.14 p.15 4. Sano o malato? • 4.1 Schede informative di 3 malattie monogeniche (anemia falciforme, ipercolesterolemia familiare, emofilia A) • 4.2 A ciascuna storia il suo pedigree. Scenari e simulazione di consulenza genetica p.20 5. Tecniche utilizzate in laboratorio • 5.1 PCR 5.1.1 termociclatori 5.2.2 Taq polimerasi 5.2.3 scelta dei primer • 5.2 Digestione con gli enzimi di restrizione 5.3 Elettroforesi su gel di agarosio • • 5.4 Strumentazione e materiale a disposizione • 5.5 Principali prefissi e unità di misura usate in biologia molecolare e cellulare p.23 p.23 p.23 p.24 p.24 p.24 p.24 p.25 p.25 6. Dal pedigree al DNA e ritorno • 6.1 Schema delle PCR e digestione con enzimi di restrizione • 6.2 Elettroforesi su gel di agarosio. Soluzioni e reagenti • 6.3 Preparazione del gel di agarosio • 6.4 Corsa elettroforetica • 6.5 Analisi dei risultati • 6.6 Consulenza genetica p.26 p.26 p.27 p.27 p.28 p.29 p.30 7. Norme di sicurezza in laboratorio p.30 8. Test di autovalutazione p.31 9. Glossario p.36 10. Siti web p.38 11. Concorso "Una settimana da ricercatore" p.38 2 p.16 p.16 1. Conoscenze propedeutiche 1.1 Le mutazioni Nella specie umana esistono 23 coppie di cromosomi che contengono circa 24.000 geni. Le malattie genetiche sono causate da mutazioni, cioè da alterazioni del corredo genetico (genoma) di un individuo. • • Se le mutazioni avvengono nelle cellule che formano i gameti, cioè nelle cellule germinali, allora possono essere trasmesse alla discendenza dove saranno presenti in ogni cellula dell’individuo affetto. Queste mutazioni possono sorgere come mutazioni nuove nei gameti di uno dei genitori oppure possono essere state ereditate dai genitori dalle generazioni precedenti. Viceversa le mutazioni che avvengono in altre cellule del corpo, le cellule somatiche, non sono trasmesse alle generazioni successive, ma determinano una differenza genetica tra le cellule dello stesso organismo (mosaicismo). La conseguenza può essere l’insorgenza e lo sviluppo di un cancro. Le mutazioni possono riguardare il numero dei cromosomi (mutazioni genomiche), la struttura dei cromosomi (mutazioni cromosomiche) o i singoli geni (mutazioni geniche). 1.2 Mutazioni geniche Le mutazioni che coinvolgono singoli geni sono, di solito, il risultato della sostituzione di una base con un'altra, della delezione (perdita) o dell’inserzione di basi (Fig. 1.1). Se insorgono all’interno di un gene che codifica una proteina, queste mutazioni possono alterare la proteina prodotta. Per esempio, una sostituzione può modificare il significato di un codone e portare all’inserimento nella proteina di un amminoacido al posto di un altro (mutazione mis-senso); oppure può cambiare un codone per un amminoacido in un codone di stop provocando la fine prematura della sintesi della proteina e un prodotto proteico incompleto (mutazione non-senso); l’inserzione o la delezione di una o più basi (non multipli di tre!) portano a una sfasatura nella lettura del codice e quindi all’alterazione della sequenza della proteina a valle della mutazione (mutazione frameshift). La conseguenza di una mutazione è quasi sempre la produzione di una proteina che non è in grado di svolgere la sua funzione biologica (ad esempio, di un enzima che non è in grado di catalizzare una reazione). In anni recenti, si è individuato un nuovo tipo di mutazione Fig. 1.1 Tipi diversi di mutazione. Le mutazioni puntiformi (fatta eccezione per le mutazioni che consiste nella presenza di copie multiple (da decine a sinonime) e le piccole delezioni causano quasi più di mille, a seconda delle diverse patologie) di una tripletta in un punto del gene (malattie da ripetizione di sempre la produzione di una proteina con funzionalità alterata. triplette); nella corea di Huntington, una malattia genetica neurodegenerativa molto grave a trasmissione autosomica dominante e ad insorgenza tardiva, la tripletta ripetuta è CAG. Questa ripetizione porta ad un incremento del numero di copie dell’amminoacido glutammina nella proteina che diventa tossica per le cellule nervose. Le mutazioni all’interno delle regioni di controllo di un gene possono invece influenzarne il livello di trascrizione. Un esempio è una forma di talassemia (nota anche come anemia mediterranea) in cui vengono prodotte in quantità insufficiente le catene dell’emoglobina. Una mutazione che interessa una sequenza nucleotidica cruciale per il meccanismo di splicing (rimozione degli introni) di un trascritto primario di RNA avrà come conseguenza il blocco dello splicing o la modificazione dello schema di splicing di quel trascritto e quindi la mancata produzione del mRNA corrispondente o la produzione di un mRNA modificato. 3 1.3. Alcuni concetti base e terminologia essenziale sulle malattie monogeniche e le leggi di Mendel Le malattie ereditarie monogeniche sono determinate da mutazioni in singoli geni che si trasmettono nelle famiglie secondo leggi ben definite scoperte dall’abate Gregorio Mendel nella seconda metà dell’Ottocento. Per questo motivo le malattie monogeniche o monofattoriali vengono anche chiamate “mendeliane”. In particolare bisogna ricordare che: I geni possono avere alleli diversi (varianti alternative di uno stesso gene) ossia essere polimorfici; Gli organismi diploidi hanno due copie di ogni gene, cioè due alleli. Se i due alleli sono uguali, l’individuo è omozigote (ad es, ha genotipo AA oppure aa). Se i due alleli sono diversi, l’individuo è eterozigote (ad es, il genotipo è Aa); La I legge di Mendel o legge dell’uniformità della prima generazione ibrida, afferma che l’incrocio tra individui della generazione parentale ciascuno omozigote per due alleli diversi di uno stesso gene (ad es, AA x aa) e che quindi differisce dall’altro genitore per una caratteristica (ad es, pelo nero o marrone), dà una progenie costituita da individui tutti identici tra loro (tutti eterozigoti; ad es, Aa); Durante la meiosi i due alleli di un gene segregano e si distribuiscono ciascuno in un gamete aploide (II legge di Mendel, legge della segregazione). Un individuo omozigote produce un solo tipo di gamete (A oppure a) relativamente a un dato locus (la posizione occupata da un gene in un cromosoma). Un individuo eterozigote produce due tipi di gameti (A e a) in ugual quantità, cioè in rapporto (50%) ciascuno. Una buona rappresentazione grafica della segregazione si ottiene costruendo il “quadrato di Punnett” (Fig. 1.2 e 1.3); Alleli appartenenti a geni diversi localizzati su cromosomi diversi segregano in modo indipendente (III legge di Mendel, legge della segregazione indipendente); Allele dominante: allele che si manifesta allo stato eterozigote; Allele recessivo: allele mascherato dall’allele dominante, che si manifesta solo allo stato omozigote; Allele codominante: due alleli entrambi espressi allo stato eterozigote, che agiscono sul fenotipo in modi indipendenti e distinguibili. Un esempio classico si ha nel caso degli alleli IA e IB del gruppo sanguigno ABO. L’1% circa dei neonati è affetto da una malattia genetica monogenica. La mutazione genica è presente fin dal concepimento, quindi anche alla nascita, anche se non sempre si manifesta fenotipicamente alla nascita. Alcune di queste malattie comportano conseguenze già apprezzabili nel neonato. Altre malattie monogeniche si manifestano, invece, durante le età successive della vita. La corea di Huntington, ad esempio, è una malattia genetica a insorgenza tardiva che si manifesta solo in età adulta. Fig. 1.2 Rappresentazione della legge della segregazione dei caratteri (I legge di Mendel): nel quadrato di Punnett sono riportati i possibili genotipi dei figli di genitori eterozigoti per un carattere recessivo (sopra) e per un carattere dominante (sotto). Fig. 1.3 Il quadrato di Punnett illustra la modalità di trasmissione di un carattere recessivo legato al cromosoma X e i possibili genotipi dei figli di un padre malato (a sinistra) o di una madre portatrice (a 4destra). Fig. 1.4 Mappa del cariotipo umano in cui sono evidenziate alcune delle malattie monogeniche autosomiche dominanti, autosomiche recessive e legate al cromosoma X recessive. Si definisce malattia autosomica quella in cui l’allele malato è presente nelle coppie di cromosomi non coinvolti nella determinazione del sesso, gli autosomi; si parla invece di malattia legata all’X quella in cui l’allele si trova nel cromosoma sessuale X. In questo caso la trasmissione segue modalità particolari in quanto la maggior parte dei geni rappresentati sul cromosoma X non sono rappresentati sul cromosoma Y. Il cromosoma Y, infatti, è molto più piccolo e contiene quasi esclusivamente i geni per la determinazione del sesso. La Fig. 1.4 rappresenta la mappa del cariotipo umano in cui è indicata la localizzazione cromosomica dei geni responsabili di alcune malattie monogeniche autosomiche e associate al cromosoma X. Per schematizzare (vedere Tab. 1.1): • • malattie autosomiche: se l’allele normale è dominante, la malattia si rende manifesta solo nella condizione omozigote recessiva, ossia negli individui in cui entrambi gli alleli del gene sono alterati (malattia autosomica recessiva); se invece è l’allele alterato a prevalere su quello sano, la malattia si rende sempre evidente, anche nella condizione eterozigote, ossia è sufficiente che uno solo dei due alleli sia alterato per avere la malattia (malattia autosomica dominante) (Fig.1.2). malattie legate all’X: se l’allele è recessivo (Fig.1.3), come nella maggior parte dei casi, i maschi ricevono l’X difettoso dalla madre, ma non possono bilanciarlo con un allele sano nell’Y in quanto questo cromosoma non contiene l’allele corrispondente; le femmine invece manifestano la malattia solo nelle condizione omozigote. Di conseguenza, la frequenza delle malattie recessive legate al cromosoma X è maggiore nei maschi che nelle femmine. Nel caso di malattie dominanti le femmine manifestano la malattia anche nella condizione eterozigote. Autosomiche Malattie a ereditarietà mendeliana Legate al cromosoma X Legate al cromosoma Y Tab.1.1 Classificazione delle malattie a ereditarietà mendeliana 5 Dominanti Recessive Dominanti Recessive Nella Tabella 1.2 sono riportate alcune delle principali malattie monogeniche di cui è indicata la frequenza nella popolazione adulta, il tipo di trasmissione, la localizzazione cromosomica e il numero del catalogo OMIM (Online Mendelian Inheritance in Man). Malattie Frequenza in popolazione adulta monogeniche Ipercolesterolemia eterozigoti 1 / 500 familiare Corea di Huntington 1 / 20000 Tipo di trasmissione Autosomica dominante Autosomica dominante Policistite renale 1 / 1000 nati vivi Autosomica dell’adulto dominante Fibrosi cistica 1 / 2000 – 4000 Autosomica popolazione caucasica recessiva Anemia falciforme Molto rara in Europa, molto Autosomica (HbS) diffusa nella popolazione nera in recessiva Africa (1 / 400 – 600) e in America (1 / 50) Talassemia Molto frequente nel bacino Autosomica Mediterraneo (1 / 250) recessiva Fenilchetonuria 1 / 10000 nati vivi Localizzazione cromosomica Cromosoma 19 Ref. OMIM Cromosoma 4 143100 Cromosoma 16 173900 Cromosoma 7 219700 Cromosoma 11 141900.0243 143890 Cromosoma 11 catene Alfa: beta; cromosoma 16 141800 Beta: catene alfa 141900 Cromosoma 12 261600 Autosomica recessiva Ipofosfatemia 1 / 20000 X-linked Cromosoma X 307800 familiare dominante Emofilia A 1 / 5000 – 10000 nei maschi X-linked Cromosoma X 306700 recessiva 8% nei maschi; 0,64% nelle X-linked Daltonismo Cromosoma X 303800 (Cecità al verde e al femmine recessivo rosso) Miopatia di 1 / 6000 nei maschi X-linked Cromosoma X 310200 Duchenne recessiva Tab. 1.2 Alcune malattie monogeniche di cui è indicata la frequenza nella popolazione adulta, il tipo di trasmissione, la localizzazione cromosomica e il numero del catalogo OMIM (Online Mendelian Inheritance in Man). 6 Ma tu ce l’hai il pedigree? ??!! 2. Malattie genetiche monogeniche e analisi dei pedigree 2.1 Che cosa e’ il pedigree? Uno degli aspetti della genetica è lo studio dei meccanismi con cui i geni sono trasmessi dai genitori ai figli. A tale scopo i genetisti effettuano accoppiamenti tra organismi della stessa specie, per analizzare la trasmissione dei caratteri. Nella genetica umana, gli accoppiamenti sperimentali ovviamente non sono possibili. Molte delle nostre conoscenze sull’ereditarietà dei caratteri umani derivano perciò dalla analisi degli alberi genealogici o pedigree. In pratica, il pedigree è la rappresentazione sistematica della storia familiare attraverso l’uso di simboli standardizzati (Fig.2.1). Il pedigree viene stilato partendo da un’intervista ai componenti di una famiglia, al fine di ricostruirne la storia (anamnesi); in questo modo è possibile seguire la trasmissione di un dato carattere attraverso parecchie generazioni in una data famiglia (Fig.2.2). L’analisi del pedigree permette di determinare se il carattere ha una modalità di trasmissione recessiva o dominante, e se il gene in questione è localizzato su un autosoma o su un cromosoma sessuale, permette in ultima analisi di informare i membri di una famiglia sulla probabilità di trasmettere queste malattie ai propri figli. Fig.2.1. I simboli usati nell’analisi del pedigree adottati nel 1995 dalla Società Americana di Fig.2.2. Un pedigree che mostra la trasmissione ereditaria di un carattere (i simboli scuri rappresentano gli individui affetti) attraverso numerose generazioni di una famiglia. Nell’analisi del pedigree ci si basa sui principi dell’eredità di Mendel per escludere le modalità di trasmissione che sono incompatibili con il pedigree. Ad esempio, la presenza nell’albero genealogico di femmine malate ci permette di escludere la trasmissione legata all’Y. 7 2.2 L’analisi del pedigree per la determinazione delle modalità di trasmissione di malattie o di caratteri monogenici Dall’analisi di un pedigree si può determinare (talvolta non in modo univoco, in quanto un pedigree può essere compatibile con più di una modalità di trasmissione ereditaria) come viene trasmesso un dato carattere. Analizziamo le caratteristiche dei pedigree relativi a caratteri: autosomici recessivi (AR) autosomici dominanti (AD) legati al cromosoma X recessivi (XR) legati al cromosoma X dominanti (XD) legati al cromosoma Y 2.2.1 Eredità autosomica recessiva Possono essere affetti sia i maschi sia le femmine. In genere gli individui affetti hanno genitori sani (portatori asintomatici). I genitori entrambi portatori sani hanno il 25% di probabilità di avere figli malati ad ogni gravidanza. L’incidenza della malattia aumenta in caso di consanguineità. Tutti i figli di genitori entrambi affetti (omozigoti) sono a loro volta affetti. • • • • • 2.2.2 Eredità autosomica dominante Possono essere affetti sia i maschi sia le femmine. • Gli individui affetti possono essere presenti in tutte le generazioni. • Gli individui affetti hanno sempre un genitore affetto. • Poiché i geni responsabili di malattie autosomiche dominanti sono rari, in genere gli individui affetti sono eterozigoti. Rarissimi sono gli omozigoti, che possono nascere solo da genitori entrambi eterozigoti. Ogni affetto (eterozigote) ha il 50% di probabilità di avere figli malati. • Individui non affetti del pedigree che sposano individui non affetti non hanno discendenti affetti. • Genitori entrambi affetti (eterozigoti) possono avere figli sani (25%). • I genitori di un bambino malato possono essere sani: in questo caso si può dedurre che la malattia origina da una nuova mutazione verificatasi durante la formazione di un gamete (mutazione “de novo”). • 2.2.3 Eredità recessiva legata al cromosoma X • • • • • • • 8 La frequenza della malattia è maggiore nei maschi che nelle femmine. Le femmine possono essere portatrici sane. Le donne portatrici hanno un rischio del 50% di avere figli maschi malati. I maschi affetti hanno figlie portatrici sane e figli maschi sani. La madre di un individuo affetto è portatrice sana. Il carattere si trasmette a zig-zag con maschi affetti in generazioni diverse (eredità diaginica). La metà delle figlie femmine di madri portatrici sono anche loro portatrici. 2.2.4 Eredità dominante legata al cromosoma X • • • Maschi affetti generano solo femmine affette, mentre i figli maschi sono sempre sani. Femmine eterozigoti affette trasmettono il carattere al 50% dei figli siano essi maschi o femmine. La frequenza della malattia nelle femmine è solitamente doppia di quella nei maschi. 2.2.5 Eredità legata al cromosoma Y • • • Sono stati individuati pochi caratteri legati al cromosoma Y. I caratteri si manifestano solo nei maschi Sono trasmessi direttamente da padre a figlio (eredità olandrica). 2.3 La banca dati OMIM OMIM, Online Mendelian Inheritance in Man, è una banca dati che contiene informazioni sui geni umani e sulle malattie genetiche realizzata e mantenuta dall’NCBI, the National Center for Biotechnology Information. La banca contiene la descrizione dei geni e delle malattie ad essi associate, i quadri clinici e i riferimenti bibliografici, oltre a link a sequenze e ad altre risorse web. Si tratta della versione on line del testo “Mendelian Inheritance in Man”, ora alla sua dodicesima edizione, a cura del genetista medico Victor A. McKusick e di un gruppo di colleghi della Johns Hopkins University e di altre istituzioni. La banca dati è aggiornata quotidianamente e a metà 2004 conteneva oltre 15400 voci. Essa riporta solo malattie che sono state associate ad uno o più geni. La pagina di accesso ad OMIM si raggiunge tramite un link sulla homepage dell’NCBI: (http://www.ncbi.nlm.nih.gov/). Per entrare, fare click sulla parola OMIM in bianco sulla striscia blu in cima alla pagina. 9 2.4 Eterogeneità genetica Per alcune malattie ereditarie monogeniche tutti gli individui affetti portano un’identica mutazione: l’anemia falciforme ne è un esempio. Per molte altre malattie ci sono invece più mutazioni che possono produrre lo stesso quadro patologico. Quando le diverse mutazioni sono a carico dello stesso gene si parla di eterogeneità allelica. Nel caso dell’emofilia A, ad esempio, il catalogo OMIM riporta 270 varianti alleliche. La fibrosi cistica è causata da più di 1000 mutazioni diverse nel gene CFTR. Le diverse mutazioni possono produrre fenotipi di gravità diversa. Nel caso in cui le mutazioni avvengono in geni diversi che collaborano alla determinazione di un fenotipo, si parla di eterogeneità di locus. Ad esempio, in una stessa via metabolica, mutazioni in geni diversi possono portare alla stessa modificazione del fenotipo (Fig.2.3). E’ il caso delle due forme di ipercolesterolemia familiare A e B (vedere §4.1) dovute rispettivamente a mutazioni del gene del recettore che lega Fig.2.3. Esempio di uno dei meccanismi alla base dell’eterogeneità genetica di le lipoproteine LDL e del locus. È rappresentata una catena metabolica costituita da tre passaggi gene della apoproteina B-100 catalizzati da differenti enzimi (x, y, z); mutazioni in uno qualunque dei tre che media il legame della geni, che inattivano uno dei tre enzimi portano tutte, come esito finale, al particella LDL al recettore. blocco della via e alla mancata produzione dello stesso metabolita. 2.5 Pleiotropia Questo concetto sta a indicare che un solo gene può essere responsabile di fenotipi diversi. Un esempio di pleiotropia nell’uomo è quello dell’anemia falciforme, una malattia caratterizzata da diversi sintomi a carico di organi e tessuti diversi. Questi possibili effetti fenotipici derivano tutti dall’azione di un solo allele mutato presente in omozigosi. L’effetto diretto dell’allele dell’anemia falciforme è quello di indurre i globuli rossi a produrre molecole anomale di emoglobina che tendono a unirsi fra loro e cristallizzare. Di conseguenza, i globuli rossi si deformano, assumendo forme a falce con contorni frastagliati, sono più fragili e lisano e tendono ad aggregarsi e a occludere i capillari. Tutto questo produce molteplici danni a carico di organi e tessuti diversi (Fig 2.4). Fig.2.4. La mutazione che causa l’anemia falciforme determina una cascata di effetti fenotipici a livello cellulare e di interi organi. 10 3. I polimorfismi di restrizione (RFLP) e il loro utilizzo nella diagnostica delle malattie genetiche 3.1 Gli enzimi di restrizione Gli enzimi di restrizione (ER) riconoscono una sequenza di nucleotidi nella doppia elica del DNA e tagliano il DNA in frammenti di lunghezza definita (Tab.3.1). Sono enzimi prodotti dai batteri che li utilizzano per difendersi dagli attacchi di un DNA estraneo, per esempio di un virus (Fig.3.1). Sono stati fino ad ora purificati più di 1000 enzimi di restrizione prodotti da altrettanti tipi di batteri diversi. coesive Tab 3.1 Gli enzimi di restrizione si indicano con un sistema di lettere e numeri che si riferisce al ceppo batterico da cui sono stati isolati. Sono mostrati alcuni esempi di enzimi di restrizione, le sequenze di DNA che questi tagliano e i prodotti di scissione. Alcuni enzimi tagliano le sequenze in modo da dare origine ad estremità coesive, altri effettuano un taglio che determina la formazione di estremità piatte. Il DNA endogeno viene protetto dall’aggiunta di gruppi metile (-CH3) ai residui di adenina e citosina (Fig.3.1). Dal punto di vista biochimico gli ER sono delle endo-desossi-ribonucleasi che scindono un legame fosfodiesterico. Gli ER si possono suddividere in varie classi a seconda della specificità e della modalità di taglio; ER diversi riconoscono e tagliano, in linea di massima, sequenze diverse; uno stesso enzima taglia qualsiasi tipo di DNA dovunque trovi la propria sequenza di riconoscimento, detta sito di restrizione. I siti di restrizione sono sequenze palindromiche (cioè che possono essere lete in entrambe le direzioni, come le parole ANNA, ETNA GIGANTE …) di poche (in genere 4, 5 o 6) coppie di nucleotidi. Gli ER sono uno strumento fondamentale per l’analisi del DNA. Fig. 3.1 I batteri producono enzimi di restrizione per difendersi dagli attacchi di DNA esogeno, per esempio DNA fagico. Altri enzimi (metilasi) proteggono il DNA batterico dall’azione delle proprie endonucleasi di restrizione. A causa del tipo di sequenze riconosciute (sequenze palindromiche) e della loro modalità di taglio (la maggior parte degli ER fa un taglio asimmetrico), tagliando due DNA diversi con uno stesso enzima si mettono allo scoperto le stesse sequenze nucleotidiche, si generano cioè le stesse estremità (estremità adesive o coesive) nei due tipi di molecole. Questo permette di costruire molecole di DNA ricombinante (Fig.3.2) 11 Fig 3.2 Costruzione di una molecola di DNA ricombinante a partire da due molecole di DNA (una bianca e una nera) provenienti da fonti diverse ed entrambe tagliate con lo stesso enzima di restrizione EcoRI. 3.2 Polimorfismi del DNA Il termine polimorfismo significa “esistenza di forme diverse”. In genetica, il polimorfismo può essere analizzato a livello di proteina (polimorfismo proteico) oppure di materiale genetico (polimorfismo genetico). In questo secondo caso, le forme diverse (ossia le varianti genetiche) possono riguardare un gene, vale a dire un tratto di DNA codificante una proteina (polimorfismo allelico), oppure un tratto di DNA non codificante (polimorfismo di sequenza). polimorfismo proteico Polimorfismo polimorfismo allelico polimorfismo genetico polimorfismo di sequenza 3.3 Polimorfismi di sequenza del DNA E’ stato osservato che il DNA di due individui differisce per circa un nucleotide ogni 500/1000. Queste diversità di sequenza si definiscono polimorfismi e dato che >98% del DNA umano è DNA non codificante, e che quindi la maggior parte di queste differenze è localizzata in sequenze non codificanti, il fenotipo di un polimorfismo di sequenza del DNA non è riconoscibile dall’esterno (come nel caso, ad esempio, dell’albinismo, o individuabile biochimicamente, come per i gruppi sanguigni). Dato l‘elevato numero di loci polimorfici (1 coppia di basi ogni 500/1000), i polimorfismi di sequenza del DNA sono molto più frequenti dei polimorfismi allelici tradizionali (albinismo, gruppi sanguigni, alleli della determinazione del colore degli occhi, etc, etc…) e conseguentemente più utili nella ricerca biologica e medica. 3.4 I polimorfismi di lunghezza dei frammenti di restrizione (RFLP) Quando un polimorfismo interessa una sequenza riconosciuta da un dato ER, la variazione, creando o distruggendo siti di restrizione, darà luogo a differenze nei siti di taglio di quel dato enzima all’interno della popolazione. Digerendo il DNA di individui diversi con quell’enzima, si osserva quindi un polimorfismo di lunghezza dei frammenti di restrizione (RFLP, che per semplicità si usa leggere RIFLIP), e cioè dal DNA di individui diversi si generano frammenti di restrizione diversi. Come tutti i polimorfismi, i RFLP sono ereditabili come caratteri mendeliani semplici (Fig. 3.3) e sono trasmessi come caratteri codominanti. Il fenotipo di un RFLP è evidenziabile in termini di differenze di numero e/o dimensione dei frammenti di DNA ottenuti dalla digestione con un certo enzima di restrizione. I frammenti sono visibili dopo migrazione elettroforetica su un gel (Fig. 3.3 in basso). 12 Fig. 3.3 Sono mostrati due frammenti di restrizione ottenuti con digestione con l’enzima EcoRI (E = sito di restrizione di EcoRI) di due alleli (1 e 2) di un gene. L’allele 1 è interrotto da un sito di taglio per l’enzima EcoRI (GAATTC), l’allele 2, a causa di una mutazione di una singola base, non presenta il sito di taglio (GACTTC). Trattando questi due alleli con l’enzima di restrizione EcoRI, si otterranno segmenti di lunghezza diversa: due segmenti (350 e 150 bp) nel caso dell’allele 1 e un solo segmento non tagliato (500 bp, 350 + 150) nel caso dell’allele 2. Negli individui eterozigoti sono presenti entrambi gli alleli e quindi si evidenzieranno tutti e tre i segmenti. Nella parte in basso della figura è mostrato un pedigree di una famiglia e sotto il simbolo dei singoli individui è indicato il genotipo relativamente agli alleli 1 e 2. Dal pedigree mostrato si capisce come i RFLP abbiano ereditarietà mendeliana semplice e siano codominanti. Nel caso osservato, una coppia eterozigote ha una figlia omozigote per l’allele 1 e un figlio omozigote per l’allele 2. Quando il DNA dei genitori e dei figli è digerito con l’enzima di restrizione EcoRI e i frammenti di DNA vengono separati mediante corsa elettroforetica, il DNA dei genitori eterozigoti mostrano 3 bande corrispondenti a frammenti da 500, 350 e da 150 bp; la figlia omozigote 1/1 mostra 2 bande corrispondenti a frammenti da 350 e 150 bp; il figlio omozigote 2/2 mostra una sola banda da 500 bp. 3.4.1 La tecnica della PCR per l’analisi degli RFLP L’introduzione della PCR, la tecnica che consente di amplificare selettivamente un tratto di DNA, ha rivoluzionato la genetica molecolare. (Per la descrizione della tecnica, vedere più avanti al § 5.1). Le applicazioni della PCR sono praticamente infinite. Uno degli ambiti di utilizzo è la diagnosi di malattie genetiche mediante analisi dei RFLP. L’utilizzo della PCR semplifica molto le cose. Ad esempio, la PCR consente di analizzare uno specifico tratto di DNA, invece di dover lavorare su tutto il DNA nucleare di una cellula, ossia sul DNA genomico. Come è illustrato nella Fig. 3.4, i primer (inneschi) della PCR vengono disegnati a monte e a valle del sito di restrizione. Il segmento di DNA amplificato viene sottoposto a digestione con l’enzima di restrizione e i prodotti della digestione vengono analizzati dopo separazione elettroforetica. Fig.3.4 I primer della PCR vengono disegnati a monte e a valle del sito di restrizione (sito di taglio dell’ER, cut site). Dopo l’amplificazione, il DNA viene digerito con l’enzima di restrizione e i frammenti di DNA vengono separati mediante corsa elettroforetica. Gli omozigoti e gli eterozigoti sono distinguibili in base alle diverse bande ottenute dalla digestione con l’ER. Gli omozigoti 1/1 e 2/2 daranno rispettivamente due bande e 1 banda; gli eterozigoti daranno 3 bande. 13 3.5 I polimorfismi di restrizione (RFLP) nella diagnosi delle malattie genetiche 3.5.1 Utilizzo di un RFLP nella diagnosi diretta. Diagnosi di anemia falciforme Gli individui affetti da anemia falciforme sono omozigoti per la mutazione HbS, che consiste nella sostituzione di un singolo amminoacido dei 146 che formano la catena dell’emoglobina. Nell’emoglobina HbS, l’acido glutammico (Glu) nella sesta posizione della catena è sostituito dalla valina (Val). La sostituzione amminoacidica è dovuta alla mutazione A T nella posizione mediana del codone 6 (Fig. 3.5). La sostituzione che converte il codone GAG (acido glutammico) nel codone GTG (valina) modifica la sequenza CCTGAGG (che interessa i codoni 5, 6 e 7) riconosciuta e tagliata dall’enzima di restrizione MstII. Gli individui omozigoti ed eterozigoti sono distinguibili in base al tipo di bande ottenute dal loro DNA dopo digestione con l’enzima MstII (Fig. 3.5, in basso). Fig. 3.5 La figura mostra l’enzima di restrizione Mst II che riconosce e taglia la sequenza CCTGAGG. Il DNA dell’allele A viene tagliato dall’enzima di restrizione. Una mutazione di una singola base fa perdere il sito di taglio dell’enzima MstII e il DNA dell’allele S non viene tagliato dall’enzima. Nella parte bassa della figura si vede il risultato della corsa elettroforetica relativa ai DNA di un individuo normale, di un portatore sano e di un individuo affetto amplificati con PCR (utilizzando i primer indicati dalle frecce orizzontali) e successivamente digeriti con l’enzima MstII. L’individuo normale (A A) mostra 2 bande, il portatore sano (A S) mostra 3 bande e l’individuo affetto (S S) mostra una sola banda di lunghezza corrispondente al DNA non tagliato. In questo caso specifico, la stessa mutazione che causa la malattia altera anche un sito di restrizione. La semplice digestione con l’enzima di restrizione rilevante consente di fare diagnosi diretta di malattia e di riconoscere i portatori (Fig. 3.5 e 3.6). Fig.3.6. E’ mostrato il pedigree di una famiglia in cui soltanto il figlio 1 è affetto da anemia falciforme. Entrambi i genitori sono eterozigoti e per questo motivo hanno avuto un figlio malato. Le bande elettroforetiche per ogni membro della famiglia (visibili al di sotto di ognuno) consentono di identificare il genotipo di ogni individuo (vedere legenda Fig.3.3 e 3.5). 14 3.5.2 Utilizzo di un RFLP nella diagnosi indiretta. Ricerca di un RFLP associato a un allelemalattia A differenza di quello che avviene nel caso dell’anemia falciforme, la maggior parte delle malattie genetiche sono dovute a numerose mutazioni diverse dello stesso gene (eterogeneità genetica, vedere pag. 10). In questo caso la mutazione responsabile della malattia non corrisponde a un unico polimorfismo di sequenza (e quindi a un unico eventuale RFLP). In questi casi non è quindi possibile utilizzare un RFLP per la diagnosi diretta. E’ invece possibile trovare uno o più RFLP associati al gene-malattia (in quanto localizzati all’interno o nelle vicinanze del gene) che possono essere utilizzati per la diagnosi: si tratta in questo caso di diagnosi indiretta per associazione e non di diagnosi diretta. Per poter utilizzare il RFLP come marcatore occorre che il gene responsabile della malattia sia collocato così vicino al RFLP che quest’ultimo possa rivelare la presenza stessa del gene malato. Un particolare RFLP può essere associato in alcuni individui con l’allele–malattia ed in altri con l’allele sano. Pertanto, per poter utilizzare un RFLP nella diagnosi indiretta, è necessario esaminare non soltanto il DNA del malato ma il maggior numero possibile di membri della famiglia per identificare il tipo di associazione presente in quel pedigree (Fig. 3.7). L’importanza dei RFLP come marcatori genetici di associazione sta nel fatto che consentono la diagnosi di malattia anche in casi in cui non è noto il gene responsabile. I marcatori RFLP (nel genoma umano sono stati identificati migliaia di RFLP e diverse centinaia sono stati assegnati a ciascun cromosoma) hanno consentito la mappatura di alcuni importanti geni-malattia (ad esempio, è stato possibile assegnare il gene della fibrosi cistica in posizione distale del braccio lungo del cromosoma 7). A differenza della diagnosi diretta, l’accuratezza della diagnosi per associazione è del 100% solo quando il locus malattia e il RFLP sono strettamente associati (vicini sul cromosoma). In questo caso, infatti la frequenza di crossing-over che può modificare l’associazione è trascurabile. Tanto maggiore è la distanza tra il RFLP e il locus genico di interesse, tanto più bassa è la probabilità di una diagnosi accurata. Un secondo aspetto da prendere in considerazione è che non sempre un dato RFLP può essere utilizzato ai fini della diagnosi indiretta. E’ necessario che nella famiglia siano presenti i due alleli (se tutti gli individui della famiglia sono portatori dello stesso allele del RFLP studiare quel RFLP in quella famiglia non è significativo!). I 1 2 3 4 II 1 2 III MW 1 2 3 1 1 4 5 6 7 8 Fig.3.7 Il pedigree mostra l’ereditarietà di un marcatore RFLP attraverso tre generazioni di una famiglia in cui è presente una malattia recessiva legata al cromosoma X. Nella famiglia sono presenti gli alleli (+) e (-). Tutti gli individui malati sono maschi che presentano l’allele (+). Tutti gli individui portatori dell’allele (-) sono sani; si può dedurre che l’allele malattia sia strettamente associato all’allele (+) di questo RFLP. Sia la madre (II 1) che la nonna I 1 sono eterozigoti portatrici sane in cui l’allele (+) è associato all’allele malattia. L’allele (-) del RFLP è associato all’allele sano del gene malattia come dimostrato da I 2, III 5, III 6 e III 7. L’accuratezza della diagnosi dipende dal grado di associazione dei due loci. Se il marcatore e il locus malattia non sono strettamente associati, il crossing-over durante la formazione dei gameti potrebbe modificare l’associazione e un individuo portatore dell’allele (+) del RFLP non sarebbe portatore dell’allele malattia. 15