Analisi del linkage (concatenazione) Corso di Genetica per la Facoltà di Medicina e Chirurgia dell’Università di Torino Alberto Piazza Ibridi cellulari somatici Analisi di ibridi cellulari somatici La rodopsina è un gene il cui difetto può causare la Retinite Pigmentosa (RP), una malattia genetica eterogenea (30% X, 25%AD, 45%AR, causa maggiore di cecità: 1/4000). Sulla base di questa analisi, quale è il cromosoma umano su cui è localizzato il gene? Crossing-over singoli e doppi L’effetto della ricombinazione Crossing-over tra cromosomi omologhi nella meiosi Distribuzione dei ricombinanti tra due loci per diverse distanze tra i loci DeM molto lontani D e M molto vicini D e M abbastanza lontani Linkage tra il gene per una forma autosomica dominante di retinite pigmentosa, RP9, e due geni marcatori AeB sul cromosoma 7 Analisi della concatenazione (o “linkage”) Concatenazione – si evidenzia quando due loci (geni) sono localizzati sullo stesso cromosoma sufficientemente vicini così che la loro frequenza di ricombinazione è minore del 50% Frequenza di ricombinazione (%) la probabilità di ricombinazione tra due loci Frequenza di ricombinazione 50% è come se i geni fossero localizzati su cromosomi diversi Frequenza di ricombinazione di 1% = 1centiMorgan centiMorgan (cM) – unità di misura genetica della frequenza di ricombinazione tra due loci, di lunghezza approssimativamente costante (la distribuzione dei crossing-over varia in misura minima a seconda del cromosoma e se si tratta di meiosi maschili o femminili), equivalente alla distanza fisica di circa 2 x 106 bp (paia di basi) Analisi del linkage Richiede famiglie di grandi dimensioni in cui siano presenti più persone affette e non affette Qual è la frequenza di ricombinazione tra l’emofilia e la cecità ai colori se i geni che controllano tali caratteri distano 10 cM sul cromosoma X? 10%: dopo la meiosi i due caratteri si troveranno su cromosomi diversi nel 10% dei casi, mentre nel 90% dei casi si troveranno insieme sullo stesso cromosoma Distanza fisica = (2 x 106 bp/cM) x 10 cM = 2 x 107 bp Ricombinante La distanza tra il gene che causa la malattia e il marcatore RFLP è 14 cM: 1 R, 6NR -> 1/7 Alberi genealogici di due famiglie con neurofibromatosi 1 (NF1) malattia autosomica dominante Fase ignota Fase nota Della madre affetta non si conosce se D è sullo stesso cromosoma di 1 o 2 Linkage sul cromosoma X Con quale probabilità sarà affetto ? ? Il gene per l’emofilia (recessivo X-linked) ha gli alleli H, h Il gene MARCATORE ha gli alleli A,a Tra il gene dell’emofilia e il gene marcatore vi è una distanza genetica di 3 cM Analisi del linkage due loci sono concatenati ad una frazione di ricombinazione=q Likelihood ratio = ------------------------------------------------------------------------------------------due loci NON sono concatenati (frazione di ricombinazione=0.5) (simile ad una probabilità) LOD score – Logaritmo10 della ODDS (= likelihood) ratio LOD score > 3.0 evidenza di linkage: 1.000 volte più probabile che due loci siano concatenati piuttosto che non concatenati. LOD score < - 2.0 evidenza di NON linkage con una probabilità di 100 contro 1. Analisi del linkage tra NF1 e un gene marcatore mediante il Lod score q = percentuale di ricombinazione Likelihood = ½ (1 - q )3 + ½ q3 ODDS = Likelihood / (1/2) 3 LOD score = Log (ODDS) Curve di lod scores In ordinata il lod score, in ascissa la frequenza di ricombinazione (da un’analisi di linkage ipotetica) Curva 1: evidenza di linkage (Z>3) con nessun caso ricombinante Curva 2: evidenza di linkage (Z>3) con una frazione di ricombinanti stimata di 0.23 Curva 3: linkage escluso (Z<-2) per frazioni di ricombinazione minori di 0.12, linkage indecidibile per valori maggiori Curva 4: linkage indecidibile per tutti i valori della frazione di ricombinazione La funzione di mappa di Haldane La determinazione dell’ordine dei loci nell’analisi di più di due loci Analisi di linkage a molti punti Uso dei dati di linkage nella diagnosi di NF1 sul cromosoma 17 L’uso della mappa genetica del cromosoma 17 per una diagnosi della NF1. Senza conoscere la posizione del gene NF1 rispetto agli altri marcatori non sarebbe possibile la diagnosi del feto maschio che in questo caso è affetto Genotipizzazione ad alta densità e linkage disequilibrium (LD) nel genoma umano (da Current Opinion in Chemical Biology 6,1( February) 2002, 24-30) X X X Il LD misura l’associazione tra alleli nei cromosomi degli individui di una popolazione. Diminuisce dal momento in cui è avvenuta la mutazione, tanto più quanto maggiore è la ricombinazione. Non sono necessari nuclei famigliari Il linkage disequilbrium (LD, in italiano “associazione gametica preferenziale”) cambia nel tempo. (a) La croce rossa indica la posizione nella quale nel DNA di un cromosoma è avvenuta una nuova mutazione X. Si crea perciò un altro allele (polimorfismo) strettamente associato (in completo LD) agli altri alleli marcatori 1–6 sullo stesso cromosoma. (b,c) Col passare delle generazioni l’estensione della regione di associazione (LD) diminuisce a causa della ricombinazione. La ricombinazione rimescola gli alleli marcatori che tendono a diminuire la loro associazione con l’allele mutato X. (d) Il LD tra la mutazione (X) e i marcatori vicini si osserva solo in una regione ristretta attorno alla mutazione. Mappa ad alta risoluzione di un gene-malattia Parametri citogenetici, fisici e genetici nel Genoma Umano Riferimento Citogenetico Dimensioni fisiche Genoma aploide (23 cromosomi) 3x109 np Un cromosoma (in media) Una banda cromosomica Distanza genetica 4300 cM 30.000 60.000 1,5x108 np ~ 200 cM 35x106 np Numero di geni ~ 5 cM ~ 2200 ~ 50 Metodi usati nella mappatura fisica del gene Metodo Scopo Risoluzione (in np) Ibrido cellulare uomotopo Assegnazione del cromosoma FISH Localizzazione entro una banda cromosomica Mappatura mediante enzimi di restrizione Mappatura fine di una regione del gene 105 106 Clonaggio in cromosomi artificiali (YAC) Clonaggio del gene (frammenti lunghi) 105 106 Clonaggio in batteri (BAC) Clonaggio del gene (frammenti medi e corti) 103 105 PCR Clonaggio del gene (frammenti corti) 102 104 Sequenziamento del DNA Identificazione del nucleotide 1 50 250x106 5 20x106