L’assortimento indipendente dei cromosomi omologhi durante la meiosi crea variabilità si formano combinazioni alleliche aploidi (cioè di alleli a loci genici diversi) non presenti nei genitori Le combinazioni teoricamente possibili sono 223, cioè > 8 milioni Il crossing-over aumenta enormemente la variabilità T. Strachan – A. Read, GENETICA UMANA MOLECOLARE, Zanichelli editore S.p.A. Copyright © 2012 2|1 Il legame genetico di ciascun individuo (x) con la generazione precedente è mediato dalla coppia di gameti (oocita e spermatozoo) che hanno dato origine a x Il legame genetico di x con la generazione successiva è mediato dai suoi gameti che contribuiscono alla formazione di nuovi individui Vengono definiti Parentali (P) i gameti prodotti da x che hanno la stessa combinazione allelica di quelli attraverso i quali lui/lei ha avuto origine, vengono invece definiti Ricombinanti (R) i gameti con una combinazione allelica diversa da quella dei gameti da cui x ha avuto origine Individuo x adulto a, B A, b Insieme dei gameti prodotti da x Aa Bb Zigote x Ab aB Gameti P AB ab Gameti R Riferendoci all’individuo della precedente diapositiva, ci aspettiamo che: Se i 2 loci sono indipendenti no.gameti aB = no.gameti Ab = no.gameti ab = no.gameti AB no. gameti P (aB + Ab) = no. gameti R (ab + AB) Se i 2 loci sono associati no.gameti aB = gameti Ab > no.gameti ab = no.gameti AB no. gameti P (aB + Ab) > no. gameti R (ab + AB) La classificazione in gameti Parentali e Ricombinanti è possibile anche quando i geni stanno su cromosomi diversi a A 1 B A 1 b B 1 2 2 a 2 Gameti P A b 1 Se i 2 loci si trovano su cromosomi diversi la probabilità che si formi un gamete Parentale è uguale alla probabilità che si formi un gamete Ricombinante 2 a b 1 2 B 1 Gameti R 2 A a B b Se i 2 loci si trovano adiacenti sullo stesso cromosoma e talmente vicini da non ricombinare mai la probabilità che si formi un gamete Parentale è 1 e la probabilità che si formi un gamete Ricombinante è 0 a A B b A A a a a a A A B B b b B B b b solo gameti P (prodotti da un doppio eterozigote in fase cis) solo gameti P (prodotti da un doppio eterozigote in fase trans) A a b B Se i 2 loci si trovano adiacenti sullo stesso cromosoma ma a una distanza che permette il verificarsi di crossing over la probabilità che si formi un gamete P è > 0.5 e la probabilità che si formi un gamete R è < 0.5 A a B b A a A a A a A a B b b B b B B b gameti R (da un doppio gameti P (da un doppio gameti R (da un doppio gameti P (da un doppio eterozigote in fase trans) eterozigote in fase trans) eterozigote in fase cis) eterozigote in fase cis) MAPPATURA GENETICA Costruzione di mappe genetiche, cioè di mappe in cui la posizione relativa dei geni (e la distanza tra di essi) viene stabilita attraverso la stima delle frequenze di ricombinazione La mappatura genetica si basa sul fatto che i geni sono disposti linearmente lungo il cromosoma e che il loro ordine è lo stesso in tutti gli individui della stessa specie. Durante la meiosi i cromosomi omologhi vanno incontro a eventi di crossing-over che riassortiscono gli alleli presenti sui due omologhi La probabilità che tra due loci avvenga un crossingover è tanto più elevata tanto più i loci sono distanti Poiché un crossing-over può essere evidenziato solo se l’individuo in cui si è verificato è doppio eterozigote (= eterozigote per entrambi i loci in esame) il requisito minimo per mappare due geni l’uno rispetto all’altro è che di ENTRAMBI si conoscano almeno due alleli: è possibile mappare i loci A e B l’uno rispetto all’altro solo se locus A alleli A1 e A2 locus B alleli B1 e B2 La costruzione di mappe genetiche è relativamente facile per gli organismi modello in cui sia possibile: 1. Programmare gli incroci 2. Ottenere una progenie numerosa Consideriamo i due loci polimorfici di Drosophila melanogaster che controllano il colore del corpo (b = corpo di colore nero, B = allele selvatico, corpo grigio) e la vestigiali Vg = allele selvatico, ali normali) forma delle ali (vg = ali vestigiali, P BB VgVg tipo selvatico (corpo grigio e ali normali) bb vgvg doppio mutante (corpo nero e ali vestigiali) Tutti con corpo grigio e ali normali nati dall’unione di un oocita B,Vg con uno spermatozoo b,vg Incrociamo un Bb Vgvg con un soggetto doppio recessivo: Bb Vgvg (BVg/bvg) tipo selvatico (corpo grigio e ali normali) bb vgvg doppio mutante (corpo nero e ali vestigiali) otteniamo la seguente progenie F1 Bb Vgvg selvatico Bb vgvg grigio vestigiali bb Vgvg nero normali bb vgvg nero vestigiali TOTALI 397 216 198 389 1200 Invece degli attesi 300:300:300:300 in base all’assortimento indipendente aa bb Aa Bb aa bb Aa Bb Aa Bb Aa Bb Aa Bb Aa Bb Aa Bb Aa Bb Se i 2 loci sono indipendenti la Probabilità di ottenere questa fratria (6 gameti Parentali su un totale di 6 meiosi informative) è (1/2)6 = 0.0156 MAPPATURA GENETICA NELL’UOMO METODO DEI LOD SCORE (Morton 1955) ► E’ in grado di distinguere tra associazione e indipendenza ► Non dipende dalla fase degli alleli del doppio eterozigote (cis o trans) né dalla sua conoscenza ► Permette di combinare dati provenienti da famiglie diverse ► In caso di associazione non assoluta è in grado di stimare la frazione di ricombinazione METODO DELLA MASSIMA VEROSIMIGLIANZA (ML = Maximum Likelihood) Metodo che viene applicato quando non è possibile verificare direttamente la veridicità di un’ipotesi Data un’ipotesi A e un certo risultato R la verosimiglianza di A viene calcolata come probabilità che si verifichi R nel caso in cui A sia vera Secondo i metodi di massima verosimiglianza (in inglese Maximum Likelihood, ML) quando ci si trova di fronte a un risultato (R) e a una serie di ipotesi tutte compatibili con esso, si valuta la verosimiglianza di ciascuna ipotesi, si ottiene così una distribuzione di verosimiglianze (definite a posteriori perché ottenute sulla base del risultato R). Se una delle ipotesi risulta molto più verosimile delle altre, la si considera l’ipotesi giusta. Talvolta, oltre al risultato R, si dispone di informazioni indipendenti che possono essere utilizzate per assegnare a ciascuna ipotesi una verosimiglianza indipendente da R (verosimiglianza a priori). In questi casi, il confronto tra le varie ipotesi avverrà sulla base delle verosimiglianze globali (= verosimiglianza a priori x verosimiglianza a posteriori). Esempio: abbiamo un sacchetto contenente vari tipi di monete: • il 90% è costituito da monete perfette (hanno un uguale probabilità di dare Testa o Croce) • il restante 10% è costituito da monete per le quali la probabilità di T è minore della probabilità di C. Le monete di questo insieme differiscono tra di loro per la probabilità di dare T, per alcune P(T) = 0.4, per altre P(T) = 0.3 ecc. Supponiamo di prendere a caso una moneta e di dover stabilire se essa sia del tipo P(T) = 0.5 o P(T) < 0.5 Sulla base della numerosità (le P(T) = 0.5 sono il 90%) tenderemo a preferire l’ipotesi P(T) = 0.5. Tuttavia il risultato di una serie di n lanci potrebbe modificare questa preferenza Immaginiamo di aver effettuato 6 lanci e di aver ottenuto 1T e 5C; la probabilità di questo risultato cambia a seconda del tipo di moneta n! Pk , n p k (1 p)( n k ) k!(n k )! Tipo di moneta PT V a posteriori 1 T, 5 C VPT/VPT = 0.5 0.5 0.4 0.3 0.2 0.1 0.0937 0.1866 0.3025 0.3932 0.3543 0 1 1.99 3.23 4.19 3.78 0 - la verosimiglianza del risultato 1 T e 5 C in una serie di 6 lanci viene calcolata con la formula di Bernoulli, dove n è il no. totale di lanci, k il no. di T ottenute, p la probabilità di ottenere T e (1-p) quella di ottenere C Possiamo scartare l’ipotesi che la moneta sia del tipo P(T) = 0, l’ipotesi più verosimile è che si tratti di una moneta con P(T) = 0.2, ma anche le altre ipotesi hanno verosimiglianze piuttosto elevate. Nessuna delle ipotesi è molto più verosimile di una qualsiasi delle altre Possiamo valutare la verosimiglianza a favore/sfavore dell’ipotesi moneta-perfetta prima e dopo la serie di 6 lanci V. ‘a priori’ 9:1 a favore (le monete perfette sono 9 volte più abbondanti delle monete viziate) V. ‘a posteriori’ a favore dell’ipotesi moneta P(T) = 0.2 (ma solo di 4 volte rispetto all’ipotesi P(T) = 0.5) Nessuno, sulla base del risultato della serie di 6 lanci, scommetterebbe una forte somma a favore di una qualsiasi delle ipotesi La possibilità di effettuare altri lanci consentirebbe di acquisire maggiori informazioni e alla fine di fare una scelta con bassa probabilità di sbagliare Quello appena illustrato è il principio su cui si basa il metodo dei LOD score La P(T) della moneta è equivalente alla frequenza di ricombinazione tra i due loci in esame: le monete con P(T) = 0.5 sono le coppie di loci indipendenti, le monete con P(T) < 0.5 sono le coppie di loci associati Ogni lancio corrisponde a una meiosi informativa (cioè a un figlio classificato con certezza come originato da un gamete P o R). Quanto deve essere la verosimiglianza a favore di un’ipotesi per accettarla come vera? Prima di iniziare l’esperimento si decide una soglia che risulta un compromesso tra due esigenze opposte: 1) ridurre al minimo i casi in cui si accetta per buona un’ipotesi che invece è sbagliata; 2) ridurre al minimo i casi in cui si lascia senza risposta il problema in esame Il valore della soglia dipende soprattutto da quanto gravi sarebbero le conseguenze di una decisione errata MAPPATURA di un LOCUS MALATTIA RISPETTO ad un LOCUS MARCATORE con il METODO DEI LOD SCORE, esempio di mappatura di una malattia Autosomica Dominante : 1. reperimento delle famiglie in cui segrega la malattia, 2. costruzione dei pedigree e assegnazione del fenotipo (malato o sano) a ciascun membro della famiglia; 3. determinazione del genotipo di tutti gli individui per il marcatore e verifica dell’informatività delle famiglie (il genitore che trasmette la malattia deve essere eterozigote per il locus marcatore); 4. per ciascuna famiglia conta dei gameti parentali e dei gameti ricombinanti; 5. calcolo dei LOD score; 6. somma dei LOD score ottenuti sulle singole famiglie; 7. costruzione del grafico dei LOD score Come si procede per calcolare i LOD score 1. calcolo della verosimiglianza ‘a posteriori’ (= sulla base del risultato osservato) per una serie di ipotesi di linkage, cioè di valori di ricombinazione i 2. calcolo, per ciascun valore i, dell’ODD ratio (= verosimiglianza dell’ipotesi i / verosimiglianza dell’ipotesi di indipendenza); 3. calcolo del Logaritmo degli ODD (= LOD) METODO DEI LOD SCORE: 3) Verifica dell’informatività delle famiglie La condizione minima è che il GENITORE CHE TRASMETTE LA MALATTIA SIA ETEROZIGOTE PER IL LOCUS MARCATORE MEIOSI INFORMATIVE E NON INFORMATIVE Locus di una malattia Autosomica Dominante, Locus del marcatore A individuo sano individuo malato A) NON INFORMATIVA Il padre, II-1, che ha trasmesso la malattia alla figlia III-1, è omozigote per il locus marcatore: i suoi alleli a questo locus non possono essere distinti Queste famiglie non sono mai informative MEIOSI INFORMATIVE E NON INFORMATIVE B) NON INFORMATIVA La figlia ha ereditato dal padre l’allele malattia, ma può averlo ereditato insieme ad A1 OPPURE insieme ad A2 (cioè, non possiamo classificare lo spermatozoo che ha dato origine a III-1 come Parentale o come Ricombinante) C) INFORMATIVA La figlia ha ereditato dal padre l’allele malattia INSIEME all’allele A1 del marcatore (cioè, lo spermatozoo che ha dato origine a III-1 era Parentale) I genitori delle famiglie B) e C) sono uguali, ma la famiglia B) NON è informativa, mentre la C) lo è MEIOSI INFORMATIVE E NON INFORMATIVE D) INFORMATIVA La figlia ha ereditato dal padre l’allele malattia INSIEME all’allele A2 del marcatore (cioè, lo spermatozoo che ha dato origine a III-1 era Ricombinante) Queste famiglie sono SEMPRE informative Per poter classificare senza ambiguità un gamete come parentale o ricombinante è necessario avere informazioni su almeno 3 generazioni P P P P P R II-1 ha ricevuto dalla madre l’allele patologico del locus malattia E l’allele A1 del locus marcatore: i suoi gameti P sono quelli con le combinazioni (A1+allele Malattia) e (A2+allele normale) II-1 ha ricevuto dalla madre l’allele malattia ma non sappiamo se lo abbia ricevuto insieme all’allele A1 o all’allele A2 del marcatore Non sappiamo quali siano i suoi gameti P e quali gli R Mappare due loci A e B l’uno rispetto all’altro equivale a rispondere alla domanda: A e B sono indipendenti? cioè θ = (1 – θ) = 0.5 oppure A e B sono associati? cioè θ < 0.5 questa ipotesi è costituita da n ipotesi, una per ciascuno degli n valori compresi tra 0 e 0.5 PROBLEMA: dove si trova il gene responsabile della malattia genetica M che è una malattia mendeliana a trasmissione Autosomica Dominante? Cerco di capire se esso sia vicino al locus del marcatore A, che è un marcatore STR di cui si conoscono vari alleli e di cui è nota la localizzazione cromosomica Se dimostro che il locus malattia M e il locus marcatore A sono vicini ho individuato la regione cromosomica in cui si trova il locus M Per cercare di rispondere a questa domanda applichiamo il metodo dei LOD SCORE (che è un metodo di Massima Verosimiglianza) Il risultato è rappresentato dal no. di gameti P e R probabilità di un gamete P = (1 – θ) probabilità di un gamete R = θ tutte le ipotesi di associazione prevedono che no.P > no.R l’ipotesi di indipendenza prevede che no.P = no.R METODO DEI LOD SCORE 4. conta dei gameti parentali e dei gameti ricombinanti; Gameti P = 5 Gameti R = 1 P P P P P R Questo calcolo viene ripetuto per una serie di valori di θ Rapporto tra la verosimiglianza dell’ipotesi θi e la verosimiglianza dell’ipotesi di indipendenza ODD = (1- θ)5 x θ1 / (1/2)6 Calcolo del log10 degli ODD (1- θ)5 x θ1 LOD score = Z = log10 --------------------- (1/2)6 θ 0 0.1 0.167 0.2 0.3 0.4 0.5 ODD 0 3.779 4.287 4.194 3.227 1.991 1 LOD - 0.577 0.632 0.623 0.509 0.299 0 METODO DEI LOD SCORE Costruzione del grafico dei LOD score, in ascisse sono riportati i valori di θ, e in ordinate i valori di LOD Risultato non conclusivo Bisogna cercare e studiare altre famiglie in cui sia presente la stessa malattia I LOD SCORE ottenuti sulle singole famiglie possono essere sommati VALORI di LOD CRITICI (valori soglia) LOD + 3 Ipotesi di linkage accettata verosimiglianza ‘a posteriori’ a favore del linkage 1000:1 verosimiglianza ‘a priori’ che due loci siano linked 1:50 (a sfavore dell’associazione) verosimiglianza globale 1000:50, cioè 20:1 (P = 0.05) LOD - 2 Ipotesi di linkage scartata verosimiglianza ‘a posteriori’ a favore dell’indipendenza 100:1 verosimiglianza ‘a priori’ a favore dell’indipendenza 50:1 verosimiglianza globale a favore dell’indipendenza 5000:1 Esempi di curve di lod score a. Evidenza di linkage per θ = 0.23 b. Evidenza di linkage assoluto (θ = 0) c. Linkage escluso per valori di θ < 0.12 d. Risultato non conclusivo per tutti i valori di θ Metodo dei LOD SCORE efficienza: Massima per linkage assoluti Teoricamente è in grado di scoprire qualsiasi grado di linkage, ma in pratica non è così per scoprire gradi di associazione modesti (= elevata frequenza di ricombinazione) è necessaria una quantità di dati non realisticamente ottenibile Esempio con 25 gameti informativi si può arrivare a dimostrare che due loci sono linked solo se la frequenza di ricombinazione tra di essi non supera il 10% Se non ci sono ricombinanti 10 meiosi informative sono sufficienti a fornire prova di linkage. Se = 0.2 sono necessarie 36 meiosi per dare una prova convincente dell’esistenza di linkage; se = 0.3 ne sono necessarie 85 Con la mappatura genetica si può restringere la regione in cui si trova un gene malattia a qualcosa dell’ordine di 1-2 cM (equivalenti a 1-2 Mb) ATTENZIONE!!! La stessa malattia NON è associata in tutte le famiglie allo stesso allele del marcatore Nelle famiglie 1 e 2 segrega la stessa malattia, ma mentre nella famiglia 1 essa ‘viaggia’ con l’allele 1, nella famiglia 2 ‘viaggia’ con l’allele 3 Quando si mappa un gene malattia bisogna fare attenzione alla possibilità di classificare come sani individui che sono in realtà ‘malati’ (penetranza incompleta e/o insorgenza tardiva) classificazione errata di gameti P e R Inoltre se la malattia presenta eterogeneità genetica di locus prima di mettere insieme dati provenienti da famiglie diverse bisogna accertarsi che in tutte le famiglie la malattia abbia la stessa causa genetica Con il metodo dei LOD SCORE si producono gruppi di associazione (o di sintenia). L’assegnazione ad un particolare cromosoma è possibile solo se almeno un marcatore del gruppo di associazione è stato assegnato ad uno specifico cromosoma (problema che oggi non si verifica più) Primi studi di mappatura genetica nell’uomo anni ‘60-70 per molti anni risultati molto modesti: scarsità di siti polimorfici ABO - adenilatochinasi ABO - sindrome unghia-rotula Duffy - cataratta congenita Rh - ellissocitosi Colinesterasi - transferrina Lutheran - secretore G6PD - emofilia G6PD - daltonismo Anni ‘80 scoperta di marcatori analizzabili a livello di DNA (RFLP prima e STR poi) e coordinamento di vari gruppi a livello internazionale Famiglie CEPH = Centre pour l’Etude des Polymorphismes Humain Costruzione di mappa marcatore-marcatore Le mappe genetiche e le mappe fisiche sono sovrapponibili? Sì, per quanto riguarda l’ordine dei geni lungo i cromosomi No, per quanto riguarda la distanza che li separa Gli eventi di crossing-over non si distribuiscono in modo uniforme lungo i cromosomi: esistono zone ‘calde’ di ricombinazione (Hot Spot), inoltre la frequenza dei crossing-over è più elevata nelle femmine che nei maschi Mappa fisica e genetica del cromosoma 13 umano nel maschio e nella femmina Mappe genetiche ottenute con meiosi femminili (in rosso) e maschili (in azzurro) e mappa fisica del cromosoma 18 Il marcatore ideale per studi di mappatura genetica deve essere: altamente polimorfico; analizzabile con una tecnica semplice e a basso costo; analizzabile su un materiale biologico facilmente reperibile; Marcatori ideali sono STR (Simple Tandem Repeats) e SNP (Single Nucleotide Polymorphism) Perché ci interessa mappare i geni? 1) interesse di tipo evolutivo 2) applicazioni pratiche a. il restringimento della regione cromosomica in cui mappa un gene-malattia costituisce il primo passo per la sua identificazione b. l’individuazione della regione cromosomica in cui mappa un gene-malattia ed il linkage con altri marcatori trova un’immediata applicazione nella consulenza genetica indiretta (diagnosi prenatale, diagnosi presintomatica, diagnosi dello stato di portatore), che è l’unica possibile quando non sia stato clonato il gene-malattia 1 2 3 4 5 Identificazione di genimalattia attraverso la strategia del clonaggio posizionale Oggi è possibile passare direttamente dalla fase 1) alla fase 3) Come si stabilisce l’ordine di priorità? Funzione appropriata Espressione spazio-temporale appropriata Omologie e relazioni funzionali Omologie con fenotipi simili in organismi modello DIAGNOSI GENETICA Diretta viene studiato il gene responsabile della malattia, è possibile solo se il gene è stato clonato e se ne conoscono le mutazioni patologiche Indiretta viene utilizzata quando non si conosce il gene malattia o quando la ricerca diretta delle mutazioni ha dato esito negativo. Deve essere nota la localizzazione del gene e si devono conoscere dei marcatori strettamente associati al gene (= che ricombinano raramente con il gene malattia). Può essere applicata a malattie a trasmissione AD, AR e X-linked. Il problema principale è rappresentato da diagnosi errate dovute alla ricombinazione. come si procede nella diagnosi genetica INDIRETTA 1. si cerca un marcatore informativo nella specifica famiglia in modo tale da poter distinguere i due cromosomi omologhi del/i genitore/i che potrebbe(ro) trasmettere la malattia 2. si determina la fase di associazione tra l’allele-marcatore e l’allele malattia; 3. si determina quale cromosoma sia stato trasmesso al probando Diagnosi genetica indiretta per una malattia Autosomica Dominante, la diagnosi è soggetta ad un errore la cui grandezza dipende dalla frequenza di ricombinazione tra locus marcatore e locus malattia L’analisi di un marcatore a monte del locus malattia e di uno a valle permette di stabilire se si siano verificati eventi di ricombinazione: si diminuisce la probabilità di diagnosi errate Diagnosi genetica indiretta per malattia X-linked recessiva OMIM = Online Mendelian Inheritance in Man Versione online del catalogo dei fenotipi mendeliani umani (la ‘Bibbia’ dei genetisti medici) edito in versione cartacea fin dal 1966 a cura di Victor McKusick (sei edizioni: la prima nel 1966, l’ultima nel 1998) E’ un compendio dei geni e dei fenotipi umani Contiene informazioni su > 13000 geni e su tutte le malattie e i fenotipi mendeliani noti Ogni voce (‘entry’) è contrassegnata da un numero a sei cifre preceduto da un simbolo il significato della prima cifra: 1..... e 2..... ‘entries’ create prima del 15/05/1994 riguardanti loci o fenotipi autosomici 3..... ‘entries’ riguardanti loci o fenotipi Xlinked 4..... ‘entries’ di loci o fenotipi Y-linked 5..... ‘entries’ di loci o fenotipi mitocondriali 6..... ‘entries’ di loci o fenotipi autosomici creati dopo il 15/05/1994 il significato del simbolo che precede il numero: * gene # fenotipo + fenotipo gene a sequenza nota + % molecolare nota fenotipo mendeliano a base no simbolo fenotipo a sospetta (ma non confermata) eredità Esempimendeliana relativi alla CF (= Cystic Fibrosis) Il gene *602421 La malattia 1 (CF) #219700 La malattia 2 (CBAVD) #277180 Per ogni gene il database fornisce numerose informazioni sia cliniche che genetico-molecolari , una serie di ‘link’ ad altri siti e un’ampia bibliografia