Genetica di popolazioni Guido Barbujani Dip. Biologia ed Evoluzione Università di Ferrara [email protected] Obiettivi del corso: Capire le basi genetiche dell’evoluzione Arrivare a poter leggere criticamente un articolo Arrivare a porsi domande scientificamente corrette Cose da ricordare Cos’è un gene, un allele, un aplotipo Com’è fatto il DNA Com’è fatto un gene Eucariote Com’è fatto un gene procariote Com’è la struttura dei geni (siti codificanti, siti di regolazione, introni, esoni) 6. Come funzionano i geni 1. 2. 3. 4. 5. Programma del corso • 1. Equilibrio e fattori di scostamento: linkage disequilibrium e mutazione • 2. Equilibrio e fattori di scostamento: deriva, flusso genico e selezione • 3. Mantenimento dei polimorfismi • 4. Introduzione al coalescente Programma 1 (a) Diversità genetica (b) Equilibrio di Hardy-Weinberg (c) Linkage disequilibrium (d) Mutazione Prima di tutto: non c’è genetica senza variabilità Variabilità morfologica Variabilità genetica: proteine I geni trascritti in proteine rappresentano negli Eucarioti fra il 5% e il 10% del genoma Parte del restante 90-95% non è funzionale (junk DNA), ma un’altra parte contiene importanti siti di regolazione Tipi di polimorfismo studiati nel DNA 1. 2. 3. 4. Di restrizione Single Nucleotide Polymorphisms: SNPs Numero di copie di elementi ripetuti Inserzione/delezione: Indel Variabilità genetica: DNA Variabilità genetica: DNA Variabilità genetica in Arabidopsis thaliana: SNPs Nordborg et al., 2005 PLoS Biology Tipi di polimorfismo studiati nel DNA 1. Di restrizione Tipi di polimorfismo studiati nel DNA 2. SNP Almeno 3 milioni di SNP nel genoma umano Tipi di polimorfismo studiati nel DNA 3. Numero di copie di elementi ripetuti: STR e VNTR Tipi di polimorfismo studiati nel DNA 3. Numero di copie di elementi ripetuti: STR Tipi di polimorfismo studiati nel DNA 4. Inserzione/delezione: Indel Tipi di polimorfismo studiati nel DNA 4. Inserzione/delezione: Inserzione di retrovirus Tassi medi di mutazione per vari polimorfismi (per locus per generazione) VNTR 10-1 – 10-2 STR 10-2 – 10-4 SNPs 10-6 – 10-8 Indel (retrovirus) 10-10 – 10-11 Nella regione ipervariabile del DNA mitocondriale, valori fino a 5 x 10-5 per sito per generazione Quand’è che una popolazione può dirsi variabile? A B Misure di diversità genetica • N di alleli • Eterozigosi osservata: Ho = N genotipi eteroz./N genotipi totali • Eterozigosi attesa: H = 1 –Σ pi2 (la frazione di individui che ci si aspetta siano eterozigoti a un gene sconosciuto) Quand’è che una popolazione può dirsi variabile? A N alleli = 5 HO = 0.4 H = 0.35 B N alleli = 2 HO = 0.6 H = 0.5 Quando il genotipo individuale è difficile da prevedere Quand’è che una popolazione può dirsi variabile? • Quando molti siti del DNA sono variabili diversità nucleotidica: π = N siti polimorfici / N totale siti • Quando ci sono grandi differenze molecolari fra I suoi membri mismatch medio: k = Σ dij / [N (N-1) / 2] Il mismatch è il numero di sostituzioni fra coppie di individui TCTAGA 1 2 CCTAGA 1 1 2 2 CCTAGG 2 2 CTTAGA CTTAAA 1 Σ dij = 17 k = 1.7 3 (Ricostruzioni parsimoniose) TCTAGA 1 CCTAGA 1 CCTAGG 1 CTTAGA CTTAAA 1 Σ dij = 17 k = 1.7 Un’applicazione: variabilità STR in popolazioni di lupi scandinavi (Flagstad et al. 2003) N alleli HO H 1829-1889 5.0 0.66 0.74 1890-1939 1940-1980 4.4 3.1 0.61 0.45 0.68 0.52 Finlandia 4.9 0.69 0.72 Nota bene La variabilità interna di una popolazione è solo uno degli aspetti della variabilità genetica: Variabilità tra individui della stessa popolazione Variabilità tra individui di popolazioni diverse Variabilità tra individui di gruppi di popolazioni diverse eccetera Programma 1 (a) Diversità genetica (b) Equilibrio di Hardy-Weinberg (c) Linkage disequilibrium (d) Mutazione Frequenze Un locus: frequenza allelica genotipi: AA, Aa, aa oppure H1H7, H4H4, H1H2 *6*9, *7*10, *7*7 oppure fase Due o più loci: frequenza aplotipica genotipi: A2B1C2/A1B1C1, o 212/111 A2B2C2/A1B2C1, o 222/121 Si può immaginare la frequenza di un aplotipo come la frequenza dei gameti che portano quella combinazione di alleli L’equilibrio di Hardy-Weinberg Dopo una generazione di accoppiamento casuale: Genotipo AA Aa aa Frequenza p2 2pq q2 Accoppiamento casuale o random mating MATING AA x AA (p2)(p2) AA x Aa (p2)(2pq) AA x aa (p2)(q2) Aa x AA (2pq)(p2) Aa x Aa (2pq)(2pq) Aa x aa (2pq)(q2) aa x AA (q2)(p2) aa x Aa (q2)(2pq) aa x aa (q2)(q2) MAT. FREQ. PROGENIE Aa p4 AA p4 2p3q p3q p3q p2q2 aa p2q2 2p3q p3q p3q 4p2q2 p2q2 2p2q2 p2q2 2pq3 pq3 pq3 p2q2 p2q2 2pq3 pq3 q4 pq3 q4 E alla fine nella progenie f(AA) = p4 + 2p3q + p2q2= p2 (p2+ 2pq +q2) = p2 f(Aa) = 2p3q + 4p2q2 + 2pq3 = 2pq (p2 + 2pq +q2) = 2pq f(aa) = p2q2 + 2pq3 + q4 = q2 (p2 + 2pq +q2) = q2 Cioè esattamente le frequenze che si ottengono immaginando di accoppiare a caso I gameti del pool genico parentale Se una popolazione è in equilibrio • Le frequenze genotipiche dipendono esclusivamente dalle frequenze alleliche o aplotipiche della generazione precedente • Le frequenze alleliche o aplotipiche non cambiano attraverso le generazioni Quindi, se c’è equilibrio non c’è evoluzione, e viceversa Condizioni per l’equilibrio di Hardy-Weinberg • • • • • • • • Organismo diploide, riproduzione sessuata Generazioni non sovrapposte Unione casuale Popolazione grande Mutazione trascurabile Migrazione trascurabile Mortalità indipendente dal genotipo Fertilità indipendente dal genotipo Se non si incontrano queste condizioni: • • • • • • Unione casuale Popolazione grande Mutazione trascurabile Migrazione trascurabile Mortalità indipendente dal genotipo Fertilità indipendente dal genotipo In caso si studi più di un locus: • Associazione casuale degli alleli sui cromosomi Inbreeding Deriva genetica Mutazione Migrazione Selezione Selezione Linkage disequilibrium Unione non casuale • Quando la scelta del partner riproduttivo non è casuale rispetto al suo genotipo si parla di unione assortativa • L’unione assortativa è positiva quando si scelgono preferenzialmente partner geneticamente affini, negativa quando avviene il contrario Unione non casuale • L’unione assortativa positiva provoca un deficit di eterozigoti rispetto alle attese di Hardy-Weinberg • Il deficit di eterozigoti viene misurato dal coefficiente F di inbreeding • Coefficienti di inbreeding possono essere stimati dalle frequenze genotipiche o dagli alberi genealogici • L’inbreeding è conseguenza anche del fatto che il numero di antenati di ognuno raddoppia ad ogni generazione, mentre le popolazioni hanno dimensioni finite Unione assortativa positiva: autofecondazione f(AA) = ¼ f(Aa) = ½ f(aa) = ¼ ¼ AA x AA 100% AA ½ Aa x Aa ¼ AA, ½ Aa, ¼ aa ¼ aa x aa 100% aa f(AA) = ¼ + (½ x ¼) f(Aa) = ½ f(AA) = 3/8 f(Aa) = ¼ f(aa) = ¼ + (½ x ¼) f(aa) = 3/8 Unione assortativa positiva: autofecondazione f(AA) = 3/8 f(Aa) = ¼ f(aa) = 3/8 3/8 AA x AA 100% AA ¼ Aa x Aa ¼ AA, ½ Aa, ¼ aa 3/8 aa x aa 100% aa f(AA) = 3/8 + (¼ x ¼) f(Aa) = ¼ f(aa) = 3/8 + (¼ x ¼) f(AA) = 7/16 f(Aa) = 1/8 f(aa) = 7/16 Unione assortativa positiva: autofecondazione Generazione 1 2 3 4 N AA ¼ 3/8 7/16 15/32 Aa ½ 1/4 1/8 1/16 1/2N aa ¼ 3/8 7/16 15/32 Effetti dell’inbreeding • La tendenza ad accoppiarsi fra consanguinei determina la comparsa nella progenie di un eccesso di omozigoti: Unione assortativa positiva: inbreeding Se Foss(Aa) = H Fatt(Aa) = H0 = 2pq (H0 – H) / H0 = F coefficiente di inbreeding FH0 = H0 – H H = H0 – FH0 , ma H0 = 2pq H = 2pq - 2pqF = 2pq(1-F) Un coefficiente di inbreeding pari a F porta a un deficit di eterozigoti pari a (1-F): metà AA e metà aa Effetto dell’inbreeding Genotipo HardyWeinberg con inbreeding AA p2 p2 + pqF Aa 2pq 2pq (1-F) aa q2 q2 + pqF L’inbreeding non altera le frequenze alleliche Depressione da inbreeding Pony delle Shetland Abbiamo tanti antenati 6 miliardi di nucleotidi nel genoma umano 1750: 1024 antenati 1500: 1 milione 1240: 1 miliardo 1000: 1000 miliardi 250 aC: 1030 Madre Padre 4 nonni Figlio 16 trisavoli 8 bisnonni 32 antenati 4 generazioni fa e ciascuno ci ha trasmesso un pezzetto del suo genoma Nessuno è immune dall’inbreeding 40 generazioni fa (1000 dC): 1 000 000 000 000 antenati Popolazione stimata della terra: 100 000 000 80 generazioni fa: 1030 antenati Popolazione stimata della terra: 100 000 000 1000 generazioni fa: 10300 antenati Popolazione stimata della terra: 1 000 000 Quindi: Del milione di individui presenti 25 000 anni fa, molti non hanno lasciato discendenti, molti non sono nostri antenati, altri lo sono miliardi di volte Le nostre genealogie sono tutte fortemente intrecciate Stima del coefficiente di inbreeding da pedigree Stima del coefficiente di inbreeding da pedigree ½ Aa ½ ½ F = (½)5 = 1/32 ½ ½ Stima del coefficiente di inbreeding da pedigree F = (½)5 x 2 = 1/32 x 2 = 1/16 Stima del coefficiente di inbreeding da pedigree Il valore di F è pari a ½ elevato a una potenza pari al numero di passaggi nel pedigree. Valore di F nella progenie di varie unioni consanguinee: Autofecondazione: ½ Fra fratello e sorella: ¼ Fra zio e nipote: 1/8 Fra cugini primi: 1/16 Fra cugini 1 e ½: 1/32 Fra cugini secondi: 1/64 …