Genetica di popolazioni
Guido Barbujani
Dip. Biologia ed Evoluzione
Università di Ferrara
[email protected]
Obiettivi del corso:
Capire le basi genetiche
dell’evoluzione
Arrivare a poter leggere
criticamente un articolo
Arrivare a porsi domande
scientificamente corrette
Cose da ricordare
Cos’è un gene, un allele, un aplotipo
Com’è fatto il DNA
Com’è fatto un gene Eucariote
Com’è fatto un gene procariote
Com’è la struttura dei geni (siti codificanti, siti
di regolazione, introni, esoni)
6. Come funzionano i geni
1.
2.
3.
4.
5.
Programma del corso
• 1. Equilibrio e fattori di scostamento:
linkage disequilibrium e mutazione
• 2. Equilibrio e fattori di scostamento:
deriva, flusso genico e selezione
• 3. Mantenimento dei polimorfismi
• 4. Introduzione al coalescente
Programma 1
(a) Diversità genetica
(b) Equilibrio di Hardy-Weinberg
(c) Linkage disequilibrium
(d) Mutazione
Prima di tutto: non c’è genetica
senza variabilità
Variabilità morfologica
Variabilità genetica: proteine
I geni trascritti in proteine rappresentano negli Eucarioti fra il 5%
e il 10% del genoma
Parte del restante 90-95% non è funzionale (junk DNA), ma
un’altra parte contiene importanti siti di regolazione
Tipi di polimorfismo studiati nel DNA
1.
2.
3.
4.
Di restrizione
Single Nucleotide Polymorphisms: SNPs
Numero di copie di elementi ripetuti
Inserzione/delezione: Indel
Variabilità genetica: DNA
Variabilità genetica: DNA
Variabilità genetica in Arabidopsis thaliana: SNPs
Nordborg et al., 2005 PLoS Biology
Tipi di polimorfismo studiati nel DNA
1. Di restrizione
Tipi di polimorfismo studiati nel DNA
2. SNP
Almeno 3 milioni di SNP nel genoma umano
Tipi di polimorfismo studiati nel DNA
3. Numero di copie di elementi ripetuti: STR e VNTR
Tipi di polimorfismo studiati nel DNA
3. Numero di copie di elementi ripetuti: STR
Tipi di polimorfismo studiati nel DNA
4. Inserzione/delezione: Indel
Tipi di polimorfismo studiati nel DNA
4. Inserzione/delezione: Inserzione di retrovirus
Tassi medi di mutazione per vari polimorfismi
(per locus per generazione)
VNTR
10-1 – 10-2
STR
10-2 – 10-4
SNPs
10-6 – 10-8
Indel (retrovirus) 10-10 – 10-11
Nella regione ipervariabile del DNA mitocondriale,
valori fino a 5 x 10-5 per sito per generazione
Quand’è che una popolazione
può dirsi variabile?
A
B
Misure di diversità genetica
• N di alleli
• Eterozigosi osservata:
Ho = N genotipi eteroz./N genotipi totali
• Eterozigosi attesa:
H = 1 –Σ pi2
(la frazione di individui che ci si aspetta siano
eterozigoti a un gene sconosciuto)
Quand’è che una popolazione
può dirsi variabile?
A
N alleli = 5
HO = 0.4
H = 0.35
B
N alleli = 2
HO = 0.6
H = 0.5
Quando il genotipo individuale è difficile da prevedere
Quand’è che una popolazione
può dirsi variabile?
• Quando molti siti del DNA sono variabili
diversità nucleotidica:
π = N siti polimorfici / N totale siti
• Quando ci sono grandi differenze
molecolari fra I suoi membri
mismatch medio:
k = Σ dij / [N (N-1) / 2]
Il mismatch è il numero di sostituzioni
fra coppie di individui
TCTAGA
1
2
CCTAGA
1
1
2
2
CCTAGG
2
2
CTTAGA
CTTAAA
1
Σ dij = 17
k = 1.7
3
(Ricostruzioni parsimoniose)
TCTAGA
1
CCTAGA
1
CCTAGG
1
CTTAGA
CTTAAA
1
Σ dij = 17
k = 1.7
Un’applicazione: variabilità STR in popolazioni
di lupi scandinavi (Flagstad et al. 2003)
N alleli
HO
H
1829-1889
5.0
0.66
0.74
1890-1939
1940-1980
4.4
3.1
0.61
0.45
0.68
0.52
Finlandia
4.9
0.69
0.72
Nota bene
La variabilità interna di una popolazione è solo uno degli
aspetti della variabilità genetica:
Variabilità tra individui della stessa popolazione
Variabilità tra individui di popolazioni diverse
Variabilità tra individui di gruppi di popolazioni diverse
eccetera
Programma 1
(a) Diversità genetica
(b) Equilibrio di Hardy-Weinberg
(c) Linkage disequilibrium
(d) Mutazione
Frequenze
Un locus: frequenza allelica
genotipi: AA, Aa, aa oppure
H1H7, H4H4, H1H2
*6*9, *7*10, *7*7
oppure
fase
Due o più loci: frequenza aplotipica
genotipi: A2B1C2/A1B1C1, o 212/111
A2B2C2/A1B2C1, o 222/121
Si può immaginare la frequenza di un aplotipo
come la frequenza dei gameti che portano
quella combinazione di alleli
L’equilibrio di Hardy-Weinberg
Dopo una generazione di accoppiamento casuale:
Genotipo AA Aa aa
Frequenza p2 2pq q2
Accoppiamento casuale o random mating
MATING
AA x AA
(p2)(p2)
AA x Aa
(p2)(2pq)
AA x aa
(p2)(q2)
Aa x AA
(2pq)(p2)
Aa x Aa
(2pq)(2pq)
Aa x aa
(2pq)(q2)
aa x AA
(q2)(p2)
aa x Aa
(q2)(2pq)
aa x aa
(q2)(q2)
MAT. FREQ.
PROGENIE
Aa
p4
AA
p4
2p3q
p3q
p3q
p2q2
aa
p2q2
2p3q
p3q
p3q
4p2q2
p2q2
2p2q2
p2q2
2pq3
pq3
pq3
p2q2
p2q2
2pq3
pq3
q4
pq3
q4
E alla fine nella progenie
f(AA) = p4 + 2p3q + p2q2= p2 (p2+ 2pq +q2) = p2
f(Aa) = 2p3q + 4p2q2 + 2pq3 = 2pq (p2 + 2pq +q2) = 2pq
f(aa) = p2q2 + 2pq3 + q4 = q2 (p2 + 2pq +q2) = q2
Cioè esattamente le
frequenze che si ottengono
immaginando di
accoppiare a caso I gameti
del pool genico parentale
Se una popolazione è in equilibrio
• Le frequenze genotipiche dipendono
esclusivamente dalle frequenze alleliche o
aplotipiche della generazione precedente
• Le frequenze alleliche o aplotipiche non
cambiano attraverso le generazioni
Quindi, se c’è equilibrio non c’è evoluzione, e
viceversa
Condizioni per l’equilibrio di
Hardy-Weinberg
•
•
•
•
•
•
•
•
Organismo diploide, riproduzione sessuata
Generazioni non sovrapposte
Unione casuale
Popolazione grande
Mutazione trascurabile
Migrazione trascurabile
Mortalità indipendente dal genotipo
Fertilità indipendente dal genotipo
Se non si incontrano queste condizioni:
•
•
•
•
•
•
Unione casuale
Popolazione grande
Mutazione trascurabile
Migrazione trascurabile
Mortalità indipendente dal genotipo
Fertilità indipendente dal genotipo
In caso si studi più di un locus:
• Associazione casuale degli alleli
sui cromosomi
Inbreeding
Deriva genetica
Mutazione
Migrazione
Selezione
Selezione
Linkage disequilibrium
Unione non casuale
• Quando la scelta del partner riproduttivo non
è casuale rispetto al suo genotipo si parla di
unione assortativa
• L’unione assortativa è positiva quando si
scelgono preferenzialmente partner
geneticamente affini, negativa quando
avviene il contrario
Unione non casuale
• L’unione assortativa positiva provoca un deficit di
eterozigoti rispetto alle attese di Hardy-Weinberg
• Il deficit di eterozigoti viene misurato dal coefficiente
F di inbreeding
• Coefficienti di inbreeding possono essere stimati
dalle frequenze genotipiche o dagli alberi genealogici
• L’inbreeding è conseguenza anche del fatto che il
numero di antenati di ognuno raddoppia ad ogni
generazione, mentre le popolazioni hanno dimensioni
finite
Unione assortativa positiva: autofecondazione
f(AA) = ¼
f(Aa) = ½
f(aa) = ¼
¼ AA x AA  100% AA
½ Aa x Aa  ¼ AA, ½ Aa, ¼ aa
¼ aa x aa 
100% aa
f(AA) = ¼ + (½ x ¼) f(Aa) = ½
f(AA) = 3/8
f(Aa) = ¼
f(aa) = ¼ + (½ x ¼)
f(aa) = 3/8
Unione assortativa positiva: autofecondazione
f(AA) = 3/8
f(Aa) = ¼
f(aa) = 3/8
3/8 AA x AA  100% AA
¼ Aa x Aa  ¼ AA, ½ Aa, ¼ aa
3/8 aa x aa 
100% aa
f(AA) = 3/8 + (¼ x ¼) f(Aa) = ¼ f(aa) = 3/8 + (¼ x ¼)
f(AA) = 7/16
f(Aa) = 1/8
f(aa) = 7/16
Unione assortativa positiva: autofecondazione
Generazione
1
2
3
4
N
AA
¼
3/8
7/16
15/32
Aa
½
1/4
1/8
1/16
1/2N
aa
¼
3/8
7/16
15/32
Effetti dell’inbreeding
• La tendenza ad
accoppiarsi fra
consanguinei determina
la comparsa nella
progenie di un eccesso
di omozigoti:
Unione assortativa positiva: inbreeding
Se Foss(Aa) = H
Fatt(Aa) = H0 = 2pq
(H0 – H) / H0 = F coefficiente di inbreeding
FH0 = H0 – H
H = H0 – FH0 ,
ma H0 = 2pq
H = 2pq - 2pqF = 2pq(1-F)
Un coefficiente di inbreeding pari a F porta a un
deficit di eterozigoti pari a (1-F): metà AA e metà aa
Effetto dell’inbreeding
Genotipo
HardyWeinberg
con
inbreeding
AA
p2
p2 + pqF
Aa
2pq
2pq (1-F)
aa
q2
q2 + pqF
L’inbreeding non altera le frequenze alleliche
Depressione da inbreeding
Pony delle Shetland
Abbiamo tanti antenati
6 miliardi di nucleotidi nel genoma umano
1750: 1024 antenati
1500: 1 milione
1240: 1 miliardo
1000: 1000 miliardi
250 aC: 1030
Madre
Padre
4 nonni
Figlio
16 trisavoli
8 bisnonni
32 antenati 4 generazioni fa
e ciascuno ci ha trasmesso un pezzetto del suo genoma
Nessuno è immune dall’inbreeding
40 generazioni fa (1000 dC): 1 000 000 000 000 antenati
Popolazione stimata della terra: 100 000 000
80 generazioni fa: 1030 antenati
Popolazione stimata della terra: 100 000 000
1000 generazioni fa: 10300 antenati
Popolazione stimata della terra: 1 000 000
Quindi:
Del milione di individui presenti 25 000 anni fa, molti non
hanno lasciato discendenti, molti non sono nostri antenati, altri
lo sono miliardi di volte
Le nostre genealogie sono tutte fortemente intrecciate
Stima del coefficiente di inbreeding da pedigree
Stima del coefficiente di inbreeding da pedigree
½
Aa
½
½
F = (½)5 = 1/32
½
½
Stima del coefficiente di inbreeding da pedigree
F = (½)5 x 2 = 1/32 x 2 = 1/16
Stima del coefficiente di inbreeding da pedigree
Il valore di F è pari a ½ elevato a una potenza pari al
numero di passaggi nel pedigree.
Valore di F nella progenie di varie unioni consanguinee:
Autofecondazione: ½
Fra fratello e sorella: ¼
Fra zio e nipote: 1/8
Fra cugini primi: 1/16
Fra cugini 1 e ½: 1/32
Fra cugini secondi: 1/64
…
Scarica

1-F