ANALISI AUTOMATICA DI MARCATORI GENETICI
POLIMORFICI
DEL
DNA
(STR,SNP)
E SUE APPLICAZIONI IN CAMPO BIOMEDICO
Laboratorio di Oncoematologia Pediatrica (BO)
Dott.ssa Virginia Libri
MARCATORE GENETICO
Qualsiasi carattere polimorfico mendeliano che può
essere impiegato per seguire l’ereditarietà di un
segmento cromosomico attraverso un albero genealogico
POLIMORFISMO
I polimorfismi genetici sono variazioni nelle sequenze
di DNA presenti in una popolazione con una frequenza
maggiore dell’1%. Quando la frequenza e' inferiore a
tale valore arbitrario, si preferisce parlare di
varianti genetiche rare, che in molti loci sono
presenti
in
aggiunta
ai
polimorfismi.
RFLP
I primi marcatori molecolari ad essere studiati furono gli
RFLP (Restriction Fragment Lenght Polymorphism):particolari
tratti di DNA presenti nella popolazione e trasmessi in
modo ereditario
La regione del genoma di
interesse viene amplificata
tramite PCR e i prodotti
ottenuti vengono incubati
con un enzima di restrizione
in grado di riconoscere una
sequenza specifica e di
catalizzare una reazione di
taglio al suo interno
RFLP: Gel di Elettroforesi
Mediante elettroforesi su gel di agarosio si è in grado di
determinare se il frammento amplificato è stato tagliato o
meno, cioè se la sequenza specifica riconosciuta
dall’enzima è presente inalterata oppure no
Direzione
di Migratione
I frammenti
più grandi
migrano più
lentamente
rispetto a
quelli più
corti
RFLP
I frammenti possono avere
lunghezza diversa nei
diversi individui ma anche
tra i due cromosomi di uno
stesso individuo, ciò è
possibile se tra due siti di
restrizione è presente una
sequenza che può variare in
lunghezza (VNTR)o se esiste
una variante polimorfa che
introduce o elimina un altro
sito di restrizione per lo
stesso enzima modificando la
grandezza dei frammenti
ottenuti per digestione.
Considerazioni sulla metodica

Uno svantaggio di questo tipo di marcatori è dato dalla loro
bassa informatività

Infatti gli RFLP presentano solo due alleli possibili: il sito
di restrizione può essere intatto oppure no

L’impiego di questi marcatori per eseguire la mappa genetica di
patologie è poco attuabile in quanto troppo spesso delle meiosi
chiave in una famiglia risultano non informative

Occorre un pedigree completo con entrambi genitori e un
precedente figlio

Occorre trovare un enzima di restrizione che nel genitore
affetto frammenti il DNA in modo tale da creare una situazione
di eterozigosi
The human genome
100%
Extragenic DNA
Gene/gene related sequences
30%
70%
Unique
Coding regions
3%
55%
Repetitive
Introns,promoter,
Pseudogenes,gene fragments
15%
27%
Tandemly
repeated
Satellite
Intersperd
repetitive
SINEs
(<500bp)
Minisatellite
Telomeric
Microsatellite
LINEs
(>500bp)
Hypervariable
Sequenzial breakdown of the genome into component DNA types (Bennett P: Demystified...Microsatellites. J
Clin Pathol:Mol Pathol 2000,53:177-183)
DNA ripetitivo intersperso



Le singole unità ripetute non sono raggruppate ma sparse in
più punti del genoma. Gli esempi più comuni sono le sequenze
SINEs (Short Interspersed Nuclear Element) e LINEs (Long
Interspersed Nuclear Element)
Sono associate
perché tendono
povere di geni
mutazionale al
LINEs
prevalentemente a DNA genomico ricco in A/T
a posizionarsi in regioni del cromosoma
allo scopo di imporre il minimo impatto
genoma.
SINEs
Sono associate prevalentemente a DNA genomico ricco in G/C.
Perché? Sembra che tali sequenze svolgano una qualche
funzione positiva per il genoma: esse sarebbero espresse in
condizioni di stress ed i risultanti RNA legherebbero una
particolare protein chinasi PKR e bloccherebbero la sua
capacità di inattivare la traduzione.
DNA ripetuto in tandem
DNA costituto da blocchi di
sequenze che possono trovarsi in
poche o in molte localizzazioni
cromosomiche differenti. A
seconda delle dimensioni medie
del blocco di unità ripetute è
possibile suddividere questo DNA
non codificante in subclassi:
satellite,minisatellite e
microsatellite.
DNA
satellite
DNA satellite comprende un
grande gruppo di blocchi di
DNA ripetuto in tandem con
singole unità ripetute più o
meno complesse. Il DNA di
questo tipo non è trascritto e
praticamente costituisce il
grosso dell’eterocromatina
del genoma localizzata al
centromero (eterocromatina
pericentrica)
DNA minisatellite comprende
due tipi di sequenze di DNA
ripetuto in tandem, non
trascritto, di modeste
dimensioni e disperso nel
genoma nucleare:
minisatelliti telomerici e
minisatelliti ipervariabili
DNA TELOMERICO

Questo tipo di DNA è localizzato all’estremità dei cromosomi,
nei telomeri

Il costituente principale del DNA telomerico è rappresentato da
10-15kb di unità esanucleotidiche ripetute in tandem, in
particolare TTAGGG, che vengono aggiunte da un enzima
specializzato, la telomerasi

Tali ripetizioni sono responsabili della funzione dei telomeri
in quanto agiscono come protezioni delle estremità dei
cromosomi dalla degradazione e dalle perdite di materiale

Inoltre forniscono un meccanismo per la replicazione delle
estremità lineari del DNA cromosomico
DNA minisatellite ipervariabile o VNTR
(Variable Number of Tandem Repeat)

Sono sequenze altamente polimorfiche ed organizzate in oltre
1000 gruppi (lunghi da 0.1 a 20 kb) di corte unità ripetute in
tandem, che variano considerevolmente per dimensioni ma
posseggono una sequenza comune centrale ( core),GGGCAGGAXG

Molti di questi gruppi si trovano vicino ai telomeri

La maggior parte di queste sequenze non sono trascritte eccetto
alcuni elementi all’interno di sequenze intrageniche non
codificanti

Il significato non è ancora chiaro, ma indipendentemente dalla
loro reale funzione nel genoma umano, esiste un utilizzo
pratico di questi gruppi, ma in genere delle sequenze ripetute,
nel DNA fingerprinting (impronta digitale del DNA)
DNA fingerprinting

La molecola del DNA possiede caratteristiche che consentono
di differenziare i diversi individui perché,diversamente da
un impronta digitale convenzionale,l’impronta digitale del
DNA non può essere alterata da alcun trattamento conosciuto

Queste differenze vengono utilizzate per studi che trovano
sviluppo in diversi ambiti:
Forense: risoluzione dei crimini
identificazione vittime
Medico: diagnosi dei disordini ereditati
cure di sviluppo per i disordini ereditati
test di paternità
Evoluzionistico:comportamento degli animali
popolazioni genetiche
Minisatelliti: Riconosciuti su gel dopo
amplificazione con PCR
DNA minisatellite ipervariabile
PROBLEMI

I VNTR presentano delle difficoltà relative alla
genotipizzazione in quanto vista la loro lunghezza
tali marcatori vengono amplificati con difficoltà in
una reazione di PCR

Non sono uniformemente distribuiti in tutto il
genoma
ALTRA CATEGORIA
DI MARCATORI MOLECOLARI
DNA Microsatellite o STR (Short Tandem Repeat)
Le famiglie di DNA
microsatellite includono
piccoli blocchi di
ripetizioni in tandem,da 1550 volte,semplici nella
sequenza (1-6bp)e dispersi
nel genoma
Sono numerosi, con una densità
media stimata intorno ad 1
STR ogni 30,000-10,000bp
Il numero di ripetizioni varia
frequentemente tra gli
alleli portando ad un alto
grado di polimorfismo
Sono abbastanza comuni le
ripetizioni
mononucleotidiche (A)n o
(T)n che arrivano a
costituire in tutto ca
10 Mb,ovvero lo 0.3% del
genoma nucleare
Le ripetizioni di (G)n e
di(C)n sono, al
contrario,più rare
DNA Microsatellite o STR
Le ripetizioni
dinucleotidiche CA/TG
(TG sul filamento
complementare)sono molto
comuni; costituiscono
infatti ca lo 0.5% del
genoma
Sono altamente polimorfiche
Sono diffuse anche le
ripetizioni CT/AG che si
verificano in media ogni
50 kb e costituiscono ca
lo 0.2% del genoma
Le ripetizioni CG/GC
risultano molto rare,
questo perché i residui C
affiancati in 3’da un
residuo G (cioè CpG)sono
soggetti a metilazione e
a successiva
deaminazione, diventando
TpG (o CpA sull’altro
filamento)
DNA Microsatellite o STR
Le ripetizioni in tandem di tre nucleotidi
nel DNA codificante possono essere
I trinucleotidi e i
siti soggetti ad espansione
tetranucleotidi
patologica.
ripetuti in tandem sono
Esempio:
Caso del sito fragile dell’X (causata relativamente rari ma
da una mutazione nel gene FMR1, che
spesso polimorfici e
codifica per una proteina implicata
potenzialmente utili
nello sviluppo delle sinapsi)
per l’identificazione
Corea di Huntington (patologia
ereditaria causata dalla
di marcatori altamente
degenerazione di neuroni
localizzati in specifiche aree del polimorfici
cervello)
I microsatelliti sono
Distrofia miotonica (chr 19, CTG è
evidenziabili non solo
ripetuta da 50 fino a migliaia di
volte nei soggetti patologici) e
nel DNA intergenico o
certi tipi di atassia cerebellare
(Bennett P: Demystified... Microsatellites.
J Clin Pathol:Mol Pathol 2000,53:177183)
dentro gli introni ma
esempi ne sono stati
riportati anche
all’interno di regioni
codificanti
VANTAGGI
Tecnicamente gli STR, a
confronto con altri
Questa relativa facilità di
marcatori,presentano il
studio ha portato ad un rapido
vantaggio di essere:
incremento del numero degli
1. Numerosi
STRs esaminati
2. Equamente distribuiti in
tutta la parte eucromatica
del genoma
Catalogazione standard: es
3. Altamente polimorfici e
D12S324,dove 12 è il cromosoma
quindi informativi
sul quale il marker è
4. Analizzabili facilmente
localizzato e 324 è un codice
tramite PCR
identificativo(Bennett P:
Demystified...Microsatellites. J Clin
Pathol:Mol Pathol 2000,53:177-183)
ANALISI degli STR
Attualmente si utilizzano
tecniche di PCR (Polymerase
Chain Reaction)
I primers, progettati esterni
alla sequenza ripetuta ed
utilizzati per amplificare
le sequenze dei
microsatelliti, sono
marcati covalentemente con
differenti fluorofori
Tali molecole assorbono
l’energia fornita da un
laser per poi riemetterla
a lunghezze d’onda
differenti specifiche per
ciascun fluoroforo
Stutter o Shadow Bands
Un problema da affrontare
nell’analisi dei
microsatelliti è la
formazione, durante il
processo di amplificazione,
di prodotti aspecifici
chiamati“stutter o shadow
bands”
Infatti l’utilizzo di una
DNA polimerasi
termostabile con un’alta
processività può ridurre
notevolmente la formazione
di prodotti aspecifici
La formazione dei prodotti
aspecifici è legata alla
processività della Taq
Polimerasi(Lawyer F. et al.PCR
Methods Appl.,1993 May; 2 (4): 275287) piuttosto che alla
struttura secondaria del DNA
ELETTOFORETOGRAMMA
Stutter o Shadow Bands

Nel caso delle ripetizioni dinucleotidiche,la stutter band
prevalente è di 2 bp più piccola rispetto al picco
principale,con in più la formazione di statter bands di 4 e
6bp più piccole anche visibili (Murray V. et al. Nucleic Acids
Res,1993,21:2395-2398)

Questo comporta che per ciascun allele si abbia un pattern
con più bande il che rende complicata l’interpretazione dei
dati, in modo particolare per campioni di DNA che sono una
miscela di due o più individui

La tendenza, adesso, è di utilizzare marcatori tri- o tetranucleotidici che danno risultati più evidenti
Stutter Bands
In seguito alla reazione di
PCR si osserva la formazione
di soltanto una singola
stutter band in una posizione
di 4bp più piccola rispetto a
ciascun allele e l’intensità
della stutter band è
generalmente <10% rispetto al
picco principale
Le statter bands sono anche
utili però nell’assegnazione
manuale dei picchi relativi
agli alleli perché la loro
presenza serve a discriminare i
picchi degli alleli principali
rispetto a picchi isolati che
sono probabilmente dovuti ad
aspecifici
Tale percentuale dipende però
anche dalla dimensione del
picco principale nel senso
che,per esempio,per alleli
compresi in un range di
166bp, la stutter band è ca
il 4% del picco principale
(P.Sean Walsh et al. Nucleic Acids
Res,1996,24 (14): 2807-2812)
TRAPIANTO

Il trapianto allogenico di midollo osseo (BM) o di cellule
staminali periferiche (PBSC) spesso rappresenta il solo
approccio terapeutico curativo utilizzabile in diverse
malattie neoplastiche e non

Inizialmente il trapianto veniva effettuato soltanto in caso
di“related donors”, negli utlimi anni viene ampliamente
utilizzato il trapianto di BM o di PBSC da “ HLA-MAtched
Unrelated Donors”(MUD)

Inoltre da quando l’“acute graft-versus host disease”
(aGVHD) rappresenta una maggiore complicazione, specialmente
in caso di trapianto da PBSC, viene effettuata frequentemente
la deplezione delle cellule T del graft
TRAPIANTO

Molte di queste procedure sono però associate con un
sostanziale rischio di incremento di rigetto e di ripresa di
malattia, quindi risulta necessario monitorare strettamente
il grado di attecchimento del trapianto (Thiede C. et al.
Leukemia,2001,15:293-302)

Diversi approcci sono stati utilizzati a tale scopo ma quello
che si è rilevato più utile perché più informativo consiste
nell’utilizzo di una multiplex PCR mediante la quale è
possibile la co-amplificazione in una singola reazione di 9 o
più differenti STR e dell’amelogenina, che è il locus del
sesso
CO-AMPLIFICAZIONE

I n c o mm er ci o e si s to no de i k it c h e co n se nt o d i c oamplificare contemporaneamente 10 o più microsatelliti

In particolare nel nostro laboratorio viene utilizzato:
AmpFlSTR PROFILER dell’Applied Biosystems

Il kit contiene:

Buffer

Set di 10 coppie di primers.Un primer di ogni
coppia è marcato con un fluorocromo: 5-FAM (5carbossifluoresceina),JOE e NED che vengono
rispettivamente rilevati come blu,verde e giallo

AmpliTaq Gold
Ne lla seguen te
localizzazione
possibili delle
fluorocrom
t abella son o indi cati : il t ipo d i STR , la
cromosomica, il core,gli intervalli (range)
dimensioni in bp dei singoli STR ed il tipo di
o coniugato ad ognuno di essi
STR system
Chromosomes
Common Sequence Motif
Range
(bp)
Fluorophores
D3S1358
3p
TCTA(TCTG)1-3(TCTA)n
114-142
5-FAM
vWA
12p12-pter
TCTA(TCTG)3-4(TCTA)n
157-197
5-FAM
FGA
4q28
(TTTC)3TTTTTTCT(CTTT)n
CTCC(TTCC)2
219-267
5-FAM
Amelogenina
X: p22.1-22.3
Y: p11.2
/
107-113
JOE
TH01
11p15.5
(AATG)n
169-189
JOE
TPOX
2p23-2per
(AATG)n
218-242
JOE
CSF1PO
5q33.3-34
(AGAT)n
281-317
JOE
D5S818
5q21-31
(AGAT)n
135-171
NED
D13S317
13q22-31
(GATA)n
206-234
NED
D7S820
7q
(GATA)n
258-294
NED
chromosome
cell nucleus
Double stranded
DNA molecule
Target Region for PCR
Individual
nucleotides
Thermal Cycling Temperatures
95oC
Temperature
95
95oC
95oC
72oC
60oC
72oC
60oC
95oC
72oC
60oC
Single Cycle
Time
The denaturation time in the first cycle is
lengthened to ~10 minutes when using
AmpliTaq Gold to perform a “hot-start” PCR
Typically 25-35 cycles
performed during PCR
PCR Copies DNA Exponentially
through Multiple Thermal Cycles
Original DNA target region
Thermal cycle
PCR Copies DNA Exponentially
through Multiple Thermal Cycles
Thermal cycle
In 32 cycles at 100% efficiency, 1.07 billion
copies of targeted DNA region are created
ELETTROFORETOGRAMMA
Calcolo del chimerismo
Per procedere al calcolo del chimerismo, occorre tenere presente
che:

La valutazione viene effettuata sulla base dei dati rilevati
nel ricevente post-trapianto

Sono da considerarsi solo i loci in cui si osserva chimerismo
misto (tra i 10 complessivamente analizzati)

Gli alleli condivisi tra donatore e ricevente non sono
considerati informativi

Occorre tenere presente diverse situazioni come di seguito
riportato (Chiede C. et al.Bone Marrow Transplatation,1993,23:10551060):
Schematic illustration of calculations performed
for the quantitative assessment of mixed chimerism
I
II
III
I. Ricevente e donatore sono omo o eterozigoti e non hanno alleli in
comune
Esempio: caso I
Schematic illustration of calculations performed
for the quantitative assessment of mixed chimerism
I
II
III
I. Ricevente e donatore sono omo o eterozigoti e non hanno alleli in
comune
II. Ricevente e donatore sono eterozigoti ed hanno un allele in comune
Esempio: caso II
Schematic illustration of calculations performed
for the quantitative assessment of mixed chimerism
I
II
III
I. Ricevente e donatore sono omo o eterozigoti e non hanno alleli in
comune
II. Ricevente e donatore sono eterozigoti ed hanno un allele in comune
III.Ricevente è omozigote ed il donatore è eterozigote ed hanno un
allele in comune
Esempio: caso III
ALTRA CATEGORIA
DI MARCATORI MOLECOLARI
SNP
(Single Nucleotide Polymorfism)

Gli SNPs,scoperti negli anni 80, sono variazioni di
sequenza del DNA che si verificano quando è alterato un
singolo nucleotide della sequenza genomica

Affinchè una variazione nella sequenza nucleotidica sia
considerata uno SNP, deve essere presente in almeno l’1%
della popolazione per cui l’inserzione/delezione di una
singola base non deve essere considerata uno SNP

A differenza delle VNTR e degli STRs, gli SNPs non sono
sequenze ripetute e possono trovarsi sia nelle regioni
codificanti che non-codificanti del genoma (Dwight H.O.et
al.Journal of Molecular Diagnostics, 2000, 2(4):202-208)
SNP

Attualmente sono i marcatori molecolari più utilizzati
perché il grande vantaggio nell’utilizzarli è dato
dall’elevato numero di polimorfismi che possono essere
genotipizzati e dalla loro elevata densità lungo tutto il
genoma

Costituiscono ca il 90% di tutti i polimorfismi presenti
nel genoma umano. A giugno del 2004 nell’uomo è stata
stimata una frequenza per gli SNP pari a 1/700bp

Il recente progresso della genomica ha messo in luce come
una parte rilevante della variabilità tra individui sia da
attribuirsi a polimorfismi a singolo nucleotide
SNP

Gli SNP acquistano particolare rilevanza in campo biomedico
quando possono essere messi in relazione a patologie che non
presentano una trasmissione genetica semplice

Confrontando lo schema e le frequenze degli SNP su geni
potenzialmente coinvolti in patologie e i fenotipi esibiti dai
soggetti portatori, è possibile utilizzare tali sequenze come
marcatori molecolari


PROBLEMI
Attualmente sono poco conosciute le distribuzioni degli SNP
all’interno di diverse popolazioni
Non essendo uguali tutti gli SNP,per capire il loro effetto
sarà importante eseguire un’analisi computazionale prima di
eseguire uno studio relativo al loro eventuale coinvolgimento
in una patologia
Individuazione degli SNP

Il più semplice approccio consiste nell’eseguire il
sequenziamento diretto dei prodotti di PCR di regioni
genomiche contenenti il gene di interesse in individui
diversi

Tale approccio è però molto costoso in quanto richiede lo
studio di primers specifici ed inoltre è limitato a regioni
di cui è nota la sequenza. Quando si presentano doppi
picchi, come negli eterozigoti, non è facile discernere tra
artefatti dovuti al sequenziamento e polimorfismi reali
Individuazione degli SNP

Per ottenere un elevato numero di SNP nell’uomo,
recentemente viene utilizzato un nuovo approccio chiamato
Reduced Representation Shotgun

Il DNA proveniente da diversi individui viene mischiato e
vengono prodotte delle librerie plasmidiche composte da
sottoinsiemi di frammenti di restrizione purificati tramite
elettroforesi su gel. Viene quindi eseguito un sequenziamento
di tipo shotgun su tali librerie e le sequenze che risultano
sovrapponibili vengono allineate, mediante l’impiego di
specifici programmi,andando ad evidenziare i polimorfismi

Genotipizzazione degli SNP mediante microarray...tale
metodica dovrebbe ridurre i problemi associati ai segnali
aspecifici migliorando la qualità dei risultati ottenuti
Scarica

analisi automatica di marcatori genetici polimorfici del dna