corso di Genomica a.a. 2010-2011
lezione 33-34
• laurea magistrale Biotecnologia
Industriale
Venerdì 21 Gennaio 2011
aula 6A
orario : Martedì ore 14.00 - 16.00
Giovedì ore 13.00 - 15.00
Esami: 24 Febbraio, 3 Marzo, 23 Marzo
Lezioni fino al 10 Febbraio
D. Frezza
Mapping 3D long range interactions
Science 9 Oct. 2009 Erez Lieberman - Aiden et al.
Cercare di superare i “bias” (pregiudiziale, risultati
influenzati e spuri, con un vizio nella raccolta, deviante
dalla veridicità, letteralmente : in sbieco)
p. es. voglio avere un campione di controllo e non posso
prenderlo dalle persone che frequentano un ospedale,
oppure tra quelli che frequentano un qualunque posto
dove si verifica una selezione solo per il fatto di andare in
quel posto.
Ci possono essere dei “bias” nel 3C, 4C e 5C,
Tentativo “un-bias” col metodo chiamato Hi-C
= trasformazione dei metodi 3-4-5C ecc con un
sequenziamento massiccio senza selezioni
“mapping” delle interazioni cromosomiche
Partenza sempre dalla fissazione delle interazioni della
cromatina tramite formaldeide
- digestione del DNA con enzimi di restriz.
- “fill-in” (riempimento) con polimerasi per avere “blunt-ends”
(terminazioni piatte del doppio filamento di DNA)
- inserimento di un nucleotide biotinilato (vedetevi la forza
del legame biotina-streptavidina)
- ligasi in condizioni diluite per favorire legami tra frammenti
“cross-linked” bloccati dalla formaldeide e non tra sequenze
indipendenti
- si selezionano i frammenti di DNA che originalmente nel
nucleo erano vicini tra loro al momento della fissazione con
la formaldeide e si marcano con la biotina
-aggiunta di palline “streptavidina” seleziona la library Hi-C
Procedura di sequenziamento “un-biased”
Non si vuole inserire nessuna selezione per non escludere nessuna
interazione.
- sequenziamento massiccio (ridondante) della “library” con creazione di
un catalogo di frammenti che interagiscono.
- analisi di una linea linfoblastoide con cariotipo normale (GN06990) su
due corsie del “Illumina Genome Analyzer”
- 8.4 milioni di doppie eliche con allineamento unico sul genoma
- di cui 6.7 milioni corrispondenti a contatti fra frammenti a distanza
maggiore di 20kb
- costruzione di una matrice genome wide “M” dividendo il genoma in
regioni “loci” di 1 Mb definendola “mii” dove i-j corrispondono a due loci
legati ed interattivi
- visivamente l’intensità del rosso da la frequenza dell’interazione
genomica o dei contatti tra porzioni di genoma (fig 1B)
Figure 1 B affidabilità del metodo Hi-C
Hi-C sta per dire che è meglio dei 3-4-5-C
QuickTime™ e un
decompressore TIFF (LZW)
sono necessari per visualizzare quest'immagine.
Quic kTime™ e un
dec ompres sore TIFF (LZW)
s ono nec es sari per visualiz zare ques t'immagine.
Esempio con sequenze del chrms 14 con l’enzima HindIII e NcoI
Il controllo è fatto tramite ripetizione dell’esperimento il buon risultato ha permesso le
analisi successive
Altre verifiche di affidabilità
Confronto dei dati con nozioni pregresse delle strutture ed
organizzazione del genoma:
- territori cromosomici (tendenza di regioni di cromatina ad
essere vicine ad altre dello stesso cromosoma)
- “patterns” di posizioni sub-nucleari (tendenza di coppie di
cromosomi ad posizionarsi vicino ad altri)
- calcolo della media dei contatti intracromosomiali In(s) di
coppie di loci separati dalla distanza s
- la probabilità di interazione tridimensionale diminuisce in
modo monotonico con l’aumento della distanza (in accordo
con FISH 3D e 3C (chrom conformat.capture)
- distanze maggiori di 200 Mb In(s) sono sempre superiori
della probabilità media di contatto tra cromosomi e questo
implica la presenza di territori cromosomici
Esistenza di contatti tra cromosomi omologhi
Figura 2B
QuickTime™ e un
decompressore TIFF (LZW)
sono necessari per visualizzare quest'immagine.
A aumentando la distanza diminuiscono le interazioni e quelle a bassa
interazione intra chrms sono a basse interazione anche interchrms ed il 10 di più
del 21
B piccoli cromosomi ricchi di geni preferenzialmente interagiscono tra loro (parte
in basso a dx della figura)
didascalia figure 2
Fig. 2.
The presence and organization of chromosome territories. (A) Probability of
contact decreases as a function of genomic distance on chromosome 1,
eventually reaching a plateau at ~90M (blue). The level of interchromosomal
contact (black dashes) differs for different pairs of chromosomes; loci on
chromosome 1 are most likely to interact with loci on chromosome 10 (green
dashes) and least likely to interact with loci on chromosome 21 (red dashes).
Interchromosomal interactions are depleted relative to intrachromosomal
interactions. (B) Observed/expected number of interchromosomal contacts
between all pairs of chromosomes.
Red indicates enrichment, and blue indicates depletion (up to twofold).
Small, gene-rich chromosomes tend to interact more with one another.
risultati congruenti con la letteratura
Risultati non contraddittori con esperimenti con FISH
- gli stessi cromosomi riportati colocalizzano al centro del
nucleo con l’altra tecnica
- chrms 18 piccolo e povero di geni interagisce poco con gli
altri piccoli cromosomi e infatti si colloca nella periferia del
nucleo
focalizzazione sulle interazioni
intracromosomiche
per analizzare la presenza di regioni che si associno
preferenzialmente
siccome la distanza di per sé è un “bias” è stata fatta una
matrice di contatto normalizzata M* dividendo ogni “entry”
(punto o valore) della matrice per la probabilità di contatto su
tutto il genoma alla distanza genomica (fig 3B)
se due loci di 1Mb stanno vicini nello spazio si è pensato che
condividano i confini o vicinanza (neighbors) ed abbiano profili
correlati da cui una nuova matrice altamente significativa : cij
(Pearson correlation) linea ith e colonna jth di M* p 0.05
Figura 3B
QuickTime™ e un
decompressore TIFF (LZW)
sono necessari per visualizzare quest'immagine.
legend to figure 3
The nucleus is segregated into two compartments corresponding to open and closed
chromatin. (A) Map of chromosome 14 at a resolution of 1Mb (1 tick mark = 10Mb)
exhibits substructure in the form of an intense diagonal and a constellation of large blocks
(three experiments combined, range: 0-200 reads). The Observed/expected matrix (B) shows
loci with either more (red) or less (blue) interactions than would be expected given their
genomic distance (range: 0.2 – 5). Correlation matrix (C) illustrates the correlation (red: 1,
blue: −1) between the intrachromosomal interaction profiles of every pair of 1 Mb loci along
chromosome 14. The plaid pattern indicates the presence of two compartments within the
chromosome. (D) Interchromosomal correlation map for chromosome 14 and chromosome
20 (red: 0.25, blue: 0.25). The unalignable region around the centromere of chromosome 20
is indicated in grey. Each compartment on chromosome 14 has a counterpart on
chromosome 20 with a very similar genome-wide interaction pattern. (E,F) We designed
probes for four loci (L1, L2, L3, and L4) that lie consecutively along Chromosome 14 but
alternate between the two compartments (L1, L3 in A; L2, L4 in B). (E) L3 (blue) was
consistently closer to L1 (green) than to L2 (red), despite the fact that L2 lies between L1
and L3 in the primary sequence of the genome. This was confirmed visually and by plotting
the cumulative distribution. (F) L2 (red) was consistently closer to L4 (green) than to L3
(blue). (G) Correlation map of chromosome 14 at a resolution of 100kb. The principal
component (eigenvector) correlates with the distribution of genes and with features of open
chromatin. (H) A 31Mb window from the chromosome 14 is shown; the indicated region
(yellow dashes) alternates between the open and closed in compartment in GM06990 (top,
eigenvector and heatmap), but is predominantly open in K562 (bottom, eigenvector and
heatmap). The change in compartmentalization corresponds to a shift in chromatin state
(DNAseI).
Fig 4 AB
Fino a 200 “reads” letture di sequenza
QuickTime™ e un
decompressore TIFF (LZW )
sono necessari per visualizzare quest'immagine.
Purtroppo la qualità è scarsa, siete pregati di guardare la
figura direttamente sul pdf dell’articolo
Fig 4 CD localizzazione nucleare
QuickTime™ e un
decompressore TIFF (LZW )
sono necessari per visualizzare quest'immagine.
Legend to figure 4
Fig. 4.
The local packing of chromatin is consistent with the behavior of a fractal globule. (A)
Contact probability as a function of genomic distance, averaged across the genome (blue)
shows a power law scaling between 500kb and 7Mb (shaded region) with a slope of −1.08
(fit shown in cyan). (B) Simulation results for contact probability as a function of distance (1
monomer~6 nucleosomes~1200 bp, SOM) for equilibrium (red) and fractal (blue) globules.
The slope for a fractal globule is very nearly −1 (cyan), confirming our prediction (SOM).
The slope for an equilibrium globule is −3/2, matching prior theoretical expectations. The
slope for the fractal globule closely resembles the slope we observed in the genome. (C)
Top: An unfolded polymer chain, 4000 monomers (4.8 Mb) long. Coloration corresponds to
distance from one endpoint, ranging from blue to cyan, green, yellow, orange, and red.
Middle: An equilibrium globule. The structure is highly entangled; loci that are nearby along
the contour (similar color) need not be nearby in 3D. Bottom: A fractal globule. Nearby loci
along the contour tend to be nearby in 3D, leading to monochromatic blocks both on the
surface and in cross-section. The structure lacks knots. (D) Genome architecture at three
scales. Top: Two compartments, corresponding to open and closed chromatin, spatially
partition the genome. Chromosomes (blue, cyan, green) occupy distinct territories. Middle:
Individual chromosomes weave back-and-forth between the open and closed chromatin
compartments. Bottom: At the scale of single megabases, the chromosome consists of a
series of fractal globules.t
Scarica

Lez_33-34_Genomic_21-1