corso di Genomica a.a. 2010-2011 lezione 33-34 • laurea magistrale Biotecnologia Industriale Venerdì 21 Gennaio 2011 aula 6A orario : Martedì ore 14.00 - 16.00 Giovedì ore 13.00 - 15.00 Esami: 24 Febbraio, 3 Marzo, 23 Marzo Lezioni fino al 10 Febbraio D. Frezza Mapping 3D long range interactions Science 9 Oct. 2009 Erez Lieberman - Aiden et al. Cercare di superare i “bias” (pregiudiziale, risultati influenzati e spuri, con un vizio nella raccolta, deviante dalla veridicità, letteralmente : in sbieco) p. es. voglio avere un campione di controllo e non posso prenderlo dalle persone che frequentano un ospedale, oppure tra quelli che frequentano un qualunque posto dove si verifica una selezione solo per il fatto di andare in quel posto. Ci possono essere dei “bias” nel 3C, 4C e 5C, Tentativo “un-bias” col metodo chiamato Hi-C = trasformazione dei metodi 3-4-5C ecc con un sequenziamento massiccio senza selezioni “mapping” delle interazioni cromosomiche Partenza sempre dalla fissazione delle interazioni della cromatina tramite formaldeide - digestione del DNA con enzimi di restriz. - “fill-in” (riempimento) con polimerasi per avere “blunt-ends” (terminazioni piatte del doppio filamento di DNA) - inserimento di un nucleotide biotinilato (vedetevi la forza del legame biotina-streptavidina) - ligasi in condizioni diluite per favorire legami tra frammenti “cross-linked” bloccati dalla formaldeide e non tra sequenze indipendenti - si selezionano i frammenti di DNA che originalmente nel nucleo erano vicini tra loro al momento della fissazione con la formaldeide e si marcano con la biotina -aggiunta di palline “streptavidina” seleziona la library Hi-C Procedura di sequenziamento “un-biased” Non si vuole inserire nessuna selezione per non escludere nessuna interazione. - sequenziamento massiccio (ridondante) della “library” con creazione di un catalogo di frammenti che interagiscono. - analisi di una linea linfoblastoide con cariotipo normale (GN06990) su due corsie del “Illumina Genome Analyzer” - 8.4 milioni di doppie eliche con allineamento unico sul genoma - di cui 6.7 milioni corrispondenti a contatti fra frammenti a distanza maggiore di 20kb - costruzione di una matrice genome wide “M” dividendo il genoma in regioni “loci” di 1 Mb definendola “mii” dove i-j corrispondono a due loci legati ed interattivi - visivamente l’intensità del rosso da la frequenza dell’interazione genomica o dei contatti tra porzioni di genoma (fig 1B) Figure 1 B affidabilità del metodo Hi-C Hi-C sta per dire che è meglio dei 3-4-5-C QuickTime™ e un decompressore TIFF (LZW) sono necessari per visualizzare quest'immagine. Quic kTime™ e un dec ompres sore TIFF (LZW) s ono nec es sari per visualiz zare ques t'immagine. Esempio con sequenze del chrms 14 con l’enzima HindIII e NcoI Il controllo è fatto tramite ripetizione dell’esperimento il buon risultato ha permesso le analisi successive Altre verifiche di affidabilità Confronto dei dati con nozioni pregresse delle strutture ed organizzazione del genoma: - territori cromosomici (tendenza di regioni di cromatina ad essere vicine ad altre dello stesso cromosoma) - “patterns” di posizioni sub-nucleari (tendenza di coppie di cromosomi ad posizionarsi vicino ad altri) - calcolo della media dei contatti intracromosomiali In(s) di coppie di loci separati dalla distanza s - la probabilità di interazione tridimensionale diminuisce in modo monotonico con l’aumento della distanza (in accordo con FISH 3D e 3C (chrom conformat.capture) - distanze maggiori di 200 Mb In(s) sono sempre superiori della probabilità media di contatto tra cromosomi e questo implica la presenza di territori cromosomici Esistenza di contatti tra cromosomi omologhi Figura 2B QuickTime™ e un decompressore TIFF (LZW) sono necessari per visualizzare quest'immagine. A aumentando la distanza diminuiscono le interazioni e quelle a bassa interazione intra chrms sono a basse interazione anche interchrms ed il 10 di più del 21 B piccoli cromosomi ricchi di geni preferenzialmente interagiscono tra loro (parte in basso a dx della figura) didascalia figure 2 Fig. 2. The presence and organization of chromosome territories. (A) Probability of contact decreases as a function of genomic distance on chromosome 1, eventually reaching a plateau at ~90M (blue). The level of interchromosomal contact (black dashes) differs for different pairs of chromosomes; loci on chromosome 1 are most likely to interact with loci on chromosome 10 (green dashes) and least likely to interact with loci on chromosome 21 (red dashes). Interchromosomal interactions are depleted relative to intrachromosomal interactions. (B) Observed/expected number of interchromosomal contacts between all pairs of chromosomes. Red indicates enrichment, and blue indicates depletion (up to twofold). Small, gene-rich chromosomes tend to interact more with one another. risultati congruenti con la letteratura Risultati non contraddittori con esperimenti con FISH - gli stessi cromosomi riportati colocalizzano al centro del nucleo con l’altra tecnica - chrms 18 piccolo e povero di geni interagisce poco con gli altri piccoli cromosomi e infatti si colloca nella periferia del nucleo focalizzazione sulle interazioni intracromosomiche per analizzare la presenza di regioni che si associno preferenzialmente siccome la distanza di per sé è un “bias” è stata fatta una matrice di contatto normalizzata M* dividendo ogni “entry” (punto o valore) della matrice per la probabilità di contatto su tutto il genoma alla distanza genomica (fig 3B) se due loci di 1Mb stanno vicini nello spazio si è pensato che condividano i confini o vicinanza (neighbors) ed abbiano profili correlati da cui una nuova matrice altamente significativa : cij (Pearson correlation) linea ith e colonna jth di M* p 0.05 Figura 3B QuickTime™ e un decompressore TIFF (LZW) sono necessari per visualizzare quest'immagine. legend to figure 3 The nucleus is segregated into two compartments corresponding to open and closed chromatin. (A) Map of chromosome 14 at a resolution of 1Mb (1 tick mark = 10Mb) exhibits substructure in the form of an intense diagonal and a constellation of large blocks (three experiments combined, range: 0-200 reads). The Observed/expected matrix (B) shows loci with either more (red) or less (blue) interactions than would be expected given their genomic distance (range: 0.2 – 5). Correlation matrix (C) illustrates the correlation (red: 1, blue: −1) between the intrachromosomal interaction profiles of every pair of 1 Mb loci along chromosome 14. The plaid pattern indicates the presence of two compartments within the chromosome. (D) Interchromosomal correlation map for chromosome 14 and chromosome 20 (red: 0.25, blue: 0.25). The unalignable region around the centromere of chromosome 20 is indicated in grey. Each compartment on chromosome 14 has a counterpart on chromosome 20 with a very similar genome-wide interaction pattern. (E,F) We designed probes for four loci (L1, L2, L3, and L4) that lie consecutively along Chromosome 14 but alternate between the two compartments (L1, L3 in A; L2, L4 in B). (E) L3 (blue) was consistently closer to L1 (green) than to L2 (red), despite the fact that L2 lies between L1 and L3 in the primary sequence of the genome. This was confirmed visually and by plotting the cumulative distribution. (F) L2 (red) was consistently closer to L4 (green) than to L3 (blue). (G) Correlation map of chromosome 14 at a resolution of 100kb. The principal component (eigenvector) correlates with the distribution of genes and with features of open chromatin. (H) A 31Mb window from the chromosome 14 is shown; the indicated region (yellow dashes) alternates between the open and closed in compartment in GM06990 (top, eigenvector and heatmap), but is predominantly open in K562 (bottom, eigenvector and heatmap). The change in compartmentalization corresponds to a shift in chromatin state (DNAseI). Fig 4 AB Fino a 200 “reads” letture di sequenza QuickTime™ e un decompressore TIFF (LZW ) sono necessari per visualizzare quest'immagine. Purtroppo la qualità è scarsa, siete pregati di guardare la figura direttamente sul pdf dell’articolo Fig 4 CD localizzazione nucleare QuickTime™ e un decompressore TIFF (LZW ) sono necessari per visualizzare quest'immagine. Legend to figure 4 Fig. 4. The local packing of chromatin is consistent with the behavior of a fractal globule. (A) Contact probability as a function of genomic distance, averaged across the genome (blue) shows a power law scaling between 500kb and 7Mb (shaded region) with a slope of −1.08 (fit shown in cyan). (B) Simulation results for contact probability as a function of distance (1 monomer~6 nucleosomes~1200 bp, SOM) for equilibrium (red) and fractal (blue) globules. The slope for a fractal globule is very nearly −1 (cyan), confirming our prediction (SOM). The slope for an equilibrium globule is −3/2, matching prior theoretical expectations. The slope for the fractal globule closely resembles the slope we observed in the genome. (C) Top: An unfolded polymer chain, 4000 monomers (4.8 Mb) long. Coloration corresponds to distance from one endpoint, ranging from blue to cyan, green, yellow, orange, and red. Middle: An equilibrium globule. The structure is highly entangled; loci that are nearby along the contour (similar color) need not be nearby in 3D. Bottom: A fractal globule. Nearby loci along the contour tend to be nearby in 3D, leading to monochromatic blocks both on the surface and in cross-section. The structure lacks knots. (D) Genome architecture at three scales. Top: Two compartments, corresponding to open and closed chromatin, spatially partition the genome. Chromosomes (blue, cyan, green) occupy distinct territories. Middle: Individual chromosomes weave back-and-forth between the open and closed chromatin compartments. Bottom: At the scale of single megabases, the chromosome consists of a series of fractal globules.t