Alessia Stell Laboratorio A. Maggi 9 Novembre 2010 Cosa sono Come si producono Microarray e Tiling Arrays Quali utilizzi hanno Cosa sono i chip a DNA • I chip a DNA sono costituiti da un array di microscopiche aree, ciascuna contenente 107 sonde identiche di 20-50 pb, covalentemente fissate al supporto (vetro, plastica, silicio o beads di polistirene) • Sfruttano una tecnica di ibridazione inversa: le probe sono fissate al supporto (in una posizione nota), mentre i frammenti di DNA da analizzare (target) sono marcati con biotina o con marker fluorescenti e ibridizzati alle sonde • Il DNA target, legato alla sonda, può essere identificato utilizzando uno scanner, capace di rivelare il segnale emesso Cosa sono i chip a DNA • I chip a DNA sono costituiti da un array di microscopiche aree, ciascuna contenente 107 sonde identiche di 20-50 pb, covalentemente fissate al supporto (vetro, plastica, silicio o beads di polistirene) • Sfruttano una tecnica di ibridazione inversa: le probe sono fissate al supporto (in una posizione nota), mentre i frammenti di DNA da analizzare (target) sono marcati con biotina o con marker fluorescenti e ibridizzati alle sonde • Il DNA target, legato alla sonda, può essere identificato utilizzando uno scanner, capace di rivelare il segnale emesso Cosa sono i chip a DNA • I chip a DNA sono costituiti da un array di microscopiche aree, ciascuna contenente 107 sonde identiche di 20-50 pb, covalentemente fissate al supporto (vetro, plastica, silicio o beads di polistirene) • Sfruttano una tecnica di ibridazione inversa: le probe sono fissate al supporto (in una posizione nota), mentre i frammenti di DNA da analizzare (target) sono marcati con biotina o con marker fluorescenti e ibridizzati alle sonde • Il DNA target, legato alla sonda, può essere identificato utilizzando uno scanner, capace di rivelare il segnale emesso Come si producono • FOTOLITOGRAFIA (in situ): Fasci di luce e maschere fotolitografiche sono utilizzati per produrre le sonde direttamente sul supporto; • SPOTTED MICROARRAYS: Le sonde sono sintetizzate prima della loro deposizione sull’array, e solo successivamente “spottati” sul supporto. Microarray e Tiling array • MICROARRAY DI ESPRESSIONE: le sonde utilizzate rappresentano porzioni di trascritti noti Gene 1 Gene 2 • TILING ARRAYS: coprono l’intero genoma o porzioni definite di genoma (tutti i promotori, solo alcuni cromosomi…) Gene 1 Gene 2 Quali utilizzi hanno • MICROARRAY DI ESPRESSIONE: utilizzati quasi esclusivamente per l’analisi dei livelli di espressione di trascritti noti, confrontata in diverse condizioni (es. controllo-trattamento, cellula sana-cellula tumorale etc.) Gene 1 Gene 2 • TILING ARRAYS: Utilizzati per • analisi unbiased dell’espressione genica (geni non noti e miRNA); • ChIP-on-chip (chromatin immunoprecipitation on a chip) • Array CGH (comparative genomic hybridization): tecnica usata in diagnostica per l’individuazione di copy number variations e anomalie del DNA Gene 1 Gene 2 da dove siamo partiti dove volevamo arrivare quali tecnologie abbiamo usato I gruppi sperimentali Da dove siamo partiti • Gli estrogeni sono i principali ormoni sessuali nella donna ed influenzano la fisiologia femminile sotto vari aspetti • Gli estrogeni permeano nelle cellule e legano il loro specifico recettore, una proteina intracellulare che , una volta attivata, è in grado di dimerizzare e attivare la trascrizione di specifici geni Cervello Sistema Cardiovascolare Sistema Riproduttivo Osso Da dove siamo partiti • Il modello animale utilizzato nel nostro laboratorio per lo studio dell’attivazione del recettore degli estrogeni in vivo è il modello ERE-Luc Luciferasi Estrogen Receptor Responsive Element Fotoni Luciferasi Luciferina + ATP Estrogen Receptor Responsive Element CA Da dove siamo partiti • Con questo modello abbiamo osservato l’attività del recettore degli estrogeni in condizioni fisiologiche nell’animale femmina ciclante, e ci siamo focalizzati sullo studio del ruolo del recettore degli estrogeni nel fegato OVARIECTOMIA + induzione con ESTRADIOLO CONDIZIONE FISIOLOGICA 1500 pg/ml pg/ml 10 pg/ml OVARIE 80 pg/ml 40 pg/ml 10 pg dove volevamo arrivare Prepuberi Femmine adulte ciclanti > 22 mesi (menopausa) Gravide quali tecnologie abbiamo usato Microarray di espressione Tiling Arrays Analisi delle differenze di espressione genica nelle due diverse condizioni Analisi delle regioni di binding sulla cromatina di ERalfa nelle due diverse condizioni I livelli di estrogeni circolanti influenzano l’espressione genica? Quali sono i geni differenzialmente espressi? Dove si localizza ERalfa? La sua localizzazione è influenzata dagli estrogeni circolanti? I gruppi sperimentali OVARIECTOMIA + induzione con ESTRADIOLO CONDIZIONE FISIOLOGICA 1500 pg/ml 80 pg/ml 40 pg/ml 10 pg/ml CONDIZIONE FISIOLOGICA OVARIECTOMIA + induzione con ESTRA 1500 pg/ml 80 pg/ml 40 pg/ml 10 pg/ml METESTRO PROESTRO Bassi livelli di estrogeno circolante Alti livelli di estrogeno circolante Workflow Output Analisi dei Dati Risultati Workflow Microarrays Congelamento Estrazione RNA Retrotrascrizione Marcatura Ibridazione Output Quasi 40.000 trascritti conosciuti Output I dati grezzi vengono raccolti in un file: File CEL E normalizzati: file RMA … e analizzati grazie all’aiuto del team di bioinformatici Met > Pro Livello E2 Output Lista dei geni individuati Met < Pro Pro Met Analisi dei dati Come otteniamo informazioni da questa lista di geni? Analizzandoli uno ad uno…. … o utilizzando specifici software che consentono di ottenere in modo semplice informazioni sulla funzione dei geni identificati CATEGORIE DI GENE ONTOLOGY Analisi dei dati • GENE ONTOLOGY: può essere considerato una specie di enciclopedia che raccoglie tutte le informazioni disponibili sui geni noti, attraverso delle definizioni e delle parole chiave condivise. • E’ suddiviso in 3 categorie: • Processi biologici • Funzioni molecolari • Componenti cellulari Un prodotto genico ha una o più funzioni cellulari, può essere coinvolto in diversi processi biologici e infine potrebbe essere associato a diversi compartimenti cellulari. http://www.geneontology.org/ http://www.geneontology.org/GO.tools.browsers.shtml http://david.abcc.ncifcrf.gov/home.jsp Risultati BIOSINTESI DEI LIPIDI e COLESTEROLO Met > Pro (pVal=5.10 e-6) A B C D E F 16% DETOXIFICATION (pVal=1.20 e-4) G H REGOLAZIONE della TRASCRIZIONE dell’mRNA Met < Pro (pVal=4.80 e-2) I L M Risultati Biosintesi degli acidi grassi Biosintesi del colesterolo Ciclo Krebs B Z X W J Y C E D …. F TG Workflow e messa a punto Output Analisi dei dati Risultati Workflow e messa a punto Crosslinking Sonicazione 500 100 DNA Crosslinking inverso Purificazione DNA LM-Amplification Frammentazione Marcatura Ibridazione Binding Regions ChIP-chip Immunoprecipitazione mRNA Output Cutoff 1. Rilevazione del segnale relativo alle sequenze Chipped, e posizionamento sul DNA 2. Definizione dei picchi relativi alle regioni di binding tramite specifico algoritmo 3. Normalizzazione e analisi dei picchi che superano il limite di cutoff Output Chr 10 23476246 23477332 BED file Analisi dei dati http://cistrome.dfci.harvard.edu/ap/ Analizzandoli uno ad uno…. … chiedendo l’aiuto dei bioinformatici che hanno creato di sicuro qualche software che ti sarà d’aiuto Analisi dei dati > > > > • Dove si localizzano (cromosomi) • Dove si localizzano rispetto a geni noti • Quali sequenze legano • Quali sono i geni che si trovano nelle vicinanze? • http://genome.ucsc.edu/ Chr 10 Risultati 553 siti di binding 15% 444 siti di binding Risultati Proestro 27% Metestro 12% 18% 28% 51% 58% Geni che presentano un sito di binding a PROESTRO nell’intorno di 20kb Geni che presentano un sito di binding a METESTRO nell’intorno di 20kb Regolazione dell’espressione genica (pVal=8.50 e-5) Regolazione dell’attività riproduttiva (pVal=3.90 e-4) Metabolismo dei lipidi e del colesterolo (pVal=1.30 e-3) Reagolazione dell’attività riproduttiva (pVal=1.40 e-3) Significato biologico Real time PCR Esperimenti sull’animale Real Time PCR • I geni epatici coinvolti nel metabolismo degli acidi grassi e del colesterolo mostrano un andamento regolare durante il ciclo regolato dalla fluttuazione di estrogeni circolanti ACLY FASN *** *** 4 *** 4 *** ELOVL6 *** * 3 *** ** * 3 3 2 2 2 1 1 1 0 0 P E M P D ** M D 0 P * ** 2.5 2.0 3 1.5 1.5 2 1.0 1.0 1 0.5 0.5 0.0 E M D P Fatty acid biosynthetic pathway E *** *** 2.5 2.0 0 M M D DHCR7 * 4 P E PMVK MVD 5 E D *** 0.0 P Cholesterol biosynthetic pathway E M D trus DHCR7 5 ** 2.0 ** MVD ** 2.0 1.5 1.5 1.0 1.0 0.5 0.5 0.0 0.0 PMVK DHCR7 M 2 1 1 DHCR7 2.5 PMVK **** ** ** 1.52.0 1.01.5 0.5 1.0 0.0 0.5 MVD 5 4 3 2 1 0 2.5 5 P Fold Induction Over Proestrus 3 Fold Induction Over Proestrus M D pr ep uDb pr er eppr uebg na e rn p2r 2 t egm nao n 22 ntth s m on th s EM P E ** *** *** P 2.02.5 pr D D pr e ep pu be ub r e p pr rr eg eg na na 22 22 nt nt m m on o th nth s s M E P 4 D pr ep ub er pr eg na 22 nt m on th s 2.5 ** 0.0 M 11 E 2 2 2 E 3 P ACLY ELOVL6 ** *** * *** Fold Induction Over Proestrus 3 P 1 Fold Induction Over Proestr 2 Fold Induction Over Proestrus D pr ep ub er pr eg na 22 nt m on th s M * Fold Induction Over Proestrus • I geni epatici coinvolti nel metabolismo lipidico e del colesterolo 0 appaiono sregolati durante0 le diverse fasi fisiologiche 0 della vita di una donna E 3 Fold Induction Over Proestrus M D pr D eppr uebp u pr p erber egre nagn 22 2m2 ntant om nto hnst hs M E P Fold Induction Over Proestrus ** P 2.5 D 0 p 1 4 3 re pr pu D e b pr pu er e b pr gnaer 22 e nt mgn 22 onat nt m hs on th s ELOVL6 M 2 E FASN M * 0 0 E 0 E 1 P 2 P 3 Fold FoldInduction InductionOver OverProestrus Proestrus * FoldInduction Induction Over Proestrus Fold Over Proestrus D pr ep ub er pr eg na 22 nt m on th s M ** PP 3 D pr ep ub er pr eg na 22 nt m on th s M E P Fold Induction Over Proestrus 4 trus 2.5 E P Fold Induction Over Proestrus Real Time PCR 4 * 2.0 1.5 1.0 0.5 0.0 4 3 2 1 0 Successivi esperimenti sull’animale Prepuberi Femmine adulte ciclanti > 22 mesi (menopausa) Gravide • Il livello di espressione dei geni epatici coinvolti nel metabolismo lipidico e del colesterolo appaiono sregolati durante le diverse fasi fisiologiche della vita di una donna • Si modifica anche il contenuto di lipidi del sangue e del fegato? • Qual è la conseguenza biologica? • Come può essere ripristinato il profilo lipidico corretto? [email protected]