CORSO DI LAUREA SPECIALISTICA IN BIOTECNOLOGIE DEL FARMACO Adriana Maggi BASI MOLECOLARI DELL’AZIONE DEL FARMACO BIOTECNOLOGIE FARMACOLOGICHE LEZIONE 4 http://users.unimi.it/mpl/lezioni.html STUDIO DELLA FUNZIONE GENICA ARRAY MACROARRAY MICROARRAY DNA microarray (o gene/genome chip, DNA chip, o gene array) è una collezione di depositi puntiformi di DNA, ciascun punto rapresentante un singolo gene immobilizzati su un supporto (vetro, plastica o silicone) mediante legami di tipo irreversibile. Esempio di microarray con 40.000 oligo immobilizzati su supporto solido e ibridati con cDNA APPLICAZIONI DI ARRAY: • SNP detection arrays – per identificare Single nucleotide polymorphism nel genoma di diverse popolazioni • comparative genomic hybridization (Array CGH) – per identificare riarragiamenti coinvolgenti un numero significtativo di basi • mRNA or gene expression profiling – per studiare I livelli di espressione di migliaia di geni simultaneamente • Chromatin immunoprecipitation (chIP) studies – per determinare il legame di specifche proteine in porzioni specifiche del DNA (ChIP-on-chip technology) Siti polimorfici per singola sostituzione di base (SNP) polimorfismo a singolo nucleotide •di base Nel genoma umano ci sono 200.000 SNP all’interno di sequenze codificanti, alcuni di questi possono essere marcatori di patologia http://www.ncbi.nlm.nih.gov/About/primer/snps.html Siti polimorfici per singola sostituzione di base (SNP) Individuo 1 Individuo 2 Gli SNP sono la causa di circa il 90% della variabilità genetica umana ed in genere si trova uno SNP ogni 100300 pb. 2/3 SNP vedono sostituita la C con T. Perchè una variazione possa essere considerata un SNP deve essere presente in almeno l’1% della popolazione Metodi di identificazione di SNP IBRIDAZIONE ALLELE-SPECIFICA REAZIONE DI ELONGAZIONE DI PRIMER FISSATO SU SUPPORTO SOLIDO 3’ AC AT CG TAGC DNA is denatured and mixed with oligonudeotides and ligase. The ligase joins pairs of oligonudeotides annealed head to tail if they are correctly base-paired at the junction. Radioactively labeled oligonudeotides (*) are immobilized and detected by autoradiography only if ligated to biotinylated oligonucleotides (B) that can be bound to streptavidin on a solid support. LANDEGREN, et al. Science 1998 Michiel J. T. van Eijk*, et al. NAR 2004 BANCHE DATI E IDENTIFICAZIONE DI SNP dbSNP sono presenti (“annotati”) in diverse banche dati quali: PubMed, genome project sequences, GenBank records, the Entrez Gene database, and the dbSTS database of sequence tagged sites. mRNA or gene expression profiling Genes x Cells Drugs x Cells Clustered Image Maps Genes x Drugs Database Microarray Experiment Sets Sample Profiles Genomics and bioinformatics group NCI and NIH Studio di proteine che interagiscono con DNA ChIP-on-chip (o ChIP-chip) è una tecnica che combina la immunoprecipitazione di cromatina (chromatin immunoprecipitation "ChIP” con la tecnologia del micro array(microarray technology “chip"). read-out Normalizzazione dei dati e analisi esplorativa dei dati Sito DNA “estrazione delle informazioni” arricchimento proteina di interesse Le prime analisi si sono focalizzate sulle differenze tra animali in Proestro e Metestro, per vedere se la differenza dei livelli di Estradiolo circolante avesse degli effetti sull’espressione genica. Come atteso, gli animali LID non mostrano nessuna significativa differenza nell’espressione genica nelle due fasi del ciclo, come se quest’ultimo fosse appiattito. Gli animali WT, al contrario, mostrano deboli ma rilevabili differenze nelle due fasi; tuttavia, il quadro osservato e’ totalmente inatteso, in quanto i geni differenzialmente espressi sono tutti geni MAGGIORMENTE espressi nella fase di metestro o, guardando all’inverso, downregolati nella fase di Proestro. Considerando cio’ che abbiamo sempre osservato, vale a dire un’attivazione del recettore degli estrogeni in fase di proestro, questo stupisce. Upregulated in M WT M vs WT P WT P vs WT M SEM Analysis Downregulated in P GO Term Analysis Una volta identificati i trascritti differenzialmente espressi nei due gruppi (t test & SAM analysis, tenendo in considerazione solo quelli con Fold Indution >=1,5), si cerca di capire se questi geni sono implicati in determinati ‘Biological Process’ o hanno particolari ‘Molecular Function’ o interferiscono in un determinato ‘Pathway’. Questa analisi si puo’ fare a diversi “livelli”, i risultati riportati si riferiscono ad un livello piuttosto superficiale, ma per questo piu’ generale e credo indicativo. Riporto: - BP = Biological Process - MF = Molecular Function - Pathway L’analisi e’ stata fatta principalmente con DAVID http://david.abcc.ncifcrf.gov/summary.jsp piu’ molti altri software e websites (le risorse sono infinite) Biological Process - WTall vs LIDall Considerando tutti i trascritti differentemente espressi, sia upregolati che downregolati. Term BP00019:Lipid, fatty acid and steroid metabolism BP00076:Electron transport BP00020:Fatty acid metabolism BP00013:Amino acid metabolism BP00180:Detoxification BP00064:Protein phosphorylation BP00148:Immunity and defense BP00150:MHCI-mediated immunity BP00001:Carbohydrate metabolism BP00143:Cation transport BP00295:Steroid metabolism BP00063:Protein modification BP00271:Other homeostasis activities BP00273:Chromatin packaging and remodeling BP00069:Protein disulfide-isomerase reaction BP00267:Homeostasis BP00147:Other transport BP00044:mRNA transcription regulation BP00008:Tricarboxylic acid pathway BP00151:MHCII-mediated immunity BP00289:Other metabolism BP00156:Interferon-mediated immunity Count % PValue 40 25 17 9 11 31 25 27 11 42 10 32 4 13 9 5 4 87 5 15 30 3 20.00% 12.50% 8.50% 4.50% 5.50% 15.50% 12.50% 13.50% 5.50% 21.00% 5.00% 16.00% 2.00% 6.50% 4.50% 2.50% 2.00% 43.50% 2.50% 7.50% 15.00% 1.50% 1.57E-19 1.96E-08 9.20E-04 9.33E-04 1.92E-03 1.98E-03 4.40E-03 7.00E-03 7.97E-03 9.66E-03 1.21E-02 1.52E-02 2.77E-02 3.04E-02 3.12E-02 3.63E-02 4.27E-02 4.74E-02 4.83E-02 6.80E-02 7.38E-02 8.79E-02 I geni per ogni categoria sono nel file Excel ‘Panther_BP_WTall_vs_LIDAll.xls’ Molecular Function - WTall vs LIDall Term MF00123:Oxidoreductase MF00124:Oxygenase MF00140:Other transferase MF00087:Transfer/carrier protein MF00099:Small GTPase MF00082:Transporter MF00212:Other G-protein modulator MF00131:Transferase MF00007:Interferon receptor MF00254:Actin and actin related protein MF00174:Complement component MF00042:Nucleic acid binding MF00126:Dehydrogenase MF00005:Cytokine receptor MF00224:KRAB box transcription factor MF00074:Translation release factor MF00063:Histone MF00213:Non-receptor serine/threonine protein kinase MF00033:Voltage-gated calcium channel MF00211:Kinase activator MF00118:Synthase and synthetase MF00242:RNA helicase MF00217:Other proteases Count 33 26 12 12 29 13 36 27 4 13 6 74 9 6 52 4 5 43 12 11 4 16 7 I geni per ogni categoria sono nel file Excel ‘Panther_MF_WTAll_vs_LIDAll.xls’ % 16.50% 13.00% 6.00% 6.00% 14.50% 6.50% 18.00% 13.50% 2.00% 6.50% 3.00% 37.00% 4.50% 3.00% 26.00% 2.00% 2.50% 21.50% 6.00% 5.50% 2.00% 8.00% 3.50% PValue 1.69E-16 4.86E-13 2.09E-04 9.62E-04 2.01E-03 3.45E-03 3.71E-03 6.35E-03 6.86E-03 1.72E-02 1.91E-02 2.68E-02 3.83E-02 5.09E-02 5.62E-02 6.44E-02 7.09E-02 7.30E-02 7.52E-02 8.12E-02 9.05E-02 9.49E-02 9.83E-02 Gene Ontology http://www.geneontology.org/index.shtml Un progetto atto a costruire un vocabolario per descrivere geni e prodotti genici attribuibili a ogni organismo Questo vocabolario serve per dare un unico nome a un specifico prodotto in modo che questi così compaia nelle diverse banche dati e possa venire rapidamente ritrovato Ogni gene/proteina si contraddistingue per un numero identificativo unico (GO:nnnnnnn) e un nome (es: cellula, fibroblasto, fattore di crescita, trasduttore del segnale). Ogni termine viene assegnato a una delle tre suddivisioni della banca (ontology): 1. Funzioni molecolari 2. Componenti cellulari 3. Componenti I processi biologici The three organizing principles of GO are cellular component, biological process and molecular function. A gene product might be associated with or located in one or more cellular components; it is active in one or more biological processes, during which it performs one or more molecular functions. For example, the gene product cytochrome c can be described by the molecular function term oxidoreductase activity, the biological process terms oxidative phosphorylation and induction of cell death, and the cellular component terms mitochondrial matrix and mitochondrial inner membrane. Topology The ontologies are structured as directed acyclic graphs, which are similar to hierarchies but differ in that a more specialized term (child) can be related to more than one less specialized term (parent). For example, the biological process term hexose biosynthetic process has two parents, hexose metabolic process and monosaccharide biosynthetic process. This is because biosynthetic process is a type of metabolic process and a hexose is a type of monosaccharide. When any gene involved in hexose biosynthetic process is annotated to this term, it is automatically annotated to both hexose metabolic process and monosaccharide biosynthetic process. I LIMITI DELLA ANALISI GENOMICA: RIPRODUCIBILITA’ ANALISI NON QUANTITATIVA I mRNA NON RIFLETTONO ESATTAMENTE LE PROTEINE PRESENTI NELLA CELLULA proteomica Il fine della proteomica consiste nella completa identificazione delle proteine e della loro espressione in determinati cellule o tessuti La metodologia su cui si basa la proteomica comprende: gel elettroforesi bidimensionale; HPLC e spettrometria di massa • (20,000 to 25,000 genes vs. > 500,000 proteins). • E’ stato calcolato che il corpo umano puo’ esprimere fino a 2 milioni di proteine, ciascuna con differenti funzioni I metodi della proteomica dagli anni ‘70: gel elettroforesi bidimensionale Limiti di definizione e riproducibilità •Anni ’90 spettrometria di massa con metodi di ionizzazione alternativi (electrospray o MALDI Matrix Assisted Laser Desorption Ionization ) Non si amplificano le proteine: dimensione campioni Identificazione dei peptidi da miscele complesse Rapidità Analisi quantitativa Limiti nelle conoscenze di genomi da diversi organismi Disponibilità di strumentazione electrospray ionization liquid chromatography mass spectrometry John Bennett Fenn ha ricevuto il premio Nobel per la chimica nel 2002 per lo sviluppo della tecnica di elettrospray per l’analisi di macromolecole biologiche Stable isotope labeling with amino acids in cell culture (SILAC) per analisi proteomica quantitativa Functional and quantitative proteomics using SILAC SILAC (Stable isotope labelling with amino acids in cell culture) Mann Nature Reviews Molecular Cell Biology 7, 952–958 (December 2006) | doi:10.1038/nrm2067 Proteomica e trascrittomica a confronto Uno studio in cui si sono comparati i dati di analisi di cellule MCF-7 Su un totale di 7278 geni identificati in modo univoco come messaggi o proteine 55% provengono da analisi proteomica 77% provengono da microarray LE PROSPETTIVE DELLA PROTEOMICA: • continuo progresso della tecnologia per misure sempre più su larga scala e rapide • costruzione di banche dati • protomica interviene in cellule dove mRNA non è informativo (es cellule ematiche) • La misura proteomica fornisce l’end point, il microarray va verificato con qPCR e da western • La proteomica permette di studiare la presenza di modificazioni post-traduzionali, di interazioni proteina-proteina INTERATTOMICA analisi del trascrittoma, del proteoma e dell’interattoma comparati per arrivare a definire le funzioni fisiologiche di ciascun gene L’INTERATTOMA O BIOLOGIA DEI SISTEMI (system biology) L’interattoma rappresenta interazioni molecolari con un sistema digrafico Per grafico intendiamo un insieme di punti, nodi o vertici che sono tra loro collegati non in modo unidirezionale. Nel digrafico la direzionalità o bidirezionalità dell’evento è segnata ‘OMICS APPLICAZIONI MEDICHE Test genetici Terapia genica Farmacogenomica Informazioni sulla malattia