Bioinformatica Banche dati specializzate Banche dati specializzate } PDB: Banca dati strutture proteiche 3D; } SNP – Single Nucleotide Polymorphism (integrato in NCBI): Banca dati delle mutazioni; } GEO Gene Expression Omnibus (integrato in NCBI): Database di dataset e espressioni geniche provenienti da esperimenti di microarray; } Genome (Initegrato in NCBI): Browser genomico; } UCSC Genome Browser: Browser genomico (CENNI); } ENSEMBL: Browser Genomico (CENNI); } GO Gene Ontologies:Vocabolario unificato per la descrizione di tutte le funzioni dei geni e dei prodotti genici in generale; 2 Bioinformatica Banche dati specializzate } BioSystems – Pathways (Integrato in NCBI); } KEGG Pathway Database; } Pathway Commons; } TarBase: microRNA Database; } Mirò: Dati riguardanti miRNA e geni corredati anche da informazioni su processi, funzioni e malattie correlate; } mirBase: microRNA Database; } EST(Expressed Sequence Tag ): E’ una collezione di brevi sequenze di acidi nucleici provenienti da genbank. Esse rappresentano una risorsa per valutare espressioni geniche, trovare potenzioli mutazioni, annotare geni. 3 Bioinformatica PDB - http://www.rcsb.org/pdb/home/home.do 4 Bioinformatica PDB - http://www.rcsb.org/pdb/home/home.do Protein Data Bank rappresenta il punto di partenza per qualsiasi ricerca di tipo strutturale. 5 Bioinformatica PDB - http://www.rcsb.org/pdb/home/home.do 6 Bioinformatica PDB - http://www.rcsb.org/pdb/home/home.do } Nella ricerca testuale è possibile utilizzare gli operatori booleani AND, OR, NOT affiancando anche l’uso di parentesi (come visto nei DB precedenti); } E’ possibile utilizzare i caratteri speciali “*” e “?” (non è consentito il carattere * all’inizio di una frase); 7 Bioinformatica PDB - http://www.rcsb.org/pdb/home/home.do Ricerchiamo tutte le strutture che riguardano BCL2 e sono coinvolte nella morte programmata della cellula: } 8 Bioinformatica PDB - http://www.rcsb.org/pdb/home/home.do Sommario 9 Bioinformatica PDB - http://www.rcsb.org/pdb/home/home.do Statistiche e grafici 10 Bioinformatica PDB - http://www.rcsb.org/pdb/home/home.do Possiamo perfezionare la query accedendo alla ricerca avanzata dove possiamo aggiungere termini. 11 Bioinformatica PDB - http://www.rcsb.org/pdb/home/home.do Possiamo scegliere tra diversi tipi di query: Possiamo scegliere di non visualizzare strutture molto simili 12 Bioinformatica PDB - http://www.rcsb.org/pdb/home/home.do } 13 Prima Entry: } ID; } Nome della struttura; } Autori (cliccando su un autore verranno visualizzate tutte le strutture ad esso relative); } Data di rilascio; } Classificazione della struttura; } Tipo di esperimento usato; } Composto (con link ai dettagli); Bioinformatica PDB - http://www.rcsb.org/pdb/home/home.do } E’ possibile scaricare l’entry in formato PDB; } Visualizzare l’entry sul browser; } Visualizzare graficamente la struttura usando JMOL; 14 Bioinformatica PDB - http://www.rcsb.org/pdb/home/home.do } 15 Cliccando sulla entry viene visualizzata la pagina con le caratteristiche della struttura; Bioinformatica PDB - http://www.rcsb.org/pdb/home/home.do } 16 Menu: } Sommario; } Sequenza; } Similarità di sequenza e 3D; } Letteratura; } Etc….. Bioinformatica PDB - http://www.rcsb.org/pdb/home/home.do } Visualizzazione 3D. Scegliamo prima cosa visualizzare: } 17 Biological Assembly: Parte della struttura che si è provato (o si crede) sia quella funzionale; Bioinformatica PDB - http://www.rcsb.org/pdb/home/home.do } 18 Lanciamo JMOL: E’ un’ applet JAVA Bioinformatica PDB - http://www.rcsb.org/pdb/home/home.do } Stile di visualizzazione; Tipo di colorazione; } Rappresentazione della superfice; } 19 Bioinformatica PDB - http://www.rcsb.org/pdb/home/home.do File PDB (http://www.wwpdb.org/docs.html). Atomi della struttura: 20 Bioinformatica PDB - http://www.rcsb.org/pdb/home/home.do } } ESERCIZIO I: Cercate la struttura tridimensionale con codice PDB: 1BJ4, 1bww, 1dlw, 1sw0; } Quale è il nome della proteina corrispondente? Visualizzare il file PDB corrispondente. } Visualizzate le strutture in 3D. } 21 Bioinformatica PDB - http://www.rcsb.org/pdb/home/home.do } } 22 ESERCIZIO II: Visualizzare la struttura 3D della sequenza proteica avente ID Entrez AAG03916; Bioinformatica OMIM - http://www.ncbi.nlm.nih.gov/omim 23 Bioinformatica OMIM - http://www.ncbi.nlm.nih.gov/omim } OMIM, Online Mendelian Inheritance in Man, è una banca dati che contiene informazioni sui geni umani e sulle malattie genetiche. } Esso contiene la descrizione di geni e delle malattie ad essi associate, i quadri clinici e i riferimenti bibliografici, oltre a link a sequenze e ad altre risorse web. } Nella banca dati sono riportate solo malattie che sono state associate ad uno o più geni. 24 Bioinformatica OMIM - http://www.ncbi.nlm.nih.gov/omim E’ possibile ricercare info in OMIM utilizzando l’interfaccia di Entrez oppure direttamente all’indirizzo indicato. } } Restano valide tutte le opzioni di ricerca viste per Entrez. Compresi i Limits e la history. 25 Bioinformatica OMIM - http://www.ncbi.nlm.nih.gov/omim Quale gene umano è correlato all’ipertensione (hypertension)? Quali di questi geni si trovano nel cromosoma 17? } } 26 Usiamo i Limits specificando il cromosoma 17. Bioinformatica OMIM - http://www.ncbi.nlm.nih.gov/omim } Quale gene umano è correlato all’ipertensione (hypertension)? Quali di questi geni si trovano nel cromosoma 17? Risultati: Localizzazione del gene. 27 Bioinformatica OMIM - http://www.ncbi.nlm.nih.gov/omim } Quale gene umano è correlato all’ipertensione (hypertension)? Quali di questi geni si trovano nel cromosoma 17? Selezionando la prima Entry otteniamo una serie di informazioni con relative pubblicazioni. ……………………………… …………………………… ………………………………………. …………………………………………… 28 Bioinformatica OMIM - http://www.ncbi.nlm.nih.gov/omim } 29 Quale gene umano è correlato all’ipertensione (hypertension)? Quali di questi geni si trovano nel cromosoma 17? Bioinformatica OMIM - http://www.ncbi.nlm.nih.gov/omim Link al genoma 30 Link alla entry del gene in OMIM Link alla entry del fenotipo in OMIM Bioinformatica OMIM - http://www.ncbi.nlm.nih.gov/omim Una importante opzione è data dai “link esterni” in alto a destra che ci permette di ottenere informazioni correlate in altri database di NCBI. I link estern cambiano a seconda del tipo di entry (ad es. per un gene ci sarà il link alla relativa proteina. 31 Bioinformatica OMIM - http://www.ncbi.nlm.nih.gov/omim } Esempi di possibili query: } 32 (cancer[titl] OR neoplas*[titl] OR tumor[titl]) AND autosomal dominant[clin] AND 11[chrom] Bioinformatica OMIM - http://www.ncbi.nlm.nih.gov/omim } } ESERCIZIO I: Descrivere due modi di ricavare le entry di OMIM riguardanti il cromosoma 12. } Ricercare il record riguardante cystic fibrosis transmembrane conductance regulator (CFTR) avente ID MIM 602421. Ottenere le proteine correlate. Ottenere i geni correlati e verificare le varianti di splicing ed esoni. } Ricercare il record relativo a tp53 e ricercare il gene correlato visualizzando le eventuali isoforme. Che ruolo ha la proteina corrispondente nell’invecchiamento? } Ricercare la patologia fenilchetonuria (PHENYLKETONURIA). Da che cosa è causata? 33 Bioinformatica SNP - http://www.ncbi.nlm.nih.gov/snp 34 Bioinformatica SNP - http://www.ncbi.nlm.nih.gov/snp } Single nucleotide polymorphisms o SNP, sono variazioni di una sequenza di DNA che si verificano quando un singolo nucleotide (A, T, C o G) nella sequenza del genoma è alterata; } Una variazione deve essere presente in almeno l'1% della popolazione, per essere considerato uno SNP; } Molti SNPs non hanno effetto sulla funzione delle cellule, mentre altri possono predisporre l’uomo alle malattie; } La mappatura degli SNP aiuterà a identificare i geni associati a malattie complesse come il cancro, il diabete, malattie vascolari, e alcune forme di malattia mentale; } Il database SNP è integrato in NCBI per cui valgono tutti i metodi di ricerca validi per gli altri Database; 35 Bioinformatica SNP - http://www.ncbi.nlm.nih.gov/snp } 36 Campo di ricerca; Bioinformatica SNP - http://www.ncbi.nlm.nih.gov/snp 37 Bioinformatica SNP - http://www.ncbi.nlm.nih.gov/snp 38 Bioinformatica SNP - http://www.ncbi.nlm.nih.gov/snp 39 Bioinformatica SNP - http://www.ncbi.nlm.nih.gov/snp Esempi Descrizione 1[CHR] AND (nonsense[Function Class] OR missense[Function Class] OR frameshift[Function Class]) SNP localizzati nel cromosoma 1 di tipo nonsense o missense o frameshift 1[CHR] OR 2[CHR] SNP localizzati nel cromosoma 1 o 2 1[CHR] OR 2[CHR] NOT unknown[METHOD] SNP localizzati nel cromosoma 1 o 2 individuati da tutti i metodi ad eccezione di unknown Nonsense: Una mutazione che determina la formazione di un codone di STOP; Frameshift: Una mutazione che causa un cambiamento del frame di lettura; Missense: Una mutazione in un codone che altera l’aminoacido che codificava; Method: Metodo utilizzato per ricercare l’SNP (computed, hibridize, dhplc, etc.) 40 Bioinformatica SNP - http://www.ncbi.nlm.nih.gov/snp } Sono presenti anche altri tag simili a quelli già visti: } [Publication Date]; } [Organism]; } ........... } [SNP_CLASS] L’ultimo tag specifica la classe del SNP: } Heterozygous (La mutazione riguarda una sequenza sconosciuta ma si è osservato essere eterozigote); } Multinucleotide (SNP multipli); } indel (Mutazione dovuta a un Inserimento o una cancellazione); } named locus (Sequenze dove la mutazione è indicata con il nome); } Microsatellite (semplici ripetizioni di sequenza); } no variation (senza variazioni): } Snp (presenza di un SNP); Esempio: "snp"[SNP_CLASS] 41 Bioinformatica SNP - http://www.ncbi.nlm.nih.gov/snp } Risultati della ricerca di TP53 in Homo Sapiens; 42 Bioinformatica SNP - http://www.ncbi.nlm.nih.gov/snp 43 Bioinformatica SNP - http://www.ncbi.nlm.nih.gov/snp } Ricerchiamo eventuali mutazioni nel gene “nitric oxide synthase 2” (HUGO: NOS2) in Homo Sapiens; } Ricerchiamo innanzi tutto il gene nel DB Gene; } Da menu laterale a destra, sotto la voce LINK scegliere “SNP Gene View” 44 …………………………. Bioinformatica SNP - http://www.ncbi.nlm.nih.gov/snp } 45 Otteniamo la lista di SNP riguardanti il gene: Bioinformatica SNP - http://www.ncbi.nlm.nih.gov/snp } ESERCIZIO I } Ricercare il gene TP53 di Homo Sapiens e seguendo il LINK a “SNP Gene View” verificare che tipi di SNP contiene. } Ci sono mutazioni sinonime? Se si indicare per una mutazione quale nucleotide è cambiato? In cosa è cambiato? Quale è l’aminoacido codificato? } Quale è la posizione rispetto alla sequenza mRNA? } 46 Bioinformatica GEO – Gene Expression Omnibus http://www.ncbi.nlm.nih.gov/geo/ 47 Bioinformatica GEO – Gene Expression Omnibus http://www.ncbi.nlm.nih.gov/geo/ } Gene Expression Omnibus (GEO) è una banca dati internazionale relativa ad esperimenti di varia natura basati sulla tecnologia dei microarrays e preposti allo studio di espressione di geni; } Fornisce un meccanismo semplice per ricercare e scaricare studi su profili di espressioni geniche di interesse; } Due classi di dati: 48 } Dataset usati per i test; } Gene Expression Profile; Bioinformatica GEO – Gene Expression Omnibus http://www.ncbi.nlm.nih.gov/geo/ I dati sono classificati in 3 categorie: 1. platform = Informazioni sulla piattaforma utilizzata (Entry code GPL#####); 2. samples = dati sui campioni biologici utilizzati nell'esperimento (Entry code GSM#####); 3. series = tutti i dati relativi ad una serie di esperimenti condotti con una singola piattaforma sperimentale (Entry code GSE#####); 49 Bioinformatica GEO – Gene Expression Omnibus http://www.ncbi.nlm.nih.gov/geo/ Esempio di record Platform La pagina contiene inizialmente informazioni relative all’esperimento, la piattaforma utilizzata etc. etc. 50 Bioinformatica GEO – Gene Expression Omnibus http://www.ncbi.nlm.nih.gov/geo/ Esempio di record Platform In fondo alla pagina è presente una tabella che descrive il microarray e i geni coinvolti nell’esperimento. E’ possibile scaricare la tabella in vari formati. 51 Bioinformatica GEO – Gene Expression Omnibus http://www.ncbi.nlm.nih.gov/geo/ Esempio di record Sample La pagina contiene Informazioni relativamente ai campioni utilizzati nello studio (ad malati/Sani). 52 Bioinformatica GEO – Gene Expression Omnibus http://www.ncbi.nlm.nih.gov/geo/ Esempio di record Sample In fondo alla pagina è presente la tabella con il risultato del processo di ibridizzazione su un determinato campione. Infine sono presenti i dati grezzi (che possono essere scaricati) da cui sono stati ricavati i risultati. 53 Bioinformatica GEO – Gene Expression Omnibus http://www.ncbi.nlm.nih.gov/geo/ Esempio di record Series Contiene informazioni su un gruppo di campioni correlati e fornisce un punto di riferimento con la descrizione dell'intero studio; Può contenere anche delle tabelle che descrivono i dati estratti, conclusioni, sintesi e analisi 54 Bioinformatica GEO – Gene Expression Omnibus http://www.ncbi.nlm.nih.gov/geo/ Interrogare GEO 1. Per dataset; 2. Per profilo di espressione genica; 3. Per ID; 4. E’ possibile ricercare datasets o singole entries; 5. Infine è possibile sottomettere i propri esperimenti; 55 Bioinformatica GEO – Gene Expression Omnibus http://www.ncbi.nlm.nih.gov/geo/ Interrogare GEO Datasets Esempi di Query Descrizione Smoking cancer Ricerca di informazioni su un argomento (smok* OR diet) AND (mammals[organism] NOT human[organism]) Operatori booleani e tag "roadmap epigenomics"[Project] Studi su un determinato progetto "expression profiling by high throughput sequencing"[DataSet Type] Tipi di dataset 100:500[Number of Samples] Dimensioni dei dataset "age"[Subset Variable Type] Dataset che contengono “age” come variabile 2007/01:2007/06[Publication Date] Data di pubblicazione dello studio 56 Bioinformatica GEO – Gene Expression Omnibus http://www.ncbi.nlm.nih.gov/geo/ Interrogare GEO Profiles Esempi di Query Descrizione CYP1A1[Gene Symbol] Profili riguardanti un gene (CYP1A1[Gene Symbol] OR ME1[Gene Symbol]) AND (smok* OR diet) Profili riguardanti geni in dataset contenenti specifiche keywords NM_014033 Genbank ID kinase[Gene Description] AND GDS182 Nome parziale di un gene in uno specifico dataset. apoptosis[Gene Ontology] AND GDS182 Termine Gen Ontology nella descrizione di uno specifico dataset (8[Chromosome] AND 10000:3000000[Base Position]) AND mouse[organism] Profili riguardanti uno specifico cromosoma, regione, e specie 2007/01:2007/06[Publication Date] Data di pubblicazione dello studio 57 Bioinformatica GEO – Gene Expression Omnibus http://www.ncbi.nlm.nih.gov/geo/ Ricerchiamo dataset riguardanti la query “smoking cancer” 58 Bioinformatica GEO – Gene Expression Omnibus http://www.ncbi.nlm.nih.gov/geo/ Analisi del microarray con algoritmi di clustering; 59 Bioinformatica GEO – Gene Expression Omnibus http://www.ncbi.nlm.nih.gov/geo/ Cliccando Invece sul nome dello studio verremo spostati sul Dataset Browser Informazioni sui sample dell’esperimento e relativi link; 60 Bioinformatica GEO – Gene Expression Omnibus http://www.ncbi.nlm.nih.gov/geo/ Cliccando Invece sul nome dello studio verremo spostati sul Dataset Browser Profili di espressione genica relativi al dataset. 61 Bioinformatica GEO – Gene Expression Omnibus http://www.ncbi.nlm.nih.gov/geo/ Cliccando su un profilo di espressione genica vengono forniti i risultati dell’esperimento sui sample (Relativamente a quel gene). Profilo di espressione genica di ADH6 sui campioni; 62 Bioinformatica GEO – Gene Expression Omnibus http://www.ncbi.nlm.nih.gov/geo/ } ESERCIZIO I } Ricercare dataset riguardanti l’effetto della vitamina C sulla pelle dell’uomo (Vitamin C, } } } } 63 Skin). Quanti campioni sono presenti? In quali classi sono suddivisi i campioni? Visualizzare il profilo di espressione genica di ID 63084153. Cosa si può dedurre dal profilo? Quale classe di campioni ha le espressioni geniche più elevate? Bioinformatica Genome – NCBI http://www.ncbi.nlm.nih.gov/sites/entrez?db=genome 64 Bioinformatica Genome – NCBI http://www.ncbi.nlm.nih.gov/sites/entrez?db=genome } Contiene i dati di sequenza del genoma e la mappa del genoma di oltre 1000 specie; } Sia genomi completamente sequenziati che quelli in-progress. } Tutti e tre i settori (Batteri, Archea, e Eukaryota) sono rappresentati, così come molti virus, fagi, viroidi, plasmidi, e organelli; 65 Bioinformatica Genome – NCBI http://www.ncbi.nlm.nih.gov/sites/entrez?db=genome Genomi in base al refSeq status; Genomi Completi o Assembly; Genomi in base alla tassonomia; 66 Bioinformatica Genome – NCBI http://www.ncbi.nlm.nih.gov/sites/entrez?db=genome } 67 RICERCA AVANZATA (Con eventuale uso della History); Bioinformatica Genome – NCBI http://www.ncbi.nlm.nih.gov/sites/entrez?db=genome } 68 RICERCA AVANZATA (Con eventuale uso della History); Bioinformatica Genome – NCBI http://www.ncbi.nlm.nih.gov/sites/entrez?db=genome } 69 RICERCA DI PROGETTI RELATIVI ALL’UOMO Bioinformatica Genome – NCBI http://www.ncbi.nlm.nih.gov/sites/entrez?db=genome } Mappa relativa al cromosoma 9 } La mappa è interattiva: Si può zoommare, cliccare sulle sequenze; } Rappresentazione schematica del cromosoma con le varie posizioni; 70 Bioinformatica Genome – NCBI http://www.ncbi.nlm.nih.gov/sites/entrez?db=genome } Mappa relativa la cromosoma 9 } Geni presenti e orientamento (down = strand positivo, up= strand negativo): 71 Bioinformatica Genome – NCBI http://www.ncbi.nlm.nih.gov/sites/entrez?db=genome } Link a risorse: } OMIM; } HGNC; } Sv = Sequence viewer; } Pr = Proteina; } Dl = Download sequenza; } Ev = Evidence viewer (visualizza evidenze biologiche che supportano un particolare modello di gene); } Hm = HomoloGene; } Sts = UniSTS (sequence tagged sites); } SNP; 72 Bioinformatica Genome – NCBI http://www.ncbi.nlm.nih.gov/sites/entrez?db=genome } 73 NAVIGARE TRA GLI ASSEMBLY Bioinformatica Genome – NCBI http://www.ncbi.nlm.nih.gov/sites/entrez?db=genome } 74 NAVIGARE TRA GLI ASSEMBLY Bioinformatica Genome – NCBI http://www.ncbi.nlm.nih.gov/sites/entrez?db=genome } 75 NAVIGARE TRA GLI ASSEMBLY Bioinformatica Genome – NCBI http://www.ncbi.nlm.nih.gov/sites/entrez?db=genome } 76 NAVIGARE TRA GLI ASSEMBLY Bioinformatica Genome – NCBI http://www.ncbi.nlm.nih.gov/sites/entrez?db=genome } 77 NAVIGARE TRA GLI ASSEMBLY Bioinformatica Genome – NCBI http://www.ncbi.nlm.nih.gov/sites/entrez?db=genome } 78 NAVIGARE TRA GLI ASSEMBLY Bioinformatica Genome – NCBI http://www.ncbi.nlm.nih.gov/sites/entrez?db=genome } 79 NAVIGARE TRA GLI ASSEMBLY Bioinformatica Genome – NCBI http://www.ncbi.nlm.nih.gov/sites/entrez?db=genome } 80 NAVIGARE TRA GLI ASSEMBLY Bioinformatica Genome – NCBI http://www.ncbi.nlm.nih.gov/sites/entrez?db=genome } 81 NAVIGARE TRA GLI ASSEMBLY Bioinformatica Genome – NCBI http://www.ncbi.nlm.nih.gov/sites/entrez?db=genome } 82 NAVIGARE TRA GLI ASSEMBLY Bioinformatica Genome – NCBI http://www.ncbi.nlm.nih.gov/sites/entrez?db=genome } 83 NAVIGARE TRA GLI ASSEMBLY Bioinformatica Genome – NCBI http://www.ncbi.nlm.nih.gov/sites/entrez?db=genome } ESERCIZIO I 84 } Utilizzando il DB Assembly, quanti progetti di sequenziamento relativi a Homo Sapiens sono presenti? Quale consorzio/Centro guida il progetto più recente? } Utilizzando il DB Genome, determinare se il gene Acta2 del topo (mus musculus) si trova nel cromosoma 19. In quale strand si trova? Quante varianti di splicing si conoscono? Bioinformatica Genome – NCBI http://www.ncbi.nlm.nih.gov/sites/entrez?db=genome } ESERCIZIO III 85 } Selezionare il genoma completo relativo al topo (mus musculus). } In quale cromosoma si trova il gene TCF3? } Quanti geni ortologhi ci sono? In quali Specie? } Quante STS ci sono? } Utilizzare sequence viewer per visualizzare tutte le sequenze vicine al gene in questione. } Quante varianti di splicing sono conosciute per tale gene? Bioinformatica UCSC Genome Browser http://genome.ucsc.edu/ cgi-bin/hgGateway 86 Bioinformatica UCSC Genome Browser http://genome.ucsc.edu/ cgi-bin/hgGateway } UCSC Genome Browser è un altro sito contenente informazioni su svariati genomi; Posizione nel genoma Organismo - Specie 87 Specifico sequenziamento per un determinato genoma Possiamo ricercare anche per nome di un gene Bioinformatica UCSC Genome Browser http://genome.ucsc.edu/ cgi-bin/hgGateway Se possediamo una sequenza genomica, di mRNA, o una proteina e non conosciamo la sua posizione nel genoma UCSC mette a disposizione il tool BLAT (simile a BLAST) che ricerca la posizione utilizzando un allineamento. 88 Bioinformatica UCSC Genome Browser http://genome.ucsc.edu/ cgi-bin/hgGateway 89 Bioinformatica ENSEMBL http://www.ensembl.org/ 90 Bioinformatica ENSEMBL http://www.ensembl.org/ Possiamo usare l’opzione BROWSE scegliendo il genoma di interesse. 91 Bioinformatica ENSEMBL http://www.ensembl.org/ } 92 Possiamo interrogare il DB: Esempio Descrizione chr7 Visualizza tutto del cromosoma 7 chr3:1-1000000 Visualizza il primo milione di basi del cromosoma 3 AF083811 Visualizza la regione contenente la sequenza con Accession GenBank homeobox caudal Visualizza sequenze relative a geni homeobox caudal Evans,J.E. Visualizza sequenze depositate dal determinato autore Bioinformatica ENSEMBL http://www.ensembl.org/ STEP 1 } } } STEP 1I } 93 Ricerchiamo ad esempio per Homo Sapiens il gene RHO Selezioniamo “GENE” e poi clicchiamo sul link Bioinformatica ENSEMBL http://www.ensembl.org/ } STEP 1II } 94 Il primo link si riferisce al gene cercato (ID ENSG00000163914) Bioinformatica ENSEMBL http://www.ensembl.org/ } STEP 1V } La barra azzurra rappresenta il genoma Sequenze vicine (in questo caso si tratta di IFT122) 95 } I gene RHO (cliccare per avere informazioni aggiuntive). } In questo caso c’e’ solo una variante di splicing. } In caso di più varianti si possono visualizzare le info aggiuntive Bioinformatica ENSEMBL http://www.ensembl.org/ } Opzioni 96 Bioinformatica ENSEMBL http://www.ensembl.org/ } Opzioni 97 Sequence: Sequenza in formato fasta che mette in evidenza esoni ed introni; Bioinformatica ENSEMBL http://www.ensembl.org/ } Opzioni 98 Genomic Alignment: Permette di allineare il genoma con altri (esempio in basso con esoni in rosso); Bioinformatica ENSEMBL http://www.ensembl.org/ } Opzioni 99 Gene Tree: Visualizza il gene in un contesto filogenetico. Usato per determinare ortologhi e paraloghi Bioinformatica ENSEMBL http://www.ensembl.org/ } Opzioni 100 Bioinformatica ENSEMBL http://www.ensembl.org/ } Opzioni SNP in formato tabellare o immagine trascritto Variazioni aminoacidi 101 Bioinformatica ENSEMBL http://www.ensembl.org/ } Opzioni } 102 Cliccando sull’immagine in corrispondenza di uno SNP otteniamo le informazioni sulla sequenza Bioinformatica ENSEMBL http://www.ensembl.org/ 103 Bioinformatica ENSEMBL http://www.ensembl.org/ 104 Bioinformatica ENSEMBL http://www.ensembl.org/ 105 Bioinformatica ENSEMBL http://www.ensembl.org/ 106 Bioinformatica ENSEMBL http://www.ensembl.org/ } Opzioni Infine cliccando su location otteniamo informazioni grafiche sulla sequenza e sulle sequenze vicine 107 Bioinformatica ENSEMBL http://www.ensembl.org/ } Per Approfondimenti: } 108 http://www.ensembl.org/info/website/tutorials/coursebook.pdf Bioinformatica ENSEMBL http://www.ensembl.org/ } ESERCIZIO I 109 } Ricercare il gene TP53 nell’uomo. } Quante sequenze vengono trovate? Selezionare la sequenza corretta. } Quali sono i geni nelle vicinanze della sequenza in questione? } Ci sono geni ortologhi? Elencare qualche specie. } Ci sono SNP? Tra questi c’e’ qualche mutazione che ha fatto perdere un codone di stop? Bioinformatica GO – Gene Ontology DB http://www.geneontology.org/ 110 Bioinformatica GO – Gene Ontology DB http://www.geneontology.org/ } } } Il numero crescente di sequenze geniche note e di informazioni disponibili su di esse spesso causa dei problemi come per esempio l’assegnazione di nomi multipli allo stesso gene oppure l’assegnazione di funzioni differenti alla stessa proteina. Queste funzioni possono essere tutte corrette (spesso una proteina svolge più di una funzione) ma esse devono essere definite utilizzando una terminologia corretta e rigorosa al fine di evitare descrizioni troppo soggettive. Lo scopo del progetto Gene Ontology (GO) è quello di creare un vocabolario unificato per la descrizione di tutte le funzioni dei geni e dei prodotti genici in generale, in maniera stabile per ogni organismo. In particolare: } } } } 111 Supportare e definire il vocabolario Fornire un accesso libero Fornire le annotazioni Sviluppare tools per l’utilizzo del vocabolario Bioinformatica GO – Gene Ontology DB http://www.geneontology.org/ } I biologi tendono ad usare nomi diversi per lo stesso concetto: } es. traduzione vs sintesi proteica } Ciò crea notevoli problemi per qualunque approccio computazionale } Una ontologia è definita da: } } } 112 un vocabolario di termini e nomi per i concetti un set di relazioni logiche tra di essi le definizioni precise e univoche dei vari termini Bioinformatica GO – Gene Ontology DB http://www.geneontology.org/ } Il progetto GO ha definito tre diversi tipi di vocabolari di termini biologici unificati (ontologie): } processo biologico: un meccanismo controllato da più prodotti genici con diverse funzioni molecolari e che porta ad un particolare risultato. Un processo biologico viene portato a termine e completato attraverso un insieme ordinato di funzioni molecolari e spesso coinvolge una trasformazione chimica o fisica; } funzione molecolare: l’attività biochimica di un prodotto genico. Spesso questa definizione si riferisce alla capacità di un prodotto genico (o di un complesso proteico) di esprimersi in un determinato contesto metabolico; } componente cellulare: zona specifica della cellula dove un prodotto genico è attivo; 113 Bioinformatica GO – Gene Ontology DB http://www.geneontology.org/ 114 Bioinformatica GO – Gene Ontology DB http://www.geneontology.org/ } I tre vocabolari sono basati su tre liste separate di GO terms; } I termini in una ontologia sono collegati tra di loro da due tipi di relazioni: is_a e part_of; } I geni (o prodotti) sono annotati con dei GO terms; } I termini di una ontologia sono organizzati in DAG (Direct Acyclic Graphs); 115 Bioinformatica GO – Gene Ontology DB http://www.geneontology.org/ } Il tool messo a disposizione per accedere al DB si chiama AmiGO } E’ possibile: } Ricercare geni o prodotti di geni; } } 116 Eseguire BLAST; Ricercare e navigare attraverso i GO terms; Bioinformatica GO – Gene Ontology DB http://www.geneontology.org/ } } } Esempi di GO Terms: } DNA Repair; } Protein kinase activity; } Mitochondrion; Filtrare: } Processo; } Funzione; } Componente cellulare; Geni o prodotti di geni coinvolti 117 Bioinformatica GO – Gene Ontology DB http://www.geneontology.org/ } Cliccando su un GO Term viene presentato come una struttura ad albero che mette in evidenza la relazione tra i vari GO Terms. 118 Bioinformatica GO – Gene Ontology DB http://www.geneontology.org/ Cliccando sul link relativo vengono visualizzati i Geni e prodotti di geni associati al GO Term } } Filtri: Tipo di prodotto, DB, Specie 119 } Link al riferimento Bioinformatica GO – Gene Ontology DB http://www.geneontology.org/ } La ricerca di geni e proteine permette di trovare informazioni generiche, sequenze, e link ai Database Uniprot, EMBL,PDB, NCBI etc etc. 120 Bioinformatica GO – Gene Ontology DB http://www.geneontology.org/ } ESERCIZIO I } Ricercare GO Terms che contengono le tre parole “positive gluconeogenesis regulation”; } Di che tipo di ontologia si tratta? } Quanti prodotti di geni sono correlati? } Ci sono prodotti di geni relativi a Homo Sapiens? 121 Bioinformatica KEGG Patways http://www.genome.jp/kegg/pathway.html Kyoto Enciclopedia of Genes and Genomes - Pathways 122 Bioinformatica KEGG Patways http://www.genome.jp/kegg/pathway.html } Un pathway è una cascata di reazioni (metaboliche o regolatrici) sequenziali (lineari o ramificate) che porta alla manifestazione di un particolare fenotipo cellulare (ad esempio la morte cellulare) o alla modificazione di composti chimici (ad esempio la produzione di energia da una molecola di zucchero); } KEGG è l’enciclopedia di Kyoto di geni e genomi. Tra i database più consultati c’e’ PATHWAY; } KEGG PATHWAY è una collezione di grafici disegnati manualmente rappresentanti patways molecolari per il metabolismo, genetic information processing, processi cellulari, malattie umane, e sviluppo di farmaci. } In ogni grafico gli elementi interagenti costituiscono i nodi di un grafo e le relazioni sono descritte dagli archi che congiungono i nodi. } Ogni pathway è identificato da un ID a 5 cifre precedute dal codice dell’organismo (ad es. HSA per homo sapiens). 123 Bioinformatica KEGG Patways http://www.genome.jp/kegg/pathway.html 124 Bioinformatica KEGG Patways http://www.genome.jp/kegg/pathway.html } } Ricerchiamo patway relativi all’ Apoptosi nell’uomo; E’ possibile ricercare anche per pathway ID; 125 Bioinformatica KEGG Patways http://www.genome.jp/kegg/pathway.html } Elenco dei pathway: 126 Bioinformatica KEGG Patways http://www.genome.jp/kegg/pathway.html 127 } Descrizione; } Classe di appartenenza; } Mappa; } Riferimenti bibliografici; } Geni coinvolti; } Pathway Correlate; Bioinformatica KEGG Patways http://www.genome.jp/kegg/pathway.html 128 Bioinformatica KEGG Patways http://www.genome.jp/kegg/pathway.html } ESERCIZIO I } Ricercare il pathway relativo a “pancreatic cancer” nell’uomo. } E’ correlata al pathway dell’apoptosis? } Quale è il nome del primo gene correlato alla malattia? Tale gene è correlato anche al cancro della tiroide? } Ci sono interazioni di fosforilazione tra proteine? 129 Bioinformatica BioSystems - http://www.ncbi.nlm.nih.gov/biosystems 130 Bioinformatica BioSystems - http://www.ncbi.nlm.nih.gov/biosystems BioSystem è il DB di NCBI che contiene pathways provenienti da diversi DB (come ad es. KEGG). Le modalità di interrogazione sono quelle già viste per gli altri DB di NCBI 131 Bioinformatica BioSystems - http://www.ncbi.nlm.nih.gov/biosystems La ricerca del pathway di Apoptosis nell’uomo da come risultati patwhay tratti da diversi DB (REACTOME, WikiPathways, KEGG) 132 Bioinformatica BioSystems - http://www.ncbi.nlm.nih.gov/biosystems Cliccando sul pathway di KEGG ritroviamo lo stesso pathway ricercato su KEGG. Vengono mostrate informazioni anche relativamente a molecole coinvolte, pathway correlati, citazioni e commenti; 133 Bioinformatica BioSystems - http://www.ncbi.nlm.nih.gov/biosystems } ESERCIZIO I } Effettuare su BioSystem la stessa ricerca impostata nell’esercizio su KEGG e provare a rispondere (se possibile) alla stesse domande scegliendo questa volta il pathway che si trova sul DB WikiPathways. 134 Bioinformatica Pathway Commons http://www.pathwaycommons.org/pc/ 135 Bioinformatica Pathway Commons http://www.pathwaycommons.org/pc/ } Ricerchiamo i pathway che contengono la keyword “BCRA1” o il gene “BCRA1”; } 136 Possiamo filtrare i risultati ricercando solo in alcuni DB e/o determinati organismi; Bioinformatica Pathway Commons http://www.pathwaycommons.org/pc/ } Risultati della ricerca 137 Bioinformatica Pathway Commons http://www.pathwaycommons.org/pc/ } Cliccando sul primo pathway troviamo informazioni su Reazioni Biochimiche, Sub Pathway e Molecole coinvolte; 138 Bioinformatica Pathway Commons http://www.pathwaycommons.org/pc/ } Una funzione molto utile è quella di caricare automaticamente il pathway su Cytoscape; 139 Bioinformatica Pathway Commons http://www.pathwaycommons.org/pc/ } Ricerca del patway di apoptosis nell’uomo (impostando il filtro) 140 Bioinformatica Pathway Commons http://www.pathwaycommons.org/pc/ } Ricerca del patway di apoptosis nell’uomo (impostando il filtro) } E’ possibile visualizzare il pathway seguendo il link al DB E’ possibile scaricare: } Il pathway in XML; } 141 Gli ID relativi a vari DB dei geni coinvolti Bioinformatica Pathway Commons http://www.pathwaycommons.org/pc/ } Seguendo il link su REACTOME è possibile “NAVIGARE” il pathway e i relativi componenti (www.reactome.org). 142 Bioinformatica Pathway Commons http://www.pathwaycommons.org/pc/ Sono disponibili delle API Web per poter accedere direttamente al DB dai propri programmi; } http://www.pathwaycommons.org/pc/webservice.do?cmd=help http://cbio.mskcc.org/software/cpath/ } E’ possibile scaricare il software cPath per interagire con i pathways. 143 Bioinformatica Pathway Commons http://www.pathwaycommons.org/pc/ } ESERCIZIO I } Ricercare i pathway in cui il gene tp53 dell’uomo è coinvolto. } Quanti pathway trovate? } Come si chiama il primo patway trovato? Da quale DB è stata prelevato? } Visualizzare il pathway. } Caricare il pathway in Cytoscape e applicare un layout “Organic”. 144 Bioinformatica TarBase - http://diana.cslab.ece.ntua.gr/tarbase/ 145 Bioinformatica TarBase - http://diana.cslab.ece.ntua.gr/tarbase/ } TarBase è un Database di miRNA e relativi target di diverse specie. Ricerchiamo dati per un determinato organismo, miRNA,Gene 146 Bioinformatica TarBase - http://diana.cslab.ece.ntua.gr/tarbase/ } TarBase è un Database di target di miRNA di diverse specie. Data_Type: Tipo di repressione esercitata dai miRNA specifici sul gene specifico. 1. mRNA cleavage: degradazione del mRNA a causa della presenza di miRNA 2. mRNA repression: l'mRNA è presente, ma non la produzione di proteine ( dovuto alla presenza del miRNA). 147 Bioinformatica TarBase - http://diana.cslab.ece.ntua.gr/tarbase/ } TarBase è un Database di target di miRNA di diverse specie. Support_Type: Validità della interazione 1. TRUE: il miRNA riduce il livello di proteina; 2. FALSE: l'espressione del gene target non è influenzato dalla presenza di miRNA; 3. WEAK: si é osservata solo una repressione debole; 4. pSILAC or MicroArray: Casi che presentano solo una prova indiretta di interazione; 148 Bioinformatica TarBase - http://diana.cslab.ece.ntua.gr/tarbase/ } TarBase è un Database di target di miRNA di diverse specie. Any S_S_S: Single Site Sufficiency (presenza di un singolo sito di interazione) 1. NO,UNKNOWN,YES; 149 Bioinformatica TarBase - http://diana.cslab.ece.ntua.gr/tarbase/ } TarBase è un Database di target di miRNA di diverse specie. Any MRE: Numero di interazioni (possibili target) del miRNA con il gene; 150 Bioinformatica TarBase - http://diana.cslab.ece.ntua.gr/tarbase/ } TarBase è un Database di target di miRNA di diverse specie. Any D_S: Direct Support (si riferisce a procedure sperimentali che forniscono prove dirette per quanto riguarda l'interazione miRNA-target) 151 Bioinformatica TarBase - http://diana.cslab.ece.ntua.gr/tarbase/ } TarBase è un Database di target di miRNA di diverse specie. Any I_S: Indirect Support (si riferisce a procedure sperimentali che forniscono prove indirette, ad es. “In silico prediction”) 152 Bioinformatica TarBase - http://diana.cslab.ece.ntua.gr/tarbase/ } TarBase è un Database di target di miRNA di diverse specie. Any Pathology or event: La patologia o evento biologico legato alla interazione del miRNA. 153 Bioinformatica TarBase - http://diana.cslab.ece.ntua.gr/tarbase/ } TarBase è un Database di target di miRNA di diverse specie. Any Mis_Regulation: Il livello di espressione del miRNA necessaria per innescare un evento specifico o patologia. 154 Bioinformatica TarBase - http://diana.cslab.ece.ntua.gr/tarbase/ } TarBase è un Database di target di miRNA di diverse specie. Any Protein Type: Funzione biologica del gene target (ad esempio apoptosis, dna repair etc etc). 155 Bioinformatica TarBase - http://diana.cslab.ece.ntua.gr/tarbase/ } TarBase è un Database di target di miRNA di diverse specie. Any Differentially_expressed_in: Livello di espressione dei miRNA in specifici tessuti. 156 Bioinformatica TarBase - http://diana.cslab.ece.ntua.gr/tarbase/ } TarBase è un Database di target di miRNA di diverse specie. Any Paper: miRNA correlati ad una specifica pubblicazione. 157 Bioinformatica TarBase - http://diana.cslab.ece.ntua.gr/tarbase/ } TarBase è un Database di target di miRNA di diverse specie. Any PPMID: PubMed ID della specifica pubblicazione. 158 Bioinformatica TarBase - http://diana.cslab.ece.ntua.gr/tarbase/ } TarBase è un Database di target di miRNA di diverse specie. Any PPMID: ENSEMBL ID dei geni presenti nel DB. 159 Bioinformatica TarBase - http://diana.cslab.ece.ntua.gr/tarbase/ } Ricerchiamo ad esempio miRNA che reprimono BCL2 nell’uomo 160 Bioinformatica TarBase - http://diana.cslab.ece.ntua.gr/tarbase/ } Otteniamo 4 risultati 161 Bioinformatica TarBase - http://diana.cslab.ece.ntua.gr/tarbase/ } ESERCIZIO I } Esistono miRNA capaci di avere un effetto repressivo su TP53 nell’uomo? } Esiste qualche miRNA capace di avere un effetto repressivo in qualunque gene coinvolto nel tumore al seno nell’uomo (breast cancer)? } Quali sono i miRNA nell’uomo coinvolti nell’inibizione dell’apoptosi? 162 Bioinformatica miRò – miR Ontology DB http://ferrolab.dmi.unict.it/miro/ 163 Bioinformatica miRò – miR Ontology DB http://ferrolab.dmi.unict.it/miro/ } miRò è un nuovo sistema sviluppato dal gruppo del prof. Ferro che fornisce agli utenti associazioni di tipo miRNA-Fenotipo nell’uomo; } Può essere interrogato via WEB attraverso una interfaccia standard e/o avanzata; } Permette di identificare al livello di miRNA relazioni tra: } Geni; } Processi; } Funzioni; 164 Bioinformatica miRò – miR Ontology DB http://ferrolab.dmi.unict.it/miro/ 165 Bioinformatica miRò – miR Ontology DB http://ferrolab.dmi.unict.it/miro/ 166 Bioinformatica miRò – miR Ontology DB http://ferrolab.dmi.unict.it/miro/ 167 Bioinformatica miRò – miR Ontology DB http://ferrolab.dmi.unict.it/miro/ 168 Bioinformatica miRò – miR Ontology DB http://ferrolab.dmi.unict.it/miro/ 169 Bioinformatica miRò – miR Ontology DB http://ferrolab.dmi.unict.it/miro/ DATA MINING I miRNA sono associati a GO Terms. Possono essere clusterizzati in base ai termini in comune (Cioè miRNA associati agli stessi termini possono essere raggruppati); miRo` permette di calcolare sottoinsiemi di miRNA con alcune caratteristiche in comune (Usando i Maximal Frequent Itemset); Un threshold alto restituisce un piccolo gruppo di miRNA associati ad un grandi numero di termini; Un thtreshold piccolo restituisce diversi gruppi di miRNA associati a pochi termini; 170 Bioinformatica miRò – miR Ontology DB http://ferrolab.dmi.unict.it/miro/ DATA MINING L’interfaccia di miRò permette di scegliere N miRNA con un criterio di associazione(processo, malattia) Il sistema è in grado di trovare tutti i sottoinsiemi di miRNA e i processi o malattie ai quali essi sono molto correlati (I risutati sono ordinati rispetto ad uno score); Questo potrebbe suggerire che un set di miRNA possa agire cooperativamente in una determinata funzione biologica; 171 Bioinformatica miRò – miR Ontology DB http://ferrolab.dmi.unict.it/miro/ 172 Bioinformatica miRò – miR Ontology DB http://ferrolab.dmi.unict.it/miro/ DATA MINING – Un caso di studio E’ stato provato che il cluster miR-17-92 ha un ruolo fondamentale in: • Proliferazione delle cellule; • Inibizione dell’apoptosis nelle cellule tumorali; • Sono tutti coinvolti in certi tumori (lynphoma, melanoma, breast cancer, colonrectal cancer, lung cancer, ovarian cancer, pancreas cancer, prostate cancer, stomach cancer); • Hanno tutti un ruolo nel normale sviluppo del cuore, dei polmoni e del sistema immunitario; 173 Bioinformatica miRò – miR Ontology DB http://ferrolab.dmi.unict.it/miro/ DATA MINING – Un caso di studio La ricerca avanzata in miRò produce tra gli altri anche i risultati provati sperimentalmente. Lo stesso ricercando per process. 174 Bioinformatica miRò – miR Ontology DB http://ferrolab.dmi.unict.it/miro/ } ESERCIZIO I } Ricercare i miRNA e relativi geni target che sono stati sperimentalmente validati, coinvolti nell’ipertensione (hypertension). } Quanti miRNA trovate? } Quali sono i geni target? 175 Bioinformatica miRò – miR Ontology DB http://ferrolab.dmi.unict.it/miro/ } ESERCIZIO II } Ricercare miRNA che sono correlati al gene TP53 e al tumore al seno (breast cancer). I mirna devono essere Validati oppure predetti da TargetScan, oppure predetti da Pictar. } Quante associazioni trovate? } Relativamente al miRNA hsa-miR-498, da chi è stato predetto? } Seguendo il link al software di predizione rispondere alle seguenti domande: 176 } Quanti target per siti conservati? } Quanti per siti non conservati? Bioinformatica miRò – miR Ontology DB http://ferrolab.dmi.unict.it/miro/ } ESERCIZIO III } } } 177 Cercare tutti i miRNA potenzialmente coinvolti nel cancro del fegato (liver cancer). Tra questi ce ne sono alcuni il cui target coinvolto nel cancro del fegato è stato validato (es. miR-16, let-7b etc.). Controllare l'espressione di questi miRNA nel fegato per vedere se sono realmente espressi in questo tessuto (non c'è un link diretto, bisogna tornare alla ricerca semplice, cercare i miRNA uno per uno e controllarne l'espressione nei vari tessuti). Bioinformatica miRò – miR Ontology DB http://ferrolab.dmi.unict.it/miro/ } ESERCIZIO IV } Cercare tutti i miRNA che sono coinvolti contemporaneamente nell' "Heart failure" (Disease), "Apoptosis" (Process) ed "RNA Binding" (Function), ma NON in "Congenital Heart Disease". 178 Bioinformatica miRò – miR Ontology DB http://ferrolab.dmi.unict.it/miro/ } NOTA: Il db mirò è attualmente in manutenzione e alcune funzionalità potrebbero non funzionare correttamente! 179 Bioinformatica miRBase - http://www.mirbase.org/ 180 Bioinformatica miRBase - http://www.mirbase.org/ } miRBase è un DB contenente informazioni su miRNA predetti da targetScan e Pictar; } E’ possibile ricercare miRNA in base alla specie (utilizzando il tasto BROWSE); 181 Bioinformatica miRBase - http://www.mirbase.org/ Si può cervcare anche per: } Nome del miRNA. } In base alla posizione nel genoma; } Per gruppi di miRNA; } Per tessuto; } Per sequenza; 182 Bioinformatica miRBase - http://www.mirbase.org/ } Ricercando un miRNA otteniamo le sequenze nelle varie specie (ad es HSA indica Homo Sapiens). Cliccando sul miRNA relativo otteniamo informazioni sulla sequenze, sulle referenze etc etc. 183 Bioinformatica miRBase - http://www.mirbase.org/ } Quando si selezionano miRNA di una data specie utilizzando il browser, è possibile allinearne le sequenze con ClustalW al fine di ricercarne similitudini o differenze. 184 Bioinformatica miRBase - http://www.mirbase.org/ } Quando si selezionano miRNA di una data specie utilizzando il browser, è possibile allinearne le sequenze con ClustalW al fine di ricercarne similitudini o differenze. Allineamento con CLUSTALW 185 Bioinformatica miRBase - http://www.mirbase.org/ } ESERCIZIO I } Quali sono i miRNA nel virus dell’ HIV? Quali sono gli articoli correlati in Pubmed? Allineare le sequenze. } 186 Ci sono miRNA del Cane che interagiscono con il cromosoma X? Bioinformatica EST - http://www.ncbi.nlm.nih.gov/nucest 187 Bioinformatica EST - http://www.ncbi.nlm.nih.gov/nucest } Il DB di expressed sequences tags contiene piccole sequenze (generalmente tra 300 e 500 pb) di DNA espresse (e quindi presenti nel citoplasma) che hanno subito il processo di splicing; } In pratica si tratta di «pezzi» di geni espressi(come ad esempio ESONI etc. etc.); } Possono essere utilizzate come sonde nei microarray; } Possono essere utilizzate per identificare nuovi geni andando a ricercare nel DNA appaiamenti con le EST; } Se un EST fa match con una sequenza di DNA che codifica per un gene conosciuto con una funzione conosciuta, allora nome del gene e funzione possono essere utilizzati per cercare Il record relativo all’EST; } Valgono tutti i metodi di ricerca visti per I DB di NCBI; 188 Bioinformatica EST - http://www.ncbi.nlm.nih.gov/nucest 189 Bioinformatica EST - http://www.ncbi.nlm.nih.gov/nucest } Un set di EST può essere utilizzato per ricostruire un gene; } SVANTAGGI: • Incompleti; • Inaccurati; • • 190 Contaminati; Lo splicing alternativo può causare assemblaggi errati; Bioinformatica EST - http://www.ncbi.nlm.nih.gov/nucest } Ricerca di EST correlate a tp53 di homo sapiens: 191 Bioinformatica EST - http://www.ncbi.nlm.nih.gov/nucest } Ricerca di EST correlate a tp53 di homo sapiens: 192 Bioinformatica EST - http://www.ncbi.nlm.nih.gov/nucest } Ricerca di EST correlate a tp53 di homo sapiens: 193 Bioinformatica EST - http://www.ncbi.nlm.nih.gov/nucest } Ricerca di EST correlate a tp53 di homo sapiens: 194 Bioinformatica EST - http://www.ncbi.nlm.nih.gov/nucest } Le EST risultano molto utili quando vogliamo verificare se un gene predetto (ad es. da GEnScan) è in banca dati; } Possiamo usare BLAST sul DB EST; } Gli eventuali matches individuati corrispondono agli esoni individuati dal programma di predizione ? 195 Bioinformatica EST - http://www.ncbi.nlm.nih.gov/nucest } Preleviamo la sequenza genomica di BAX dal DB Gene e facciamo un blast su EST; In rosso piccole sequenze di cDNA che si legano con regioni della sequenza genomica di BAX corrispondenti effettivamente agli esoni del gene BAX; 196 Bioinformatica