Bioinformatica
Banche dati specializzate
Banche dati specializzate
} 
PDB: Banca dati strutture proteiche 3D;
} 
SNP – Single Nucleotide Polymorphism (integrato in NCBI): Banca dati delle mutazioni;
} 
GEO Gene Expression Omnibus (integrato in NCBI): Database di dataset e espressioni
geniche provenienti da esperimenti di microarray;
} 
Genome (Initegrato in NCBI): Browser genomico;
} 
UCSC Genome Browser: Browser genomico (CENNI);
} 
ENSEMBL: Browser Genomico (CENNI);
} 
GO Gene Ontologies:Vocabolario unificato per la descrizione di tutte le funzioni dei geni e
dei prodotti genici in generale;
2
Bioinformatica
Banche dati specializzate
} 
BioSystems – Pathways (Integrato in NCBI);
} 
KEGG Pathway Database;
} 
Pathway Commons;
} 
TarBase: microRNA Database;
} 
Mirò: Dati riguardanti miRNA e geni corredati anche da informazioni su processi, funzioni e
malattie correlate;
} 
mirBase: microRNA Database;
} 
EST(Expressed Sequence Tag ): E’ una collezione di brevi sequenze di acidi nucleici
provenienti da genbank. Esse rappresentano una risorsa per valutare espressioni geniche,
trovare potenzioli mutazioni, annotare geni.
3
Bioinformatica
PDB - http://www.rcsb.org/pdb/home/home.do
4
Bioinformatica
PDB - http://www.rcsb.org/pdb/home/home.do
Protein Data Bank rappresenta il punto di partenza per qualsiasi ricerca di tipo strutturale.
5
Bioinformatica
PDB - http://www.rcsb.org/pdb/home/home.do
6
Bioinformatica
PDB - http://www.rcsb.org/pdb/home/home.do
} 
Nella ricerca testuale è possibile utilizzare gli operatori booleani AND, OR, NOT
affiancando anche l’uso di parentesi (come visto nei DB precedenti);
} 
E’ possibile utilizzare i caratteri speciali “*” e “?” (non è consentito il carattere *
all’inizio di una frase);
7
Bioinformatica
PDB - http://www.rcsb.org/pdb/home/home.do
Ricerchiamo tutte le strutture che riguardano BCL2 e sono coinvolte nella morte
programmata della cellula:
} 
8
Bioinformatica
PDB - http://www.rcsb.org/pdb/home/home.do
Sommario
9
Bioinformatica
PDB - http://www.rcsb.org/pdb/home/home.do
Statistiche e grafici
10
Bioinformatica
PDB - http://www.rcsb.org/pdb/home/home.do
Possiamo
perfezionare la
query accedendo
alla ricerca
avanzata dove
possiamo
aggiungere
termini.
11
Bioinformatica
PDB - http://www.rcsb.org/pdb/home/home.do
Possiamo scegliere tra
diversi tipi di query:
Possiamo scegliere di non visualizzare strutture
molto simili
12
Bioinformatica
PDB - http://www.rcsb.org/pdb/home/home.do
} 
13
Prima Entry:
} 
ID;
} 
Nome della struttura;
} 
Autori (cliccando su un
autore verranno
visualizzate tutte le
strutture ad esso relative);
} 
Data di rilascio;
} 
Classificazione della
struttura;
} 
Tipo di esperimento usato;
} 
Composto (con link ai
dettagli);
Bioinformatica
PDB - http://www.rcsb.org/pdb/home/home.do
} 
E’ possibile scaricare
l’entry in formato PDB;
} 
Visualizzare l’entry sul
browser;
} 
Visualizzare graficamente
la struttura usando JMOL;
14
Bioinformatica
PDB - http://www.rcsb.org/pdb/home/home.do
} 
15
Cliccando sulla
entry viene
visualizzata la pagina
con le
caratteristiche della
struttura;
Bioinformatica
PDB - http://www.rcsb.org/pdb/home/home.do
} 
16
Menu:
} 
Sommario;
} 
Sequenza;
} 
Similarità di sequenza
e 3D;
} 
Letteratura;
} 
Etc…..
Bioinformatica
PDB - http://www.rcsb.org/pdb/home/home.do
} 
Visualizzazione 3D.
Scegliamo prima cosa
visualizzare:
} 
17
Biological Assembly: Parte
della struttura che si è provato
(o si crede) sia quella
funzionale;
Bioinformatica
PDB - http://www.rcsb.org/pdb/home/home.do
} 
18
Lanciamo JMOL: E’ un’ applet JAVA
Bioinformatica
PDB - http://www.rcsb.org/pdb/home/home.do
} 
Stile di visualizzazione;
Tipo di colorazione;
} 
Rappresentazione della superfice;
} 
19
Bioinformatica
PDB - http://www.rcsb.org/pdb/home/home.do
File PDB (http://www.wwpdb.org/docs.html). Atomi della struttura:
20
Bioinformatica
PDB - http://www.rcsb.org/pdb/home/home.do
} 
} 
ESERCIZIO I:
Cercate la struttura tridimensionale con codice PDB: 1BJ4, 1bww, 1dlw, 1sw0;
} 
Quale è il nome della proteina corrispondente?
Visualizzare il file PDB corrispondente.
} 
Visualizzate le strutture in 3D.
} 
21
Bioinformatica
PDB - http://www.rcsb.org/pdb/home/home.do
} 
} 
22
ESERCIZIO II:
Visualizzare la struttura 3D della sequenza proteica avente ID Entrez AAG03916;
Bioinformatica
OMIM - http://www.ncbi.nlm.nih.gov/omim
23
Bioinformatica
OMIM - http://www.ncbi.nlm.nih.gov/omim
} 
OMIM, Online Mendelian Inheritance in Man, è una banca dati che contiene
informazioni sui geni umani e sulle malattie genetiche.
} 
Esso contiene la descrizione di geni e delle malattie ad essi associate, i quadri clinici
e i riferimenti bibliografici, oltre a link a sequenze e ad altre risorse web.
} 
Nella banca dati sono riportate solo malattie che sono state associate ad uno o
più geni.
24
Bioinformatica
OMIM - http://www.ncbi.nlm.nih.gov/omim
E’ possibile ricercare info in OMIM utilizzando l’interfaccia di Entrez oppure
direttamente all’indirizzo indicato.
} 
} 
Restano valide tutte
le opzioni di ricerca
viste per Entrez.
Compresi i Limits e
la history.
25
Bioinformatica
OMIM - http://www.ncbi.nlm.nih.gov/omim
Quale gene umano è correlato all’ipertensione (hypertension)? Quali di questi
geni si trovano nel cromosoma 17?
} 
} 
26
Usiamo i Limits
specificando il
cromosoma 17.
Bioinformatica
OMIM - http://www.ncbi.nlm.nih.gov/omim
} 
Quale gene umano è correlato all’ipertensione (hypertension)? Quali di questi
geni si trovano nel cromosoma 17?
Risultati: Localizzazione del gene.
27
Bioinformatica
OMIM - http://www.ncbi.nlm.nih.gov/omim
} 
Quale gene umano è correlato all’ipertensione (hypertension)? Quali di questi
geni si trovano nel cromosoma 17?
Selezionando la prima
Entry otteniamo una
serie di informazioni
con relative
pubblicazioni.
………………………………
……………………………
……………………………………….
……………………………………………
28
Bioinformatica
OMIM - http://www.ncbi.nlm.nih.gov/omim
} 
29
Quale gene umano è correlato all’ipertensione (hypertension)? Quali di questi
geni si trovano nel cromosoma 17?
Bioinformatica
OMIM - http://www.ncbi.nlm.nih.gov/omim
Link al genoma
30
Link alla entry
del gene in
OMIM
Link alla entry
del fenotipo in
OMIM
Bioinformatica
OMIM - http://www.ncbi.nlm.nih.gov/omim
Una importante opzione è data dai “link esterni” in alto a destra che
ci permette di ottenere informazioni correlate in altri database di
NCBI.
I link estern cambiano a seconda del tipo di entry (ad es. per un
gene ci sarà il link alla relativa proteina.
31
Bioinformatica
OMIM - http://www.ncbi.nlm.nih.gov/omim
} 
Esempi di possibili query:
} 
32
(cancer[titl] OR neoplas*[titl] OR tumor[titl]) AND autosomal dominant[clin]
AND 11[chrom]
Bioinformatica
OMIM - http://www.ncbi.nlm.nih.gov/omim
} 
} 
ESERCIZIO I:
Descrivere due modi di ricavare le entry di OMIM riguardanti il cromosoma 12.
} 
Ricercare il record riguardante cystic fibrosis transmembrane conductance
regulator (CFTR) avente ID MIM 602421. Ottenere le proteine correlate.
Ottenere i geni correlati e verificare le varianti di splicing ed esoni.
} 
Ricercare il record relativo a tp53 e ricercare il gene correlato visualizzando le
eventuali isoforme. Che ruolo ha la proteina corrispondente nell’invecchiamento?
} 
Ricercare la patologia fenilchetonuria (PHENYLKETONURIA). Da che cosa
è causata?
33
Bioinformatica
SNP - http://www.ncbi.nlm.nih.gov/snp
34
Bioinformatica
SNP - http://www.ncbi.nlm.nih.gov/snp
} 
Single nucleotide polymorphisms o SNP, sono variazioni di una sequenza di DNA
che si verificano quando un singolo nucleotide (A, T, C o G) nella sequenza del
genoma è alterata;
} 
Una variazione deve essere presente in almeno l'1% della popolazione, per essere
considerato uno SNP;
} 
Molti SNPs non hanno effetto sulla funzione delle cellule, mentre altri possono
predisporre l’uomo alle malattie;
} 
La mappatura degli SNP aiuterà a identificare i geni associati a malattie complesse
come il cancro, il diabete, malattie vascolari, e alcune forme di malattia mentale;
} 
Il database SNP è integrato in NCBI per cui valgono tutti i metodi di ricerca validi
per gli altri Database;
35
Bioinformatica
SNP - http://www.ncbi.nlm.nih.gov/snp
} 
36
Campo di ricerca;
Bioinformatica
SNP - http://www.ncbi.nlm.nih.gov/snp
37
Bioinformatica
SNP - http://www.ncbi.nlm.nih.gov/snp
38
Bioinformatica
SNP - http://www.ncbi.nlm.nih.gov/snp
39
Bioinformatica
SNP - http://www.ncbi.nlm.nih.gov/snp
Esempi
Descrizione
1[CHR] AND (nonsense[Function Class] OR
missense[Function Class] OR
frameshift[Function Class])
SNP localizzati nel cromosoma 1 di tipo
nonsense o missense o frameshift
1[CHR] OR 2[CHR]
SNP localizzati nel cromosoma 1 o 2
1[CHR] OR 2[CHR] NOT unknown[METHOD]
SNP localizzati nel cromosoma 1 o 2 individuati
da tutti i metodi ad eccezione di unknown
Nonsense: Una mutazione che determina la formazione di un codone di STOP;
Frameshift: Una mutazione che causa un cambiamento del frame di lettura;
Missense: Una mutazione in un codone che altera l’aminoacido che codificava;
Method: Metodo utilizzato per ricercare l’SNP (computed, hibridize, dhplc, etc.)
40
Bioinformatica
SNP - http://www.ncbi.nlm.nih.gov/snp
} 
Sono presenti anche altri tag simili a quelli già visti:
} 
[Publication Date];
} 
[Organism];
} 
...........
} 
[SNP_CLASS]
L’ultimo tag specifica la classe del SNP:
} 
Heterozygous (La mutazione riguarda una sequenza sconosciuta ma si è osservato essere
eterozigote);
} 
Multinucleotide (SNP multipli);
} 
indel (Mutazione dovuta a un Inserimento o una cancellazione);
} 
named locus (Sequenze dove la mutazione è indicata con il nome);
} 
Microsatellite (semplici ripetizioni di sequenza);
} 
no variation (senza variazioni):
} 
Snp (presenza di un SNP);
Esempio: "snp"[SNP_CLASS]
41
Bioinformatica
SNP - http://www.ncbi.nlm.nih.gov/snp
} 
Risultati della ricerca di TP53 in Homo Sapiens;
42
Bioinformatica
SNP - http://www.ncbi.nlm.nih.gov/snp
43
Bioinformatica
SNP - http://www.ncbi.nlm.nih.gov/snp
} 
Ricerchiamo eventuali mutazioni nel gene “nitric
oxide synthase 2” (HUGO: NOS2) in Homo
Sapiens;
} 
Ricerchiamo innanzi tutto il gene nel DB Gene;
} 
Da menu laterale a destra, sotto la voce LINK
scegliere “SNP Gene View”
44
………………………….
Bioinformatica
SNP - http://www.ncbi.nlm.nih.gov/snp
} 
45
Otteniamo la lista di SNP riguardanti il gene:
Bioinformatica
SNP - http://www.ncbi.nlm.nih.gov/snp
} 
ESERCIZIO I
} 
Ricercare il gene TP53 di Homo Sapiens e seguendo il LINK a “SNP Gene View” verificare che
tipi di SNP contiene.
} 
Ci sono mutazioni sinonime? Se si indicare per una mutazione quale nucleotide è
cambiato? In cosa è cambiato?
Quale è l’aminoacido codificato?
} 
Quale è la posizione rispetto alla sequenza mRNA?
} 
46
Bioinformatica
GEO – Gene Expression Omnibus
http://www.ncbi.nlm.nih.gov/geo/
47
Bioinformatica
GEO – Gene Expression Omnibus
http://www.ncbi.nlm.nih.gov/geo/
} 
Gene Expression Omnibus (GEO) è una banca dati internazionale relativa ad
esperimenti di varia natura basati sulla tecnologia dei microarrays e preposti allo
studio di espressione di geni;
} 
Fornisce un meccanismo semplice per ricercare e scaricare studi su profili di
espressioni geniche di interesse;
} 
Due classi di dati:
48
} 
Dataset usati per i test;
} 
Gene Expression Profile;
Bioinformatica
GEO – Gene Expression Omnibus
http://www.ncbi.nlm.nih.gov/geo/
I dati sono classificati in 3
categorie:
1.  platform = Informazioni sulla
piattaforma utilizzata (Entry
code GPL#####);
2.  samples = dati sui campioni
biologici utilizzati
nell'esperimento (Entry code
GSM#####);
3.  series = tutti i dati relativi ad
una serie di esperimenti
condotti con una singola
piattaforma sperimentale
(Entry code GSE#####);
49
Bioinformatica
GEO – Gene Expression Omnibus
http://www.ncbi.nlm.nih.gov/geo/
Esempio di record Platform
La pagina contiene
inizialmente informazioni
relative all’esperimento, la
piattaforma utilizzata etc. etc.
50
Bioinformatica
GEO – Gene Expression Omnibus
http://www.ncbi.nlm.nih.gov/geo/
Esempio di record Platform
In fondo alla pagina è
presente una tabella che
descrive il microarray e i geni
coinvolti nell’esperimento.
E’ possibile scaricare la tabella
in vari formati.
51
Bioinformatica
GEO – Gene Expression Omnibus
http://www.ncbi.nlm.nih.gov/geo/
Esempio di record Sample
La pagina contiene
Informazioni relativamente ai
campioni utilizzati nello studio
(ad malati/Sani).
52
Bioinformatica
GEO – Gene Expression Omnibus
http://www.ncbi.nlm.nih.gov/geo/
Esempio di record Sample
In fondo alla pagina è presente
la tabella con il risultato del
processo di ibridizzazione su
un determinato campione.
Infine sono presenti i dati
grezzi (che possono essere
scaricati) da cui sono stati
ricavati i risultati.
53
Bioinformatica
GEO – Gene Expression Omnibus
http://www.ncbi.nlm.nih.gov/geo/
Esempio di record Series
Contiene informazioni su un
gruppo di campioni correlati e
fornisce un punto di riferimento
con la descrizione dell'intero
studio;
Può contenere anche delle
tabelle che descrivono i dati
estratti, conclusioni, sintesi e
analisi
54
Bioinformatica
GEO – Gene Expression Omnibus
http://www.ncbi.nlm.nih.gov/geo/
Interrogare GEO
1. Per dataset;
2. Per profilo di espressione
genica;
3. Per ID;
4. E’ possibile ricercare
datasets o singole entries;
5. Infine è possibile
sottomettere i propri
esperimenti;
55
Bioinformatica
GEO – Gene Expression Omnibus
http://www.ncbi.nlm.nih.gov/geo/
Interrogare GEO Datasets
Esempi di Query
Descrizione
Smoking cancer
Ricerca di informazioni su un argomento
(smok* OR diet) AND (mammals[organism]
NOT human[organism])
Operatori booleani e tag
"roadmap epigenomics"[Project]
Studi su un determinato progetto
"expression profiling by high throughput
sequencing"[DataSet Type]
Tipi di dataset
100:500[Number of Samples]
Dimensioni dei dataset
"age"[Subset Variable Type]
Dataset che contengono “age” come
variabile
2007/01:2007/06[Publication Date]
Data di pubblicazione dello studio
56
Bioinformatica
GEO – Gene Expression Omnibus
http://www.ncbi.nlm.nih.gov/geo/
Interrogare GEO Profiles
Esempi di Query
Descrizione
CYP1A1[Gene Symbol]
Profili riguardanti un gene
(CYP1A1[Gene Symbol] OR ME1[Gene
Symbol]) AND (smok* OR diet)
Profili riguardanti geni in dataset
contenenti specifiche keywords
NM_014033
Genbank ID
kinase[Gene Description] AND GDS182
Nome parziale di un gene in uno specifico
dataset.
apoptosis[Gene Ontology] AND GDS182
Termine Gen Ontology nella descrizione di
uno specifico dataset
(8[Chromosome] AND 10000:3000000[Base
Position]) AND mouse[organism]
Profili riguardanti uno specifico
cromosoma, regione, e specie
2007/01:2007/06[Publication Date]
Data di pubblicazione dello studio
57
Bioinformatica
GEO – Gene Expression Omnibus
http://www.ncbi.nlm.nih.gov/geo/
Ricerchiamo dataset riguardanti la query “smoking cancer”
58
Bioinformatica
GEO – Gene Expression Omnibus
http://www.ncbi.nlm.nih.gov/geo/
Analisi del microarray con algoritmi di clustering;
59
Bioinformatica
GEO – Gene Expression Omnibus
http://www.ncbi.nlm.nih.gov/geo/
Cliccando Invece sul nome dello studio verremo spostati sul Dataset Browser
Informazioni sui sample dell’esperimento
e relativi link;
60
Bioinformatica
GEO – Gene Expression Omnibus
http://www.ncbi.nlm.nih.gov/geo/
Cliccando Invece sul nome dello studio verremo spostati sul Dataset Browser
Profili di espressione genica relativi al
dataset.
61
Bioinformatica
GEO – Gene Expression Omnibus
http://www.ncbi.nlm.nih.gov/geo/
Cliccando su un profilo di espressione genica vengono forniti i risultati dell’esperimento
sui sample (Relativamente a quel gene).
Profilo di espressione genica di ADH6 sui
campioni;
62
Bioinformatica
GEO – Gene Expression Omnibus
http://www.ncbi.nlm.nih.gov/geo/
} 
ESERCIZIO I
}  Ricercare dataset riguardanti l’effetto della vitamina C sulla pelle dell’uomo (Vitamin C,
} 
} 
} 
} 
63
Skin).
Quanti campioni sono presenti?
In quali classi sono suddivisi i campioni?
Visualizzare il profilo di espressione genica di ID 63084153.
Cosa si può dedurre dal profilo? Quale classe di campioni ha le espressioni geniche più
elevate?
Bioinformatica
Genome – NCBI
http://www.ncbi.nlm.nih.gov/sites/entrez?db=genome
64
Bioinformatica
Genome – NCBI
http://www.ncbi.nlm.nih.gov/sites/entrez?db=genome
} 
Contiene i dati di sequenza del genoma e la mappa del genoma di oltre 1000 specie;
} 
Sia genomi completamente sequenziati che quelli in-progress.
} 
Tutti e tre i settori (Batteri, Archea, e Eukaryota) sono rappresentati, così come molti virus, fagi, viroidi,
plasmidi, e organelli;
65
Bioinformatica
Genome – NCBI
http://www.ncbi.nlm.nih.gov/sites/entrez?db=genome
Genomi in base al refSeq status; Genomi Completi o Assembly; Genomi in base alla tassonomia;
66
Bioinformatica
Genome – NCBI
http://www.ncbi.nlm.nih.gov/sites/entrez?db=genome
} 
67
RICERCA AVANZATA (Con eventuale uso della History);
Bioinformatica
Genome – NCBI
http://www.ncbi.nlm.nih.gov/sites/entrez?db=genome
} 
68
RICERCA AVANZATA (Con eventuale uso della History);
Bioinformatica
Genome – NCBI
http://www.ncbi.nlm.nih.gov/sites/entrez?db=genome
} 
69
RICERCA DI PROGETTI RELATIVI ALL’UOMO
Bioinformatica
Genome – NCBI
http://www.ncbi.nlm.nih.gov/sites/entrez?db=genome
} 
Mappa relativa al
cromosoma 9
} 
La mappa è
interattiva: Si può
zoommare, cliccare
sulle sequenze;
} 
Rappresentazione
schematica del
cromosoma con le
varie posizioni;
70
Bioinformatica
Genome – NCBI
http://www.ncbi.nlm.nih.gov/sites/entrez?db=genome
} 
Mappa relativa la
cromosoma 9
} 
Geni presenti e
orientamento
(down = strand
positivo, up= strand
negativo):
71
Bioinformatica
Genome – NCBI
http://www.ncbi.nlm.nih.gov/sites/entrez?db=genome
} 
Link a risorse:
} 
OMIM;
} 
HGNC;
} 
Sv = Sequence viewer;
} 
Pr = Proteina;
} 
Dl = Download sequenza;
} 
Ev = Evidence viewer
(visualizza evidenze
biologiche che
supportano un
particolare modello di
gene);
} 
Hm = HomoloGene;
} 
Sts = UniSTS (sequence
tagged sites);
} 
SNP;
72
Bioinformatica
Genome – NCBI
http://www.ncbi.nlm.nih.gov/sites/entrez?db=genome
} 
73
NAVIGARE TRA GLI ASSEMBLY
Bioinformatica
Genome – NCBI
http://www.ncbi.nlm.nih.gov/sites/entrez?db=genome
} 
74
NAVIGARE TRA GLI ASSEMBLY
Bioinformatica
Genome – NCBI
http://www.ncbi.nlm.nih.gov/sites/entrez?db=genome
} 
75
NAVIGARE TRA GLI ASSEMBLY
Bioinformatica
Genome – NCBI
http://www.ncbi.nlm.nih.gov/sites/entrez?db=genome
} 
76
NAVIGARE TRA GLI ASSEMBLY
Bioinformatica
Genome – NCBI
http://www.ncbi.nlm.nih.gov/sites/entrez?db=genome
} 
77
NAVIGARE TRA GLI ASSEMBLY
Bioinformatica
Genome – NCBI
http://www.ncbi.nlm.nih.gov/sites/entrez?db=genome
} 
78
NAVIGARE TRA GLI ASSEMBLY
Bioinformatica
Genome – NCBI
http://www.ncbi.nlm.nih.gov/sites/entrez?db=genome
} 
79
NAVIGARE TRA GLI ASSEMBLY
Bioinformatica
Genome – NCBI
http://www.ncbi.nlm.nih.gov/sites/entrez?db=genome
} 
80
NAVIGARE TRA GLI ASSEMBLY
Bioinformatica
Genome – NCBI
http://www.ncbi.nlm.nih.gov/sites/entrez?db=genome
} 
81
NAVIGARE TRA GLI ASSEMBLY
Bioinformatica
Genome – NCBI
http://www.ncbi.nlm.nih.gov/sites/entrez?db=genome
} 
82
NAVIGARE TRA GLI ASSEMBLY
Bioinformatica
Genome – NCBI
http://www.ncbi.nlm.nih.gov/sites/entrez?db=genome
} 
83
NAVIGARE TRA GLI ASSEMBLY
Bioinformatica
Genome – NCBI
http://www.ncbi.nlm.nih.gov/sites/entrez?db=genome
} 
ESERCIZIO I
84
} 
Utilizzando il DB Assembly, quanti progetti di sequenziamento relativi a Homo Sapiens
sono presenti? Quale consorzio/Centro guida il progetto più recente?
} 
Utilizzando il DB Genome, determinare se il gene Acta2 del topo (mus musculus)
si trova nel cromosoma 19. In quale strand si trova? Quante varianti di splicing si
conoscono?
Bioinformatica
Genome – NCBI
http://www.ncbi.nlm.nih.gov/sites/entrez?db=genome
} 
ESERCIZIO III
85
} 
Selezionare il genoma completo relativo al topo (mus musculus).
} 
In quale cromosoma si trova il gene TCF3?
} 
Quanti geni ortologhi ci sono? In quali Specie?
} 
Quante STS ci sono?
} 
Utilizzare sequence viewer per visualizzare tutte le sequenze vicine al gene in questione.
} 
Quante varianti di splicing sono conosciute per tale gene?
Bioinformatica
UCSC Genome Browser http://genome.ucsc.edu/
cgi-bin/hgGateway
86
Bioinformatica
UCSC Genome Browser http://genome.ucsc.edu/
cgi-bin/hgGateway
} 
UCSC Genome Browser è un altro sito contenente informazioni su svariati genomi;
Posizione nel genoma
Organismo - Specie
87
Specifico sequenziamento
per un determinato
genoma
Possiamo ricercare anche
per nome di un gene
Bioinformatica
UCSC Genome Browser http://genome.ucsc.edu/
cgi-bin/hgGateway
Se possediamo una sequenza genomica, di mRNA, o una proteina e non conosciamo la
sua posizione nel genoma UCSC mette a disposizione il tool BLAT (simile a BLAST) che
ricerca la posizione utilizzando un allineamento.
88
Bioinformatica
UCSC Genome Browser http://genome.ucsc.edu/
cgi-bin/hgGateway
89
Bioinformatica
ENSEMBL
http://www.ensembl.org/
90
Bioinformatica
ENSEMBL
http://www.ensembl.org/
Possiamo usare l’opzione BROWSE scegliendo il genoma di interesse.
91
Bioinformatica
ENSEMBL
http://www.ensembl.org/
} 
92
Possiamo interrogare il DB:
Esempio
Descrizione
chr7
Visualizza tutto del
cromosoma 7
chr3:1-1000000
Visualizza il primo milione di
basi del cromosoma 3
AF083811
Visualizza la regione
contenente la sequenza con
Accession GenBank
homeobox caudal
Visualizza sequenze relative a
geni homeobox caudal
Evans,J.E.
Visualizza sequenze
depositate dal determinato
autore
Bioinformatica
ENSEMBL
http://www.ensembl.org/
STEP 1
} 
} 
} 
STEP 1I
} 
93
Ricerchiamo ad esempio per
Homo Sapiens il gene RHO
Selezioniamo “GENE” e poi
clicchiamo sul link
Bioinformatica
ENSEMBL
http://www.ensembl.org/
} 
STEP 1II
} 
94
Il primo link si riferisce al gene
cercato (ID ENSG00000163914)
Bioinformatica
ENSEMBL
http://www.ensembl.org/
} 
STEP 1V
} 
La barra azzurra
rappresenta il
genoma
Sequenze vicine (in questo
caso si tratta di IFT122)
95
} 
I gene RHO (cliccare per avere
informazioni aggiuntive).
} 
In questo caso c’e’ solo una
variante di splicing.
} 
In caso di più varianti si possono
visualizzare le info aggiuntive
Bioinformatica
ENSEMBL
http://www.ensembl.org/
} 
Opzioni
96
Bioinformatica
ENSEMBL
http://www.ensembl.org/
} 
Opzioni
97
Sequence: Sequenza in formato fasta che mette in evidenza esoni ed introni;
Bioinformatica
ENSEMBL
http://www.ensembl.org/
} 
Opzioni
98
Genomic Alignment: Permette di allineare il genoma con altri (esempio in basso con
esoni in rosso);
Bioinformatica
ENSEMBL
http://www.ensembl.org/
} 
Opzioni
99
Gene Tree: Visualizza il gene in un contesto filogenetico. Usato per determinare
ortologhi e paraloghi
Bioinformatica
ENSEMBL
http://www.ensembl.org/
} 
Opzioni
100
Bioinformatica
ENSEMBL
http://www.ensembl.org/
} 
Opzioni
SNP in formato tabellare o immagine
trascritto
Variazioni aminoacidi
101
Bioinformatica
ENSEMBL
http://www.ensembl.org/
} 
Opzioni
} 
102
Cliccando sull’immagine
in corrispondenza di
uno SNP otteniamo le
informazioni sulla
sequenza
Bioinformatica
ENSEMBL
http://www.ensembl.org/
103
Bioinformatica
ENSEMBL
http://www.ensembl.org/
104
Bioinformatica
ENSEMBL
http://www.ensembl.org/
105
Bioinformatica
ENSEMBL
http://www.ensembl.org/
106
Bioinformatica
ENSEMBL
http://www.ensembl.org/
} 
Opzioni
Infine cliccando su location otteniamo informazioni grafiche sulla sequenza e sulle
sequenze vicine
107
Bioinformatica
ENSEMBL
http://www.ensembl.org/
} 
Per Approfondimenti:
} 
108
http://www.ensembl.org/info/website/tutorials/coursebook.pdf
Bioinformatica
ENSEMBL
http://www.ensembl.org/
} 
ESERCIZIO I
109
} 
Ricercare il gene TP53 nell’uomo.
} 
Quante sequenze vengono trovate? Selezionare la sequenza corretta.
} 
Quali sono i geni nelle vicinanze della sequenza in questione?
} 
Ci sono geni ortologhi? Elencare qualche specie.
} 
Ci sono SNP? Tra questi c’e’ qualche mutazione che ha fatto perdere un codone di
stop?
Bioinformatica
GO – Gene Ontology DB
http://www.geneontology.org/
110
Bioinformatica
GO – Gene Ontology DB
http://www.geneontology.org/
} 
} 
} 
Il numero crescente di sequenze geniche note e di informazioni disponibili
su di esse spesso causa dei problemi come per esempio l’assegnazione di
nomi multipli allo stesso gene oppure l’assegnazione di funzioni differenti
alla stessa proteina.
Queste funzioni possono essere tutte corrette (spesso una proteina svolge
più di una funzione) ma esse devono essere definite utilizzando una
terminologia corretta e rigorosa al fine di evitare descrizioni troppo
soggettive.
Lo scopo del progetto Gene Ontology (GO) è quello di creare un
vocabolario unificato per la descrizione di tutte le funzioni dei geni e dei
prodotti genici in generale, in maniera stabile per ogni organismo. In
particolare:
} 
} 
} 
} 
111
Supportare e definire il vocabolario
Fornire un accesso libero
Fornire le annotazioni
Sviluppare tools per l’utilizzo del vocabolario
Bioinformatica
GO – Gene Ontology DB
http://www.geneontology.org/
} 
I biologi tendono ad usare nomi diversi per lo stesso
concetto:
} 
es. traduzione vs sintesi proteica
} 
Ciò crea notevoli problemi per qualunque approccio
computazionale
} 
Una ontologia è definita da:
} 
} 
} 
112
un vocabolario di termini e nomi per i concetti
un set di relazioni logiche tra di essi
le definizioni precise e univoche dei vari termini
Bioinformatica
GO – Gene Ontology DB
http://www.geneontology.org/
} 
Il progetto GO ha definito tre diversi tipi di vocabolari di
termini biologici unificati (ontologie):
} 
processo biologico: un meccanismo controllato da più prodotti genici
con diverse funzioni molecolari e che porta ad un particolare risultato.
Un processo biologico viene portato a termine e completato attraverso
un insieme ordinato di funzioni molecolari e spesso coinvolge una
trasformazione chimica o fisica;
} 
funzione molecolare: l’attività biochimica di un prodotto genico.
Spesso questa definizione si riferisce alla capacità di un prodotto genico
(o di un complesso proteico) di esprimersi in un determinato contesto
metabolico;
} 
componente cellulare: zona specifica della cellula dove un prodotto
genico è attivo;
113
Bioinformatica
GO – Gene Ontology DB
http://www.geneontology.org/
114
Bioinformatica
GO – Gene Ontology DB
http://www.geneontology.org/
} 
I tre vocabolari sono basati su tre liste separate di GO terms;
} 
I termini in una ontologia sono collegati tra di loro da due tipi di relazioni:
is_a e part_of;
} 
I geni (o prodotti) sono annotati con dei GO terms;
} 
I termini di una ontologia sono organizzati in DAG (Direct Acyclic
Graphs)‫;‏‬
115
Bioinformatica
GO – Gene Ontology DB
http://www.geneontology.org/
} 
Il tool messo a disposizione per accedere al DB si chiama AmiGO
} 
E’ possibile:
}  Ricercare geni o prodotti di geni;
} 
} 
116
Eseguire BLAST;
Ricercare e navigare attraverso i GO terms;
Bioinformatica
GO – Gene Ontology DB
http://www.geneontology.org/
} 
} 
} 
Esempi di GO Terms:
} 
DNA Repair;
} 
Protein kinase activity;
} 
Mitochondrion;
Filtrare:
} 
Processo;
} 
Funzione;
} 
Componente cellulare;
Geni o prodotti di geni
coinvolti
117
Bioinformatica
GO – Gene Ontology DB
http://www.geneontology.org/
} 
Cliccando su un GO
Term viene
presentato come
una struttura ad
albero che mette in
evidenza la
relazione tra i vari
GO Terms.
118
Bioinformatica
GO – Gene Ontology DB
http://www.geneontology.org/
Cliccando sul link relativo vengono visualizzati i Geni e prodotti di geni associati al GO Term
} 
} 
Filtri: Tipo di prodotto, DB, Specie
119
} 
Link al riferimento
Bioinformatica
GO – Gene Ontology DB
http://www.geneontology.org/
} 
La ricerca di geni e proteine permette di trovare informazioni generiche, sequenze, e link ai
Database Uniprot, EMBL,PDB, NCBI etc etc.
120
Bioinformatica
GO – Gene Ontology DB
http://www.geneontology.org/
} 
ESERCIZIO I
} 
Ricercare GO Terms che contengono le tre parole “positive gluconeogenesis regulation”;
} 
Di che tipo di ontologia si tratta?
} 
Quanti prodotti di geni sono correlati?
} 
Ci sono prodotti di geni relativi a Homo Sapiens?
121
Bioinformatica
KEGG Patways
http://www.genome.jp/kegg/pathway.html
Kyoto Enciclopedia of Genes and
Genomes - Pathways
122
Bioinformatica
KEGG Patways
http://www.genome.jp/kegg/pathway.html
} 
Un pathway è una cascata di reazioni (metaboliche o regolatrici) sequenziali (lineari o
ramificate) che porta alla manifestazione di un particolare fenotipo cellulare (ad
esempio la morte cellulare) o alla modificazione di composti chimici (ad esempio la
produzione di energia da una molecola di zucchero);
} 
KEGG è l’enciclopedia di Kyoto di geni e genomi. Tra i database più consultati c’e’
PATHWAY;
} 
KEGG PATHWAY è una collezione di grafici disegnati manualmente rappresentanti patways
molecolari per il metabolismo, genetic information processing, processi cellulari, malattie
umane, e sviluppo di farmaci.
} 
In ogni grafico gli elementi interagenti costituiscono i nodi di un grafo e le relazioni sono
descritte dagli archi che congiungono i nodi.
} 
Ogni pathway è identificato da un ID a 5 cifre precedute dal codice dell’organismo (ad es.
HSA per homo sapiens).
123
Bioinformatica
KEGG Patways
http://www.genome.jp/kegg/pathway.html
124
Bioinformatica
KEGG Patways
http://www.genome.jp/kegg/pathway.html
} 
} 
Ricerchiamo patway relativi all’ Apoptosi nell’uomo;
E’ possibile ricercare anche per pathway ID;
125
Bioinformatica
KEGG Patways
http://www.genome.jp/kegg/pathway.html
} 
Elenco dei pathway:
126
Bioinformatica
KEGG Patways
http://www.genome.jp/kegg/pathway.html
127
} 
Descrizione;
} 
Classe di appartenenza;
} 
Mappa;
} 
Riferimenti bibliografici;
} 
Geni coinvolti;
} 
Pathway Correlate;
Bioinformatica
KEGG Patways
http://www.genome.jp/kegg/pathway.html
128
Bioinformatica
KEGG Patways
http://www.genome.jp/kegg/pathway.html
} 
ESERCIZIO I
}  Ricercare il pathway relativo a “pancreatic cancer” nell’uomo.
}  E’ correlata al pathway dell’apoptosis?
}  Quale è il nome del primo gene correlato alla malattia? Tale gene è correlato
anche al cancro della tiroide?
}  Ci sono interazioni di fosforilazione tra proteine?
129
Bioinformatica
BioSystems - http://www.ncbi.nlm.nih.gov/biosystems
130
Bioinformatica
BioSystems - http://www.ncbi.nlm.nih.gov/biosystems
BioSystem è il DB di NCBI che contiene pathways provenienti da diversi DB (come ad
es. KEGG).
Le modalità di interrogazione sono quelle già viste per gli altri DB di NCBI
131
Bioinformatica
BioSystems - http://www.ncbi.nlm.nih.gov/biosystems
La ricerca del pathway di Apoptosis nell’uomo da come risultati patwhay tratti da
diversi DB (REACTOME, WikiPathways, KEGG)
132
Bioinformatica
BioSystems - http://www.ncbi.nlm.nih.gov/biosystems
Cliccando sul pathway di KEGG ritroviamo lo
stesso pathway ricercato su KEGG.
Vengono mostrate informazioni anche
relativamente a molecole coinvolte, pathway
correlati, citazioni e commenti;
133
Bioinformatica
BioSystems - http://www.ncbi.nlm.nih.gov/biosystems
} 
ESERCIZIO I
}  Effettuare su BioSystem la stessa ricerca impostata nell’esercizio su KEGG e
provare a rispondere (se possibile) alla stesse domande scegliendo questa volta
il pathway che si trova sul DB WikiPathways.
134
Bioinformatica
Pathway Commons
http://www.pathwaycommons.org/pc/
135
Bioinformatica
Pathway Commons
http://www.pathwaycommons.org/pc/
} 
Ricerchiamo i pathway che contengono
la keyword “BCRA1” o il gene
“BCRA1”;
} 
136
Possiamo filtrare
i risultati
ricercando solo
in alcuni DB e/o
determinati
organismi;
Bioinformatica
Pathway Commons
http://www.pathwaycommons.org/pc/
} 
Risultati della ricerca
137
Bioinformatica
Pathway Commons
http://www.pathwaycommons.org/pc/
} 
Cliccando sul primo pathway troviamo informazioni su Reazioni Biochimiche, Sub
Pathway e Molecole coinvolte;
138
Bioinformatica
Pathway Commons
http://www.pathwaycommons.org/pc/
} 
Una funzione molto utile è quella di caricare automaticamente il pathway su
Cytoscape;
139
Bioinformatica
Pathway Commons
http://www.pathwaycommons.org/pc/
} 
Ricerca del patway di apoptosis nell’uomo (impostando il filtro)
140
Bioinformatica
Pathway Commons
http://www.pathwaycommons.org/pc/
} 
Ricerca del patway di apoptosis nell’uomo (impostando il filtro)
} 
E’ possibile visualizzare
il pathway seguendo il
link al DB
E’ possibile scaricare:
}  Il pathway in XML;
} 
141
Gli ID relativi a vari
DB dei geni coinvolti
Bioinformatica
Pathway Commons
http://www.pathwaycommons.org/pc/
} 
Seguendo il link su REACTOME è possibile “NAVIGARE” il pathway e i relativi
componenti (www.reactome.org).
142
Bioinformatica
Pathway Commons
http://www.pathwaycommons.org/pc/
Sono disponibili delle API Web per
poter accedere direttamente al
DB dai propri programmi;
} 
http://www.pathwaycommons.org/pc/webservice.do?cmd=help
http://cbio.mskcc.org/software/cpath/
} 
E’ possibile scaricare il software
cPath per interagire con i
pathways.
143
Bioinformatica
Pathway Commons
http://www.pathwaycommons.org/pc/
} 
ESERCIZIO I
}  Ricercare i pathway in cui il gene tp53 dell’uomo è coinvolto.
}  Quanti pathway trovate?
}  Come si chiama il primo patway trovato? Da quale DB è stata prelevato?
}  Visualizzare il pathway.
}  Caricare il pathway in Cytoscape e applicare un layout “Organic”.
144
Bioinformatica
TarBase - http://diana.cslab.ece.ntua.gr/tarbase/
145
Bioinformatica
TarBase - http://diana.cslab.ece.ntua.gr/tarbase/
} 
TarBase è un Database di miRNA e relativi target di diverse specie.
Ricerchiamo dati per un
determinato organismo,
miRNA,Gene
146
Bioinformatica
TarBase - http://diana.cslab.ece.ntua.gr/tarbase/
} 
TarBase è un Database di target di miRNA di diverse specie.
Data_Type: Tipo di repressione esercitata
dai miRNA specifici sul gene specifico.
1. mRNA cleavage: degradazione del
mRNA a causa della presenza di miRNA
2. mRNA repression: l'mRNA è presente,
ma non la produzione di proteine ( dovuto
alla presenza del miRNA).
147
Bioinformatica
TarBase - http://diana.cslab.ece.ntua.gr/tarbase/
} 
TarBase è un Database di target di miRNA di diverse specie.
Support_Type: Validità della interazione
1. TRUE: il miRNA riduce il livello di
proteina;
2. FALSE: l'espressione del gene target non
è influenzato dalla presenza di miRNA;
3. WEAK: si é osservata solo una
repressione debole;
4. pSILAC or MicroArray: Casi che
presentano solo una prova indiretta di
interazione;
148
Bioinformatica
TarBase - http://diana.cslab.ece.ntua.gr/tarbase/
} 
TarBase è un Database di target di miRNA di diverse specie.
Any S_S_S: Single Site Sufficiency (presenza
di un singolo sito di interazione)
1.  NO,UNKNOWN,YES;
149
Bioinformatica
TarBase - http://diana.cslab.ece.ntua.gr/tarbase/
} 
TarBase è un Database di target di miRNA di diverse specie.
Any MRE: Numero di interazioni (possibili
target) del miRNA con il gene;
150
Bioinformatica
TarBase - http://diana.cslab.ece.ntua.gr/tarbase/
} 
TarBase è un Database di target di miRNA di diverse specie.
Any D_S: Direct Support (si riferisce a
procedure sperimentali che forniscono prove
dirette per quanto riguarda l'interazione
miRNA-target)
151
Bioinformatica
TarBase - http://diana.cslab.ece.ntua.gr/tarbase/
} 
TarBase è un Database di target di miRNA di diverse specie.
Any I_S: Indirect Support (si riferisce a
procedure sperimentali che forniscono prove
indirette, ad es. “In silico prediction”)
152
Bioinformatica
TarBase - http://diana.cslab.ece.ntua.gr/tarbase/
} 
TarBase è un Database di target di miRNA di diverse specie.
Any Pathology or event:
La patologia o evento biologico legato alla
interazione del miRNA.
153
Bioinformatica
TarBase - http://diana.cslab.ece.ntua.gr/tarbase/
} 
TarBase è un Database di target di miRNA di diverse specie.
Any Mis_Regulation:
Il livello di espressione del miRNA necessaria
per innescare un evento specifico o
patologia.
154
Bioinformatica
TarBase - http://diana.cslab.ece.ntua.gr/tarbase/
} 
TarBase è un Database di target di miRNA di diverse specie.
Any Protein Type:
Funzione biologica del gene target (ad
esempio apoptosis, dna repair etc etc).
155
Bioinformatica
TarBase - http://diana.cslab.ece.ntua.gr/tarbase/
} 
TarBase è un Database di target di miRNA di diverse specie.
Any Differentially_expressed_in:
Livello di espressione dei miRNA in specifici
tessuti.
156
Bioinformatica
TarBase - http://diana.cslab.ece.ntua.gr/tarbase/
} 
TarBase è un Database di target di miRNA di diverse specie.
Any Paper: miRNA correlati ad una
specifica pubblicazione.
157
Bioinformatica
TarBase - http://diana.cslab.ece.ntua.gr/tarbase/
} 
TarBase è un Database di target di miRNA di diverse specie.
Any PPMID: PubMed ID della specifica
pubblicazione.
158
Bioinformatica
TarBase - http://diana.cslab.ece.ntua.gr/tarbase/
} 
TarBase è un Database di target di miRNA di diverse specie.
Any PPMID: ENSEMBL ID dei geni presenti
nel DB.
159
Bioinformatica
TarBase - http://diana.cslab.ece.ntua.gr/tarbase/
} 
Ricerchiamo ad esempio miRNA che reprimono BCL2 nell’uomo
160
Bioinformatica
TarBase - http://diana.cslab.ece.ntua.gr/tarbase/
} 
Otteniamo 4 risultati
161
Bioinformatica
TarBase - http://diana.cslab.ece.ntua.gr/tarbase/
} 
ESERCIZIO I
}  Esistono miRNA capaci di avere un effetto repressivo su TP53 nell’uomo?
} 
Esiste qualche miRNA capace di avere un effetto repressivo in qualunque gene
coinvolto nel tumore al seno nell’uomo (breast cancer)?
} 
Quali sono i miRNA nell’uomo coinvolti nell’inibizione dell’apoptosi?
162
Bioinformatica
miRò – miR Ontology DB
http://ferrolab.dmi.unict.it/miro/
163
Bioinformatica
miRò – miR Ontology DB
http://ferrolab.dmi.unict.it/miro/
} 
miRò è un nuovo sistema sviluppato dal gruppo del prof. Ferro che fornisce agli
utenti associazioni di tipo miRNA-Fenotipo nell’uomo;
} 
Può essere interrogato via WEB attraverso una interfaccia standard e/o avanzata;
} 
Permette di identificare al livello di miRNA relazioni tra:
} 
Geni;
} 
Processi;
} 
Funzioni;
164
Bioinformatica
miRò – miR Ontology DB
http://ferrolab.dmi.unict.it/miro/
165
Bioinformatica
miRò – miR Ontology DB
http://ferrolab.dmi.unict.it/miro/
166
Bioinformatica
miRò – miR Ontology DB
http://ferrolab.dmi.unict.it/miro/
167
Bioinformatica
miRò – miR Ontology DB
http://ferrolab.dmi.unict.it/miro/
168
Bioinformatica
miRò – miR Ontology DB
http://ferrolab.dmi.unict.it/miro/
169
Bioinformatica
miRò – miR Ontology DB
http://ferrolab.dmi.unict.it/miro/
DATA MINING
I miRNA sono associati a GO Terms.
Possono essere clusterizzati in base ai termini in comune (Cioè miRNA associati agli
stessi termini possono essere raggruppati);
miRo` permette di calcolare sottoinsiemi di miRNA con alcune caratteristiche in
comune (Usando i Maximal Frequent Itemset);
Un threshold alto restituisce un piccolo gruppo di miRNA associati ad un grandi
numero di termini; Un thtreshold piccolo restituisce diversi gruppi di miRNA associati
a pochi termini;
170
Bioinformatica
miRò – miR Ontology DB
http://ferrolab.dmi.unict.it/miro/
DATA MINING
L’interfaccia di miRò permette di scegliere N miRNA con un criterio di
associazione(processo, malattia)
Il sistema è in grado di trovare tutti i sottoinsiemi di miRNA e i processi o malattie ai
quali essi sono molto correlati (I risutati sono ordinati rispetto ad uno score);
Questo potrebbe suggerire che un set di miRNA possa agire cooperativamente in una
determinata funzione biologica;
171
Bioinformatica
miRò – miR Ontology DB
http://ferrolab.dmi.unict.it/miro/
172
Bioinformatica
miRò – miR Ontology DB
http://ferrolab.dmi.unict.it/miro/
DATA MINING – Un caso di studio
E’ stato provato che il cluster miR-17-92 ha un ruolo fondamentale in:
•  Proliferazione delle cellule;
•  Inibizione dell’apoptosis nelle cellule tumorali;
•  Sono tutti coinvolti in certi tumori (lynphoma, melanoma, breast cancer,
colonrectal cancer, lung cancer, ovarian cancer, pancreas cancer, prostate cancer,
stomach cancer);
•  Hanno tutti un ruolo nel normale sviluppo del cuore, dei polmoni e del sistema
immunitario;
173
Bioinformatica
miRò – miR Ontology DB
http://ferrolab.dmi.unict.it/miro/
DATA MINING – Un caso di studio
La ricerca avanzata in miRò
produce tra gli altri
anche i risultati provati
sperimentalmente.
Lo stesso ricercando per
process.
174
Bioinformatica
miRò – miR Ontology DB
http://ferrolab.dmi.unict.it/miro/
} 
ESERCIZIO I
}  Ricercare i miRNA e relativi geni target che sono stati sperimentalmente
validati, coinvolti nell’ipertensione (hypertension).
}  Quanti miRNA trovate?
}  Quali sono i geni target?
175
Bioinformatica
miRò – miR Ontology DB
http://ferrolab.dmi.unict.it/miro/
} 
ESERCIZIO II
}  Ricercare miRNA che sono correlati al gene TP53 e al tumore al seno (breast
cancer). I mirna devono essere Validati oppure predetti da TargetScan, oppure
predetti da Pictar.
}  Quante associazioni trovate?
}  Relativamente al miRNA hsa-miR-498, da chi è stato predetto?
}  Seguendo il link al software di predizione rispondere alle seguenti domande:
176
} 
Quanti target per siti conservati?
} 
Quanti per siti non conservati?
Bioinformatica
miRò – miR Ontology DB
http://ferrolab.dmi.unict.it/miro/
} 
ESERCIZIO III
} 
} 
} 
177
Cercare tutti i miRNA potenzialmente coinvolti nel cancro del fegato (liver cancer).
Tra questi ce ne sono alcuni il cui target coinvolto nel cancro del fegato è stato validato
(es. miR-16, let-7b etc.).
Controllare l'espressione di questi miRNA nel fegato per vedere se sono realmente
espressi in questo tessuto (non c'è un link diretto, bisogna tornare alla ricerca semplice,
cercare i miRNA uno per uno e controllarne l'espressione nei vari tessuti).
Bioinformatica
miRò – miR Ontology DB
http://ferrolab.dmi.unict.it/miro/
} 
ESERCIZIO IV
} 
Cercare tutti i miRNA che sono coinvolti contemporaneamente nell' "Heart
failure" (Disease), "Apoptosis" (Process) ed "RNA Binding" (Function), ma NON in
"Congenital Heart Disease".
178
Bioinformatica
miRò – miR Ontology DB
http://ferrolab.dmi.unict.it/miro/
} 
NOTA: Il db mirò è attualmente in manutenzione e
alcune funzionalità potrebbero non funzionare
correttamente!
179
Bioinformatica
miRBase - http://www.mirbase.org/
180
Bioinformatica
miRBase - http://www.mirbase.org/
} 
miRBase è un DB contenente informazioni su
miRNA predetti da targetScan e Pictar;
} 
E’ possibile ricercare miRNA in base alla
specie (utilizzando il tasto BROWSE);
181
Bioinformatica
miRBase - http://www.mirbase.org/
Si può cervcare anche per:
}  Nome del miRNA.
}  In base alla posizione nel genoma;
}  Per gruppi di miRNA;
}  Per tessuto;
} 
Per sequenza;
182
Bioinformatica
miRBase - http://www.mirbase.org/
} 
Ricercando un miRNA otteniamo le sequenze nelle varie specie (ad es HSA indica
Homo Sapiens). Cliccando sul miRNA relativo otteniamo informazioni sulla
sequenze, sulle referenze etc etc.
183
Bioinformatica
miRBase - http://www.mirbase.org/
} 
Quando si selezionano miRNA di una data specie utilizzando il browser, è possibile
allinearne le sequenze con ClustalW al fine di ricercarne similitudini o differenze.
184
Bioinformatica
miRBase - http://www.mirbase.org/
} 
Quando si selezionano miRNA di una data specie utilizzando il browser, è possibile
allinearne le sequenze con ClustalW al fine di ricercarne similitudini o differenze.
Allineamento con CLUSTALW
185
Bioinformatica
miRBase - http://www.mirbase.org/
} 
ESERCIZIO I
}  Quali sono i miRNA nel virus dell’ HIV? Quali sono gli articoli correlati in
Pubmed? Allineare le sequenze.
} 
186
Ci sono miRNA del Cane che interagiscono con il cromosoma X?
Bioinformatica
EST - http://www.ncbi.nlm.nih.gov/nucest
187
Bioinformatica
EST - http://www.ncbi.nlm.nih.gov/nucest
} 
Il DB di expressed sequences tags contiene piccole sequenze (generalmente tra 300 e 500 pb)
di DNA espresse (e quindi presenti nel citoplasma) che hanno subito il processo di splicing;
} 
In pratica si tratta di «pezzi» di geni espressi(come ad esempio ESONI etc. etc.);
} 
Possono essere utilizzate come sonde nei microarray;
} 
Possono essere utilizzate per identificare nuovi geni andando a ricercare nel DNA
appaiamenti con le EST;
} 
Se un EST fa match con una sequenza di DNA che codifica per un gene conosciuto con una
funzione conosciuta, allora nome del gene e funzione possono essere utilizzati per cercare Il
record relativo all’EST;
} 
Valgono tutti i metodi di ricerca visti per I DB di NCBI;
188
Bioinformatica
EST - http://www.ncbi.nlm.nih.gov/nucest
189
Bioinformatica
EST - http://www.ncbi.nlm.nih.gov/nucest
} 
Un set di EST può essere utilizzato per ricostruire un gene;
} 
SVANTAGGI:
•  Incompleti;
•  Inaccurati;
• 
• 
190
Contaminati;
Lo splicing alternativo può causare assemblaggi errati;
Bioinformatica
EST - http://www.ncbi.nlm.nih.gov/nucest
} 
Ricerca di EST correlate a tp53 di homo sapiens:
191
Bioinformatica
EST - http://www.ncbi.nlm.nih.gov/nucest
} 
Ricerca di EST correlate a tp53 di homo sapiens:
192
Bioinformatica
EST - http://www.ncbi.nlm.nih.gov/nucest
} 
Ricerca di EST correlate a tp53 di homo sapiens:
193
Bioinformatica
EST - http://www.ncbi.nlm.nih.gov/nucest
} 
Ricerca di EST correlate a tp53 di homo sapiens:
194
Bioinformatica
EST - http://www.ncbi.nlm.nih.gov/nucest
} 
Le EST risultano molto utili quando vogliamo verificare se un gene predetto (ad es.
da GEnScan) è in banca dati;
} 
Possiamo usare BLAST sul DB EST;
} 
Gli eventuali matches individuati
corrispondono agli esoni
individuati dal programma di
predizione ?
195
Bioinformatica
EST - http://www.ncbi.nlm.nih.gov/nucest
} 
Preleviamo la sequenza genomica di BAX dal DB Gene e facciamo un blast su EST;
In rosso piccole sequenze di
cDNA che si legano con regioni
della sequenza genomica di BAX
corrispondenti effettivamente agli
esoni del gene BAX;
196
Bioinformatica
Scarica

Bioinformatica