WP 5 – Attività 1
Il portale Web
www.hrbc-genomics.net
Paolo Romano
Istituto Nazionale per la Ricerca sul Cancro
([email protected])
Romano, Portale Web
1
Sommario

Motivazioni e obiettivi del portale

Panoramica dei contenuti

Qualche parola in più su:
• SRS
• questionari
• databases
Romano, Portale Web
2
Motivazioni

strumenti bioinformatici distribuiti su siti diversi:
 difficoltà nella ricerca e nella scelta degli strumenti,

interfacce, metodi di ricerca, strutture dati
eterogenei:
 difficoltà nell’utilizzo degli strumenti disponibili

post-genomica in continua evoluzione:
 strumenti bioinformatici poco numerosi e interfacce
primitive,

elevata partecipazione nel progetto:
 difficoltà di coordinamento e messa in comune dei dati
 sinergie e ottimizzazione risorse
Romano, Portale Web
3
Obiettivi
Realizzare un portale che:
 ospiti servizi e strumenti di tipo bioinformatico, utili
ai ricercatori coinvolti nel progetto e non,
 dia visibilità al progetto e ai partner (parte
accessibile a tutti)
 serva come strumento di lavoro e coordinamento
per le unità di ricerca (parte ad accesso riservato)
 rimanga un riferimento alla fine del progetto
Romano, Portale Web
4
Organizzazione
non solo portale, contenuti propri
 gestione comune
 siti mirror per garantire servizio e
prestazioni
 software “ingombranti” non replicati

Romano, Portale Web
5
Risultati attesi




Disponibilità di strumenti di tipo generale (banche
dati, sistemi di ricerca, programmi per analisi delle
sequenze, strumenti bioinformatici di uso comune)
SRS per interrogazione di banche dati di pubblico
dominio (GenBank, LocusLink, OMIM, SwissProt,
ecc.) e strumenti di analisi di pubblico dominio
(BLAST, FASTA, ecc.)
Disponibilità di strumenti di analisi e banche dati di
specifico interesse ai fini del progetto HRBC
Nuovi strumenti specificamente sviluppati da questa
unità
Romano, Portale Web
6
Riferimenti





Lingua:
inglese (e italiano nella parte riservata)
Nome:
Hormone Responsive Breast Cancer (HRBC)
Genomics Network
Dominio: hrbc-genomics.net
(e hrbc-genomics.org e hrbc-genomics.info)
Indirizzo:
www.hrbc-genomics.net
Logo:
da definire
Romano, Portale Web
7
Logo attuale
Romano, Portale Web
8
Contenuti (area pubblica)
Presentazione del progetto
 sintesi del progetto di ricerca
 responsabili unità operative e altri contatti
 elenco articoli/documenti vari prodotti nell’ambito
del progetto
Romano, Portale Web
9
Contenuti (area pubblica)

sito SRS (con accesso a software d’analisi, se
collegato a SRS)
–
–
–
–
–
elenco database da definire
possibile inserimento di nuovi database
elenco software a definire
limitazione d’accesso (per progetto, per utente)
riferimento iniziale SRS @ ISA/CNR
Romano, Portale Web
10
Contenuti (area pubblica)

link a siti unità operative e partner
link a siti di interesse scientifico affine al progetto
link a corsi di formazione on-line (free) selezionati
tra quelli esistenti per la loro attinenza al progetto e
agli strumenti del progetto

elenchi da definire


Romano, Portale Web
11
Contenuti (area pubblica)

Materiale didattico corsi organizzati dal progetto
– Sull’accesso e uilizzo degli strumenti
– Sulle tecnoilogie (microarray)

Materiale didattico corsi organizzati dai partner
– Biology for dummies
– Perl

Mirror di corsi creati da altri ricercatori
– BioComputing Division VSNS
Romano, Portale Web
12
Contenuti (area pubblica)

analisi dei risultati dei questionari
– Quali tools installare e perché
– Quali tools sviluppare e perché

dati estratti dinamicamente da db
Romano, Portale Web
13
Contenuti (area riservata)



progetto di ricerca dettagliato,
elenco dettagliato partner,
documenti prodotti nell’ambito del progetto:
– presentazioni a meetings (questo!)
– relazioni annuali
Romano, Portale Web
14
Contenuti (area riservata)

archivio mailing list di progetto
–
–
–
–
coordinamento
annunci interni
annunci pubblici (?)
unità operative
Romano, Portale Web
15
Contenuti (area riservata)

Database dati sperimentali del progetto
– Database microarray
– Database overall del progetto

Interfacce per accesso a software di analisi dei dati
di espressione genica e proteomica
– Sviluppati nel progetto
– Sottoposti a licenza
– Computazionalmente onerosi
Romano, Portale Web
16
Contenuti (area riservata)
Questionari

Esempi:
– Quali software esistenti si desiderano sul sito
– Quali analisi sarebbe utile implementare

Implementazione:
– Compilazione tramite form
– Inserimento dati in db
– Estrazione dati riassuntivi
Romano, Portale Web
17
Contenuti (area riservata)
Sviluppo cooperativo di documenti

Esempi:
– Preparazione materiale corsi
– Redazione relazioni/articoli

Strumenti
– Wiki?
Romano, Portale Web
18
SRS - Sequence Retrieval Software


SRS è un esempio di integrazione locale di
banche dati eterogenee in maniera semplice
ed efficiente
L’approccio originale di SRS consiste in
o Banche dati disponibili localmente come “flat file”
o Definizione di sintassi specifiche per l’estrazione
dei dati
o Utilizzo di link interni espliciti e impliciti tra
banche dati
o L’integrazione trasparente con applicazioni
o L’integrazione esterna tramite link HTML
Romano, Portale Web
19
SRS – I links
• I collegamenti (links) tra banche dati
possono essere definiti in maniera
o Esplicita, quando un termine è
appositamente inserito in un field come
riferimento a una entry di un’altra banca
dati
o Implicita, cercando termini comuni
all’interno di fields predefiniti di banche
dati diverse
Romano, Portale Web
20
SRS – I links espliciti
• Esplicito riferimento a un’altra
banca dati
Other_collection_numbers CCUG 34964; NCIB 12128
Literature DSM ref.no. 72; DSM ref.no. 1300
EMBL: X52289
Romano, Portale Web
21
SRS – I links impliciti
• Termini comuni in banche dati
diverse
TargetGene: APOE
Constructed_from pMB1, pSC101 and Tn3
Name Gluconacetobacter xylinus subsp. xylinus, (Brown
1886) Yamada, Hoshino and Ishikawa 1998 VL
Literature Nucleic Acids Res 1990;18:4967 [PMID: 2395673]
Romano, Portale Web
22
SRS – Possibili estensioni
• SRS è facilmente estendibile
o Nuove banche dati possono essere aggiunte
dando una descrizione della loro sintassi nel
linguaggio Icarus o fornendo il DTD
o È possibile stabilire nuovi collegamenti tra
banche dati inserendo xrefs o lasciando che
siano identificati da SRS, specificando i fields
o Molte banche dati sono distribuite in formato “flat
file” e con relative sintassi Icarus (qualche DTD)
Romano, Portale Web
23
SRS: operatori link
• SRS consente di utilizzare i link
esistenti per le ricerche tramite un
apposito operatore: <
o swissprot < EMBL
o EMBL < swissprot
o swissprot < [EMBL-id: X52289]
o [EMBL-organism:human]
< [medline-pmid:3137981]
Romano, Portale Web
24
Gestione di un sito SRS

Aggiornamento del software
o Nuove releases (3-4 / anno)
o Modifiche software / nuove funzioni

Aggiornamento banche dati
o Nuove releases (3-4 / anno)
o Modifica contenuto / struttura file

Controllo processi
o Directory temporanee
o Problemi memoria/disco
o Analisi degli accessi
Romano, Portale Web
25
Nuove banche dati





Definizione delle informazioni e analisi delle
sorgenti
Analisi dei link con banche dati esistenti
Definizione di una struttura dati e di un
formato “flat file” o DTD
Creazione di un’analizzatore di sintassi
Indicizzazione
Romano, Portale Web
26
Con la collaborazione di…..
Idee raccolte e discusse con:



Assunta Manniello, Istituto Nazionale per la
Ricerca sul Cancro, Genova
Elda Rossi e Francesco Falciano, CINECA,
Bologna
Angelo Facchiano, ISA/CNR, Avellino
Romano, Portale Web
27
Stato del sito prototipo
http://www.hrbc-genomics.net/
http://www.hrbc-genomics.net/internal/
(user: hrbc, password: testpwd)
Contenuti:



Struttura definita, pagine riservate protette
Link a vari strumenti su siti dei partner (ISA/CNR,
CINECA)
Corso Biocomputing Division (BCD) della Virtual
School of Natural Sciences (VSNS)
Romano, Portale Web
28
Scarica

Presentazione di PowerPoint