Il supporto informatico alle biblioteche astronomiche Roberto Baglioni Dipartimento di Astronomia - Università di Firenze Settembre 2002 In sintesi Il supporto informatico alle biblioteche non è più e non è solo quell`attività di supporto spicciolo da fornire nei ritagli di tempo Le biblioteche infatti stanno diventando agenti primari della distribuzione delle informazioni nel web, e in questo senso l’esperto/a informatico può considerare la biblioteca come un ambiente potenzialmente ad alto contenuto tecnologico Attività bibliotecarie che richiedono supporto informatico In ordine crescente di tasso tecnologico: Installazione e manutenzione h/w e s/w Le riviste elettroniche Il sito web Il catalogo della biblioteca Gestione di archivi storici Il multiopac Metadati Cosa è stato fatto fino ad ora (e/o si deve continuare a fare) Completato Attualmente non richiede lavoro Richiede lavoro Supporto informatico di base all’utente “biblioteca” Attivazione di una mailing list dei bibliotecari astronomici Programmi di catalogazione e gestione spesso sviluppati localmente Il servizio ACNP (Archivio Collettivo Nazionale dei Periodici) L’accesso alle riviste scientifiche in formato elettronico Supporto alla scelta e alla attivazione del nuovo programma di gestione unico Il progetto multiopac CUBAI (Catalogo Unico delle Biblioteche Astronomiche Italiane) OPAC locale (On line Public Access Catalog): dipende dalle realtà locali Programmi di gestione di archivi storici (vedi archivio “Abetti” ad Arcetri) Il document delivery elettronico Supporto alla creazione e manutenzione del sito web Due parole due sul CUBAI Il CUBAI è un progetto che risale al 1994 ed inizialmente era basato sul protocollo wais Costituisce il primo esempio di collaborazione organica e avanzata tra bibliotecari ed informatici Nella versione attuale (3.1) utilizza un paradigma semplice e democratico: da ciascuno secondo le sue possibilità, ovvero si aggancia ai CGI di interrogazione sviluppati localmente per il web Dalla biblioteca tradizionale alla digital library La rete internet e il web in particolare impongono un cambiamento radicale del modo di intendere la biblioteca e i servizi che essa offre La biblioteca si trasforma in biblioteca digitale nel senso che le informazioni tendono a presentarsi sempre più spesso in formato elettronico e l’accesso ad esse via rete Per questo motivo il moderno bibliotecario usa la sua competenza di “catalogatore” per arricchire l’informazione elettronica di metadati o per fornire supporto a chi deve svolgere questo servizio DC-2002: Metadata for e-Communities Un esempio dell’interesse delle biblioteche è dato dal congresso su Dublin Core che si terrà a Firenze il prossimo mese di Ottobre Il congresso è organizzato da vari enti tra cui la Biblioteca Nazionale Centrale di Firenze, l’Università di Firenze, DCMI, Associazione italiana Biblioteche ecc.ecc. http://www.bncf.net/dc2002/ Il progetto del web semantico Cosa serve Una sintassi: XML Una o più ontologies: Dublin Core Una struttura: RDF/S La prossima generazione di applicazioni web, conosciuta come semantic web, dovrà supportare una semantica direttamente processabile dai computer. Le attività umane potranno essere supportate dalle macchine solo se queste “conoscerannno” le implicazione. Per esempio la macchine deve “sapere” che andare a teatro implica chiamare un taxi, comprare il biglietto, scegliere lo spettacolo, ecc. ecc. (dalla brochure di Sesame) Un po’ di link XML Dublin Core http://www.dublincore.org RDF http://www.w3.org/XML/ http://www.arcetri.astro.it/~baglioni/XML/seminari/ http://www.arcetri.astro.it/~baglioni/talks/xml/ http://www.w3.org/RDF/ Semantic Web http://www.w3.org/2001/sw/ http://www.arcetri.astro.it/~baglioni/talks/semantic_web/ Il software “sesame” ad arcetri Ad Arcetri abbiamo cominciato a fare esperimenti con un s/w open source che si chiama sesame Sesame consente di depositare in un archivio un insieme di triple RDF per renderle disponibili tramite un apposito linguaggio di interrogazione (RQL) ad utenti umani o a programmi (agenti s/w) I primi risultati sull’uso di sesame sono stati presentati in un poster al congresso LISA IV (Library and Information Services in Astronomy) tenuto a Praga lo scorso luglio. The Information Resources in Arcetri Astrophysics Observatory: Between Metadata and Semantic Web Roberto Baglioni Dipartimento di Astronomia dell’Università di Firenze Antonella Gasperini Istituto Nazionale di Astrofisica - Osservatorio Astrofisico di Arcetri The project The library of the Arcetri Astrophysical Observatory is looking into the possibility of a way of publishing different kinds of electronic documents on the net and a way of enriching them with semantic metadata. We have realized that RDF (Resource Description Framework) from W3C and the DCMS (Dublin Core Metadata Set) are, for the moment, the two main building blocks of the semantic web. Furthermore, RDF seems to be a good method to represent IFLA FRBR information (Jørgensen, 2002) The steps of the project In a first phase we are focusing on the library catalogue and in a second phase we will consider bibliographies, preprints and technical reports, web pages, archives of astronomical data, photographic and historical archives. All the documents contained on the Arcetri’s web site can be filled with metadata in order to build sophisticated relationships among them based on their semantic contents. Resource Description Framework RDF superimposes a structure to the way we represent knowledge. This structure makes it easier for the machines to process statements. Each RDF statement is expressed like a triple where the three elements follow a predefined pattern. URI Type of predicate Value A way to represent knowledge This oriented graph respresents some knowledge. An RDF parser can •Navigate the graph •Extract some portion of the graph •Modify the graph XML serialization Actually, for better processing RDF is usually expressed using the XML syntax. http://www/something DC:creator Joe Smith <?xml version = '1.0’ ?> <rdf:RDF xmlns:rdf="http://www.w3.org/1999/02/22-rdf-syntax-ns#" xmlns:DC="http://purl.org/dc/elements/1.1/"> <rdf:Description rdf:about=”http://www/something"> <DC:creator> Joe Smith </DC:creator> </rdf:Description> </rdf:RDF> Tools: RQL and Sesame The first thing we need is a tool for storing, querying and modify a model, that is a set of RDF triples. A DBMS with an RDF front end is the natural choice. RQL is a specific language for RDF queries. The queries in RQL are translated in SQL by the front end. The name of the front end is Sesame. RQL Front end SQL DBMS RDF repository Sesame Sesame is an architecture for efficient storage and expressive querying of large quantities of RDF metadata. Sesame is developed by Aidministrator Nederland b.v. http://www.aidministrator.nl Architecture of Sesame http protocolo handler soap protocolo handler Request router Admin module Query module Export module Repository abstraction layer repository Sesame can handle requests from the net. Three modules are available for adding, querying and exporting RDF models. RQL RQL is a query language specific for RDF and RDF schema. select author, title from {resource} DC:creator {author}, {resource} DC:title {title} where title like "*stellar*"