SAPERI STORICI E NUOVE TECNOLOGIE Università degli Studi di Napoli “Federico II” Dipartimento di discipline storiche “Ettore Lepore” Nicola Madonna Dalla catalogazione al sistema informativo di ateneo: il formato di gestione bibliografica Unimarc Definizioni Documento: «Qualsiasi oggetto utilizzabile a fini di consultazione, ricerca, informazione» (Devoto-Oli) Biblioteca: «una raccolta di documenti ordinata per il loro reperimento» (Guerrini) Catalogo: costituisce il mezzo che consente l’incontro tra i documenti di una biblioteca e i bisogni informativi dell’utenza 5 maggio 2006 2 Documenti = fonti d’informazione Secondo il contenuto informativo, i documenti si distinguono in fonti: Primarie documenti consultabili per sé, che non rimandano necessariamente o esclusivamente ad altri documenti (es.: enciclopedie, saggi, opere letterarie, musicali, teatrali, cinematografiche, figurative, rapporti tecnici, progetti, statistiche) Secondarie Documenti che rinviano ad altri documenti (Es.: bibliografie, cataloghi, indici e abstract di riviste) 5 maggio 2006 3 Fonti secondarie e repertori bibliografici Una citazione bibliografica, un abstract o un sommario di un articolo, l’indice di un’annata di un periodico sono descrizioni sintetiche di documenti finalizzate a facilitarne l’identificazione. Esse consistono nell’estrapolazione, dai documenti descritti, di alcune informazioni essenziali, che poi vengono registrate secondo determinate convenzioni, in modo da risultare facilmente identificabili da parte dei destinatari del messaggio Fonti secondarie possono essere pubblicate con la stessa fonte primaria descritta, oppure autonomamente: in tal caso, sono raggruppate e ordinate in appositi repertori bibliografici 5 maggio 2006 4 Repertori bibliografici in ambiente elettronico Un repertorio bibliografico in ambiente elettronico può consistere in: una semplice lista precoordinata di citazioni, consultabile in maniera sequenziale (es.: un elenco di citazioni in una pagina web) un vero e proprio database, o un sistema integrato di databases 5 maggio 2006 5 Database bibliografici Un data-base è un archivio elettronico di documenti (o comunque di dati omogenei tra loro). Gli archivi (file) raccolgono e indicizzano le singole registrazioni (record). Un data-base bibliografico è un archivio di fonti secondarie a carattere testuale 5 maggio 2006 6 Cos’è un “formato” Si definisce “formato” la struttura logica degli oggetti digitali. Perché un software possa riconoscere e gestire un oggetto digitale, deve identificarne la struttura come corrispondente a una categoria astratta di strutture o formati ad esso noti. I “formati di scambio” dei dati sono dedicati allo scambio di dati fra sistemi differenti. 5 maggio 2006 7 Formati strutturati Un formato si dice strutturato (o complesso) se in uno stesso documento, insieme ai dati informativi, sono presenti diverse tipologie di metadati strutturali (descrittivi, amministrativi, ecc.). Più è analitico un formato strutturato, più indici se ne potranno ricavare. I record bibliografici sono oggetti digitali a formato molto strutturato. 5 maggio 2006 8 ISBD Tra gli scopi con cui erano nate le ISBD, oltre a «fornire norme per la catalogazione descrittiva compatibili in tutto il mondo allo scopo di facilitare lo scambio internazionale delle registrazioni bibliografiche», vi era anche quello di «favorire la conversione delle registrazioni bibliografiche in forma leggibile dalla macchina». Per questo secondo scopo sono nati formati di gran lunga più analitici: i MARC. 5 maggio 2006 9 Lo standard ISO 2709 L’International Organization for Standardization ha pubblicato nel 1996 la terza edizione della norma ISO 2709 per la standardizzazione del formato scambio su nastro magnetico dei record bibliografici (Format for bibliographic information interchange on magnetic tape). La norma, agilissima, serve unicamente ad impostare la struttura astratta del formato. 5 maggio 2006 10 Conformità a ISO 2709 Elementi necessari ad una registrazione per essere conforme a ISO2709: Etichetta del record (guida o leader): 24 caratteri con informazioni codificate sul record. Indice (directory): riporta un numero di occorrenze uguale al numero dei campi presenti nella registrazione. Campi di dati (datafields): indicatori, identificatori di sottocampo, codici di sottocampo, dati (max. 9999 car. per campo e 99999 car. per record). Separatore di registrazione (field terminator): codice di fine record (%). 5 maggio 2006 11 Caratteristiche di un record ISO 2709 Un record ISO 2709 è dunque un file lineare di testo. Ciò consente la sua esportabilità e lo scambio tra database gestiti da software diversi. 5 maggio 2006 12 Il formato Unimarc Definizione: Unimarc è un formato macchina standardizzato per lo scambio di record bibliografici. Unimarc è: Conforme a ISO 2709. Conforme alle ISBD. Flessibile rispetto a livelli di analiticità differenziati. Ridondante (sono previsti campi e modalità diversi per una stessa tipologia di informazione). Gerarchico (ha campi e sottocampi). 5 maggio 2006 13 Origini di MARC Anni ’60: la Library of Congress pensa di convertire il catalogo cartaceo in un catalogo su elaboratore; si sviluppa il primo formato MARC (MAchine Readable Cataloguing), da cui nel 1973 deriverà la prima edizione di ISO 2709. Nel 1968 LC in cooperazione con la British Library sperimenta MARC II, prototipo di tutti i MARC successivi. Anni ’70: nei vari Paesi nascono e si diffondono MARC nazionali fondati su ISO 2709. 5 maggio 2006 14 Nascita di UNIMARC Nel ’75 fu pubblicato UKMARC (per la Gran Bretagna) e INTERMARC (per paesi francofoni e slavi); in Italia si diffuse ANNAMARC (Automazione Nella NAzionale). A partire dal ’77 appaiono a cura dell’IFLA le prime edizioni di UNIMARC Negli Stati Uniti si passò invece da MARC II a USMARC; nel 1999 è stato pubblicato MARC 21. 5 maggio 2006 15 Prime edizioni di UNIMARC La prima edizione (1977) conteneva solo il trattamento dei materiali per cui si era già pubblicato il corrispondente ISBD (cioè monografie e periodici). La seconda edizione (1980) armonizzava lo standard alle revisioni di ISBD, ma comprendeva anche materiale cartografico e non librario Nel 1983 esce l’UNIMARC handbook, indispensabile guida all’utilizzo del formato. 5 maggio 2006 16 Aggiornamenti e Raccomandazioni Negli anni ’90 l’IFLA costituisce il PUC (Permanent Unimarc Committee) con il compito di seguire la costante evoluzione del formato, ma anche di promuoverne la diffusione. Il PUC ha pubblicato tre aggiornamenti del manuale (1996, 1998, 2000) e numerose Guideline (raccomadazioni) dedicate alle registrazioni analitiche, alle microforme, al libro antico, alla catalogazione a più livelli e alle risorse elettroniche. 5 maggio 2006 17 Evoluzione di Unimarc Negli anni ’90 si moltiplicano i progetti europei per la conversione in Unimarc dai Marc nazionali. In Italia già dal 1985 la BNI aveva adottato Unimarc come formato di scambio delle registrazioni; in Unimarc sono anche i dati del catalogo della Biblioteca nazionale centrale di Firenze. Unimarc tende ad affermarsi non solo come formato di scambio, ma anche come formato di gestione “interno”. 5 maggio 2006 18 La catalogazione con Unimarc Unimarc è sviluppato sulla base delle ISBD, prevede pertanto campi e codici specifici per record catalografici relativi a: monografie, periodici, parti componenti, libri antichi, partiture musicali, documenti cartografici, immagini, registrazioni audio e video, materiali museali, risorse lettroniche. 5 maggio 2006 19 I quattro formati Unimarc Unimarc prevede a tutt’oggi 4 formati: Unimarc Bibliographic Format Unimarc Authority Format (1991, poi 1996) Unimarc Classification Format (2000) Unimarc Holdings Format (in programmazione) 5 maggio 2006 20 Analisi del formato Unimarc Bibliographic, come tutti i formati scambio, ha tre componenti base: la struttura fisica gli identificatori del contenuto il contenuto della registrazione 5 maggio 2006 21 La struttura fisica La struttura fisica definisce le regole di costruzione della registrazione, indicando la tipologia dei campi di cui si compone, se cioè di lunghezza fissa o variabile, e la possibile ripetibilità dei campi stessi. 5 maggio 2006 22 Gli identificatori del contenuto Vi sono tre tipi di identificatori: etichette (stringa di tre caratteri che identifica il tipo di campo che la segue); indicatori (sono al massimo due per campo, sono numerici e hanno valore diverso a seconda dei campi utilizzati) codici di sottocampo (introducono all’interno di un campo gli elementi che costituiscono un sottocampo) 5 maggio 2006 23 Il contenuto della registrazione Il contenuto della registrazione è costituito dai dati contenuti in ciascun campo e sottocampo. Anche se le problematiche relative a questo aspetto sono di pertinenza delle regole di catalogazione e degli standard applicati, tuttavia il passaggio dalla catalogazione manuale a quella automatizzata rende sempre più stretti i rapporti fra il formato e il contenuto. 5 maggio 2006 24 Tipologie di campi In Unimarc troviamo: campi di dati codificati e di dati descrittivi (sono sempre dati testuali, ma i primi sono in codice, i secondi in linguaggio naturale) campi a lunghezza fissa e a lunghezza variabile (i primi sono di dati codificati) campi obbligatori, raccomandati e facoltativi (sono obbligatori solo i campi: 001, 100, 101, 200, 801 e, in presenza del dato, 120, 123 e 206) campi ripetibili e non ripetibili (ma attenzione a non confondere campi e sottocampi: la casistica è oltremodo varia) 5 maggio 2006 25 I Campi di dati (1) I campi di dati sono la parte del record in cui vengono riportate generalmente le vere e proprie informazioni bibliografiche, in alcuni tipi di campi in forma testuale, in altri in forma codificata All’interno di un campo, i dati sono generalmente articolati in sottocampi e possono essere introdotti da un massimo di due indicatori, che ne specificano il contenuto o il trattamento 5 maggio 2006 26 I Campi di dati (2) • I campi delle informazioni descrittive corrispondono alle aree ISBD e al loro interno i sottocampi corrispondono alla punteggiatura ISBD • L’ISBD viene in tal modo (non sostituito ma) disambiguato e tradotto in un formato macchina 5 maggio 2006 27 L’etichetta del record: Leader È una stringa di 24 caratteri contenenti informazioni generali sul record espresse in codice. È obbligatoria: è necessaria per le macchine ai fini della corretta decodifica della registrazione È il primo elemento della registrazione; non ha etichetta, né indicatori, né sottocampi. Ogni informazione occupa una posizione fissa all’interno della stringa (ciò la rende più facilmente individuabile dai software). 5 maggio 2006 28 I dati codificati presenti nel Leader 0-4 Lunghezza del record (massimo 99.999 caratteri) 5 Stato del record 6 Tipo di documento descritto 7 Livello bibliografico 8 Livello gerarchico (rispetto ad altro record) 9 Non definito 10 Lunghezza degli indicatori 11 Lunghezza degli identificatori di sottocampo 12-16 Posizione del carattere iniziale del primo campo 17 Livello di codifica UNIMARC 18 Tipo di catalogazione (conformità a ISBD) 20-22 23 5 maggio 2006 Struttura della directory Non definito 29 Esempio di Leader LDR: 00515nam0#2200193###|450# nuovo record, di 515 caratteri, dove il carattere iniziale del primo campo occupa la posizione 193esima. Il record è relativo a un testo a stampa monografico, non è collegato gerarchicamente ad altri records, è pienamente codificato secondo UNIMARC e la catalogazione è pienamente conforme a ISBD 5 maggio 2006 30 I blocchi Unimarc 0 Blocco di identificazione 1 Blocco delle informazioni codificate 2 Blocco delle informazioni descrittive 3 Blocco delle note 4 Blocco dei legami 5 Blocco dei titoli in relazioni 6 Blocco dell’analisi semantica 7 Blocco della responsabilità intellettuale 8 Blocco dei dati internazionali 9 Blocco di uso locale 5 maggio 2006 31 Blocco 0 - Identificazione I campi contrassegnati da un tag che comincia per “0” contengono numeri o stringhe alfanumeriche che identificano univocamente: il record. Esempi: 001 numero di sistema del record nel proprio archivio (obbligatorio); 005 data e ora dell'ultima modifica 035, numero di sistema dell'archivio da cui il record è stato importato Il documento catalogato. Esempi: 5 maggio 2006 010 ISBN 011 ISSN 020 numero di bibliografia nazionale 32 Blocco 1 Informazioni codificate I campi contrassegnati da un tag che comincia per "1" contengono sequenze di informazioni espresse in linguaggio codificato, utile a disambiguare l'informazione e a facilitare operazioni di filtering su archivi estesi. Ogni elemento della sequenza è identificabile ed enucleabile dalla sua posizione, che è predefinita. Esempi: 100 Dati generali per l’elaborazione 101 Lingua della pubblicazione 102 Paese della pubblicazione 105 Materiale testuale, monografie 110 Periodici 135 Risorse elettroniche 5 maggio 2006 33 Blocco 2 Informazioni descrittive I campi il cui tag comincia per "2" contengono le informazioni prescritte dall'ISBD, espresse -come in ISBD- in termini tratti dal linguaggio naturale. La differenza sta solo nella punteggiatura, che in UNIMARC si omette ed è sostituita dal sistema dei campi e sottocampi (eccetto il segno "=" per i titoli paralleli, che permane). Esempio: 200 1 $a Titolo proprio $b Indicazione generica del materiale $c Titolo proprio di altro autore $d= Titolo parallelo $e complemento del titolo $f Prima formulazione di responsabilità $g Seconda formulazione di responsabilità 5 maggio 2006 34 I campi più importanti del blocco 2 200 Titolo e formulazione di responsabilità 205 Edizione 210 Pubblicazione, distribuzione, ecc. 215 Descrizione fisica 225 Collezione 5 maggio 2006 35 Blocco 3 - Note I campi il cui tag comincia per "3" contengono le informazioni che in un record ISBD sono fornite in nota. Per diverse tipologie di nota esiste un apposito campo 3xx. Alcuni ess.: 300 Note generali 304 Note riferite al titolo e alla formulazione di responsabilità 324 Nota di edizione originale 327 Nota di contenuto 330 Sommario o abstract 336 Nota sul tipo di risorsa elettronica 5 maggio 2006 36 Blocco 4 - Legami I campi il cui tag comincia per "4" contengono informazioni su altri record collegati a quello in esame. Sono previste due tecniche: Quella dell'incapsulamento, fondata appunto sull'incapsulamento nel campo 4xx $1 di interi campi dell'altro record, inclusi i tag, gli indicatori e gli identificatori di sottocampo. Esempio: 410 1$1001005678 Quella per sottocampi standard, fondata sulla citazione in appositi sottocampi del campo 4xx delle informazioni presenti nell'altro record Esempio: 410 1$tTitolo della serie$0numero di sistema del record collegato 5 maggio 2006 37 Blocco 5 Titoli in relazione I campi il cui tag comincia per "5" contengono titoli associati alla pubblicazione catalogata. Ess.: 500 Titolo uniforme 510 Titolo parallelo 512 Titolo di copertina 516 Titolo del dorso 517 Altri titoli varianti 532 Titolo per esteso 5 maggio 2006 38 Blocco 6 Analisi semantica I campi il cui tag comincia per "6" contengono le formulazioni di soggetto, secondo sistemi che utilizzano termini del linguaggio naturale o codici alfanumerici. Ess.: 610 Termini di soggetto non controllati 675 CDU (Classificazione Decimale Universale) 676 CDD (Classificazione Decimale Dewey) 680 Classificazione della Library of Congress 5 maggio 2006 39 Blocco 7 Responsabilità intellettuale I campi il cui tag comincia per "7" contengono le intestazioni per autori ed enti, ossia i nomi di persone o enti cui è associata una responsabilità intellettuale rispetto alla pubblicazione catalogata. Sono previsti campi per vari livelli di responsabilità (700, 710 principale; 701, 711, alternativa; 702, 712 secondaria; 730, livello non specificato), e sottocampi ("$4") in cui specificare in codice il tipo di relazione del soggetto con l'opera . Se l'intestazione è tratta da un authority file, si raccomanda di citare il corrispondente record di authority (nel sottocampo "$3") Non essendo standardizzate le forme delle intestazioni, vanno specificati l'ordine di citazione delle parti del nome (mediante indicatori appositi) e la punteggiatura (che va apposta dal catalogatore). 5 maggio 2006 40 I campi del blocco 7 700 Autore personale – Responsabilità principale 701 Autore personale – Responsabilità alternativa 702 Autore personale – Responsabilità secondaria 710 Ente collettivo – Responsabilità principale 711 Ente collettivo – Responsabilità alternativa 712 Ente collettivo – Responsabilità secondaria 5 maggio 2006 41 Blocco 8 Dati internazionali I campi il cui tag comincia per "8" contengono informazioni di genere vario: sul record Esempi: 801 fonte della registrazione (i.e.: chi l'ha prodotta) 886 dati non convertiti dal formato fonte o sulla pubblicazione Esempio: 856 localizzazione e accesso elettronici (URL) 5 maggio 2006 42 I campi "9xx", "x9x", "xx9" • I campi con un "9" nel tag contengono dati di tipo non previsto dal formato UNIMARC ma appartenenti a convenzioni descrittive nazionali. • Tali dati, a meno di accordi espressi, non vengono esportati. • In assenza di un formato UNIMARC per dati gestionali sulle copie fisiche, spesso un campo "9xx" viene utilizzato per registrare tali dati. • Si ricorre al "9" nel tag anche per registrare soggetti o classificazioni tratti da sistemi non riconosciuti ufficialmente sul piano internazionale. • La BNI utilizza i campi 900 e 910 per registrare forme non preferite di nomi di persone o di enti. 5 maggio 2006 43 I set di caratteri I primi calcolatori sono nati con set di caratteri minimali (numeri e caratteri del solo alfabeto latino), dovendo rispondere unicamente a esigenze di calcolo. Ciò costituì un regresso rispetto alle schede cartacee, venendo meno i caratteri diacritici e i segni speciali 5 maggio 2006 44 I caratteri ASCII Da tempo c’è convergenza sul set di caratteri base sullo standard ISO 646, 7-bit coded character set for information processing interchange, meglio noto come set di caratteri ASCII (American standard code for information interchange). Il set comprende 128 caratteri: i primi 32 riservati a funzioni di controllo, 94 ai caratteri grafici, 1 allo spazio, 1 alla cancellazione. Anche in questo modo però i caratteri e i segni speciali rappresentabili non bastano a rispondere alle esigenze del trattamento dei dati bibliografici. 5 maggio 2006 45 I set di caratteri estesi La Library of Congress ha sviluppato un set di caratteri esteso (ANSEL, Extended latin alphabet coded character set for bibliographic use), poi utilizzato per la codifica delle registrazioni USMARC. Unimarc ha invece adottato la norma ISO 5426, Extended latin set. Ciò significa che per transcodificare una registrazione da un Marc all’altro è necessario anche tradurre i caratteri speciali da un set all’altro. 5 maggio 2006 46 I set di caratteri per alfabeti non latini Unimarc prevede anche la possibilità di trattare registrazioni in alfabeti non latini. Ecco i set attualmente previsti: ISO Registration #37 = cirillico di base ISO DIS 5427 = cirillico esteso ISO 5428 = greco antico ISO 6438 = africano ISO 10586 = georgiano 5 maggio 2006 47 Unicode Anche i set appena visti sono tuttavia ben lontani dall’esaurire le esigenze della catalogazione; essi sono inoltre di spiccata impronta europea. Una risposta infinitamente più ricca alle esigenze espresse, è stata data da Unicode (norma ISO 10646 livello 3). Unicod è basato su una codifica a 16 bits ed è in grado di gestire fino a 65.000 caratteri. È prevista una sua ulteriore estensione, l’UTF-16, che consentirebbe la codifica di oltre un miliione di dati. Unimarc prevede già la possibilità di utilizzare Unicode; tutti i principali produttori di hardware e software per l’automazione bibliotecaria si stanno orientando verso questo standard. 5 maggio 2006 48 Presente e futuro di Unimarc (1) Unimarc è uno standard ormai “maturo” La sua difficoltà principale è oggi costituita dal fatto che il MARC si fonda sulla norma ISO 2709 studiata per database gerarchici in tempi in cui il web non esisteva ISO 2709 di fatto contrasta con i set di metadati per la codifica di documenti web (è stato pensato per la creazione di registrazioni fuori linea e inoltre che contengano solo materiale testuale) 5 maggio 2006 49 Presente e futuro di Unimarc (2) Si delineano due possibilità: 1) Rivedere profondamenteil Marc 2) Integrarlo con altri tipi di metadati, come Dublin core, pienamente compatibile con il web (con l’obiettivo, tra l’altro, di facilitare forme di autodescrizione della propria opera da parte degli autori stessi, senza la mediazione di bibliotecari o altri specialisti dell’informazione) 5 maggio 2006 50 Presente e futuro di Unimarc (3) Un altro sviluppo possibile è stato individuato nell’utilizzazione della sintassi XML, come “cornice” entro cui- tramite una specifica DTD- far rientrare i rispettivi metadati descrittivi, eliminando- per il MARC- la sintassi ISO 2709 ma conservandone l’analiticità Ciò consentirebbe, tra l’altro, di gestire record bibliografici con relazioni gerarchiche più ricche e analitiche. Per un esempio di schema Unimarc-XML vedere all’URL: http://www.bncf.firenze.sbn.it/progetti/unimarc/slim/document ation/unimarcslim.html 5 maggio 2006 51 2ª parte OPAC panoramica e guida all’uso 5 maggio 2006 52 OPAC Un OPAC è un particolare tipo di database bibliografico in cui sono descritte le pubblicazioni possedute da - o accessibili tramite - una biblioteca o una rete di biblioteche. L’Opac deve rispondere a tre tipi di domande: se la biblioteca possiede una determinata pubblicazione quali opere di uno stesso autore e quali edizioni di una stessa opera sono possedute Quali opere su un determinato argomento sono possedute 5 maggio 2006 53 Online Public Access Catalogue L’accesso all’OPAC deve essere intuitivo per l’utente, l’interfaccia (Web, GUI o Z39.50) deve essere facile da usare La ricerca deve poter essere formulata per parole chiave o a scorrimento su una pluralità di indici Devono essere previste opzioni di filtro e ordinamento I risultati devono essere visualizzati in modo da evidenziare gruppi di record affini I singoli record devono apparire in formati standard (ISBD, UNIMARC) 5 maggio 2006 54 Interrogare un Opac* Interrogare un Opac consiste essenzialmente nel verificare se una o più parole specificate siano contenute in qualcuno dei record che costituiscono l‘Opac. L'utente quindi deve inserire le parole desiderate negli appositi spazi visibili sullo schermo; il sistema risponderà visualizzando quei record che contengono le parole richieste, i quali descrivono i volumi posseduti dalle biblioteche in questione. * Da questa diapositiva e fino alla diapositiva n. 69 le informazioni sono state prese da: Claudio Gnoli, Gli Opac. Una guida per il pubblico all’utilizzo dei cataloghi in linea, in Aib-Web Contributi, seconda edizione aprile 1999 <http://www.aib.it/aib/contr/gnoli1.htm> 5 maggio 2006 55 L’uso dei campi Poiché i record sono divisi in campi, generalmente conviene cercare le parole desiderate nell'ambito di un determinato campo Interrogando un Opac, si troverà sullo schermo una scelta fra i diversi campi nei quali è possibile cercare. I campi più importanti sono generalmente quelli dell'autore, del titolo e del soggetto. Come nel caso dei cataloghi a schede, quando si conoscono esattamente i dati delle opere che si stanno cercando, conviene cercare per autore o per titolo. 5 maggio 2006 56 La ricerca per soggetto Quando invece si sta cercando qualsiasi opera che tratti un determinato argomento, il metodo più logico è cercare nel campo del soggetto. Tuttavia non è detto che in questo modo si trovino tutti i record pertinenti all'argomento cercato, perché: i soggetti si basano rigidamente su vocabolari controllati, per cui il soggetto appropriato per l'argomento cercato potrebbe non essere il termine che si ha in mente, ma un suo sinonimo; in molti Opac una parte delle opere non sono associate a nessun soggetto, in quanto per risparmiare tempo sono state catalogate in forma più semplice. 5 maggio 2006 57 Altri campi In alcuni Opac è possibile cercare anche in altri campi, ad esempio luogo e data di pubblicazione, editore, collana, lingua: questi campi di solito non sono molto utili se presi da soli, perché contengono le stesse espressioni per moltissimi libri diversi. Alcuni Opac offrono anche la possibilità di cercare se determinate parole siano presenti in un qualsiasi campo. Ciò può essere utile per esempio nel caso di parole poco comuni, ad esempio nomi di persone che possono essere sia autori di opere che argomento di altre opere. Se però le parole cercate sono comuni, questa strategia può dare risultati problematici. 5 maggio 2006 58 Una regola d’oro Anche quando è possibile farlo, infine, non conviene riempire troppi campi contemporaneamente, perché così si rischia di restringere troppo la gamma dei possibili risultati: basta infatti che ci sia un'inesattezza in uno dei termini richiesti, perché la ricerca non dia alcun risultato. Perciò, anche se si cerca un testo di cui si conoscono tutti i dati bibliografici, conviene utilizzare solo uno o due campi per volta, selezionando alcune parole particolarmente significative che si desidera compaiano nei record. 5 maggio 2006 59 Le modalità di ricerca: ricerca browse L'aspetto delle videate attraverso cui ci si muove varia a seconda dei diversi Opac. Tuttavia, esistono essenzialmente due modi con cui si può cercare: per liste o per parole. Nella ricerca per liste, il sistema richiede di inserire una sola stringa, contenente una o più parole da cercare nel campo dell'autore, oppure nel campo del titolo, oppure nel campo del soggetto. Quindi viene visualizzata una lista di voci che iniziano con la parola o le parole richieste, oppure con parole simili, che nell'ordine alfabetico si trovano vicino a quella richiesta. La prima delle voci che rispondono meglio alla richiesta è di solito evidenziata, ma viene comunque mostrato anche un certo numero di voci precedenti e successive. Questo sistema permette di compensare una parte dei possibili errori nello spelling delle parole richieste; e inoltre, permette di vedere contemporaneamente diverse voci che inizino con le stesse parole, per poi scegliere quelle desiderate. 5 maggio 2006 60 Le modalità di ricerca: ricerca find Nella ricerca per parole, invece, si può cercare anche in più campi contemporaneamente; il sistema risponderà visualizzando tutti i record che contengono le parole cercate, non solo all'inizio ma anche all'interno dei campi rispettivi. Non vengono invece visualizzate le voci che contengono parole simili a quelle richieste: quindi occorre fare particolare attenzione alle parole che si inseriscono, poiché il risultato dipenderà rigorosamente da queste. 5 maggio 2006 61 Come inserire le richieste fare attenzione alla battitura maiuscole e minuscole: generalmente non c’è differenza segni diacritici: di solito non è necessario indicarli (è consigliabile provare in entrambi i modi) segni di punteggiatura, trattini, apostrofi: vale lo stesso che per i diacritici stop word: sono alcune parole corte (es.: gli articoli, congiunzioni, ecc.) che gli Opac tralasciano automaticamente; in particolari occorre omettere gli articoli iniziali perché non indicizzati soggetti (o parole chiave): bisogna digitarli nella lingua del catalogo 5 maggio 2006 62 Linguaggi di interrogazione Esistono numerosi linguaggi di interrogazione: 5 maggio 2006 Il più diffuso nella maggior parte delle banche dati è quello degli operatori logici che derivano dall'algebra di Boole e vengono impiegati dai calcolatori per compiere moltissime operazioni. Molto diffusi anche gli operatori relazionali e gli operatori di prossimità. Da non dimenticare, infine, i cosiddetti caratteri jolly. 63 Gli operatori logici (o booleani) AND o + (intersezione): si usa per rintracciare i record che soddisfano entrambi i criteri richiesti. OR (unione): si usa per rintracciare i record che soddisfano almeno uno dei criteri richiesti. NOT o AND NOT (complemento): si usa per rintracciare i record che soddisfano un determinato criterio escludendo quelli che però ne soddisfano un altro. XOR o NOR (esclusione): si usa per rintracciare i record che soddisfano esclusivamente uno solo dei criteri richiesti. 5 maggio 2006 64 Operatori relazionali In alcuni opac è possibile utilizzare anche degli operatori relazionali, che permettono di richiedere che il contenuto di un campo sia maggiore (>), minore (<) oppure uguale (=) ad un valore specificato. Questi operatori si applicano tipicamente alle date ed altri campi numerici; altrimenti assumono il significato di "precedente/successivo nell'ordine alfabetico a -". 5 maggio 2006 65 Operatori di prossimità Gli operatori di prossimità sono una versione più precisa degli operatori AND e NOT: permettono infatti di richiedere che le parole in questione non solo siano (o non siano) presenti nello stesso record, ma si trovino ad una determinata distanza fra loro ed eventualmente in un determinato ordine. Gli operatori di prossimità disponibili variano a seconda degli Opac, ma perlopiù permettono di: cercare due parole adiacenti e nell'ordine dato (l'operatore è spesso scritto ADJ oppure WITH); cercare due parole adiacenti in qualsiasi ordine (spesso scritto NEAR) cercare due parole presenti all'interno dello stesso campo (spesso scritto SAME). 5 maggio 2006 66 Combinare gli operatori Gli operatori logici si possono combinare, creando stringhe di ricerca anche complesse per particolari esigenze. In questo caso occorre fare attenzione all'ordine con cui vengono eseguite le operazioni logiche; secondo la gerarchia standard, l'ordine di priorità dovrebbe essere NOT, AND, OR, ma in realtà non tutti gli opac seguono questa regola: perciò il sistema più sicuro è utilizzare le parentesi. 5 maggio 2006 67 I caratteri jolly I cosiddetti caratteri jolly sono dei simboli che possono corrispondere a qualsiasi carattere, oppure a una sequenza di caratteri di qualsiasi lunghezza. Anche nei simboli usati come caratteri jolly gli Opac variano molto, e occorre appurarli in ciascun caso leggendo le relative istruzioni. Ecco i casi in cui si usano: troncamento: è un modo per evitare di dover digitare lunghe sequenze di termini alternativi aventi una stessa radice, separati dall'operatore OR (carattere jolly usato: asterisco, dollaro, due punti, o altro). mascheramento: si sostituisce un determinato numero di caratteri all’interno della parola (carattere jolly usato: soprattutto asterisco, o punto interrogativo). 5 maggio 2006 68 Troppi risultati! Se una ricerca produce una grande quantità di record, la maggior parte dei quali non sembrano interessanti, piuttosto che scorrerli tutti conviene fare una nuova ricerca utilizzando dei termini più specifici: scegliere parole meno comuni per i titoli e i soggetti, specificare l'autore (eventualmente anche il suo nome, se il cognome è piuttosto comune), specificare un intervallo di date, utilizzare più campi contemporaneamente. 5 maggio 2006 69 Integrazione dell’informazione (1) Le tecnologie dell’ipertesto e dei database relazionali permettono di superare la gestione settoriale dei servizi bibliotecari e bibliografici, a vantaggio di una forte integrazione dell’informazione e dei processi gestionali retrostanti 5 maggio 2006 70 Integrazione dell’informazione (2) Il catalogo bibliografico, l’OPAC tradizionale, può essere integrato con altre tipologie di documenti o altri database: Amministrativi (archivi dei fornitori, anagrafe degli utenti, inventario) Bibliografici (Authority files, bibliografie, TOCs, OPAC esterni, …) Documentari (full text, immagini, registrazioni audio e video) 5 maggio 2006 71 Integrazione dell’informazione (3) Tramite un’unica interfaccia, l’utente accede non solo al record bibliografico, ma da questo al documento elettronico descritto, oppure a una gamma di servizi interattivi, comunque orientati alla disponibilità del documento finale: prestito, prenotazioni, desiderata, fotocopie, DD, SDI. L’integrazione dell’informazione può essere interna a uno stesso sistema informativo e riguardare le sue sole risorse, oppure essere fondata sull’uso di standard internazionali (MARC, EDI, Z39.50, …) e riguardare l’attività e i servizi di molteplici organizzazioni, diverse e distanti. 5 maggio 2006 72 Dall’OPAC ai Portali Lo sviluppo dell’ipertestualità e del Web favoriscono diverse soluzioni per la cooperazione e l’integrazione di servizi e risorse a distanza: La biblioteca integra l’OPAC nelle proprie pagine Web La biblioteca integra il reference nell’OPAC La biblioteca integra nell’OPAC l’accesso ai documenti catalogati Più biblioteche condividono lo stesso OPAC, in forma virtuale o materiale Si diffondono i portali (Non solo OPAC, ma accesso a varietà di altre risorse, mediante uno stesso motore di ricerca). 5 maggio 2006 73 Per chi vuole approfondire Unimarc IFLA UBCIM, 1998: UNIMARC Manual. Bibliographic format. 2. ed. München, Saur. N.B.: per l'ed. elettronica aggiornata vai al sito <http://www.ifla.org/VI/3/p1996-1/sec-uni.htm > SCOLARI, Antonio, 2000: UNIMARC. Roma, Associazione Italiana Biblioteche (ET Enciclopedia tascabile; 18) MAIELLO, Rosa, 2002: UNIMARC, un formato “universale"? <http://www.aib.it/aib/sezioni/cam/maiel-tx.htm> GORMAN, Michael, 1998: Il futuro della catalogazione nell'era elettronica. In: "Bollettino AIB", 38 (2), p. 138-148 PERUGINELLI, S., 1998: Il futuro dei formati bibliografici. In: Congresso nazionale AIB, 44., Genova, 1998 <http://www.aib.it/aib/congr/co98stand5.htm> WESTON, P. G., 2001: Catalogazione bibliografica: dal formato MARC a FRBR. In: Bollettino AIB, 41 (3), p. 267-284 5 maggio 2006 74 Altri indirizzi utili per Unimarc Sito IFLA: < http://www.ifla.org/ > IFLA UNIMARC Core Activity: <http://www.ifla.org/VI/8/up.htm > Archive - Historical Material: UBCIM - IFLA Universal Bibliographic Control and International MARC Core Activity (aggiornamenti) <http://www.ifla.org/VI/3/ubcim.htm > 5 maggio 2006 75 Per chi vuole approfondire gli Opac BASILI, C., 1998: La biblioteca in rete: strategie e servizi nella Società dell'informazione. Milano, Editrice Bibliografica (Bibliografia e Biblioteconomia; 53) GNOLI, C., 1999: OPAC in Italia: una panoramica delle tipologie e delle modalità di consultazione. In: "Bibliotime", 2 (1) <http://www.spbo.unibo.it/aiber/bibtime/num-ii1/gnoli.htm> METITIERI, F. - RIDI, R., 2002: Biblioteche in Rete: istruzioni per l’uso. Roma-Bari, Laterza SALARELLI, A. - TAMMARO, A.M., 2000: La biblioteca digitale. Milano, Editrice Bibliografica (Bibliografia e Biblioteconomia; 57) 5 maggio 2006 76 Alcuni Opac e Metaopac SBN < http://sbnonline.sbn.it/ > Opac Federico II < http://sib04.unina.it/ALEPH > BCNFirenze < http://catalogo.bncf.firenze.sbn.it/cgiopac/opac.cgi?Lingua=ITA&unicode=F > BNNapoli < http://83.103.45.70/SebinaOpacNA/Opac > Azalai < http://azalai.cilea.it/ > Ubka < http://www.ubka.uni-karlsruhe.de/hylib/en/kvk.html > LoC < http://catalog.loc.gov/ > 5 maggio 2006 77