Dall’opac al web –
Dal web all’opac
CORSO DI PERFEZIONAMENTO
SAPERI STORICI E NUOVE TECNOLOGIE
(Napoli, 6 giugno 2006)
--------
Paul Gabriele Weston
[email protected]
Il campione dell’indagine
Ambiti di indagine




Biblioteche e fonti di informazione: uso, familiarità e preferenze
analisi comparativa dei comportamenti degli utenti riguardo a:
fonti di informazione fisiche e virtuali (motori di ricerca,
biblioteche, librerie, archivi di testi elettronici, librerie online);
risorse elettroniche (motori di ricerca, librerie online, periodici
elettronici, e-books, siti web specializzati, messaggistica
elettronica, siti web di biblioteca, notiziari online, blogs, basi di
dati, posta elettronica, audiolibri, e-reference); uso di prodotti di
consolidata notorietà (una ventina di prodotti tra i quali
AllTheWeb.com, AOL Search, Ask a librarian, Ask an expert,
Ask Jeeves, Google.com, HotBot.com, siti web di biblioteche,
Yahoo.com)
Uso della biblioteca: in presenza e a distanza
in che modo i consumatori di informazioni fanno uso delle
biblioteche e quale è l’impatto delle più recenti fonti informative
e delle risorse elettroniche sulle loro abitudini e sui loro
comportamenti
Altri ambiti
Il marchio biblioteca


le caratteristiche positive o negative ritenute specifiche
dell’istituzione bibliotecaria o sulle quali sarebbe
opportuno investire
Raccomandazioni degli intervistati alle biblioteche


il risultato dell’analisi di oltre 3.000 suggerimenti
riguardanti i servizi, le risorse e l’organizzazione delle
biblioteche
Biblioteche: un marchio universale?


il grado di omogeneità dei risultati dell’indagine nelle aree
geografiche interessate
Utilizzo della biblioteca
Utilizzo passato e futuro
Strumenti di ricerca preferiti
Punto di partenza della ricerca
elettronica
Fonti informative
Conoscenza delle risorse
disponibili in biblioteca
Conclusioni dell’indagine



emerge “la crescente difficoltà di caratterizzare e descrivere le
motivazioni alla base dell’uso delle biblioteche [...] Le relazioni tra
i professionisti dell’informazione, gli utenti e il contenuto sono
mutate e continuano a cambiare”.
viene evidenziata una crescita tendenziale della discordanza tra
il contesto e il patrimonio documentale offerti dalle biblioteche e il
contesto e il patrimonio documentale ritenuti necessari dai
consumatori di informazioni al fine di garantire il massimo di
efficacia alla propria ricerca
le criticità sembrano riguardare facilità d’uso, convenienza e
disponibilità, ritenute requisiti fondamentali tanto quanto la
qualità e l’affidabilità dell’informazione, due caratteristiche da
sempre associate ai servizi bibliografici erogati dalla biblioteca
Confronto opac-web



qualità e quantità delle informazioni sono unanimemente ritenute
indicatori di soddisfazione, mentre la credibilità è il criterio
prevalente nella valutazione delle risorse elettroniche, seguita a
breve distanza dalla gratuità
il tempo occorrente per l’effettuazione di una ricerca è un criterio
ritenuto meno decisivo rispetto alla semplicità di uso dello
strumento e i cataloghi, sebbene conducano in definitiva più
velocemente all’individuazione e alla selezione delle risorse
documentarie potenzialmente utili, sono ritenuti troppo complessi
e molto più difficili da utilizzare dei motori di ricerca
l’utente gradisce far da sé, piuttosto che richiedere l’ausilio del
bibliotecario e considera sempre più irrinunciabile la possibilità di
passare immediatamente dalla citazione bibliografica al
documento, dalla notizia al dato.
Struttura dello studio

finalità:


individuare le scelte strategiche e tecnologiche da operare
per consentire a prodotti, dotati di caratteristiche
appropriate allo scopo per cui erano stati realizzati, di
garantire un livello di interoperabilità adeguato alle
esigenze della biblioteca digitale da realizzare negli anni a
venire
raccomandazioni:

raggruppate in tre macroaree:
 potenziamento della ricerca e dell’accesso
 ristrutturazione dell’opac
 adozione di nuove pratiche catalografiche
Criticità dei sistemi bibliografici

non hanno tenuto il passo con i tempi e non sono stati capaci di
beneficiare dei cambiamenti in atto negli strumenti di organizzazione e
diffusione delle risorse digitali



Amazon, Google, iTunes realizzano un modello di semplicità d’uso che i sistemi
bibliotecari, opac in testa, sono ben lungi dal conseguire e l’utente ha iniziato a
disaffezionarsi ai servizi informativi delle biblioteche, preferendo rivolgersi ad
altre fonti
il catalogo viene percepito dai lettori come un dispositivo per la
localizzazione degli esemplari e la gestione del prestito, al quale ricorrere
una volta in possesso di dati ricavati consultando altri strumenti (motori di
ricerca)
troppe risorse sono state dedicate a mantenere in vita l’esistente,
rinunciando ad interventi radicali sulla struttura dei dati e sulle funzionalità
dei sistemi, a causa dei costi esorbitanti richiesti da modifiche anche di
modesta entità


perpetuazione del formato MARC, con le rigidità dovute alla sua funzione
originaria e all’architettura dei sistemi elettronici degli anni Sessanta e Settanta
rinnovamento dell’opac principalmente dal punto di vista della grafica, senza
implementarvi le funzioni che avrebbero garantito maggiore colloquialità allo
strumento
Nodi cruciali dell’opac




le biblioteche mettono a disposizione dei propri lettori uno
strumento ibrido che non svolge adeguatamente né le funzioni di
un repertorio bibliografico, né quelle di un vero e proprio catalogo
la moltiplicazione delle descrizioni, in conseguenza della
cumulazione dei cataloghi, costringe a scorrere pagine e pagine
di risultati, rendendo l’individuazione di un documento una
procedura spesso inutilmente faticosa
il trattamento separato di ciascuna fonte bibliografica – catalogo,
periodici elettronici, archivi istituzionali, banche dati, archivi di
testi, web – presuppone l’esistenza di esigenze organizzative
diverse, anche se le ragioni per mantenere questa separazione
anche al momento della ricerca, per lo più, sfugge agli utenti, ai
quali più che la natura bibliografica o la tipologia documentaria
interessano i dati
“only librarians like to search, everyone else likes to find” (Roy
Tennant)
UCL – Raccomandazioni finali
potenziamento della ricerca e dell’accesso









fornire agli utenti un accesso diretto al documento
suggerire la lettura di documenti con caratteristiche e
contenuti simili a quelli ricercati
favorire la personalizzazione
suggerire l’adozione di strategie di ricerca e procedure
alternative
migliorare la navigazione nel caso di risultati molto
numerosi
erogare i servizi bibliografici dove si trovano gli utenti
introdurre criteri di ranking nella restituzione dei risultati
agevolare la ricerca in ambienti multi-alfabeto
UCL – Raccomandazioni finali
ristrutturazione dell’opac



creare un’unica interfaccia per tutti i cataloghi
unificare la ricerca per tutte le risorse informative
adozione di nuove pratiche catalografiche





ripensare il flusso operativo
scegliere lo schema di metadati più adeguato a ciascuna
tipologia documentaria
arricchire manualmente i metadati relativamente a
specifici elementi (nomi, titoli, serie, ecc.) o a particolari
ambiti (musica, letteratura, ecc.)
automatizzare la creazione di metadati
Strategie illustrate nel
documento LC




promuovere un uso più frequente da parte
degli utenti abituali
sviluppare nuovi servizi per gli utenti abituali
trovare nuovi utenti del prodotto esistente
trovare nuovi servizi e nuovi utenti
nuovi
Nuovi utenti
Servizi esistenti
Nuovi utenti
Nuovi servizi
marketing diretto a nuove fasce
utenza
 ricerche bibliografiche o
brevettuali
d-d e ill a richiesta diretta
valorizzazione cultura locale
 portali disciplinari
 conservazione siti web
 progetti digitalizzazione
 contenuti pacchetti formativi
utenti


Utenti abituali
Servizi esistenti
modalità di ricerca
 visualizzazione risultati

Utenti abituali
Nuovi servizi
descrizione risorse elettr.
 servizi a valore aggiunto
 export bibliografie multiformato

esistenti
nuovi
servizi
Strategie alternative
(da ultima spiaggia)




ricerca della leadership
individuazione di una nicchia
affidamento all’harvesting
rinuncia al catalogo locale
Ostacoli da prevedere










mancanza di consenso riguardo all’introduzione di procedure operative
standard, semplificate e automatizzate
indisponibilità a rinunciare alla personalizzazione degli acquisti e della
catalogazione
difficoltà ad accettare la semplice cattura di dati da fonti esterne, anche
non bibliotecarie
indisponibilità a modulare la catalogazione sulle reali esigenze richieste
dalla natura della pubblicazione e dalla vocazione della biblioteca
mancanza di dialogo con gli altri soggetti interessati (ad esempio i
fornitori degli applicativi gestionali)
difficoltà ad adeguarsi agli standard richiesti per l’interoperabilità
incapacità di ascoltare gli utenti (le loro richieste, esperienze,
motivazioni)
inadeguatezza degli strumenti di monitoraggio a supporto delle scelte
strategiche
competenze inadeguate degli operatori
incapacità di motivare gli amministratori
Una strategia di lungo periodo



in primo luogo
 consolidare i servizi esistenti e le strutture necessarie a
supportarli,
 favorire i processi di integrazione tra soggetti omogenei
di seguito
 cominciare ad espandere i propri servizi
 attuare la condivisione delle risorse con altri istituti bibliotecari
 individuare all’interno della rete la propria specificità
al termine di questo processo la biblioteca, o per meglio dire la
rete, il consorzio di biblioteche, sarà pronto per
 cooperare con altri soggetti
 erogare nuovi servizi
 raggiungere nuove e sin qui non individuate fasce di utenza.
Modelli funzionali per il nuovo
opac

l’opac che si adatta


differenziandosi di volta in volta dal punto di vista
del linguaggio, degli elementi visualizzati, della
tipologia delle ricerche permesse e
dall'arricchimento bibliografico e semantico
proposto
modellandosi sul comportamento dell’utente che
lo sta consultando o che li raggruppi per “classi”
(clusters), definendo profili, più o meno omogenei,
di utenti con caratteristiche simili
Data mining (applicato
all’analisi dell’utenza)



processo di estrazione della conoscenza che si basa sull’applicazione di
algoritmi che consentono l’esplorazione di dati con l’obiettivo di individuare le
informazioni più importanti
“garbage in, garbage out”: la correttezza dei dati inseriti è essenziale per
ottenere risultati organici e profittevoli
negli opac, i dati possono venire estratti



Knowledge Discovery in Databases




da un modulo elettronico (form) messo a disposizione dell'utenza con lo scopo
dichiarato di definire il profilo della stessa
dall'analisi dei comportamenti dell'utilizzatore
selezione ed eliminazione dei dati che non sono riconducibili a nessun cluster
(eliminazione degli outliers)
analisi dei dati scelti (età, titolo di studio, professione, lingua, interessi etc.) mediante
un algoritmo di clusterizzazione per raggruppare il campione in un numero (definito in
precedenza o libero) di clusters.
estrazione di un albero decisionale (schema di analisi che, a partire da un nuovo
utente ipotetico, tenti di ricondurlo all’interno di uno dei profili precedentemente definiti)
esempio: Amazon in fase di creazione dell’account personale viene compilato un
profilo mirato alla fornitura di suggerimenti di acquisto conformi ai propri interessi
e ai propri gusti, che si arricchisce nel tempo delle informazioni provenienti dalle
ricerche effettuate e dagli acquisti portati a buon fine
Flexplearn –
Navigazione sulla
base della tipologia
delle risorse
Elenco dei powerpoint disponibili
Possibilità di
navigare per autore e
per l’argomento a cui
è collegato
Navigazione per autore
Navigazione delle risorse per gruppo di studio
Dettaglio del gruppo di studio su dreamweaver, con date,
lezioni e risorse collegate
Modelli funzionali per il nuovo
opac


l’opac che si adatta
l’opac che suggerisce

orientando l’utente in quei casi in cui la ricerca
sembri approdata ad un punto morto, vuoi in
seguito ad una conoscenza approssimativa di ciò
che si sta cercando e del modo di cercarlo, vuoi
per l’assenza di record che corrispondano
esattamente alla caratteristica richiesta
Fuzzy logic



rendere più fruttuosa la ricerca, anche attraverso la valorizzazione
della serendipità:
 correggere eventuali errate digitazioni della stringa di ricerca
 suggerire chiavi alternative e nuovi patterns
generazione dinamica di liste o reti di termini affini, in senso
semantico o anche soltanto lessicale, alla stringa iniziale, tra i quali
operare scelte o navigare ed ottenere risultati diversi rispetto a
quelli ricercati in prima battuta
livelli crescenti di complessità:
 estrazione degli elementi dai soggetti, dai nomi e dalla
classificazione
 traduzione (semantica e non solo letterale) degli elementi enucleati
 implementazione della distanza semantica fra i nodi della rete e
adattamento della navigazione e dei topics proposti allo specifico
cluster di utenza, in modo che la navigazione sia influenzata dai
comportamenti dell'utenza stessa
Aquabrowser
Discover attraverso associazioni
generate automaticamente
Refine, attraverso liste
Review
Character Informaton
Possibilità di navigare gli argomenti del JNCI Cancer Spectrum
attraverso una mappa topica
Possibilità di
ricercare il
singolo topic
Zoom nel dettaglio con successivi sotto argomenti
Modelli funzionali per il nuovo
opac



l’opac che si adatta
l’opac che suggerisce
l’opac che apprende

il sistema legge il comportamento dei diversi
utenti per estenderlo a profili simili, presumendo
che utenti simili possano avere gusti simili
Social bookmarks



Esempi: Del.icio.us (http://del.icio.us/), Connotea
(http://www.connotea.org/) e Furl (http://furl.net/)
possono essere utilizzati per favorire il reference digitale e la
creazione di virtual reference desk
contro:
 rumore in assenza di una soggettazione univoca e di un
vocabolario controllato
 in parte contrastato tramite



l’applicazione di algoritmi di controllo che eliminino le indicizzazioni
difformi
l’utilizzo dell’opac come ontologia di riferimento
pro:
 servizio tarato sull’utenza
 allestimento di virtual reference desk non più costituiti da semplici
directory e link classificati, ma componenti di un servizio modellato
sull’utenza e diverso a seconda delle caratteristiche di chi lo
consulta
Collaborative filtering e punti
di accesso




il comportamento degli utenti può essere utilizzato anche ai fini
del popolamento e della manutenzione delle liste di autorità
non sempre le forme che appaiono sulle pubblicazioni o quelle
ottenute attenendosi agli standard internazionali di
traslitterazione o di trascrizione fonetica sono quelle con le quali
gli utenti hanno maggiore familiarità
l’opac, nel caso di stringhe (per esempio costituite da nomi) che
non producano corrispondenze, potrebbe proporre una o più
stringhe alternative, secondo il modello illustrato in precedenza,
considerare l’eventuale scelta da parte dell’utente come un
indizio affirmatorio e registrare in un file temporaneo
l’associazione
se la medesima associazione dovesse ripetersi più volte, fino al
superamento di una soglia predeterminata, il sistema potrebbe
provvedere a stabilizzare l’associazione o richiamare l’attenzione
del bibliotecario
Modelli funzionali per il nuovo
opac




l’opac che si adatta
l’opac che suggerisce
l’opac che apprende
l’opac che integra

mediante il servizio di arricchimento bibliografico,
che consiste nel collegare alla notizia di catalogo
altre notizie e documenti che possano fornire
informazioni supplementari utili al lettore per
conoscere il contenuto di una pubblicazione
Biblioteche, editori, distributori




la biblioteca può avvalersi dei dati presenti sul sito dell’editore per potenziare
il proprio catalogo e promuovere percorsi di lettura a beneficio dei lettori,
nonché disporre di uno strumento prezioso per orientare la propria politica
degli acquisti
la presenza delle notizie sul catalogo contribuisce a favorirne la conoscenza
presso il pubblico e, di conseguenza, il catalogo svolge per conto dell’editore
una funzione di tipo promozionale
l’editore può avvalersi, per il controllo semantico delle pubblicazioni in
commercio, di quei dispositivi di controllo sofisticati (soggettario,
classificazione, ecc.) che sarebbero troppo onerosi per lui da gestire e che
fanno parte invece del mestiere del catalogatore
editori e bibliotecari stanno incominciando a valutare l’opportunità di una
maggiore convergenza nel modo di rappresentare le pubblicazioni:



editori e distributori mirano a valorizzare le descrizioni, chiedendo la
collaborazione degli utenti più esperti per migliorare la qualità complessiva dei
dati
le biblioteche dedicano più attenzione al trattamento semantico rispetto a
quello descrittivo
sono più numerosi i sistemi di catalogazione in grado di catturare e trattare i
metadati provenienti dagli archivi degli editori, allo stesso modo in cui sono
trattate le notizie catturate dai cataloghi delle reti e delle agenzie bibliografiche
nazionali
Modelli funzionali per il nuovo
opac





l’opac che si adatta
l’opac che suggerisce
l’opac che apprende
l’opac che integra
l’opac che aggrega

gestire insiemi di risultati resi particolarmente
corposi per le dimensioni raggiunte dai cataloghi
collettivi e che si presentano più eterogenei rispetto
al passato per la crescente varietà di formati
editoriali.
Ranking e aggregazioni



il ranking:
 restituzione dei risultati di una ricerca secondo criteri di
priorità regolati mediante algoritmi prestabiliti
non è la soluzione più opportuna, specialmente nel caso
delle opere letterarie, per le quali possono esistere decine
di edizioni curate da editori diversi, in lingue e su supporti
differenti
ricorso ad aggregazioni virtuali e dinamiche
 applicazione della logica espressa in FRBR per produrre
dei sottoinsiemi per le singole opere, per le edizioni
costituite da versioni sostanzialmente simili del medesimo
testo, per le traduzioni, per i diversi formati di pubblicazione
Classificazione a “faccette”
dei risultati della ricerca



i dati vengono analizzati e categorizzati per data, lingua, formato,
soggetto, intestazione, disponibilità per la consultazione
l’applicazione di una o più faccette per la determinazione dei
sottoinsiemi può essere determinata dinamicamente in funzione
del numero di occorrenze individuate per un certo aspetto
(qualora, ad esempio, il raggruppamento per secoli abbia
determinato per il range 1900-1999 più di cento occorrenze, il
sistema provvede automaticamente ad applicare la ripartizione
per decennio)
Esempi:
 Endeca
 Grokker (http://www.grokker.com/)
RedLightGreen: aggregazioni per opere
Grokker – Visualizzazione per liste – ricerca di “digital libraries”
Risorse
Grokker – raffinamento della ricerca attraverso una keyword
Possibilità di
limitare il dominio
su cui effettuare la
ricerca
Dettaglio dell’area selezionata
Dettaglio dell’area selezionata
Modelli funzionali per il nuovo
opac






l’opac che si adatta
l’opac che suggerisce
l’opac che apprende
l’opac che integra
l’opac che aggrega
l’opac che organizza il web

instaurando rapporti con i contenuti della rete,
l’insieme dei cataloghi e degli altri repertori
bibliografici contribuiscono all’organizzazione del
web semantico
Macro aree
LCC
Navigazione per lista di termini associati
Lista di termini associati
per raffinare le ricerche
Macro aree
LCC
Navigazione per lista di termini associati
Dettaglio
LCC
Ordinare i risultati
Dettaglio in popup
Espandere la ricerca a partire dai soggetti
Open WorldCat (via Google)
Edizioni di Tales from Shakespeare
Trova il libro in una biblioteca
Possibilità di inserire informazioni per circoscrivere
geograficamente la ricerca di biblioteche
Commercio
elettronico a partire
da una notizia di
WorldCat
Google Scholar
ricerca per autore
Dettaglio del raggruppamento
selezionato
Collegamento a British Library Direct
Ricerca nelle risorse in cui l’opera
è citata
Ricerca web a partire dalle parole
chiave del record selezionato
Link automatico nel caso in cui è
permesso l’accesso diretto alla risorsa
RedLightGreen
aggregazioni per opere
Scarica

Dall`Opac al Web