Dall’opac al web – Dal web all’opac CORSO DI PERFEZIONAMENTO SAPERI STORICI E NUOVE TECNOLOGIE (Napoli, 6 giugno 2006) -------- Paul Gabriele Weston [email protected] Il campione dell’indagine Ambiti di indagine Biblioteche e fonti di informazione: uso, familiarità e preferenze analisi comparativa dei comportamenti degli utenti riguardo a: fonti di informazione fisiche e virtuali (motori di ricerca, biblioteche, librerie, archivi di testi elettronici, librerie online); risorse elettroniche (motori di ricerca, librerie online, periodici elettronici, e-books, siti web specializzati, messaggistica elettronica, siti web di biblioteca, notiziari online, blogs, basi di dati, posta elettronica, audiolibri, e-reference); uso di prodotti di consolidata notorietà (una ventina di prodotti tra i quali AllTheWeb.com, AOL Search, Ask a librarian, Ask an expert, Ask Jeeves, Google.com, HotBot.com, siti web di biblioteche, Yahoo.com) Uso della biblioteca: in presenza e a distanza in che modo i consumatori di informazioni fanno uso delle biblioteche e quale è l’impatto delle più recenti fonti informative e delle risorse elettroniche sulle loro abitudini e sui loro comportamenti Altri ambiti Il marchio biblioteca le caratteristiche positive o negative ritenute specifiche dell’istituzione bibliotecaria o sulle quali sarebbe opportuno investire Raccomandazioni degli intervistati alle biblioteche il risultato dell’analisi di oltre 3.000 suggerimenti riguardanti i servizi, le risorse e l’organizzazione delle biblioteche Biblioteche: un marchio universale? il grado di omogeneità dei risultati dell’indagine nelle aree geografiche interessate Utilizzo della biblioteca Utilizzo passato e futuro Strumenti di ricerca preferiti Punto di partenza della ricerca elettronica Fonti informative Conoscenza delle risorse disponibili in biblioteca Conclusioni dell’indagine emerge “la crescente difficoltà di caratterizzare e descrivere le motivazioni alla base dell’uso delle biblioteche [...] Le relazioni tra i professionisti dell’informazione, gli utenti e il contenuto sono mutate e continuano a cambiare”. viene evidenziata una crescita tendenziale della discordanza tra il contesto e il patrimonio documentale offerti dalle biblioteche e il contesto e il patrimonio documentale ritenuti necessari dai consumatori di informazioni al fine di garantire il massimo di efficacia alla propria ricerca le criticità sembrano riguardare facilità d’uso, convenienza e disponibilità, ritenute requisiti fondamentali tanto quanto la qualità e l’affidabilità dell’informazione, due caratteristiche da sempre associate ai servizi bibliografici erogati dalla biblioteca Confronto opac-web qualità e quantità delle informazioni sono unanimemente ritenute indicatori di soddisfazione, mentre la credibilità è il criterio prevalente nella valutazione delle risorse elettroniche, seguita a breve distanza dalla gratuità il tempo occorrente per l’effettuazione di una ricerca è un criterio ritenuto meno decisivo rispetto alla semplicità di uso dello strumento e i cataloghi, sebbene conducano in definitiva più velocemente all’individuazione e alla selezione delle risorse documentarie potenzialmente utili, sono ritenuti troppo complessi e molto più difficili da utilizzare dei motori di ricerca l’utente gradisce far da sé, piuttosto che richiedere l’ausilio del bibliotecario e considera sempre più irrinunciabile la possibilità di passare immediatamente dalla citazione bibliografica al documento, dalla notizia al dato. Struttura dello studio finalità: individuare le scelte strategiche e tecnologiche da operare per consentire a prodotti, dotati di caratteristiche appropriate allo scopo per cui erano stati realizzati, di garantire un livello di interoperabilità adeguato alle esigenze della biblioteca digitale da realizzare negli anni a venire raccomandazioni: raggruppate in tre macroaree: potenziamento della ricerca e dell’accesso ristrutturazione dell’opac adozione di nuove pratiche catalografiche Criticità dei sistemi bibliografici non hanno tenuto il passo con i tempi e non sono stati capaci di beneficiare dei cambiamenti in atto negli strumenti di organizzazione e diffusione delle risorse digitali Amazon, Google, iTunes realizzano un modello di semplicità d’uso che i sistemi bibliotecari, opac in testa, sono ben lungi dal conseguire e l’utente ha iniziato a disaffezionarsi ai servizi informativi delle biblioteche, preferendo rivolgersi ad altre fonti il catalogo viene percepito dai lettori come un dispositivo per la localizzazione degli esemplari e la gestione del prestito, al quale ricorrere una volta in possesso di dati ricavati consultando altri strumenti (motori di ricerca) troppe risorse sono state dedicate a mantenere in vita l’esistente, rinunciando ad interventi radicali sulla struttura dei dati e sulle funzionalità dei sistemi, a causa dei costi esorbitanti richiesti da modifiche anche di modesta entità perpetuazione del formato MARC, con le rigidità dovute alla sua funzione originaria e all’architettura dei sistemi elettronici degli anni Sessanta e Settanta rinnovamento dell’opac principalmente dal punto di vista della grafica, senza implementarvi le funzioni che avrebbero garantito maggiore colloquialità allo strumento Nodi cruciali dell’opac le biblioteche mettono a disposizione dei propri lettori uno strumento ibrido che non svolge adeguatamente né le funzioni di un repertorio bibliografico, né quelle di un vero e proprio catalogo la moltiplicazione delle descrizioni, in conseguenza della cumulazione dei cataloghi, costringe a scorrere pagine e pagine di risultati, rendendo l’individuazione di un documento una procedura spesso inutilmente faticosa il trattamento separato di ciascuna fonte bibliografica – catalogo, periodici elettronici, archivi istituzionali, banche dati, archivi di testi, web – presuppone l’esistenza di esigenze organizzative diverse, anche se le ragioni per mantenere questa separazione anche al momento della ricerca, per lo più, sfugge agli utenti, ai quali più che la natura bibliografica o la tipologia documentaria interessano i dati “only librarians like to search, everyone else likes to find” (Roy Tennant) UCL – Raccomandazioni finali potenziamento della ricerca e dell’accesso fornire agli utenti un accesso diretto al documento suggerire la lettura di documenti con caratteristiche e contenuti simili a quelli ricercati favorire la personalizzazione suggerire l’adozione di strategie di ricerca e procedure alternative migliorare la navigazione nel caso di risultati molto numerosi erogare i servizi bibliografici dove si trovano gli utenti introdurre criteri di ranking nella restituzione dei risultati agevolare la ricerca in ambienti multi-alfabeto UCL – Raccomandazioni finali ristrutturazione dell’opac creare un’unica interfaccia per tutti i cataloghi unificare la ricerca per tutte le risorse informative adozione di nuove pratiche catalografiche ripensare il flusso operativo scegliere lo schema di metadati più adeguato a ciascuna tipologia documentaria arricchire manualmente i metadati relativamente a specifici elementi (nomi, titoli, serie, ecc.) o a particolari ambiti (musica, letteratura, ecc.) automatizzare la creazione di metadati Strategie illustrate nel documento LC promuovere un uso più frequente da parte degli utenti abituali sviluppare nuovi servizi per gli utenti abituali trovare nuovi utenti del prodotto esistente trovare nuovi servizi e nuovi utenti nuovi Nuovi utenti Servizi esistenti Nuovi utenti Nuovi servizi marketing diretto a nuove fasce utenza ricerche bibliografiche o brevettuali d-d e ill a richiesta diretta valorizzazione cultura locale portali disciplinari conservazione siti web progetti digitalizzazione contenuti pacchetti formativi utenti Utenti abituali Servizi esistenti modalità di ricerca visualizzazione risultati Utenti abituali Nuovi servizi descrizione risorse elettr. servizi a valore aggiunto export bibliografie multiformato esistenti nuovi servizi Strategie alternative (da ultima spiaggia) ricerca della leadership individuazione di una nicchia affidamento all’harvesting rinuncia al catalogo locale Ostacoli da prevedere mancanza di consenso riguardo all’introduzione di procedure operative standard, semplificate e automatizzate indisponibilità a rinunciare alla personalizzazione degli acquisti e della catalogazione difficoltà ad accettare la semplice cattura di dati da fonti esterne, anche non bibliotecarie indisponibilità a modulare la catalogazione sulle reali esigenze richieste dalla natura della pubblicazione e dalla vocazione della biblioteca mancanza di dialogo con gli altri soggetti interessati (ad esempio i fornitori degli applicativi gestionali) difficoltà ad adeguarsi agli standard richiesti per l’interoperabilità incapacità di ascoltare gli utenti (le loro richieste, esperienze, motivazioni) inadeguatezza degli strumenti di monitoraggio a supporto delle scelte strategiche competenze inadeguate degli operatori incapacità di motivare gli amministratori Una strategia di lungo periodo in primo luogo consolidare i servizi esistenti e le strutture necessarie a supportarli, favorire i processi di integrazione tra soggetti omogenei di seguito cominciare ad espandere i propri servizi attuare la condivisione delle risorse con altri istituti bibliotecari individuare all’interno della rete la propria specificità al termine di questo processo la biblioteca, o per meglio dire la rete, il consorzio di biblioteche, sarà pronto per cooperare con altri soggetti erogare nuovi servizi raggiungere nuove e sin qui non individuate fasce di utenza. Modelli funzionali per il nuovo opac l’opac che si adatta differenziandosi di volta in volta dal punto di vista del linguaggio, degli elementi visualizzati, della tipologia delle ricerche permesse e dall'arricchimento bibliografico e semantico proposto modellandosi sul comportamento dell’utente che lo sta consultando o che li raggruppi per “classi” (clusters), definendo profili, più o meno omogenei, di utenti con caratteristiche simili Data mining (applicato all’analisi dell’utenza) processo di estrazione della conoscenza che si basa sull’applicazione di algoritmi che consentono l’esplorazione di dati con l’obiettivo di individuare le informazioni più importanti “garbage in, garbage out”: la correttezza dei dati inseriti è essenziale per ottenere risultati organici e profittevoli negli opac, i dati possono venire estratti Knowledge Discovery in Databases da un modulo elettronico (form) messo a disposizione dell'utenza con lo scopo dichiarato di definire il profilo della stessa dall'analisi dei comportamenti dell'utilizzatore selezione ed eliminazione dei dati che non sono riconducibili a nessun cluster (eliminazione degli outliers) analisi dei dati scelti (età, titolo di studio, professione, lingua, interessi etc.) mediante un algoritmo di clusterizzazione per raggruppare il campione in un numero (definito in precedenza o libero) di clusters. estrazione di un albero decisionale (schema di analisi che, a partire da un nuovo utente ipotetico, tenti di ricondurlo all’interno di uno dei profili precedentemente definiti) esempio: Amazon in fase di creazione dell’account personale viene compilato un profilo mirato alla fornitura di suggerimenti di acquisto conformi ai propri interessi e ai propri gusti, che si arricchisce nel tempo delle informazioni provenienti dalle ricerche effettuate e dagli acquisti portati a buon fine Flexplearn – Navigazione sulla base della tipologia delle risorse Elenco dei powerpoint disponibili Possibilità di navigare per autore e per l’argomento a cui è collegato Navigazione per autore Navigazione delle risorse per gruppo di studio Dettaglio del gruppo di studio su dreamweaver, con date, lezioni e risorse collegate Modelli funzionali per il nuovo opac l’opac che si adatta l’opac che suggerisce orientando l’utente in quei casi in cui la ricerca sembri approdata ad un punto morto, vuoi in seguito ad una conoscenza approssimativa di ciò che si sta cercando e del modo di cercarlo, vuoi per l’assenza di record che corrispondano esattamente alla caratteristica richiesta Fuzzy logic rendere più fruttuosa la ricerca, anche attraverso la valorizzazione della serendipità: correggere eventuali errate digitazioni della stringa di ricerca suggerire chiavi alternative e nuovi patterns generazione dinamica di liste o reti di termini affini, in senso semantico o anche soltanto lessicale, alla stringa iniziale, tra i quali operare scelte o navigare ed ottenere risultati diversi rispetto a quelli ricercati in prima battuta livelli crescenti di complessità: estrazione degli elementi dai soggetti, dai nomi e dalla classificazione traduzione (semantica e non solo letterale) degli elementi enucleati implementazione della distanza semantica fra i nodi della rete e adattamento della navigazione e dei topics proposti allo specifico cluster di utenza, in modo che la navigazione sia influenzata dai comportamenti dell'utenza stessa Aquabrowser Discover attraverso associazioni generate automaticamente Refine, attraverso liste Review Character Informaton Possibilità di navigare gli argomenti del JNCI Cancer Spectrum attraverso una mappa topica Possibilità di ricercare il singolo topic Zoom nel dettaglio con successivi sotto argomenti Modelli funzionali per il nuovo opac l’opac che si adatta l’opac che suggerisce l’opac che apprende il sistema legge il comportamento dei diversi utenti per estenderlo a profili simili, presumendo che utenti simili possano avere gusti simili Social bookmarks Esempi: Del.icio.us (http://del.icio.us/), Connotea (http://www.connotea.org/) e Furl (http://furl.net/) possono essere utilizzati per favorire il reference digitale e la creazione di virtual reference desk contro: rumore in assenza di una soggettazione univoca e di un vocabolario controllato in parte contrastato tramite l’applicazione di algoritmi di controllo che eliminino le indicizzazioni difformi l’utilizzo dell’opac come ontologia di riferimento pro: servizio tarato sull’utenza allestimento di virtual reference desk non più costituiti da semplici directory e link classificati, ma componenti di un servizio modellato sull’utenza e diverso a seconda delle caratteristiche di chi lo consulta Collaborative filtering e punti di accesso il comportamento degli utenti può essere utilizzato anche ai fini del popolamento e della manutenzione delle liste di autorità non sempre le forme che appaiono sulle pubblicazioni o quelle ottenute attenendosi agli standard internazionali di traslitterazione o di trascrizione fonetica sono quelle con le quali gli utenti hanno maggiore familiarità l’opac, nel caso di stringhe (per esempio costituite da nomi) che non producano corrispondenze, potrebbe proporre una o più stringhe alternative, secondo il modello illustrato in precedenza, considerare l’eventuale scelta da parte dell’utente come un indizio affirmatorio e registrare in un file temporaneo l’associazione se la medesima associazione dovesse ripetersi più volte, fino al superamento di una soglia predeterminata, il sistema potrebbe provvedere a stabilizzare l’associazione o richiamare l’attenzione del bibliotecario Modelli funzionali per il nuovo opac l’opac che si adatta l’opac che suggerisce l’opac che apprende l’opac che integra mediante il servizio di arricchimento bibliografico, che consiste nel collegare alla notizia di catalogo altre notizie e documenti che possano fornire informazioni supplementari utili al lettore per conoscere il contenuto di una pubblicazione Biblioteche, editori, distributori la biblioteca può avvalersi dei dati presenti sul sito dell’editore per potenziare il proprio catalogo e promuovere percorsi di lettura a beneficio dei lettori, nonché disporre di uno strumento prezioso per orientare la propria politica degli acquisti la presenza delle notizie sul catalogo contribuisce a favorirne la conoscenza presso il pubblico e, di conseguenza, il catalogo svolge per conto dell’editore una funzione di tipo promozionale l’editore può avvalersi, per il controllo semantico delle pubblicazioni in commercio, di quei dispositivi di controllo sofisticati (soggettario, classificazione, ecc.) che sarebbero troppo onerosi per lui da gestire e che fanno parte invece del mestiere del catalogatore editori e bibliotecari stanno incominciando a valutare l’opportunità di una maggiore convergenza nel modo di rappresentare le pubblicazioni: editori e distributori mirano a valorizzare le descrizioni, chiedendo la collaborazione degli utenti più esperti per migliorare la qualità complessiva dei dati le biblioteche dedicano più attenzione al trattamento semantico rispetto a quello descrittivo sono più numerosi i sistemi di catalogazione in grado di catturare e trattare i metadati provenienti dagli archivi degli editori, allo stesso modo in cui sono trattate le notizie catturate dai cataloghi delle reti e delle agenzie bibliografiche nazionali Modelli funzionali per il nuovo opac l’opac che si adatta l’opac che suggerisce l’opac che apprende l’opac che integra l’opac che aggrega gestire insiemi di risultati resi particolarmente corposi per le dimensioni raggiunte dai cataloghi collettivi e che si presentano più eterogenei rispetto al passato per la crescente varietà di formati editoriali. Ranking e aggregazioni il ranking: restituzione dei risultati di una ricerca secondo criteri di priorità regolati mediante algoritmi prestabiliti non è la soluzione più opportuna, specialmente nel caso delle opere letterarie, per le quali possono esistere decine di edizioni curate da editori diversi, in lingue e su supporti differenti ricorso ad aggregazioni virtuali e dinamiche applicazione della logica espressa in FRBR per produrre dei sottoinsiemi per le singole opere, per le edizioni costituite da versioni sostanzialmente simili del medesimo testo, per le traduzioni, per i diversi formati di pubblicazione Classificazione a “faccette” dei risultati della ricerca i dati vengono analizzati e categorizzati per data, lingua, formato, soggetto, intestazione, disponibilità per la consultazione l’applicazione di una o più faccette per la determinazione dei sottoinsiemi può essere determinata dinamicamente in funzione del numero di occorrenze individuate per un certo aspetto (qualora, ad esempio, il raggruppamento per secoli abbia determinato per il range 1900-1999 più di cento occorrenze, il sistema provvede automaticamente ad applicare la ripartizione per decennio) Esempi: Endeca Grokker (http://www.grokker.com/) RedLightGreen: aggregazioni per opere Grokker – Visualizzazione per liste – ricerca di “digital libraries” Risorse Grokker – raffinamento della ricerca attraverso una keyword Possibilità di limitare il dominio su cui effettuare la ricerca Dettaglio dell’area selezionata Dettaglio dell’area selezionata Modelli funzionali per il nuovo opac l’opac che si adatta l’opac che suggerisce l’opac che apprende l’opac che integra l’opac che aggrega l’opac che organizza il web instaurando rapporti con i contenuti della rete, l’insieme dei cataloghi e degli altri repertori bibliografici contribuiscono all’organizzazione del web semantico Macro aree LCC Navigazione per lista di termini associati Lista di termini associati per raffinare le ricerche Macro aree LCC Navigazione per lista di termini associati Dettaglio LCC Ordinare i risultati Dettaglio in popup Espandere la ricerca a partire dai soggetti Open WorldCat (via Google) Edizioni di Tales from Shakespeare Trova il libro in una biblioteca Possibilità di inserire informazioni per circoscrivere geograficamente la ricerca di biblioteche Commercio elettronico a partire da una notizia di WorldCat Google Scholar ricerca per autore Dettaglio del raggruppamento selezionato Collegamento a British Library Direct Ricerca nelle risorse in cui l’opera è citata Ricerca web a partire dalle parole chiave del record selezionato Link automatico nel caso in cui è permesso l’accesso diretto alla risorsa RedLightGreen aggregazioni per opere