Stelline 2008 Sala Volta, venerdì 7 marzo 2008 1 Seminario: "La biblioteca digitale tra accesso e produzione di conoscenza: un percorso tra le statistiche d'uso e citazionali" A cura del Consorzio interuniversitario per le Applicazioni del Supercalcolo Per Università e Ricerca, Settore Automazione Biblioteche Utilizzo di risorse elettroniche e produzione scientifica in un ente di ricerca: esiste una relazione? Paola De Castro – Franco Toni, Istituto Superiore di Sanità - Roma 2 Relazione tra quantità di risorse a disposizione e produzione scientifica • La grande disponibilità di documentazione elettronica ha portato ad un incremento della produzione scientifica dell’ente? • E’ migliorata la qualità scientifica degli articoli prodotti? • La risposta al primo quesito comporta un’analisi quantitativa, al secondo una qualitativa Carlo Maria Serio - [email protected] 3 Analisi quantitativa • Occorre mettere in relazione il numero di risorse a disposizione e l’uso che ne viene fatto e il numero di articoli o documenti prodotti. • Sostanzialmente quindi significa analizzare la relazione tra quantità di riviste, basi dati, repositories accessibili dai ricercatori, numero degli articoli scaricati e quantità della produzione scientifica numero degli articoli scaricati numero degli articoli pubblicati • Sembrerebbe un’operazione relativamente semplice ma in realtà comporta la soluzione di una serie di problemi di grande portata sia relativamente al versante esterno, dell’utilizzo delle risorse, che a quello interno, della produzione Carlo Maria Serio - [email protected] 4 Analisi quantitativa [2] – Problemi relativi all’utilizzo delle risorse: • Compatibilità dei dati utilizzo di COUNTER • COUNTER: non tutti i publisher adottano questo standard de facto • Importanza dell’attivazione di SUSHI per la raccolta automatizzata e normalizzata dei dati forniti dagli editori • Per la grande maggioranza delle pubblicazioni OA non esistono dati statistici sul numero di accessi e scarichi (solo BioMed Central fornisce statistiche). • La quantità di utilizzo di archivi OA (periodici, repositories) può essere determinata solo attraverso l’attivazione di una ricognizione TLA (Transaction Log Analysis), con tutte le difficoltà che questo comporta – Problemi legati alla produzione scientifica • Tipologia delle pubblicazioni che devono essere prese in considerazione (anche proceedings, posters, rapporti, ecc.?) • Gap temporale (anche di anni) tra il momento del download della risorsa e la pubblicazione dell’articolo porta a una distorsione del dato statistico Carlo Maria Serio - [email protected] 5 Usage Factor • Studio di Peter T. Shepherd commissionato dall’UKSG (United Kingdom Serials Group) – Maggio 2007 • Nasce come possibile alternativa/affiancamento dell’IF • UF = Total usage (COUNTER JR1 Data for a specified period) Total number of articles published online (during a specified period) • Analisi condotta analizzando risposte a questionari fornite da editori, autori e bibliotecari Carlo Maria Serio - [email protected] 6 Usage Factor [2] • Principali risultati: – Vantaggi: • • • • • – UF può costituire un valido strumento di valutazione dei giornali per deciderne l’acquisto o la cancellazione UF può coprire un campo molto più vasto rispetto agli 8.000 titoli coperti dall’IF e quindi riflettere il valore di un giornale in modo più ampio rispetto alle citazioni UF può mettere in rilievo all’interno delle raccolte di un istituto l’importanza di giornali che sono “sottovalutati” dall’IF UF può costituire un’alternativa credibile e valida all’IF per misurare il valore di un giornale: due parametri di valutazione sono meglio di uno! UF può porsi come importante bilanciamento all’IF Possibili elementi negativi: • • • • Le statistiche d’uso possono essere “gonfiate” dalle interfacce degli editori COUNTER non ha ancora una diffusione sufficiente per assicurare una copertura globale La difficoltà nel determinare il range temporale da considerare nell’analisi: è stato suggerito un periodo di 2 anni (ma anche fino a 5) per tener conto dei due picchi legati alla consultazione, il primo relativo al momento della pubblicazione dell’articolo, il secondo a quando inizia ad essere citato Il ranking dei giornali: mentre gli autori sono favorevoli, gli editori lo sono molto meno Carlo Maria Serio - [email protected] 7 Usage Factor [3] • L’UF può essere utilizzato per fornire valori ai fini della valutazione dell’attività di ricerca e della produzione scientifica di un istituto? • Certamente risulta molto utile per la valutazione dell’utilizzo delle risorse ma non per l’analisi quantitativa della produzione scientifica • Essendo un fattore complementare all’IF si dimostra invece un elemento importante per il bibliotecario nel momento in cui deve decidere l’acquisto o la dismissione di un giornale, per l’autore nel momento in cui deve scegliere dove pubblicare e per gli editori che acquisiscono un ulteriore elemento per valutare validità e posizionamento dei loro prodotti nel panorama generale del mercato Carlo Maria Serio - [email protected] 8 Analisi qualitativa • 1° aspetto: – Il beneficio che può derivare alla ricerca dalla qualità e tipologia della documentazione messa a disposizione del ricercatore ai fini della produzione dei suoi lavori. Un’analisi di questo tipo può essere condotta ad esempio attraverso la verifica di quanto di quello che viene citato nelle pubblicazioni dei ricercatori è stato recuperato attraverso le collezioni messe a disposizione dalla biblioteca – La difficoltà risiede nel fatto che non è un’indagine che può essere fatta utilizzando un trattamento automatico dei dati e che spesso il ricercatore non segnala nel riferimento bibliografico se la fonte è di natura digitale – Può essere utile tuttavia tentare una ricognizione non sistematica ma a campione su un numero limitato di unità selezionate per natura disciplinare, in modo da verificare se c’è una disparità di risultati nei diversi settori scientifici Carlo Maria Serio - [email protected] 9 Analisi qualitativa [2] • 2° aspetto: – Impatto citazionale, ovvero verificare se col migliorare dell’offerta aumenta la quantità di articoli pubblicati su riviste impattate, se aumenta il numero di citazioni per gli autori, se aumenta l’HIndex dei singoli autori – In questo caso le problematiche che possono insorgere sono quelle tipiche legate all’uso dell’IF: necessità di separare con precisione gli ambiti disciplinari per avere valori attendibili e non astratti, presenza delle autocitazioni, distinzione tra citazioni positive e negative, ecc. – Anche per questa ricognizione conviene partire, per ottenere risultati attendibili e di maggiore precisione soprattutto nell’analisi specifica delle citazioni, da una ricerca condotta su campioni selezionati e per ambito disciplinare Carlo Maria Serio - [email protected] 10 Produzione di letteratura scientifica del personale ISS: anni 2001-2007 dati dell’archivio bibliografico ISS CONTESTO - 1800 unità - 800 ricercatori Assestamento dei dati negli anni Maggiore abitudine alla registrazione Carlo Maria Serio - [email protected] 11 Tipologia delle pubblicazioni ISS Comunicazioni a congressi nazionali internazionali Articoli di periodici nazionali internazionali Monografie nazionali internazionali Letteratura grigia 22 % 10 12 57 % 18 39 9% 2 7 12 % 100 % numericamente 21/12/2015Incontro con il CASPUR – 5 febbraio 2008 Circa 1800 Edita ISS: 20% 12 21/12/2015Incontro con il CASPUR – 5 febbraio 2008 Carlo Maria Serio - [email protected] 13 21/12/2015Incontro con il CASPUR – 5 febbraio 2008 Carlo Maria Serio - [email protected] 14 Numero di pubblicazioni ISS 2006 suddivise per struttura (aree tematiche) 160 148 indicizzate non indicizzate 140 128 120 114 100 77 80 75 74 70 69 56 60 46 46 49 46 41 37 40 32 22 19 20 15 11 5 4 2 1 1 0 MIPI BCN FARM TES CNE AMPP EOMM SAAN CNAIDS CNRA SBGSA CNT 5 0 SIDBAE 0 URE La percentuale fra pubblicazioni indicizzate e non indicizzate è uguale al 50% 15 Pubblicazioni ISS 2006 con IF e IF normalizzato per struttura 450 433 440 400 Indicizzate con: IF IF normalizzato 350 329 329 292 300 287 250 240 249 200 188 183 192 184 168 156 150 152 147 128 91 100 77 75 69 46 50 84 74 41 46 22 34 37 15 19 18 5 1 4 4 0 MIPI BCN FARM CNE EOMM TES SAAN AMPP CNAIDS CNRA SBGSA CNT IF normalizzato secondo la Circolare del Ministero della Salute del 30 maggio 2002 16 IF totale delle pubblicazioni dei ricercatori dell’ISS dal 2000 al 2006 2006 2.127 2005 2.331 2004 2.196 2003 2.127 2002 2.146 2001 2.140 2000 2.027 0 500 1000 1500 2000 2500 Come determinare l’influenza dell’accesso a risorse elettroniche sull’output scientifico? CONSIDERANDO CHE • Produzione (1800) • Impact Factor (>2) pressoché costanti 2001-2007 E CHE >Circolazione di risorse online = > citazioni > possibilità di contatti con l’autore (e-mail) > collaborazioni (finanziamenti) > maggiore scambio tra settori > produttività disciplinari ALCUNE IPOTESI DI RICERCA 17 18 Ipotesi di ricerca 1) Analisi delle bibliografie Analisi delle bibliografie citate nei lavori per verificare i link a risorse elettroniche Difficoltà • ricerca manuale • forte bias dovuto alla pigrizia dell’autore • presenza di autocitazoni ANALISI FATICOSA E DI ESITO INCERTO 19 Ipotesi di ricerca 2. Analisi delle lingue L’analisi delle lingue maggiormente “lette” (citate) potrebbe tradursi nell’analisi dell’accesso alle risorse online a livello nazionale o internazionale. Sembrerebbe evidente la prevalenza di consultazione di risorse in lingua inglese, che poi risultano tra le fonti più citate nelle bibliografie dei lavori e nella stessa produzione scientifica dell’ente. Produzione ISS in inglese = 58,3% versus 41,7 (in italiano) 21/12/2015Incontro con il CASPUR – 5 febbraio 2008 Carlo Maria Serio - [email protected] 20 Ipotesi di ricerca 3. Analisi delle caratteristiche formali delle risorse online: i titoli dei lavori IL TITOLO (chiarezza e lunghezza) influenza la scelta da parte del lettore di utilizzare o meno una risorsa online. Nell’abbondanza dell’offerta di risorse, il lettore per naturale pigrizia tenda a leggere con maggiore interesse un titolo breve e a scartare un titolo lungo che richiederebbe una maggiore concentrazione a meno che la sua ricerca non sia finalizzata proprio sul quel testo avente il titolo lungo! Hartley J, Betts L. The Effects of Spacing and Titles on Judgements of the effectiveness of Structured Abstracts. Journal of the American Society for Information Science and Technology 2007;58(14):2335-2340 21 Ipotesi di ricerca 4. Analisi delle caratteristiche formali delle risorse online: tipologia di abstract La tipologia e qualità dell’abstract e l’impaginazione influenzano la lettura del testo corrispondente Un abstract “ben fatto” induce alla lettura, un abstract “mal fatto”…. Si riferisce una generale preferenza di abstract strutturati perché: • contengono più informazioni rispetto all’abstract non strutturato • sono più facili da leggere e sono preferiti anche dai referee. Anche le spaziature (corretta visualizzazione di testi e immagini) influenzano la lettura. E’ necessario dare in giusto respiro (spazio) per facilitare la comprensione dei concetti. Perché preferire PDF all’HTML? 22 Ipotesi di ricerca 5. Valutazione della qualità delle fonti online Data l’enorme disponibilità delle fonti online sarebbe utile indagare come l’utente valuta/percepiscela qualità delle fonti IPOTESI: La qualità dell’offerta informativa online non è sempre attentamente valutata Parametri tipici per la valutazione: prestigio della rivista, IF, indicizzazione, ecc. TUTTAVIA spesso le risorse in rete sono recuperate “per caso” e allora sarebbe utile che porsi alcune domande sulla fonte del documento online (chi lo ha prodotto, quali comitati editoriali, ecc.) La disponibilità immediata online di queste informazioni potrebbe facilitare la scelta da parte del ricercatore verso un certo tipo di produzione. MA esiste questa attitudine? Questionario 23 Ipotesi di ricerca 6. Valutazione del plagio In ultimo, ma da non sottovalutare, data la facilità di effettuare il “Copia incolla” si riscontra un aumentato tasso di plagio nei lavori scientifici in rapporto alla maggiore disponibilità delle risorse online e ai sistemi di individuazione dei lavori “copiati” È perché oggi è più facile individuare il plagio, o perché la pratica è “facilitata”? (Research policy 36, 2007: 905-911 Martin B. R. Keeping plagiarism at bay - A salutary tale. Science Direct 2007;36(7):905-91 24 http://www.sasi.group.shef.ac.uk/worldmapper/index.html 25 Bibliografia • • • • • • • • Roswitha Poll, Impact/Outcome Measures for Libraries, Liber Quarterly, 2003, 13, p.329-342 Roswitha Poll, Measuring the impact of new library services, 71th IFLA General Conference and Council, Oslo, 2005, http://www.ifla.org/IV/ifla71/papers/081ePoll.pdf Tim Brody, Stevan Harnad, Leslie Carr, Earlier Web Usage Statistics as Predictors of Later Citation Impact. Journal of the American Association for Information Science and Technology (JASIST), 2006, 57, 8, p. 1060-1072, http://www3.interscience.wiley. com/cgi-bin/fulltext/112593522/HTMLSTART?CRETRY=1&SRETRY=0 Deborah D. Blecic, Joan B. Fiscella, Stephen E. Wiberley Jr., Measurement of use of electronic resources: advances in use statistics and innovations in resource functionality, College & Research Libraries, 2007, 68, 1, p. 26-44, http://www.ala.org/ala/acrl/acrlpubs/crljournal/backissues2007a/crljanuary07/blecic07. pdf Domenico Dellisanti, ICOLC 2006: SUSHI un nuovo strumento per la misurazione delle risorse elettroniche, Bollettino del CILEA, 2007, 105, p. 17-20 Antonella De Robbio, Analisi citazionale e indicatori bibliometrici nel modello Open Access, Bollettino AIB, 2007, 47, 3, p. 257-289 Diane Harley, Jonathan Henke, Toward an effective understanding of website users, D-Lib Magazine, 2007, 13, 3/4, http://www.dlib.org/dlib/march07/harley/03harley.html Peter T. Shepherd, Final Report on the investigation into the feasibility of developing and implementing journal usage factor, May 2007, http://www.uksg.org/usagefactors Carlo Maria Serio - [email protected]