Comunicazione scientifica ed editoria elettronica: la parola agli Autori L'Utente-Autore nel circuito della comunicazione scientifica: editoria elettronica e valutazione della ricerca Auto-archiviazione per la ricerca: problemi aperti e sviluppi futuri Antonella De Robbio 20 maggio 2003 Università degli Studi di Milano Via Festa del Perdono, 7 - Aula Magna L’auto-archiviazione L’auto-archiviazione o self-archiving è un processo essenziale nel nuovo modello di comunicazione scientifica Non va confuso l’auto-pubblicazione (self-publishing) o vanity press Self-archiving è il primo passo entro circuito di disseminazione informativa caratterizzato dal deposito delle proprie produzioni di ricerca entro spazi “open access” Le produzioni di ricerca auto-archiviate massimizzano e accelerano l’impatto della ricerca massimizzando l’accesso alla ricerca Molti sono i ricercatori che da alcuni anni archiviano i loro lavori sui server delle loro istituzioni o in server disciplinari fisica, economica, matematica, biomedicina, astronomia, chimica … Per esserci impatto è necessaria un’ampia disseminazione I lavori dei ricercatori devono essere letti, citati e utilizzati da altri ricercatori: solo così raggiungono l’impatto utile ad uno sviluppo collettivo Per questa ragione occorre fare attenzione ai contratti editoriali nel trasferimento dei diritti (copyright) agli editori: ritenzione di alcuni diritti, cessione non esclusiva I ricercatori, contrariamente a tutti gli altri autori, devono i loro guadagni non alla vendita dei loro articoli scientifici, ma all'impatto dei loro articoli sulla comunità Gli obiettivi dell’open access • Un recente articolo apparso su Nature rileva il 336% (media) in più di citazioni ad articoli online rispetto agli stessi articoli pubblicati a stampa (Lawrence, 2001) • Gli articoli sono universalmente e liberamente accessibili • Gli autori ritengono il copyright sulle loro produzioni • Due i canali dell’Open Access: • Pubblicazioni entro iniziative di editoria elettronica sostenibile • Deposito negli Open Archives I due principali ostacoli alla disseminazione di contenuti L’aumento dei prezzi delle riviste scientifiche influenza in modo negativo il fattore di impatto entro la comunità scientifica La questione della proprietà intellettuale (copyright) dei lavori scientifici porta all’attuale situazione paradossale ben nota Ostacoli all’accesso ai contenuti della ricerca Margini di profitto di alcuni editori STM - Anno 2000 dati presentati da Giuseppe Vitiello al Seminario Vinay 2003 Venezia Politiche editoriali per la cessione dei diritti d’autore di tipo esclusivo Editore / Settore Giuridico % Scientifico % Thomson 29,6 Elsevier 38,6% Kluwer 26,4 Kluwer 25,8% Elsevier 19,7 John Wiley 48,1% Business % Finanziario % Elsevier 15,8% McGraw Hill 31,6% 18,8% Reuters 27,9% VNU 18,1% Thomson 27,6% Primedia 19,6% United Media Business Maximized Research Access and Impact Through Self-Archiving “Skywriting”: All research, accessible to all potential users, anywhere, anytime Inizio del ciclo d’impatto: Ricerca creata Il ricercatore scrive il paper pre-print pre-refereeing Pre-Print autoarchiviato nel WebServer istituzionale di Ateneo 12-18 Months Sottomissione al periodico “Pre-Print” referato dal Post-Print autoComitato di Esperti dei Pari archiviato nel “Peer-Review” Pre-Print revisionato WebServer istituzionale dall’Autore dell’articolo di Ateneo “Post-Print” riveduto, accettato, certificato e pubblicato dal periodico I ricercatori possono accedere al Post-Print SOLO se la loro istituzione ha un abbonamento a quel periodico Rielaborazione slide tratta dalla presentazione di Tim Brody Nuovo ciclo d’impatto: L’impatto di ricerca a seguito dell’autodeposito è grande e veloce dovuto alla massimizzazione dell’accesso accelerato Nuovo ciclo d’impatto: Nuove ricerche si costruiscono sulla ricerca esistente La proporzione di periodici che formalmente supportano il self-archiving (già 54%) è in continua crescita 2 milioni di articoli annui in 20.000 riviste Esiste una linea di demarcazione che differenzia i due canali: – – circuito della ricerca circuito commerciale E' l'incapacità di vedere questa "linea di demarcazione" che crea così tanta confusione e che ritarda la transizione degli oltre due milioni di articoli scientifici annui pubblicati in ventimila riviste da un circuito "chiuso" a pagamento" verso territori "open" dove abitano gli "open archive" Che cosa sono gli e-prints Gli e-prints sono copie elettroniche di papers accademici, comprendono: – – – I pre-prints I post-prints I post-post-prints Gli e-prints posti dentro gli archivi di e-prints consentono agli autori di rendere le proprie produzioni di ricerca, liberamente disponibili alla comunità internazionale scientifica, disseminandoli su scala mondiale, cosa impossibile per un lavoro su carta Che cosa sono gli Open Archives Gli Open Archives, o E-prints server, sono Archivi Aperti preposti al deposito dei documenti scientifici, in forma elettronica (eprints), funzionali alla loro gestione e conservazione. Si dicono OAI (Open Archive Initivative) compatibili quando rispondono ai requisiti tecnici e agli standard di interoperabilità I documenti elettronici possono essere depositati direttamente dagli autori attraverso un semplice processo noto come autoarchiviazione o da terze persone (bibliotecari) Interoperabilità degli OAI Un deposito entro l’architettura OAI Open Archive Initivative è noto come “data provider” Ciascun documento depositato in un DP Data Provider è corredato da metadati in formato standard che vengono esposti per la raccolta (harvesting) da parte dei SP Service Provider “fornitori di servizi” Gli archivi sono detti “aperti” in quanto possono essere interrogati da un servizio (“service provider”) che si occupa di indicizzare i metadati raccolti dai vari archivi attraverso la funzione di harvesting Il colloquio e lo scambio informativo di metadati è possibile solo tra archivio OAI compatibili o interoperabili Due le aree di intervento Da una parte si trovano iniziative come OAI nata con lo scopo di – – sviluppare e promuovere standard per l'interoperabilità tra archivi essere di supporto ad un'efficiente disseminazione di contenuti; Dall'altra si collocano iniziative come – – – Budapest Open Access Initiative BOAI movimento Free Online Scholarship FOS Public Library of Science (30.000 scienziati di 180 Paesi I modelli di Open Archives: tecnici e organizzativi Numerose sono le esperienze nel mondo e anche le tipologie tecniche – modello accentrato (arXiv.org) – modello distribuito (RePEc) A livello organizzativo le scelte possono essere – server istituzionali (institutional repositories) – server subject-based o disciplinari Esistono inoltre altre soluzioni: gli “umbrella server” (specie di MetaOA) individual data provider (modello Kepler) Modello disciplinare accentrato HEP e discipline correlate Nasce nel 1991 80.000 utenti / 80 Paesi 3500 nuovi lavori al mese 234.181 documenti totali (17/05/03) Processo di assorbimento di piccoli server di matematica dal 1994 Entro una decade si potrà raggiungere parità tra lavori open access depositati e lavori pubblicati Modello disciplinare distribuito Che cosa sono i repositories istituzionali I depositi istituzionali di documenti sono collezioni digitali che raccolgono e conservano la produzione intellettuale delle comunità accademiche (singoli o multi Atenei) possono essere considerati estensione naturale delle responsabilità dell’istituzione accademica in qualità di generatori di ricerca primaria sono potenzialmente la componente più importante nell’evoluzione della struttura dei nuovi modelli di comunicazione scientifica Le potenzialità di un deposito istituzionale giocano un ruolo significativo nel processo evolutivo della ristrutturazione della comunicazione scientifica offrono una risposta strategica ai problemi esistenti nel sistema che regola i periodici scientifici forniscono un immediato complemento di qualità al modello di pubblicazione scientifica esistente stimolano l’innovazione entro una struttura di editoria disaggregata sono indicatori tangibili della qualità di un’istituzione, incrementandone la visibilità, il prestigio e il valore a livello pubblico Lo status quo: situazione frammentaria Centinaia di e-server: istituzionali, disciplinari, accentrati, distribuiti, piccoli, grandi, depositi di collezioni, ... Papers sparsi sui siti Web Umbrella servers (es. MPRESS) MetaMotori OA (service provider) CiteSeer, servizio precedentemente chiamato ResearchIndex, costruito da NEC Research Institute Cooperazione e interoperabilità I Software Open Source disponibili per la creazione di OA ArXive, RePEc, Kit NCSTRL (ex-protocollo Dienst): per server disciplinari VT EDT Virginia Tech per le Tesi Eprints software (OAI compatibile): per server istituzionali (68 archivi nel mondo lo adottano) Kepler software: per server individuali DSpace di MIT. Gestisce anche formati multimediali utili alla didattica (nato nel 2003) CDSware del CERN: funge anche da portale con motore che ricerca entro le collezioni della biblioteca Dati statistici sugli Open Archive La crescita di archivi OAI: Ad oggi esistono oltre 140 archivi, tra disciplinari e istituzionali, di cui 3 di grandi dimensioni e ricchi di papers e 68 basati sul modello EPrints L’incremento del numero di lavori free access entro gli archivi OAI: I depositi attuali superano i 1.400.000 record totali (compresi i 234.181 di ArXive e i 200.000 di RePEc), anche se non tutti i record si riferiscono a lavori a testo pieno Il totale dei record di tutti i 68 Archivi Eprints è di oltre 8000, con una media di 120 papers depositati in ciascuno (va considerato che il modello EPrints è appena nato) La media del numero totale di depositi per archivio è circa 10000 (tenendo conto dei tre grandi e considerando la media bassa degli EPrints) e va necessariamente innalzata velocemente Gli Archivi istituzionali assestati e operativi nel mondo sono 23 con un totale di 5000 papers full-text (processo lento) Crescita del numero di archivi OAI ad oggi esistono oltre 140 archivi, ma la media del numero di papers per Archivio (9000) necessità di una crescita veloce Number of Archives and Mean Number of Papers Per Archive (all OAI Archives) Cumulative Mean Records per Archive Cumulative Archives to Date Archives 160 140 120 100 80 60 40 20 0 10000 9000 8000 7000 6000 5000 4000 3000 2000 1000 0 ja nv -9 av 9 r-9 ju 9 il9 oc 9 t- 9 ja 9 nv -0 av 0 r-0 ju 0 il0 oc 0 t- 0 ja 0 nv -0 av 1 r-0 ju 1 il01 oc tja 01 nv -0 av 2 r-0 ju 2 il0 oc 2 t- 0 ja 2 nv -0 3 Mean Records per Archive dall’analisi di Tim Brody Il modelloEprints.org sottoinsieme di OAI (sono circa la metà di tutti gli archivi correnti OAI Archives, 70/140) dall’analisi di Tim Brody Crescita dei papers negli archivi Eprints (esclusi i tre grandi) oltre 8000 papers ad oggi (maggio 2003) Cumulative and Monthly Papers in EPrints.org Archives (minus top 3) 9000 1600 8000 1400 7000 1000 5000 800 4000 600 3000 400 2000 200 1000 Cumulative Record Count no v02 ju il02 se pt -0 2 2 ai -0 m ja nv -0 2 m ar s02 no v01 0 ju il01 se pt -0 1 ar s01 m ai -0 1 0 Total New Records per Month Records 1200 6000 m Cumulative Records dall’analisi di Tim Brody Crescita nel numero di papers a testo pieno depositati negli archivi isituzionali (oltre 5000 papers in 23 archivi) Institutional Full-Text Archives (c.23) Total and Monthly Papers 6000 5000 4000 3000 2000 1000 Ju l- 0 3 0 dall’analisi di Tim Brody Che cosa serve per riempire gli Open Archives L’obiettivo primario delle Università (o degli enti finanziatori della ricerca) deve essere quello di adottare una politica sistematica di auto-archiviazione di tutte le produzioni di ricerca “refereed” Servono inoltre policies a corredo dell’OA per la submission, di copyright, e sui medatati Altro passo fondamentale: adottare CV online standardizzati Valutazione online dell’impatto della ricerca da parte di chi finanzia la ricerca (anche attraverso i CVs connessi agli OA) Gli archivi istituzionali devono essere integrati dentro la Biblioteca Digitale (visibilità dal sistema informativo: portale, OPAC …) Esempio di CV universitario online standardizzato e con indicatori di performance esposti agli harvester e links agli Eprint Archive istituzionali Che cosa serve per convincere gli autori È necessario il CONSENSO per ottenere il deposito di “contents, contents, contents” (grido di Harnad) che si acquisisce: – Analizzando i comportamenti e le abitudini delle singole comunità di studiosi: a livello di gruppo, nazionale, internazionale, dentro l’istituzione, nella comunità disciplinare... – Tenendo conto degli “user requirements” per la costruzione di Archivi confezionati sulle reali esigenze delle comunità (LOCALI? CENTRALIZZATI?) Non basta dire che online è meglio (il grido di Krichel), occorre offrire QUALCOSA IN PIU’ Risultati dell’indagine sull’utilizzo degli archivi ArXive e CogPrints: http://www.eprints.org/results/ Parole chiave per il consenso Il valore aggiunto sta nelle parole chiave – Motori di ricerca per le ricerche nei full-text: vedi esperienze CERN e Caltech – Analisi delle transazioni Log: statistiche sugli accessi al server, ma anche sul singolo autore e su ogni singolo articolo (vedi esempio ArXive, RePEc per abstract visualizzati, articoli scaricati, per giorno, mese, anno ...) – Analisi scientometriche e webmetriche: nuovi strumenti per il calcolo e le nuove misurazioni dell’impatto di ricerca, per il recupero e linking delle citazioni nel web (vedi Paracite, OpCite, CiteBase, Citeseer/ResearchIndex) Liste di discussione internazionali Nature: http://www.nature.com/nature/debates/e-access/index.html Science: http://www.sciencemag.org/cgi/eletters/291/5512/2318b American Scientist: http://amsci-forum.amsci.org/archives/september98-forum.html FOS Newsletter and Forum: http://www.earlham.edu/~peters/fos/index.htm Colloque virtuel text-e: http://www.text-e.org/ SPARC Institutional Repositories Discussion List Archive - [email protected] https://mx2.arl.org/Lists/SPARC-IR/ CNI-COPYRIGHT Forum http://www.cni.org/forums/cni-copyright/cni-copyright.html Riferimenti strategici Bozza delle politiche di autoarchiviazione (preprint e postprint) per le Università http://www.ecs.soton.ac.uk/~lac/archpol.html Proposta UK per una politica nazionale di auto-deposito nelle Università britanniche di tutte le produzioni di ricerca “refereed” ai fini della valutazione http://www.ecs.soton.ac.uk/~harnad/Temp/Ariadne-RAE.doc Template e demo per CV universitari online standardizzati con indicatori di performance esposti agli harvester e links agli Eprint Archive istituzionali http://paracite.eprints.org/cgi-bin/rae_front.cgi RoMEO Project (Loughborough) Rights MEtadata for Open archiving) http://www.lboro.ac.uk/departments/ls/disresearch/romeo/ Strumenti per l’Analisi Citazionale (Scientometrica, Webmetrica) http://citebase.eprints.org/help/ http://opcit.eprints.org/evaluation/Citebase-evaluation/evaluation-report.html http://paracite.eprints.org/ http://citeseer.nj.nec.com/cs Bibliografia Lawrence, S. (2001) Free online availability substantially increases a paper's impact. Nature 411 (6837): 521. http://www.neci.nec.com/~lawrence/papers/online-nature01/ Guédon, Jean-Claude (2002) In Oldenburg’s Long Shadow: Librarians, Research Scientists, Publishers, and the Control of Scientific Publishing http://www.arl.org/arl/proceedings/138/guedon.html Harnad, Stevan (1990) Scholarly Skywriting and the Prepublication Continuum of Scientific Inquiry. Psychological Science 1: 342 - 343 (reprinted in Current Contents 45: 9-13, November 11 1991). http://cogprints.soton.ac.uk/documents/disk0/00/00/15/81/ Harnad, Stevan (2001) For Whom the Gate Tolls? How and Why to Free the Refereed Research Literature Online Through Author/Institution Self-Archiving, Now. http://cogprints.soton.ac.uk/documents/disk0/00/00/16/39/ Grazie per l’attenzione! "Liberare la ricerca valutata, presente e futura, da tutti gli ostacoli all'accesso e all'impatto, dipende ormai dai ricercatori. La posterità già ci guarda e non ci giudicherà bene se continuiamo a ritardare senza ragione l'ottimo e l'ineluttabile, che sono chiaramente alla nostra portata". Stevan Harnard