accesso aperto ai risultati della ricerca nell’ambito delle scienze fisiche e matematiche: pratiche correnti, sfide e piani futuri stefano bianco - referente OA per l’infn Istituto Nazionale di Fisica Nucleare – Laboratori Nazionali di Frascati [email protected] In stretta collaborazione con: Dario Menasce (INFN Milano Bicocca), Laura Perini (INFN Milano), Marcello Maggi (INFN Bari), Roberto Barbera (INFN Catania), Tommaso Boccali (INFN Pisa), Luca Dell’Agnello (CNAF) Paola Gargiulo (CINECA) Istituto Nazionale di Fisica Nucleare Ente pubblico che promuove, coordina ed effettua la ricerca scientifica nel campo della fisica subnucleare, nucleare ed astroparticellare nonché la ricerca e lo sviluppo tecnologico necessari alle attività in tali settori, in stretta collaborazione con l’Università e nel contesto della collaborazione e del confronto internazionale S.Bianco (INFN Frascati) et al. - Pisa 8 aprile 2014 3 Progetti Open Access Data & Data Preservation SCOAP3 Modello economico innovativo di OAP Attivita’ Knowledge Base & Semantic Searches Pratiche correnti S.Bianco (INFN Frascati) et al. - Pisa 8 aprile 2014 4 …dagli albori del Tempo • La comunita’ dei fisici e’ abituata a distribuire da piu’ di 50 anni i preprint cartacei per tutto il mondo via servizio postale… S.Bianco (INFN Frascati) et al. - Pisa 8 aprile 2014 5 …e l’archivio di preprint dei laboratori nazionali di frascati risale al 1954 S.Bianco (INFN Frascati) et al. - Pisa 8 aprile 2014 6 L’aumento dei prezzi degli abbonamenti e` un problema globale • Journal subscription prices have soared above any indicator • The more libraries cancel subscriptions, the more these prices grow (serial crisis) S.Bianco (INFN Frascati) et al. - Pisa 8 aprile 2014 7 HEP e Open Access: sinergia • La comunita` High Energy Physics (HEP) e` decenni avanti nel “pensare Open Access”: – Per 40 anni i fisici hanno diffuso per il mondo montagne di preprint cartacei – 1984 nasce arXiv – Il WWW nasce al CERN ~1990 soprattutto per la diffusione dei documenti, interfaccia web per arxiv – Nascono le prime peer-reviewed riviste elettroniche: •Journal of High Energy Physics (1997) •Physical Review Special Topics Accelerators and Beams (1998) •New Journal of Physics (1998) • • • • • Siamo una comunita` piccola e connessa (<20000 scienziati) Abbiamo un output scientifico ridotto (<10000 articoli/anno) Il panorama editoriale e` ristretto (< 10 journals) Le comunita` lettore e autore coincidono L’Open Access e` per noi una seconda natura: normalmente si pubblica su arXiv prima ancora di inviare alla rivista S.Bianco (INFN Frascati) et al. - Pisa 8 aprile 2014 8 Infn e Open Access – Budapest Open Access Initiative 2001 – Dichiarazione di Berlino sull'accesso aperto alla letteratura scientifica 2003 – L’Infn aderisce a SCOAP3 2007 – Dichiarazione delle 4 collaborazioni LHC 2007 – L’Infn firma la dichiarazione di Berlino 2008 – L’Infn firma la dichiarazione di Granada 2010 – L’Infn firma il position paper MedOAnet/Roma 2013 • Insieme a MIUR, CRUI, CNR, ENEA, INGV, ISS, INAF S.Bianco (INFN Frascati) et al. - Pisa 8 aprile 2014 9 L’Infn, con la preziosa collaborazione di Cineca, Crui, universita`, Cnr e Enea, sostiene il progetto SCOAP3 Sponsoring Consortium for Open Access Publishing in Particle Physics • Spesa non superiore a quella attualmente sostenuta per gli abbonamenti • Selezione delle riviste attraverso un regime di competizione commerciale • Pubblicazione Open Access sulle riviste High Energy Physics • Prezzo per articolo bloccato nel corso del contratto triennale 2014-2016 (opposto all’aumento annuale degli attuali abbonamenti) • Implementazione di un modello economico innovativo basato sulla competizione, con potenzialita` di applicazione in campi vicini S.Bianco (INFN Frascati) et al. - Pisa 8 aprile 2014 10 come funziona SCOAP3 Sponsoring Consortium for Open Access Publishing in Particle Physics Un consorzio mondiale che finanzia le pubblicazioni HEP e le rende OA attraverso il ri-instradamento dei fondi di abbonamento, ed il passaggio ad un regime di competizione commerciale. Ieri: Le agenzie attraverso le biblioteche compravano abbonamenti per finanziare la peer-review e per permettere ai propri utenti di leggere gli articoli. Non esisteva alcuna forma di competizione commerciale fra riviste. Oggi (2014-2016): Le agenzie e le biblioteche insieme contribuiscono al consorzio SCOAP3 che, dopo aver selezionato con un bando di gara le riviste, paga centralmente la peer-review per ciascun articolo pubblicato. Gli articoli sono OA per tutti. S.Bianco (INFN Frascati) et al. - Pisa 8 aprile 2014 11 Una collaborazione mondiale delle agenzie finanziatrici in High Energy Physics S.Bianco (INFN Frascati) et al. - Pisa 8 aprile 2014 12 Prezzo per articolo di pubblicazione OA S.Bianco (INFN Frascati) et al. - Pisa 8 aprile 2014 sensibilmente piu` basso del costo di mercato 13 • SCOAP3 partito il 1 gennaio 2014 con il forte supporto del CERN • Contratto triennale • Circa 600 articoli OA al mese • Sfida: sustainability 2017 S.Bianco (INFN Frascati) et al. - Pisa 8 aprile 2014 14 Progetti Open Access Data & Data Preservation SCOAP3 Modello economico innovativo di OAP Attivita’ Knowledge Base & Semantic Searches Pratiche correnti S.Bianco (INFN Frascati) et al. - Pisa 8 aprile 2014 15 Bosone di Higgs e Open Data Una foto elettronica di un bosone di Higgs che decade in quattro muoni nell’esperimento CMS S.Bianco (INFN Frascati) et al. - Pisa 8 aprile 2014 16 Il risultato finale: S.Bianco (INFN Frascati) et al. - Pisa 8 aprile 2014 17 Quello che vedete pubblicato e` la cima dell’iceberg Raw data S.Bianco (INFN Frascati) et al. - Pisa 8 aprile 2014 18 Gli esperimenti al CERN hanno approvato (o stanno per approvare) policies specifiche di open data • CMS – https://cms-docdb.cern.ch/cgi-bin/PublicDocDB/ShowDocument?docid=6032 • ATLAS – In preparazione • ALICE – In preparazione • LHCb – https://cds.cern.ch/record/1543410?ln=en S.Bianco (INFN Frascati) et al. - Pisa 8 aprile 2014 19 Quattro livelli di Dati in Open Access Mode Data Harmonization Guidelines •Common tacit points of agreement between LHC experiments: •level 1 data: All experiments already make data from papers and supporting ! information available through HEPDATA/Inspire, support open access journals etc.. level 2 data: All experiments already support limited access of samples in simple formats for outreach and teaching. level 3 data: Full reconstruction outputs for analysis (AOD, DPD/ntuples) might be made available after an embargo period – but suggested durations range from 3 to 10 years, and there is a question of usefullness. The resource implications to make this useful are high. level 4 data: General agreement RAW data is preserved for the experiment and future – open data access is not usually possible even to the collaboration members. (In ATLAS access to RAW data on tape is restricted). • • • •Tools like Rivet, HEPDATA & Recast may make data (information) usefully available, bridging level 3 and level 1. 4 S.Bianco (INFN Frascati) et al. - Pisa 8 aprile 2014 20 CMS policy for Open Data • • • • At level 1, the additional data is made available at the moment of the publication. At level 2, simplified data format samples are released promptly as determined by the Collaboration Board. At level 3, public data releases, accompanied by stable, open source, software and suitable documentation, will take place yearly during long LHC machine shutdowns and at best efforts during running periods. During the lifetime of CMS an upper limit on the amount of publicly available data, compared to those still only available to the collaboration, will correspond to 50% of the integrated luminosity collected by CMS. Data will be usually released 3 years after data taking, but the Collaboration Board could, in exceptional circumstances, decide to release some particular data sets either earlier or later. The raw data formats of level 4 are not useful for analysis and will not be included in the public data release. Only level 3 formats after final calibration and reconstruction will be made available. These are the data formats used also internally in CMS for analysis. S.Bianco (INFN Frascati) et al. - Pisa 8 aprile 2014 21 INFN e` partner di DPHEP e partecipa alla costruzione di progetti con gli altri enti di ricerca per assicurare la costruzione di una infrastruttura capace di dare accesso agli open data. S.Bianco (INFN Frascati) et al. - Pisa 8 aprile 2014 22 Attivita` INFN Knowledge Base and Semantic Search S.Bianco (INFN Frascati) et al. - Pisa 8 aprile 2014 23 Sostenibilita’ di SCOAP3 Interconnessione fra Enti Database della ricerca Sfide & Piani futuri S.Bianco (INFN Frascati) et al. - Pisa 8 aprile 2014 24 Interconnessione fra Enti • Lettera di intenti per una collaborazione INFNOpenAIRE inviata il 7 aprile 2014 • Convenzione INFN-CNR per il deposito legale dei prodotti digitali della ricerca editi/realizzati dall’INFN firmata nell’ottobre 2013 • Partecipazione a proposte H2020 • Possibilita` di utilizzo infrastruttura INFN “Big Data” – 1 Tier1 + 12 Tier2 • O(25000) cores • O(20) PB di Disco • O(20) PB di tape – Centri interconnessi almeno a 10 Gbit/s S.Bianco (INFN Frascati) et al. - Pisa 8 aprile 2014 25 Database della ricerca S.Bianco (INFN Frascati) et al. - Pisa 8 aprile 2014 26 DATABASE DELLA RICERCA pilot: opendata.ct.infn.it Bibl. CNR openAIRE CINECA VQR DSPACE arXiv Scoap3 OA papers INFN Grey Lit INFN Multi media Happy INFN (etc.) scientists: SINGLE MANDATORY DEPOSIT INVENIO-NEXT & ZENODO S.Bianco (INFN Frascati) et al. - Pisa 8 aprile 2014 27 PILOT SCREENSHOT opendata.ct.infn.it pilot screenshot Add any other participating Institutes S.Bianco (INFN Frascati) et al. - Pisa 8 aprile 2014 28 Sostenibilita’ di SCOAP3 Interconnessione fra Enti Database della ricerca Sfide & Piani futuri Organismo di certificazione indipendente S.Bianco (INFN Frascati) et al. - Pisa 8 aprile 2014 29 e quindi … in cui si risparmia ???? S.Bianco (INFN Frascati) et al. - Pisa 8 aprile 2014 30 Conclusioni • L’Infn e la comunita’ dei fisici che esso rappresenta hanno l’OA nel DNA • SCOAP3 puo’ essere un passo avanti come modello economico alternativo agli abbonamenti ma non va alla radice del problema. – Sfida: un organismo certificatore indipendente dagli editori • Problemi ? Superabili ? Cfr Roberto Caso, questo Workshop • L’Infn ha forte impegno e motivazione nella data preservation e negli open data – Partner di DPHEP, attivo nelle call E-INFRA1 (EUDAT, EU-T0) • e-Infrastructure presente e disponibile per collaborazioni • Iniziato progetto per database della ricerca aperto a collaborazioni S.Bianco (INFN Frascati) et al. - Pisa 8 aprile 2014 31 Conclusioni bis Open Data & Data Preservation SCOAP3 nuovo modello economico OAP E’ possibile realizzare un organismo di certificazione indipendente dagli editori ? Database della ricerca Interconnes sione fra Enti e-Infra structure S.Bianco (INFN Frascati) et al. - Pisa 8 aprile 2014 32 Liste • [email protected] – Info line, rispondono gli SCOAP3 National Contacts SB & P.Gargiulo (Cineca) • [email protected] – Per tutti gli addetti ai lavori e agli interessati S.Bianco (INFN Frascati) et al. - Pisa 8 aprile 2014 33 bibliografia 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. Info ? Referente OA per l’Infn Stefano Bianco [email protected] http://scoap3.org/ Towards open access publishing in high energy physicsS. Bianco et al. CERN-OPEN-2007015, Apr 2007. 35pp. http://aperto.unito.it/bitstream/2318/708/1/Bianco_La_fisica_e_open_access.pdf http://unitosvicol.wordpress.com/2007/12/07/stefano-bianco-scoap-e-linfn/ http://oa.mpg.de/berlin6/index3d3a.html?page_id=67 S.B., Talk at BERLIN6 www.berlin6.org http://oa.mpg.de/openaccess-dus/index.html BERLIN6 @ Duesseldorf SCOAP3 @ CERN scoap3.org S.B. et al., Report of the SCOAP3 Working Party, ISBN 978-92-9083-292-8 http://scoap3.org/files/Scoap3WPReport.pdf A.Gentil-Beccot et al., arXiv:0906.5418 S.B. Status of SCOAP3, MedOAnet workshop January 2013 https://indico.cern.ch/conferenceTimeTable.py?confId=233119#20130321.detailed Joint DASPOS / DPHEP7 Workshop Open Data Preservation M.Maggi Open Data in HEP, www.garr.tv R.Barbera CHAIN-REDS (www.chain-project.eu) Grant Agreement no. 306819 S.Bianco (INFN Frascati) et al. - Pisa 8 aprile 2014 34 Spare slides S.Bianco (INFN Frascati) et al. - Pisa 8 aprile 2014 35 Glossario SCOAP3 • Mapping – Ricognizione degli abbonamenti in corso, tipologia, persona di riferimento • Unbundling – Scorporo della reduction in caso di abbonamenti inseriti in pacchetti • Reduction – Quota che l’editore sottrarra` all’abbonamento e che la biblioteca/consorzio ridirezionera’ al CERN tramite l’INFN come quota associativa a SCOAP3 • Calculator – Tool excel per il calcolo della reduction • Reconciliation Facility – Tool web per la contrattazione delle reduction • MOU Memorandum Of Understanding – Impegno fra INFN e CERN S.Bianco (INFN Frascati) et al. - Pisa 8 aprile 2014 36 VANTAGGI DI SCOAP3 • SCOAP3 e` un progetto di reindirizzamento dei fondi dagli abbonamenti alla quota associativa consortile • Spesa totale mondiale di Article Processing Costs (APC): 5MEUR / anno. Quota Italia e` 6.9%. • SCOAP3 e` un progetto a costo aggiuntivo zero • SCOAP3 fornisce un contratto OA per tre anni a costo fisso per articolo • Gli articoli OA sono inseriti nel repository di ogni biblioteca partecipante a meno di 24h dalla pubblicazione – Full support per metadati – Creative Common copyright • SCOAP3 e` un modello economico innovativo basato sulla concorrenza • SCOAP3 affronta il nodo centrale (modello economico alternativo) di tutte le politiche OA, estremo interesse di EU. Piu’ recentemente anche sensibilita` del MIUR. Proposte per progetti H2020. • SCOAP3 ha le potenzialita` per essere esteso al di la` di HEP S.Bianco (INFN Frascati) et al. - Pisa 8 aprile 2014 37