Seminario Residenziale CIBER 2006 Messina, Villa Pace – 12-14 Giugno 2006 Il nuovo servizio di produzione di statistiche d'uso, compatibili COUNTER, dell'Emeroteca Virtuale Ugo Contino – [email protected] Seminario Residenziale CIBER 2006 – Villa Pace – Messina - 12.14 Giugno Sommario Promissio boni viri… Analisi della struttura di generazione delle nuove statistiche Statistiche d’uso per il CIBER: un esempio concreto di nuove sinergie Ulteriori sviluppi Conclusioni Seminario Residenziale CIBER 2006 – Villa Pace – Messina - 12.14 Giugno Napoli – 10 Novembre 2005… Proposta di adesione allo standard COUNTER (2) Generazione di report mensili con informazioni di accesso alle riviste full-text sull’Emeroteca (Journal_report_1 -> Number of Successful Article Requests by Month and Journal) Generazione di report mensili con informazioni sui turnaways alle riviste fulltext sull’Emeroteca (Journal_report_2 -> Turnaways by Month and Journal) Seminario Residenziale CIBER 2006 – Villa Pace – Messina - 12.14 Giugno …Messina 14 giugno 2006! Statistiche Counter (2) disponibili (a partire dal mese di dicembre 2005 sull’area di Repository del CIBER e sull’Area Riservata -> http://www.uniciber.it/areaciber/inde x.php?id=185) Analisi retrospettiva del 2005 Lacuna sulle statistiche del maggio 2005… Report disponibili (sull’Area Riservata) in formato csv Seminario Residenziale CIBER 2006 – Villa Pace – Messina - 12.14 Giugno Uno sguardo al dettaglio… Journal_report_1 Intestazione Ente Data generazione report Profondità analisi Totali su tutte le riviste Dettaglio singola rivista Seminario Residenziale CIBER 2006 – Villa Pace – Messina - 12.14 Giugno Uno sguardo al dettaglio… Journal_report_2 Informazioni: http://www.uniciber.it/areaciber/fileadmin/area_ciberdoc/COUNTER_MANUALE_STATISTICHE_corretto.pdf http://www.uniciber.it/areaciber/fileadmin/area_ciberdoc/CounterRepIstruzioni1maria-1.pdf Seminario Residenziale CIBER 2006 – Villa Pace – Messina - 12.14 Giugno I turnaways nell’Emeroteca Virtuale Definizione Counter: “A turnaway (rejected session) is defined as an unsuccessful login to an electronic service due to exceeding the simultaneous user limit allowed by the licence” Definizione Emeroteca: ”Un turnaway (accesso all’articolo non consentito) è definito come evento nel quale all’utente non è consentito accedere (per il particolare tipo di licenza dell’ateneo al quale appartiene) ad un ben determinato articolo in formato full-text Seminario Residenziale CIBER 2006 – Villa Pace – Messina - 12.14 Giugno Stastistiche@CASPUR (classic version…) Basate sul software SAS “Granularità giornaliera” Disponibili in formato rapporto (PDF o HTML) Metriche disponibili: Distribuzioni giornaliere di accesso ai contenuti (aggregate sull’editore e sulle riviste) Distribuzioni medie orarie di accesso ai contenuti (aggregate sull’editore e sulle riviste) Valori aggregati per rivista ed editore di accesso agli indici di riviste e di fascicolo sia in abbonamento che fuori abbonamento (aggregate sul periodo temporale) Dettaglio accessi ad indici di rivista, di fascicolo, di abstract e fulltext (sia html che pdf) suddivisi per editore e per tipologia in abbonamento che fuori abbonamento (aggregate sul periodo temporale) Andamento giornaliero accessi full-text (sia html e pdf) aggregati sull’editore e sulla rivista Top 10 journals (sia Abs che FT) per tipologia in abbonamento che fuori abbonamento che in UTL (se prevista); aggregazione sul periodo temporale Elenco accessi riviste (sia Abs che FT) per tipologia in abbonamento che fuori abbonamento che in UTL (se prevista); aggregazione sul periodo temporale Seminario Residenziale CIBER 2006 – Villa Pace – Messina - 12.14 Giugno L’Ambiente di produzione “classico” Page view Servizio di Emeroteca Virtuale Informazioni statistiche per ateneo o cumulative Utenti “classici” Sottomissione della richiesta via WEB Ogni mese Server delle statistiche Apache Log files Riviste & Abbonamenti Aggiornamenti mensili Lista IP istituzione PDF HTML Seminario Residenziale CIBER 2006 – Villa Pace – Messina - 12.14 Giugno L’Ambiente di produzione “attuale” Page view Servizio di Emeroteca Virtuale Informazioni statistiche per ateneo o cumulative Utenti “classici” Generazione automatica dei 2 JRC Ogni mese Utenti “remoti” Server delle Statistiche (software Open-source) Apache Log files Riviste & Abbonamenti Aggiornamenti mensili Lista IP istituzione CSV XML …a breve Seminario Residenziale CIBER 2006 – Villa Pace – Messina - 12.14 Giugno Black box unveiled… Primo passo: analisi del file di log dell’Emeroteca e identificazione delle righe utili “Marcatore” di un accesso ad un PDF Seminario Residenziale CIBER 2006 – Villa Pace – Messina - 12.14 Giugno Black box unveiled… Secondo passo: identificazione dei gruppi di analisi Accesso ai PDF Accesso ai PDF da utenza remota LOG FILES (basati su IP+Remoti) Accesso agli HTML Script di parsing Accesso agli HTML da Utenza remota Turnaways sui PDF Turnaways sui PDF da utenza remota Turnways sugli HTML Turnaways sugli HTML da Utenza remota Seminario Residenziale CIBER 2006 – Villa Pace – Messina - 12.14 Giugno Black box unveiled… Terzo passo: eliminazione dei doppi click Dati senza doppi-click Accesso ai PDF Turnaways sui PDF Accesso ai PDF da utenza remota Accesso agli HTML Accesso agli HTML da Utenza remota Turnaways sui PDF da utenza remota Turnways sugli HTML Turnaways sugli HTML da Utenza remota SI Applicazione del criterio del “doppio-click” secondo la direttiva COUNTER HTML consec. > 10 sec PDF consec. > 10 sec NO Seminario Residenziale CIBER 2006 – Villa Pace – Messina - 12.14 Giugno Curiosità… Esistono dei fenomeni di doppi-click anche sui turnaways… 193.204.17.XXX - - [01/Sep/2005:10:07:44 +0200] "GET /cgibin/sciserv.pl?collection=journals&journal=09445013&issue=v157i0004&article=267_iaioyaorg amd&form=pdf&file=file.pdf HTTP/1.1" 200 182 192.84.152.XXX - - [01/Sep/2005:10:11:46 +0200] "GET /cgibin/sciserv.pl?collection=journals&journal=00191035&issue=v77i0001&article=171_pooa3262 a8&form=pdf&file=file.pdf HTTP/1.1" 200 182 192.84.152.XXX - - [01/Sep/2005:10:11:58 +0200] "GET /cgibin/sciserv.pl?collection=journals&journal=00191035&issue=v77i0001&article=171_pooa3262 a8&form=pdf&file=file.pdf HTTP/1.1" 200 182 192.84.152.XXX - - [01/Sep/2005:10:12:06 +0200] "GET /cgibin/sciserv.pl?collection=journals&journal=00191035&issue=v77i0001&article=187_asmocbp& form=pdf&file=file.pdf HTTP/1.1" 200 182 192.84.152.XXX - - [01/Sep/2005:10:12:17 +0200] "GET /cgibin/sciserv.pl?collection=journals&journal=00191035&issue=v77i0001&article=109_ae5sou&fo rm=pdf&file=file.pdf HTTP/1.1" 200 182 192.84.152.XXX - - [01/Sep/2005:10:12:45 +0200] "GET /cgibin/sciserv.pl?collection=journals&journal=00191035&issue=v81i0002&article=314_alof1&for m=pdf&file=file.pdf HTTP/1.1" 200 182 Seminario Residenziale CIBER 2006 – Villa Pace – Messina - 12.14 Giugno Black box unveiled… Quarto passo: popolamento del Data Base sugli accessi/turnaways (vengono utilizzati i file di supporto sulla lista dei titoli, la lista degli IP/username, la lista della data di pubblicazione, aggiornati mensilmente) Tipologia di accesso (locale/remoto) Tipologia di materiale (html/pdf) Turnaways si(1), no(0) Base dati “Statistiche2XXX” Data di pubblicazione Seminario Residenziale CIBER 2006 – Villa Pace – Messina - 12.14 Giugno Black box unveiled… Quinto passo: costruzione delle statistiche sugli accessi Accesso art. in formato PDF=18 Accesso art. in formato HTML=8 Accesso in remoto art. in formato PDF=1 Accesso in remoto art. in formato HTML=0 Turnaways su art. in formato PDF=2 Turnaways su art. in formato HTML=0 Turnaways in remoto su art. in formato PDF=0 Turnaways in remoto su art. in formato HTML=0 Seminario Residenziale CIBER 2006 – Villa Pace – Messina - 12.14 Giugno Black box unveiled… Sesto passo: generazione delle statistiche Counter Seminario Residenziale CIBER 2006 – Villa Pace – Messina - 12.14 Giugno Black box unveiled… Ultimo passo: pubblicazione sull’area riservata Seminario Residenziale CIBER 2006 – Villa Pace – Messina - 12.14 Giugno Caratteristiche riassuntive PRO… Pienamente compatibile con le direttive COUNTER (1/2) Generazione dei report off-line e non onerosa in termini di tempo/risorse macchina Disponibile su base mensile e per tutti gli enti che accedono all’Emeroteca Disponibile la statistica cumulativa dell’ente Ciber Report facilmente accessibili e convertibili in formato Excel grazie ad una procedura documentata sull’A.R. Seminario Residenziale CIBER 2006 – Villa Pace – Messina - 12.14 Giugno Caratteristiche riassuntive CONTRO… Non sono disponibili Report in formato XLS (Excel) nativo Non è attualmente disponibile un formato aperto (XML) di esportazione delle statistiche d’uso Molte delle informazioni disponibili all’interno del DB delle statistiche d’uso non vengono utilizzate Assenza di report ulteriori (Journal_Report_3, Number of Successfull Item Requests and Turnaways…, e Journal_Report_4, Total Searches Run…) => modifiche pesanti alle procedure di estrazione dell’informazione dai log files Apache Seminario Residenziale CIBER 2006 – Villa Pace – Messina - 12.14 Giugno Nuovi scenari di collaborazione Esiste un’attività di collaborazione tra il CAB dell’Università di Messina ed il settore dei servizi di automazione delle biblioteche del CASPUR, finalizzata alla messa a punto di un portale dinamico sulle statistiche d’uso dell’Emeroteca Estrazione periodica (mensile) dell’intera base dati (base dati “Statistiche2XXX) con le statistiche d’uso generali per tutto il CIBER Inoltro dei file aggiornati di supporto alla generazione delle statistiche (lista dei titoli, IP/username per Ateneo, lista delle date di pubblicazione in funzione del fascicolo) Seminario Residenziale CIBER 2006 – Villa Pace – Messina - 12.14 Giugno Proposta evolutiva Generazione di Report in formato Excel nativo Produzione di Journal_Report_1/2 in formato XML (propedeutico a SUSHI) Eventuale produzione di ulteriori Journal_Report (3/4) => necessario ripensamento dei filtri di estrazione dei dati dai log files di Apache …per il resto… c’è il nuovo portale! Seminario Residenziale CIBER 2006 – Villa Pace – Messina - 12.14 Giugno Conclusioni Genesi del nuovo portale sulle statistiche d’uso del CIBER: un interessante esempio di sinergia all’interno del CIBER Grande aspettativa su tool di supporto all’ERM Necessità di avviare un percorso di auditing per le statistiche d’uso del CIBER (direttiva COUNTER) Apertura ai nuovi standard (SUSHI) Tempo limite? Seminario Residenziale CIBER 2006 – Villa Pace – Messina - 12.14 Giugno Grazie per la vostra attenzione! [email protected]