Publishing Platform Presentazione: Cinzia Colacicco Support Account Manager Agenda Publishing – Cosa è Processo di Publishing Esportazione Dati Pubblicati Informazioni Tecniche per il Publishing Publishing Platform Publishing cosa è Le biblioteche hanno aumentato la loro presenza nel Web per esporre online i propri cataloghi. L’esigenza ha portato alla pubblicazione dei record nel Web. Questo però richiede una preparazione dei dati presenti nei cataloghi, sia dati descrittivi che amministrativi, sia i dati di posseduto I dati non sono essere pubblicati immediatamente ma devono essere preparati tenendo conto dei concetti di gestione di sistemi del Web Publishing Platform Publishing da ALEPH Un semplice meccanismo - publishing platform – permette ai siti di estrarre record dal catalogo ALEPH Publishing platform estrae i record appartenenti ad un set che è popolato dai record del catalogo in un repository separato Il repository è costantemente aggiornato Il recupero di record dal repository è permesso per sistemi esterni quali Primo Publishing Platform Dove è possibile trovare i record pubblicati? Publishing Platform Processo Publishing Estrazione dal repository: Include dati pubblicati per ogni set nel formato configurato Creazione record pubblicati (Z00P) per: Completa popolamento dei set (processo unico iniziale) Creazione/Aggironamento/Cancellazione record (processo continuo) Configurazione popolamento set: Base Logica Manipolazione Dati Layout dati Publishing Platform Workflow Il processo di estrazione ha due differenti flussi: Processo iniziale - estrazione iniziale Può essere fatto su tutto il database o su basi logiche creando diversi set. Questo viene fatto attraverso la procedura p-publish-04. Processo di continuazione - estrazione continua Interessa record nuovi/aggiornati e cancellati. Viene eseguita attraverso la ue_21. Publishing Platform Workflow Entrambi i processi di pubblicazione (iniziale e continua) pongono il documento nel data repository, una directory definita localmente. I record estratti possono essere modificati per includere informazioni aggiunte dalle procedure standard di ALEPH come FIX ed EXPAND. Publishing Platform Processo Estrazione Iniziale Il processo di estrazione iniziale è attivato attraverso la procedura Processo di Pubblicazione Iniziale (publish-04). Questo servizio si trova nel sottomenu Publishing del menu Servizi nel modulo Catalogazione. Publishing Platform Processo Estrazione Iniziale L’estrazione (iniziale o continua) è eseguita in accordo con la tabella tab_publish nella directory tab della library che contiene i record che si vogliono estrarre (ad es.: UNI01,USM01). Publishing Platform tab_publish Queste due linee sono presenti in $alephe_tab/tab_base.lng: ! 1 2 3 4 5 6 7 8 9 !!!!!!!!!!!!!!!!!!!!-!-!!!!!!!!!!!!!!!!!!!!-!!!!!-!!!!!-!!!!!-!!!!!-!-!!!!!!!!!> EDUCATION Education USM01 USM01 Y wti=education HISTORY History USM01 USM01 Y wti=history queste linee appaiono in $data_tab/tab_publish: ! 1 2 3 4 5 !!!!!!!!!!!!!!!!!!!!-!!!!!!!!!!!!!!!!!!!!-!-!!!!!-!!!!!!!!!!!!!!!!!!!!!!!!!!!!!! PERFORMANCE USM01 N AVAIL MARC_XML EDUCATION EDUCATION N AVAIL MARC_XML HISTORY HISTORY N AVAIL MARC_XML Nome del set Nome della base o library bibliografica Codice Fix ed Expand dei record pubblicati Publishing Platform 6 Processo Iniziale Pubblicazione (publish-04) La lista dei set di pubblicazione deriva dalla colonna 1 della tab_publish Nota: Una volta che il record viene pubblicato non verrà pubblicato nuovamente. Per “unpublish” un record si deve attivare il servizio “Cancella Record Pubblicati di ALEPH (publish-05)” Publishing Platform Processo Iniziale Pubblicazione (publish-04) • Il Servizio “publish-04” è utilizzato per eseguire l’estrazione iniziale dei record del catalogo ALEPH a scopo pubblicazione. I record estratti sono conservati nella tabella Oracle Z00P. • Il servizio non deve essere rilanciato a meno di cambiamenti in $alephe_tab/tab_base.eng • Per stampare realmente i record dovrà essere attivato il servizio “Creazione di un file TAR per record ALEPH pubblicati (publish-06)” Publishing Platform Processo Publishing in continuazione Record processati che hanno avuto modifiche nel database della libray Le modifiche possono essere originate da aggiornamento del record bibliografico, di holding o dei record di authority così come le copie o i dati della circolazione Il record Z07P indica i cambiamenti nel record pubblicato Sulla base del record Z07, che indica gli aggiornamenti del record BIB e i cambiamenti nello status della Circolazione (necessari per le informazioni sulla disponibilità), il processo deamon ue_21 è responsabile della raccolta delle modifiche e aggiornamenti nel repository Publishing Platform Esportazione dei dati Pubblicati I record nel repository pronti per l’esportazione e i set popolati possono essere trasferiti ad altre applicazioni L’Export può essere fatto in diversi modi: file tar protocollo OAI indicizzazione in Google Publishing Platform File Tar Contiene dati di set popolati del repository; si basa su date, numero record o file di input Creato attraverso il servizio Crea file Tar per record ALEPH Pubblicati (publish-06) Può essere catturato da diverse applicazioni quali Primo Publishing Platform Creare file TAR (publish-06) Publishing Platform Creare file TAR per record ALEPH Pubblicati (publish-06) Flag Aggiorna data configurato con No Nota: Flag Aggiorna Data – normalmente dovrebbe essere Si – per essere in grado di inviare solo gli ultimi record aggiornati. Publishing Platform Creare un file TAR per record ALEPH Pubblicati (publish-06) Il file di output viene inviato a /tmp/publish per esempio il-aleph02-18(1) USM01-YOELK>>cd /tmp/publish/ il-aleph02-18(1) USM01-YOELK>>ls -lrt total 8 drwxrwxr-x 3 aleph exlibris 4096 Nov 13 08:39 usm01_all/ drwxrwxr-x 2 aleph exlibris 4096 Nov 13 09:24 usm01_education/ La directory viene definita dal campo Percorso della procedura Publishing Platform Creare un file TAR (publish-06) Se in publish-06 flag il Aggiorna data è Si, allora i record non verrano più stampati fino a quando non verranno aggiornati. Quindi, un record viene stampato solo una volta attraverso la publish-06 quando il flag Aggiorna dato è su Si. Quando il flag Aggiorna Data è Si ogni record risulta “flagged” che indica che è già stato stampato e non deve essere stampato di nuovo. Per “cancellare” tutti i flag deve essere attivato il servizio publish-05. Nota: flag Aggirona Data – Il flag è conneso alla data. Se una timestemp di uno z00p è successiva a questa data allora il record è pubblicato Publishing Platform Creare un file TAR per record ALEPH Pubblicati (publish-06) Quando attiviamo nuovamente la publish-06 con il campo “crea file tar per” “Dalla data dell'ultima attività” verranno stampati solo i record nuovi o aggiornati. Publishing Platform Protocollo OAI OAI (Open Archive Initiative) Data Provider implementa il protocollo OAI, Version 2.0 Record Z00P in formato OAI_DC_XML e OAI_MARC21_XML usati per esportare le informazioni con il protocollo OAI ALEPH OAI Data Provider parte di ALEPH www_server – lavora in modalità richiesta/risposta Publishing Platform Pubblicazione con OAI Catalogo Publishing platform server OAI client OAI Browser Publishing Platform Indicizzazione Google Il processo di pubblicazione permette l’estrazione di dati dal repository in formato HTML Usando uno script fornito da Ex Libris, i dati vengono trasferiti e ristrutturati in formato adatto all’indicizzazione in Google I dati possono ora essere indicizzati attraverso il crawler ed esposto per ricerche Google Publishing Platform Pubblicazione in Google Ricerca in Google Google crawling/indexing File per indicizzazione in Google Data Repository di Google firewall Il risultato della ricerca contiene in link back ad ALEPH Publishing / Estrazione Dati Publishing Platform Agenda Publishing – Che cosa, Perché, Dove? Processo di Publishing Esportazione Dati Published Informazioni Tecniche per il Publishing Publishing Platform Definizione Processo Tutti i formati del repository richiedono la configurazione della tab_publish: Si trova nella tab directory della library pubblicata Definisce i set popolati Per ogni set, definisce la sua base logica (o l’intero catalogo), formato di output, manipolazione dati e routine di arricchimento Publishing Platform Definizione Processo Per Google, ci sono due ulteriori tabelle: tab_doc_publish Si trova nella tab directory della library pubblicata Definisce quali campi estrarre e quali campi caricare tab_font_publish Si trova nella tab directory della library pubblicata Definisce gli stili dei font del record Z00P HTML Publishing Platform Informazioni Tecniche della Pubblicazione Il calcolo dello spazio disco richiesto si basa su: Numero set di pubblicazione Numero record Z00P Espansione informazioni nei record estratti Publishing Platform Sommario della Piattaforma di Pubblicazione PRIMO cleint OAI Google server OAI file TAR USR Library (Set di entità) Catalogo Publishing Platform Browser In conclusione… Publishing in formato MARC XML Interoperabilità con Primo Personalizzazione output usando routine di expand Include informazioni disponibilità Publishing per Google Le pagine HTML devono essere indicizzate da Google Back link ad ALEPH Publishing Platform Grazie