Publishing Platform
Presentazione:
Cinzia Colacicco
Support Account Manager
Agenda
Publishing – Cosa è
Processo di Publishing
Esportazione Dati Pubblicati
Informazioni Tecniche per il Publishing
Publishing Platform
Publishing cosa è
Le biblioteche hanno aumentato la loro presenza nel Web per esporre
online i propri cataloghi.
L’esigenza ha portato alla pubblicazione dei record nel Web.
Questo però richiede una preparazione dei dati presenti nei cataloghi,
sia dati descrittivi che amministrativi, sia i dati di posseduto
I dati non sono essere pubblicati immediatamente ma devono essere
preparati tenendo conto dei concetti di gestione di sistemi del Web
Publishing Platform
Publishing da ALEPH
Un semplice meccanismo - publishing platform
– permette ai siti di estrarre record dal catalogo
ALEPH
Publishing platform estrae i record appartenenti
ad un set che è popolato dai record del
catalogo in un repository separato
Il repository è costantemente aggiornato
Il recupero di record dal repository è permesso
per sistemi esterni quali Primo
Publishing Platform
Dove è possibile trovare i record pubblicati?
Publishing Platform
Processo Publishing
Estrazione dal repository:
Include dati pubblicati per ogni set nel formato
configurato
Creazione record pubblicati (Z00P) per:
Completa popolamento dei set (processo unico
iniziale)
Creazione/Aggironamento/Cancellazione record
(processo continuo)
Configurazione popolamento set:
Base Logica
Manipolazione Dati
Layout dati
Publishing Platform
Workflow
Il processo di estrazione ha due differenti flussi:
 Processo iniziale - estrazione iniziale
Può essere fatto su tutto il database o su basi logiche
creando diversi set. Questo viene fatto attraverso la
procedura p-publish-04.
 Processo di continuazione - estrazione continua
Interessa record nuovi/aggiornati e cancellati. Viene
eseguita attraverso la ue_21.
Publishing Platform
Workflow
Entrambi i processi di pubblicazione (iniziale e
continua) pongono il documento nel data
repository, una directory definita localmente.
I record estratti possono essere modificati per
includere informazioni aggiunte dalle procedure
standard di ALEPH come FIX ed EXPAND.
Publishing Platform
Processo Estrazione Iniziale
Il processo di estrazione iniziale è attivato attraverso la
procedura Processo di Pubblicazione Iniziale (publish-04).
Questo servizio si trova nel sottomenu Publishing del menu
Servizi nel modulo Catalogazione.
Publishing Platform
Processo Estrazione Iniziale
L’estrazione (iniziale o continua) è eseguita in
accordo con la tabella tab_publish nella directory
tab della library che contiene i record che si
vogliono estrarre (ad es.: UNI01,USM01).
Publishing Platform
tab_publish
Queste due linee sono presenti in
$alephe_tab/tab_base.lng:
!
1
2
3
4
5
6
7
8
9
!!!!!!!!!!!!!!!!!!!!-!-!!!!!!!!!!!!!!!!!!!!-!!!!!-!!!!!-!!!!!-!!!!!-!-!!!!!!!!!>
EDUCATION
Education
USM01
USM01 Y wti=education
HISTORY
History
USM01
USM01 Y wti=history
queste linee appaiono in $data_tab/tab_publish:
!
1
2
3
4
5
!!!!!!!!!!!!!!!!!!!!-!!!!!!!!!!!!!!!!!!!!-!-!!!!!-!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
PERFORMANCE
USM01
N AVAIL MARC_XML
EDUCATION
EDUCATION
N AVAIL MARC_XML
HISTORY
HISTORY
N AVAIL MARC_XML
Nome del
set
Nome della base
o library
bibliografica
Codice Fix ed
Expand dei record
pubblicati
Publishing Platform
6
Processo Iniziale Pubblicazione (publish-04)
La lista dei set di
pubblicazione
deriva dalla
colonna 1 della
tab_publish
Nota: Una volta che il record viene pubblicato non verrà pubblicato
nuovamente. Per “unpublish” un record si deve attivare il servizio
“Cancella Record Pubblicati di ALEPH (publish-05)”
Publishing Platform
Processo Iniziale Pubblicazione (publish-04)
• Il Servizio “publish-04” è utilizzato per eseguire l’estrazione
iniziale dei record del catalogo ALEPH a scopo pubblicazione.
I record estratti sono conservati nella tabella Oracle Z00P.
• Il servizio non deve essere rilanciato a meno di
cambiamenti in $alephe_tab/tab_base.eng
• Per stampare realmente i record dovrà essere attivato il
servizio “Creazione di un file TAR per record ALEPH pubblicati
(publish-06)”
Publishing Platform
Processo Publishing in continuazione
Record processati che hanno avuto modifiche nel
database della libray
Le modifiche possono essere originate da aggiornamento
del record bibliografico, di holding o dei record di
authority così come le copie o i dati della circolazione
Il record Z07P indica i cambiamenti nel record pubblicato
Sulla base del record Z07, che indica gli aggiornamenti
del record BIB e i cambiamenti nello status della
Circolazione (necessari per le informazioni sulla
disponibilità), il processo deamon ue_21 è responsabile
della raccolta delle modifiche e aggiornamenti nel
repository
Publishing Platform
Esportazione dei dati Pubblicati
I record nel repository pronti per l’esportazione e
i set popolati possono essere trasferiti ad altre
applicazioni
L’Export può essere fatto in diversi modi:
file tar
protocollo OAI
indicizzazione in Google
Publishing Platform
File Tar
Contiene dati di set popolati del repository; si
basa su date, numero record o file di input
Creato attraverso il servizio Crea file Tar per
record ALEPH Pubblicati (publish-06)
Può essere catturato da diverse applicazioni
quali Primo
Publishing Platform
Creare file TAR (publish-06)
Publishing Platform
Creare file TAR per record ALEPH Pubblicati (publish-06)
Flag
Aggiorna
data
configurato
con No
Nota: Flag Aggiorna Data – normalmente dovrebbe essere Si – per essere in grado di
inviare solo gli ultimi record aggiornati.
Publishing Platform
Creare un file TAR per record ALEPH Pubblicati
(publish-06)
Il file di output viene inviato a /tmp/publish per
esempio
il-aleph02-18(1) USM01-YOELK>>cd /tmp/publish/
il-aleph02-18(1) USM01-YOELK>>ls -lrt
total 8
drwxrwxr-x
3 aleph
exlibris
4096 Nov 13 08:39 usm01_all/
drwxrwxr-x
2 aleph
exlibris
4096 Nov 13 09:24 usm01_education/
La directory viene definita dal campo Percorso della procedura
Publishing Platform
Creare un file TAR (publish-06)
Se in publish-06 flag il Aggiorna data è Si, allora i record
non verrano più stampati fino a quando non verranno
aggiornati.
Quindi, un record viene stampato solo una volta attraverso
la publish-06 quando il flag Aggiorna dato è su Si.
Quando il flag Aggiorna Data è Si ogni record risulta
“flagged” che indica che è già stato stampato e non deve
essere stampato di nuovo.
Per “cancellare” tutti i flag deve essere attivato il servizio
publish-05.
Nota: flag Aggirona Data – Il flag è conneso alla data. Se una timestemp di uno z00p
è successiva a questa data allora il record è pubblicato
Publishing Platform
Creare un file TAR per record ALEPH Pubblicati
(publish-06)
Quando attiviamo nuovamente la publish-06 con il campo
“crea file tar per” “Dalla data dell'ultima attività” verranno
stampati solo i record nuovi o aggiornati.
Publishing Platform
Protocollo OAI
OAI (Open Archive Initiative) Data Provider
implementa il protocollo OAI, Version 2.0
Record Z00P in formato OAI_DC_XML e
OAI_MARC21_XML usati per esportare le
informazioni con il protocollo OAI
ALEPH OAI Data Provider parte di ALEPH
www_server – lavora in modalità
richiesta/risposta
Publishing Platform
Pubblicazione con OAI
Catalogo
Publishing platform
server OAI
client
OAI
Browser
Publishing Platform
Indicizzazione Google
Il processo di pubblicazione permette
l’estrazione di dati dal repository in formato
HTML
Usando uno script fornito da Ex Libris, i dati
vengono trasferiti e ristrutturati in formato
adatto all’indicizzazione in Google
I dati possono ora essere indicizzati attraverso il
crawler ed esposto per ricerche Google
Publishing Platform
Pubblicazione in Google
Ricerca in Google
Google crawling/indexing
File per indicizzazione in
Google
Data Repository di Google
firewall
Il risultato della
ricerca contiene in
link back ad
ALEPH
Publishing /
Estrazione Dati
Publishing Platform
Agenda
Publishing – Che cosa, Perché, Dove?
Processo di Publishing
Esportazione Dati Published
Informazioni Tecniche per il Publishing
Publishing Platform
Definizione Processo
Tutti i formati del repository richiedono la
configurazione della tab_publish:
Si trova nella tab directory della library
pubblicata
Definisce i set popolati
Per ogni set, definisce la sua base logica (o
l’intero catalogo), formato di output,
manipolazione dati e routine di arricchimento
Publishing Platform
Definizione Processo
Per Google, ci sono due ulteriori tabelle:
tab_doc_publish
Si trova nella tab directory della library pubblicata
Definisce quali campi estrarre e quali campi caricare
tab_font_publish
Si trova nella tab directory della library pubblicata
Definisce gli stili dei font del record Z00P HTML
Publishing Platform
Informazioni Tecniche della Pubblicazione
Il calcolo dello spazio disco richiesto si basa su:
Numero set di pubblicazione
Numero record Z00P
Espansione informazioni nei record estratti
Publishing Platform
Sommario della Piattaforma di Pubblicazione
PRIMO
cleint
OAI
Google
server OAI
file TAR
USR Library
(Set di entità)
Catalogo
Publishing Platform
Browser
In conclusione…
Publishing in formato MARC XML
Interoperabilità con Primo
Personalizzazione output usando routine di expand
Include informazioni disponibilità
Publishing per Google
Le pagine HTML devono essere indicizzate da Google
Back link ad ALEPH
Publishing Platform
Grazie
Scarica

Publishing Platform