La Guida Generale degli Archivi di Stato
italiani informatizzata
SGML
XML
Formazione Labirinti:
Sabrina Auricchio
Ilaria Barbanti
Silvia Mazzini
Chiara Veninata
La Sperimentazione Labirinti
Il lavoro sulla GG rientra fra le attività, svolte dal gruppo di
formazione nella fase di laboratorio, riguardanti lo studio di
applicazioni collegate agli argomenti affrontati durante la fase
di “aula”
In questo senso ci è sembrato naturale affrontare come caso di
studio il maggiore progetto archivistico italiano di
infomatizzazione, realizzato attraverso l’uso dei linguaggi di
marcatura: la Guida generale agli archivi di Stato italiani
La sperimentazione sulla Guida Generale ha coperto un
periodo complessivo di circa 1 mese ed ha avuto inizio il 19
novembre 2001
Motivazioni dell’intervento
Dal termine del progetto “Guida” ad oggi sono
trascorsi quasi due anni e gli strumenti per la codifica
strutturale dei testi che sono stati sviluppati in questo
periodo, spingono verso una rilettura del progetto
di informatizzazione
...
... “La codifica SGML dei volumi della Guida
generale si presta in maniera del tutto
naturale ad una "rilettura" XML.”
Da “Sviluppi futuri” in Progetto informatico della GG
Scopo dell’intervento
In particolare, l’introduzione di un nuovo linguaggio
di marcatura (XML), anch’esso definito come
standard e nato come diretta emanazione di SGML,
ha aperto ulteriori possibilità per il trattamento delle
informazioni strutturate
Perché XML
Potenzialità di XML:
!
!
!
!
Il linguaggio XML, pur mantenendo tutti i vantaggi
di SGML, è molto più semplice del suo predecessore
Sarà presto possibile associare ad XML un motore di
ricerca nativo
Attraverso i fogli di stile è possibile realizzare
visualizzazioni personalizzate della GG
È visulizzabile direttamente con il browser Explorer
6.0
Il nostro intervento
In questa prospettiva il nuovo intervento sul Progetto
Guida non necessita di una elaborazione ex-novo della
struttura informativa e dei dati ad essa associati, ma si
configura piuttosto come un aggiornamento della
procedura che sfrutti al meglio tutte le potenzialità del
nuovo standard
Articolazione dell’intervento
1. Analisi della DTD SGML di partenza
2. Creazione della DTD XML
3. Stesura del foglio di trasformazione
4. Creazione di diversi fogli di presentazione
5. Mapping con EAD
1) Analisi della DTD di partenza
In un primo momento la nostra attenzione si era concentrata nel
tentativo di semplificare la DTD, cercando di avvicinarci il più
possibile ad un modello EAD-compatibile, che fosse cioè
impostato su livelli di descrizione omogenei il cui rapporto
gerarchico era definito volta per volta
La proliferazione, nella DTD di partenza, di livelli descrittivi non
sempre logicamente riconducibili ad una struttura archivistica,
poteva essere attenuata con XML attraverso l’uso di attributi cui
affidare la definizione dei livelli
<fondo livello=“Supersuperfondo”>
Supersuperfondo
II Livello
<fondo livello=“Superfondo”>
I Livello
Superfondo
1)... analisi della DTD di partenza
Tuttavia, l’esigenza di mantenere il modello dati il più
possibile coerente con quello di partenza, si è tradotta nella
necessità di mantenere in vita la maggior parte degli
elementi presenti nella prima DTD
I livelli archivistici logicamente individuabili sono
effettivamente tutti quelli individuati nel prototipo Guida?
2) Creazione della DTD XML
preliminari
I passi preliminari di questa attività hanno riguardato un'analisi
particolareggiata dei files SGML di partenza
Nell'originario lavoro di informatizzazione della
GG, le varianti riscontrate nel corso della marcatura
rispetto alla DTD SGML erano state gestite come
eccezioni rispetto a questo modello, dal momento
che questo lavoro era funzionale al riversamento dei
dati nel DB Highway
Questa situazione di partenza ha reso necessaria una
operazione intermedia nella procedura di lavoro che
ha riguardato la creazione di una DTD per validare i
files SGML, più elastica riguardo alla posizione degli
elementi e alla loro obbligatorietà
2) Creazione della DTD XML
analisi delle varianti
In generale, hanno subito una trasformazione quegli elementi che,
differenziati da elementi più generici per agevolare il lavoro di
marcatura automatica attraverso l'uso del parser, non veicolavano,
tuttavia, rispetto a questi, informazioni di natura diversa
Sono stati trasformati i seguenti
elementi:
fondo.acc
<fondo>
fondo.acc-tes
titolo
titolo.pa
<denominazione>
nome
nome.pa
nota.storica.ca
<nota.storica>
nota.archivistica.ca
<nota.archivistica>
2) Creazione della DTD XML
analisi delle varianti
Alcuni elementi nella nuova DTD sono stati eliminati
totalmente, dal momento che era possibile recuperarli attraverso
il foglio di presentazione
Copertina
– Indice
– Sommario
–
Questi elementi nel primo modello dati facevano diretto
riferimento alla formattazione e alla presentazione del
testo che invece oggi XML consente di gestire in modo
separato
3) Stesura del foglio di
trasformazione
Questa fase ha riguardato la costruzione di una
procedura che permettesse una conversione
automatica dei files SGML di partenza in files
XML validati secondo la nuova DTD
3) Stesura del foglio di
trasformazione
<ISTITUTO>
<FRONTESPIZIO> I </FRONTESPIZIO>
<COPERTINA>
<DENOMINAZIONE>ARCHIVIO DI STATO
DI AREZZO </DENOMINAZIONE>
<INFO>Via degli Albergotti, 1 (cod. post.
52100); tel.0575/20803.
Consistenza totale: filze, bb., pacchi, regg., voll. e
mappe 33.615; pergg. 390 e frammenti 600.
Biblioteca: voll. 1.984; opuscoli 335.
Servizio di fotoriproduzione.
Laboratorio di cartotecnica
<Npag>359</Npag></INFO>
<CURATORI>La voce e' stata curata da Luigi
Borgia, coadiuvato da Loredana Paffetti. Successive
integrazioni a cura di Maria Vittoria Palli D'Addario
<Npag>360</Npag></CURATORI>
</COPERTINA>
<SOMMARIO>
<TITOLO>SOMMARIO
</TITOLO>
<CORPO>Introduzione 365
XSLT
<Istituto>
<Frontespizio> I </Frontespizio>
<Denominazione>
<Testo>ARCHIVIO DI STATO DI AREZZO
</Testo>
</Denominazione>
<Info>
<Testo>Via degli Albergotti, 1 (cod. post.
52100); tel.0575/20803.
Consistenza totale: filze, bb., pacchi, regg., voll. e
mappe 33.615; pergg. 390 e frammenti 600.
Biblioteca: voll. 1.984; opuscoli 335.
Servizio di fotoriproduzione.
Laboratorio di cartotecnica </Testo>
<Npag>359</Npag>
</Info>
<Curatori>
<Testo>La voce e' stata curata da Luigi Borgia,
coadiuvato da Loredana Paffetti. Successive
integrazioni a cura di Maria Vittoria Palli D'Addario
</Testo>
<Npag>360</Npag>
</Curatori>
4) Creazione dei fogli di
presentazione
In questa fase della sperimentazione sono state percorse due strade
parallele: da una parte si è cercato di riprodurre l'aspetto cartaceo
della GG in formato HTML, dall’altra di proporre una versione
WEB della GG del tutto nuova
Quest’ultimo intervento, nel caso in cui si preferisse percorrere la
strada di una pubblicazione on-line ex-novo in grado di sfruttare al
meglio tutte le potenzialità dell’ipertestualità, potebbe apportare
numerosi vantaggi come ad esempio un’agevolazione della lettura e
della comprensione del testo
4) Creazione dei fogli di
presentazione - tradizionale
4) Creazione dei fogli di
presentazione - ipertestuale
5) Mapping con EAD
L’ultimo passo di questo lavoro ha visto la realizzazione di un
Mapping tra la DTD della Guida Generale con la DTD EAD
con lo scopo di:
riuscire a far comunicare i dati di GG con altri
strumenti di ricerca o guide realizzate secondo lo
standard EAD
avvicinare il modello dati creato per GG all'unico
standard internazionale per la descrizione archivistica
basato su SGML
Sviluppi futuri
Come ulteriore sviluppo si potrebbe pensare anche alla
realizzazione di un “modello” da utilizzare per redigere gli
aggiornamenti della Guida basandosi direttamente sui tag
XML individuati dalla DTD
Questo permetterebbe di ottenere, dagli aggiornamenti
provenienti dagli AS, files XML validati e coerenti con il
modello dati della Guida Generale
Scarica

progetto recupero retrospettivo guida generale degli archivi di stato