La Guida Generale degli Archivi di Stato italiani informatizzata SGML XML Formazione Labirinti: Sabrina Auricchio Ilaria Barbanti Silvia Mazzini Chiara Veninata La Sperimentazione Labirinti Il lavoro sulla GG rientra fra le attività, svolte dal gruppo di formazione nella fase di laboratorio, riguardanti lo studio di applicazioni collegate agli argomenti affrontati durante la fase di “aula” In questo senso ci è sembrato naturale affrontare come caso di studio il maggiore progetto archivistico italiano di infomatizzazione, realizzato attraverso l’uso dei linguaggi di marcatura: la Guida generale agli archivi di Stato italiani La sperimentazione sulla Guida Generale ha coperto un periodo complessivo di circa 1 mese ed ha avuto inizio il 19 novembre 2001 Motivazioni dell’intervento Dal termine del progetto “Guida” ad oggi sono trascorsi quasi due anni e gli strumenti per la codifica strutturale dei testi che sono stati sviluppati in questo periodo, spingono verso una rilettura del progetto di informatizzazione ... ... “La codifica SGML dei volumi della Guida generale si presta in maniera del tutto naturale ad una "rilettura" XML.” Da “Sviluppi futuri” in Progetto informatico della GG Scopo dell’intervento In particolare, l’introduzione di un nuovo linguaggio di marcatura (XML), anch’esso definito come standard e nato come diretta emanazione di SGML, ha aperto ulteriori possibilità per il trattamento delle informazioni strutturate Perché XML Potenzialità di XML: ! ! ! ! Il linguaggio XML, pur mantenendo tutti i vantaggi di SGML, è molto più semplice del suo predecessore Sarà presto possibile associare ad XML un motore di ricerca nativo Attraverso i fogli di stile è possibile realizzare visualizzazioni personalizzate della GG È visulizzabile direttamente con il browser Explorer 6.0 Il nostro intervento In questa prospettiva il nuovo intervento sul Progetto Guida non necessita di una elaborazione ex-novo della struttura informativa e dei dati ad essa associati, ma si configura piuttosto come un aggiornamento della procedura che sfrutti al meglio tutte le potenzialità del nuovo standard Articolazione dell’intervento 1. Analisi della DTD SGML di partenza 2. Creazione della DTD XML 3. Stesura del foglio di trasformazione 4. Creazione di diversi fogli di presentazione 5. Mapping con EAD 1) Analisi della DTD di partenza In un primo momento la nostra attenzione si era concentrata nel tentativo di semplificare la DTD, cercando di avvicinarci il più possibile ad un modello EAD-compatibile, che fosse cioè impostato su livelli di descrizione omogenei il cui rapporto gerarchico era definito volta per volta La proliferazione, nella DTD di partenza, di livelli descrittivi non sempre logicamente riconducibili ad una struttura archivistica, poteva essere attenuata con XML attraverso l’uso di attributi cui affidare la definizione dei livelli <fondo livello=“Supersuperfondo”> Supersuperfondo II Livello <fondo livello=“Superfondo”> I Livello Superfondo 1)... analisi della DTD di partenza Tuttavia, l’esigenza di mantenere il modello dati il più possibile coerente con quello di partenza, si è tradotta nella necessità di mantenere in vita la maggior parte degli elementi presenti nella prima DTD I livelli archivistici logicamente individuabili sono effettivamente tutti quelli individuati nel prototipo Guida? 2) Creazione della DTD XML preliminari I passi preliminari di questa attività hanno riguardato un'analisi particolareggiata dei files SGML di partenza Nell'originario lavoro di informatizzazione della GG, le varianti riscontrate nel corso della marcatura rispetto alla DTD SGML erano state gestite come eccezioni rispetto a questo modello, dal momento che questo lavoro era funzionale al riversamento dei dati nel DB Highway Questa situazione di partenza ha reso necessaria una operazione intermedia nella procedura di lavoro che ha riguardato la creazione di una DTD per validare i files SGML, più elastica riguardo alla posizione degli elementi e alla loro obbligatorietà 2) Creazione della DTD XML analisi delle varianti In generale, hanno subito una trasformazione quegli elementi che, differenziati da elementi più generici per agevolare il lavoro di marcatura automatica attraverso l'uso del parser, non veicolavano, tuttavia, rispetto a questi, informazioni di natura diversa Sono stati trasformati i seguenti elementi: fondo.acc <fondo> fondo.acc-tes titolo titolo.pa <denominazione> nome nome.pa nota.storica.ca <nota.storica> nota.archivistica.ca <nota.archivistica> 2) Creazione della DTD XML analisi delle varianti Alcuni elementi nella nuova DTD sono stati eliminati totalmente, dal momento che era possibile recuperarli attraverso il foglio di presentazione Copertina – Indice – Sommario – Questi elementi nel primo modello dati facevano diretto riferimento alla formattazione e alla presentazione del testo che invece oggi XML consente di gestire in modo separato 3) Stesura del foglio di trasformazione Questa fase ha riguardato la costruzione di una procedura che permettesse una conversione automatica dei files SGML di partenza in files XML validati secondo la nuova DTD 3) Stesura del foglio di trasformazione <ISTITUTO> <FRONTESPIZIO> I </FRONTESPIZIO> <COPERTINA> <DENOMINAZIONE>ARCHIVIO DI STATO DI AREZZO </DENOMINAZIONE> <INFO>Via degli Albergotti, 1 (cod. post. 52100); tel.0575/20803. Consistenza totale: filze, bb., pacchi, regg., voll. e mappe 33.615; pergg. 390 e frammenti 600. Biblioteca: voll. 1.984; opuscoli 335. Servizio di fotoriproduzione. Laboratorio di cartotecnica <Npag>359</Npag></INFO> <CURATORI>La voce e' stata curata da Luigi Borgia, coadiuvato da Loredana Paffetti. Successive integrazioni a cura di Maria Vittoria Palli D'Addario <Npag>360</Npag></CURATORI> </COPERTINA> <SOMMARIO> <TITOLO>SOMMARIO </TITOLO> <CORPO>Introduzione 365 XSLT <Istituto> <Frontespizio> I </Frontespizio> <Denominazione> <Testo>ARCHIVIO DI STATO DI AREZZO </Testo> </Denominazione> <Info> <Testo>Via degli Albergotti, 1 (cod. post. 52100); tel.0575/20803. Consistenza totale: filze, bb., pacchi, regg., voll. e mappe 33.615; pergg. 390 e frammenti 600. Biblioteca: voll. 1.984; opuscoli 335. Servizio di fotoriproduzione. Laboratorio di cartotecnica </Testo> <Npag>359</Npag> </Info> <Curatori> <Testo>La voce e' stata curata da Luigi Borgia, coadiuvato da Loredana Paffetti. Successive integrazioni a cura di Maria Vittoria Palli D'Addario </Testo> <Npag>360</Npag> </Curatori> 4) Creazione dei fogli di presentazione In questa fase della sperimentazione sono state percorse due strade parallele: da una parte si è cercato di riprodurre l'aspetto cartaceo della GG in formato HTML, dall’altra di proporre una versione WEB della GG del tutto nuova Quest’ultimo intervento, nel caso in cui si preferisse percorrere la strada di una pubblicazione on-line ex-novo in grado di sfruttare al meglio tutte le potenzialità dell’ipertestualità, potebbe apportare numerosi vantaggi come ad esempio un’agevolazione della lettura e della comprensione del testo 4) Creazione dei fogli di presentazione - tradizionale 4) Creazione dei fogli di presentazione - ipertestuale 5) Mapping con EAD L’ultimo passo di questo lavoro ha visto la realizzazione di un Mapping tra la DTD della Guida Generale con la DTD EAD con lo scopo di: riuscire a far comunicare i dati di GG con altri strumenti di ricerca o guide realizzate secondo lo standard EAD avvicinare il modello dati creato per GG all'unico standard internazionale per la descrizione archivistica basato su SGML Sviluppi futuri Come ulteriore sviluppo si potrebbe pensare anche alla realizzazione di un “modello” da utilizzare per redigere gli aggiornamenti della Guida basandosi direttamente sui tag XML individuati dalla DTD Questo permetterebbe di ottenere, dagli aggiornamenti provenienti dagli AS, files XML validati e coerenti con il modello dati della Guida Generale