Documenti digitali: dematerializzazione, archiviazione e conservazione Guido Marinelli Bologna 20 Aprile 2006 1 Condivisione • Nell’antichità era la voce degli aedi o dei rapsodi a narrare e a tramandare le gesta degli dei dell’Olimpo e degli eroi greci; successivamente, nella società moderna, la condivisione dei saperi e dei gusti con gli altri individui è stata affidata alla carta e a supporti persistenti; oggi la Società Digitale sembra non aver più bisogno più di supporti e intermediari: il bit appare intrinsecamente “condivisibile”. 2 Il concetto di documento • I documenti e i supporti evolvono congiuntamente: – documento “orale”: supporto “volatile” – documento scritto: supporto “persistente” (diversi supporti, diverse tecniche di manipolazione, diversa durata, diverse tecniche di conservazione) – documento digitalizzato: frutto della conversione su supporto digitale di un’opera “analogica” (documento scritto, immagine, film, suono…) – documento digitale: opera su supporto digitale realizzata originariamente con tecniche digitali 3 L’archivio digitale (1) • Archivi digitali “omogenei”: – Archivio digitale “omogeneo” è l’archivio che contiene dati (e/o documenti) “omogenei” non solo nei contenuti e nei formati ma anche nelle loro caratteristiche di conservazione. Es: • archivio di planimetrie catastali tutte acquisite e digitalizzate nello stesso formato (bitmap …) • archivio di atti notarili formati digitalmente e memorizzati tutti nello stesso formato (.doc, .pdf …) • archivio di risultati di analisi cliniche strutturato in una base dati relazionale tramite un RDBMS secondo un progetto logico e fisico dei dati 4 L’archivio digitale (2) • Archivi digitali “misti” – Archivio digitale “disomogeneo” per contenuti o formati oppure “disomogeneo” per necessità o caratteristiche di conservazione. Es: • archivio contenente sia planimetrie catastali digitalizzate (bitmap) che atti catastali cartacei digitalizzati (.pdf …): archivio disomogeneo per formati (relazione tra atto e planimetria) • archivio notarile contenente sia la digitalizzazione di contratti firmati (autografi) tra le parti sia altri documenti non autografi: archivio disomogeneo per necessità di conservazione (conservazione del cartaceo del documento autografo, conservazione solo digitale di altri documenti) • Archivio contenente sia documenti firmati digitalmente sia documenti autografi digitalizzati sia documenti non autografi: archivio disomogeneo per necessità e per 5 caratteristiche di conservazione (firma digitale) Archivi digitali (misti): dati (multimediali) complessi che presentano problemi di: Memorizzazione - durata Supporti, - durata tecnologie -… Formati standard - di memorizzazione - di lettura Ricerca - Interrogazione - correlazione Interazione sistema/utente, interazione sistema/sistema Uso (in sicurezza) - fruizione - manipolazione - creazione - privacy Memorizzazione (1) • Persistenza dei supporti di memorizzazione • Persistenza del documento digitale a fronte di evoluzione tecnologica delle piattaforme hardware e software che permettono di trattare l’informazione, cioè di attività che trasferiscano i dati da una piattaforma di elaborazione ad un’altra assicurando che gli utenti possano utilizzare gli oggetti digitali migrati anche nei nuovi ambienti tecnologici (migrazione, emulazione, incapsulamento) 7 Memorizzazione (2) • Persistenza dei supporti di memorizzazione: – Il degrado nel tempo permette di mantenere inalterato il documento digitale originale? • Persistenza del documento digitale a fronte di evoluzione tecnologica delle piattaforme hardware e software: – le diverse tecniche (migrazione, emulazione, incapsulamento o compatibilità retroattiva) permettono di mantenere inalterate le caratteristiche del documento digitale originale? 8 Formati standard • I formati digitali conosciuti possono essere considerati rappresentazione fedele della realtà? (risoluzione dell’immagine, campionamento del suono, bit rate, algoritmi di codifica …). • Necessità di definire gli standard di creazione e fruizione di documenti digitali per i testi, le immagini, i suoni … (XML, PDF/A, …) • Necessità di definire gli standard relativi alle basi di dati (XML-Enabled DBMS, XML-Native DBMS) 9 Ricerca • I metadati per la ricerca del contenuto alfanumerico – testuale sono stati messi a punto da decenni • Le tecniche per la ricerca del contenuto multimediale, vale a dire suono, fotogrammi, immagini in movimento, non sono ancora state messe a punto, o nel migliore dei casi sono allo stato embrionale. Inoltre presentano complessità elevate. • Le tecniche per la ricerca in archivi “misti” presentano un ordine di complessità ancora superiore Sicurezza (1) • Requisiti di sicurezza (estesi) – Sicurezza e integrità dell’archivio digitale – Controllo dei diritti di accesso e di uso dell’archivio digitale – Protezione dell’archivio digitale contro usi e manipolazioni illecite – Protezione della Privacy … – Sicurezza della conservazione dell’archivio digitale – Sicurezza dell’inalterabilità delle caratteristiche dell’archivio digitale La sicurezza non è solo proteggere l’archivio digitale e regolamentarne l’uso ma anche controllare il suo uso e la sua evoluzione nel tempo 11 Sicurezza (2) • Tutti gli archivi digitali contengono informazioni che devono essere adeguatamente protette: – Contro i “furti digitali” – Contro usi impropri e illegali – A tutela della privacy (dati sensibili) – Per impedire la diffusione di pericoli e minacce in Internet – L’origine dei documenti e il mantenimento delle loro caratteristiche originali devono essere certificate e “firmate” con meccanismi che consentano di verificarne l’integrità. 12 Questioni aperte Ammesso di averne garantito la persistenza e la sicurezza come si “utilizza” un archivio digitale? • Interoperabilità tra archivi digitali “misti” – Interoperabilità tra archivi digitali “omogenei”. Es: • Diversi Archivi di Stato Civile (diversi Comuni … diversi Stati) • Diversi Archivi di dati sanitari – Interoperabilità tra archivi digitali “disomogenei” • Interazione tra Archivi anagrafici e archivi catastali, notarili, fiscali … • Validità di un archivio digitale “misto” – “fotografia periodica” dello stato dell’archivio digitale a fini conservativi? 13