Sistemi per l’archiviazione storica di documenti elettronici Giovanni Neri Università di Bologna Bologna 20-4-2006 L’università di Bologna e la smaterializzazione dei documenti Progetti iniziati e realizzati fin dal 2000 Verbalizzazione degli esami Gestione dei registri delle lezioni Verbalizzazione degli esami di laurea Gestione informatica dei documenti scambiati con la tesoreria L’universita di Bologna è titolare di una convenzione con il CNIPA avente come tema “ l’attuazione delle politiche del Governo con particolare riferimento all’obiettivo di realizzare una “Pubblica amministrazione on line”, sia all’interno e fra i domini istituzionali, sia nei rapporti con gli utenti finali promuovendo congiuntamente a tal fine, la divulgazione delle tecnologie alla base dell’informatizzazione delle amministrazioni pubbliche “ Convegno DOCAREA G.Neri 2 La problematica Conservazione autentica di lungo o lunghissimo termine di documenti pubblici prodotti, trasmessi e/o memorizzati in forma elettronica Convegno DOCAREA G.Neri 3 Il documento Documento archivistico : – Informazioni allocate su un supporto – Oggetto prodotto da una persona fisica o giuridica al fine di compiere un’attività Finalità: – Documentazione di attività – Fissare un’informazione in un punto del tempo e in uno stadio dell’attività Convegno DOCAREA G.Neri 4 Contenuto e meta-dati del documento •Un documento deve - mantenere inalterato il proprio contenuto informativo - permettere al destinatario e/o a terzi di “leggere” l’informazione contenuta in modo univoco e stabile. •Oltre al contenuto il documento deve definire: - le relazioni con altri documenti - il contesto amministrativo e temporale - gli autori - i destinatari - il redattore / scrittore Convegno DOCAREA G.Neri 5 Il documento elettronico Il documento cartaceo non richiede una “mediazione” per la sua lettura. MENTRE Il documento elettronico non permette mai una sua lettura senza l’uso di opportuni apparati e programmi. Il caso del documento elettronico è assimilabile a un documento cartaceo scritto in cinese o a un manoscritto Vinciano: senza un “demiurgo fidato” il contenuto non è decifrabile Convegno DOCAREA G.Neri 6 Obiettivi dell’archiviazione Primo requisito è il mantenimento dell’integrità del contenuto: “Restituire l’informazione binaria intatta in modo sicuro e affidabile in qualunque momento del futuro” Secondo requisito è il mantenimento della leggibilità: “Garantire che il documento possa ancora produrre l’interpretazione del contenuto informativo originale” Convegno DOCAREA G.Neri 7 Il problema della leggibilità: i formati In ogni documento elettronico l’informazione è rappresentata con una codifica collegata a una specifica tipologia di apparati. I formati seguono i seguenti criteri di ottimizzazione: • la trasmissione dei dati • la memorizzazione • i tempi di codifica/decodifica I formati sono determinati dalla storia dello sviluppo tecnologico ed in generale vengono abbandonati all’affermarsi di nuove soluzioni (Es: Wordstar vs. Word). Per molti formati è oggi persino difficile trovare gli “interpreti”. E’ sostanziale utopia ipotizzare un formato “finale e definitivo” Convegno DOCAREA G.Neri 8 Formati di codifica e problemi di conservazione I criteri di scelta del formato debbono tenere in considerazione - Formati più o meno adatti alla conservazione - Documentazione e pubblicità della tecnologia - Portabilità (numero e diffusione degli strumenti di lettura/scrittura) - Presenza di estensioni programmabili (Es. “macro”) L’“archivista elettronico” deve interagire con l’ente produttore di documenti per orientarlo nella scelta dei formati utilizzati. Convegno DOCAREA G.Neri 9 Tecniche per il mantenimento della leggibilità 1) Conservazione dello “strumento di mediazione” con emulatori hardware e software - Interpretazione diretta del flusso binario originale - Fattibilità vs. - Costi - Difficoltà di diffusione 2) Migrazione permanente dei contenuti in versioni di formato “attuale”. - Semplicità - Diffusa disponibilità Convegno DOCAREA vs. - Monitoraggio della tecnologia - Fedeltà del riversamento G.Neri 10 Emulazione vs. migrazione Il costo della progettazione e costruzione di emulatori per ogni singolo formato utilizzato diventa insensato se confrontato con il probabile tasso di utilizzo (molto scarso) Questo non esclude che questo percorso possa essere intrapreso anche per un solo documento di rilevanza particolare L’unica ovvia pre-condizione è la conservazione del flusso binario originale (importante anche ai fini dell’autenticità) Convegno DOCAREA G.Neri 11 L’integrità nel tempo Deve essere garantita l’integrità di tutti i documenti (anche quelli non firmati digitalmente). Per il controllo su lungo periodo delle varie versioni di ogni documento potrebbe essere molto vantaggioso attivare un controllo euristico dell’integrità (tecniche di refresh). In pratica si può creare un’impronta digitale (hash) di ogni oggetto e conservarla separatamente dai dati. Si potranno poi attivare “agenti” software automatici che controllano a campione l’integrità degli oggetti conservati Convegno DOCAREA G.Neri 12 Documenti autentici firmati digitalmente Un documento sottoscritto digitalmente con firma che risulti valida è garantito inalterato rispetto al momento della firma stessa In questa ottica si aprono i problemi connessi alla conservazione di lungo periodo della validità della firma. Il sistema di archiviazione deve quindi svolgere in qualche modo anche una funzione “notarile” di autenticazione e conservazione delle firme Questo processo deve raccogliere e conservare le “prove” informatiche dell’autenticità Convegno DOCAREA G.Neri 13 La firma digitale nel tempo Ogni firma digitale è legata al sottoscrittore dal “certificato” crittografico ovvero dalla CA Il certificato è valido in un periodo che scade alla data dichiarata (salvo revoca o sospensione, es. per furto) L’apposizione a un documento informatico di una firma digitale o di un altro tipo di firma elettronica qualificata basata su un certificato elettronico revocato, scaduto o sospeso equivale a mancata sottoscrizione (Codice dell’amministrazione digitale) Convegno DOCAREA G.Neri 14 I riferimenti temporali La firma necessita di un riferimento temporale certo per poter conoscere se il certificato di firma era valido in quel momento Un riferimento fissa un istante in cui il documento firmato esisteva in quella esatta forma Tipi di riferimento: - Marca temporale emessa da un’autorità di certificazione (time stamp) - Registrazione di un sistema di protocollo informatico Convegno DOCAREA G.Neri 15 L’istante fissato dal riferimento temporale Un time stamp può essere apposto dal mittente nel momento della firma oppure dal ricevente in qualunque momento successivo. La registrazione di protocollo fissa necessariamente l’istante della ricezione. Firma Ricezione t0 t1 Convegno DOCAREA t G.Neri 16 Il riferimento temporale e le prove informatiche per la conservazione autentica Per la conservazione si deve attendere la pubblicazione della prima CRL successiva alla ricezione per avere la certezza della validità del documento da conservare (e collezionarne tutte le “prove”) Pubblicazione (CRL) OK Conservazione Valida + ? (+ Firma Ricezione t0 t1 Convegno DOCAREA tP ) tC G.Neri 17 Conservazione dei documenti con firma digitale Parallelamente alla conservazione archivistica si deve avviare un processo di “conservazione notarile”. La conservazione dei documenti con firma digitale richiede la creazione di marche di controllo sui supporti, che possono richiedere “rinnovi periodici”. Il processo deve iniziare al momento della ricezione dei documenti, non alla chiusura dei fascicoli e successivo versamento all’archivio storico. Al momento del versamento i documenti già conservati devono essere ricongiunti con i fascicoli pervenuti. Convegno DOCAREA G.Neri 18 Architettura di un archivio per documenti elettronici Servizi di Ricezione / ricezione Creazione Conservazione firme digitali Creazione registrazioni Controllo formati Verifica firma Versamento Servizi di versamento Accettazione Deposito temporaneo Marca di controllo Conservazione documenti Archivio Storico Classificazione Riconciliazione contenuti Gestione supporti Copie autentiche Servizi di consultazione Ricerche Struttura Fondi Controlli integrità Esibizione e download Monitoraggio formati Convegno DOCAREA G.Neri 19 Convegno dell’Università di Bologna L’archiviazione e conservazione dei documenti digitali Esperienze reali e prospettive future Bologna 28 Giugno 2006 (ore 9.30 - 16.00) Aula Absidale Santa Lucia Via De’ Chiari, 26 Segreteria organizzativa: Unimatica Convegno DOCAREA [email protected] G.Neri 20 Giovanni Neri Dipartimento di Elettronica Informatica e Sistemistica Viale Risorgimento 2 – 40136 Bologna Tel 051-2093040 Fax 051-2093088 e-mail [email protected] Convegno DOCAREA G.Neri 21