Sistemi per l’elaborazione dell’informazione Maria Teresa Pazienza DISP - Dipartimento di Informatica, Sistemi e Produzione aa. 2008-09 Tendenze evolutive della Gestione Documentale: dall’archiviazione alla gestione della conoscenza Verso una cultura della conoscenza • La conoscenza costituisce una fonte di vantaggio competitivo – Per questo va misurata, coltivata, registrata, resa accessibile • Gestire la conoscenza significa trovare la conoscenza o l’esperto che serve, quando serve per risolvere un problema di dominio specifico In domini medico-sanitari la dimensione della conoscenza è: • vasta e non misurabile • in continua evoluzione • a diversi livelli di specializzazione • accessibile in tempi e modi diversi Vari tipi di conoscenza – conoscenza esplicita codificata in libri, mail, documenti, modelli – conoscenza tacita collocata nella testa delle persone attraverso l’esperienza sul lavoro – conoscenza incorporata esplicitabile solo attraverso il ricorso ad altra conoscenza. – Un sistema per la Gestione della Conoscenza si basa su: • Sistema documentale – Documenti, libri, file multimediali, e-mail, etc. • Modello dell’organizzazione – Rappresentazione delle conoscenze dei singoli e delle aree di competenze • Descrizione dei processi – Esplicitazione delle routine organizzative, delle prassi e dei protocolli Il processo di gestione della conoscenza Attività di produzione di conoscenza Organizzare Strutturare Archivia re Condivi dere Utilizzar e Attività di supporto Architettura della conoscenza Organizzazione e strutture operative Linee guida per la comunicazione Strategie di Business La conoscenza vista come un oggetto il cui scopo e’ aiutare a fare meglio e prima Valore aggiunto Creare Acquisir e Il ciclo di vita di un documento I documenti costituiscono la componente più rilevante della conoscenza (della conoscenza esplicita, almeno) all’interno di una struttura organizzata La gestione documentale coinvolge la memorizzazione e strutturazione di documenti o rapporti cartacei ed elettronici su un supporto di archiviazione elettronico; ciò renderà poi possibile recuperare facilmente le informazioni secondo modalità prestabilite ed in accordo con i diritti di accesso concordati. Le attività fondamentali in un sistema di gestione documentale sono: – Acquisizione – Memorizzazione – Indicizzazione – Ricerca – Controllo d’accesso Il ruolo del documento Ricerca documenti Archiviazione documenti Processi Utilizzo documenti Creazione documenti – Documenti come Memoria – Documenti come Processi – Documenti come Prodotti Organizzazione e strutturazione • Misurare per comprendere rendere il documento “misurabile” • Cosa intendiamo per misurabile: – Interrogabile – Confrontabile – Valutabile • Un esempio su larga scala: il web e i sistemi di information retrieval (motori di ricerca) • Come si raggiunge la “misurabilità”? • Attraverso il riconoscimento della struttura del documento • Attraverso l’identificazione del contenuto del documento Organizzazione e strutturazione • Necessità di strutturare l’informazione per agevolarne il riuso, a vari livelli, sia nella produzione di documenti elettronici che nella acquisizione da documenti cartacei • Template e omogeneita’ di forma • Etichettatura (metadati) – assegnazione di attributi per il riconoscimento e le ricerche • • • • • • • autore data versione approvazione titolo e descrizione categorie e/o parole chiave codice documento Organizzazione e strutturazione • … • Catalogazione – definizione di una struttura di categorie (tassonomia) documentali secondo un criterio predefinito La catalogazione determina una mappatura della conoscenza – permette di specificare tutte le informazioni gestite – facilita la ricerca e la navigazione – permette di distinguere tra • l’organizzazione fisica dei documenti • le “viste logiche” sui documenti Esempio di tassonomia (classificazione) • Classificazione in funzione dei contenuti della base di conoscenza – (Organizzazione dell’azienda; Soluzioni ; Partner; Personale, Fornitori) • Classificazione in funzione della provenienza del documento – (Interno, Esterno, Processo di appartenenza, localizzazione,...) • Classificazione in base alla finalità del documento – (Condivisione, comunicazione, ricerca, riutilizzo, trasmissione...) • Classificazione in base alla destinazione del documento – (Tutti, specialisti, team tematici, famiglie interesse,...) • Classificazione in base ad attributi specifici / strutturali – (Data, argomento, forma, riservatezza,...) Identificazione dei contenuti • Obiettivi: – Identificare informazioni di interesse in testi non strutturati • Applicazioni tipiche: Estrazione di informazione da flussi di notizie Estrazione di informazioni da atti documentali Estrazione di descrizioni di prodotti da cataloghi • Difficoltà: – Si trattano testi non strutturati o semi-strutturati – Riconoscimento di entità e relazioni – Di solito richiede una qualche forma di comprensione del testo Esempio di estrazione di informazioni • CROSSMARC (IST 2000-25366) – sistema di comparazazione tra prodotti di e-commerce, con l’obiettivo di fornire agli utenti dell’informazione sintetica sui prodotti che maggiormente soddifano le proprie esigenze CROSSMARC partners: NCSR “Demokritos” (GR), University of Edinburgh (UK), Università di Roma Tor Vergata (IT), Lingway (FR), and VeltiNet (GR). Esempio di output strutturato <?xml version="1.0" encoding="UTF-8" ?> <page xmlns="http://www.crossmarc.com/FE" xmlns:onto="http://www.crossmarc.com/ONTOLOGY" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://www.crossmarc.com/FE ..\XSD\FE.xsd"> <prodDescr language="IT"> <manufacturerName >Acer</manufacturerName> <modelName >Travelmate 612 TX</modelName> <weight unit="g" norm="2400">2,4kg</weight> <processorName >INTEL Pentium III</processorName> <processorSpeed unit="MHz" norm="900">900 MHZ</processorSpeed> <ram unit="MB" norm="128">128 MB</ram> <hdCapacity unit="GB" norm="20">20 GB</hdCapacity> <screenSize unit="inch" norm="14.1">14,1"</screenSize> <screenType >XTFT</screenType> <price unit="Lit" norm="3899000">£. 3.899.000</price> </prodDescr> </page> Archiviazione • L’archiviazione presuppone uno strumento informatico appropriato • L’archivio dovrebbe essere unico in modo che la tassonomia sia unica e le ricerche possano essere condotte ogni volta su tutta la conoscenza • oppure possono essere molti ma con un sistema di accesso che permette di accedere ad un unico archivio virtuale (e’ necessario integrare eventuali archivi preesistenti separati) • L’accesso all’archivio dev’essere controllato – per ragioni di riservatezza e sicurezza – per garantire una corretta archiviazione – per garantire la correttezza delle informazioni archiviate Visione estesa dei contenuti T E C N O L O G I A M A T U R A • • • • • • Scannerizzazione Gestione Document. Web Content Management Personalizzazione Portali Digital Asset Management + COLD/ERM Workflow Acquisizione documentale Indicizzazione Ricerca Gestione delle revisioni Servizi di libreria Archivi + • • • • • • Aggregazione Syndication Personalizzazione implicita e esplicita Templating Ricerca avanzata Profilazione dell’utenza N U O V A T E C N O L O G I A Architettura di Gestione della Conoscenza Strumenti d’accesso Thin client Palmare/ PDA Thick client Mobile phone WAP Interfaccia Utente Funzioni Gestione Recupero Delivery Hard Copy Portali informativi d’impresa GUI CD-ROM Gest. Ciclo Vita Ricerca Full Text Sicurezza & Ammin Workflow Metadati Servizi di libreria/ Gestione Archivi Ricerca Contesto Personalizzazione/ Profilaz. Authoring & Composiz. Ricerca Audio/Video Syndication Contenuto statico Streaming Archivi Documenti Video Audio E-mail Disc. DBs Codice Sorg. Print Streams Contenuto dinamico Prime conclusioni La “knowlege based organisation” è un modello organizzativo ove si combinano: • la convinzione strategica della rilevanza della conoscenza nella formazione del vantaggio competitivo • La convinzione che il KM è un sistema integrato di scelte di progettazione (tecnologie, investimenti, portafoglio prodotti, posizionamento) • Mutano i parametri con cui si giudica: 1) la qualità dell’organizzazione; 2) qualità delle persone; 3) la relazione personeorganizzazione • La gestione documentale costituisce un primo, importantissimo passo verso la gestione della conoscenza Organizzazione della conoscenza nei portali sanitari Gli standard nei progetti internazionali L’informazione di qualità deve passare il vaglio di standard, norme e codici di condotta, griglie valutative, stabiliti come strumento di garanzia del fruitore e per consentire la massima precisione nella ricerca. Per l’organizzazione dei portali sanitari occorre: definire il target (anche con l’uso di modelli comunicativi su misura del tipo di utenza), valutare l’informazione (che deve rispondere a requisiti chiarezza, trasparenza, veridicità delle fonti, attenzione alla tipologia di utente), strutturare l’informazione con metadata standard tra cui il Dublin Core …. Organizzazione della conoscenza nei portali sanitari … esempio di tipo di utenza Cancer.gov fornisce parallelamente informazione oncologica agli operatori sanitari e ai pazienti, Medlineplus® per i consumatori di salute, Quick insegna ai bambini come selezionare l’informazione sanitaria in Internet) ….