Sistemi per l’elaborazione
dell’informazione
Maria Teresa Pazienza
DISP - Dipartimento di Informatica, Sistemi e Produzione
aa. 2008-09
Tendenze evolutive della Gestione
Documentale:
dall’archiviazione
alla gestione della conoscenza
Verso una cultura della conoscenza
• La conoscenza costituisce una fonte di vantaggio
competitivo
– Per questo va misurata, coltivata, registrata, resa accessibile
• Gestire la conoscenza significa trovare la conoscenza o
l’esperto che serve, quando serve per risolvere un
problema di dominio specifico
In domini medico-sanitari la dimensione della conoscenza è:
• vasta e non misurabile
• in continua evoluzione
• a diversi livelli di specializzazione
• accessibile in tempi e modi diversi
Vari tipi di conoscenza
– conoscenza esplicita  codificata in libri, mail, documenti,
modelli
– conoscenza tacita  collocata nella testa delle persone
attraverso l’esperienza sul lavoro
– conoscenza incorporata  esplicitabile solo attraverso il
ricorso ad altra conoscenza.
– Un sistema per la Gestione della Conoscenza si basa su:
• Sistema documentale
– Documenti, libri, file multimediali, e-mail, etc.
• Modello dell’organizzazione
– Rappresentazione delle conoscenze dei singoli e delle aree di
competenze
• Descrizione dei processi
– Esplicitazione delle routine organizzative, delle prassi e dei protocolli
Il processo di gestione della conoscenza
Attività di produzione di conoscenza
Organizzare
Strutturare
Archivia
re
Condivi
dere
Utilizzar
e
Attività di
supporto
Architettura della conoscenza
Organizzazione e strutture operative
Linee guida per la comunicazione
Strategie di Business
La conoscenza vista come un oggetto il cui scopo e’
aiutare a fare meglio e prima
Valore
aggiunto
Creare
Acquisir
e
Il ciclo di vita di un documento
I documenti costituiscono la componente più rilevante della conoscenza
(della conoscenza esplicita, almeno) all’interno di una struttura
organizzata
La gestione documentale coinvolge la memorizzazione e strutturazione
di documenti o rapporti cartacei ed elettronici su un supporto di
archiviazione elettronico; ciò renderà poi possibile recuperare
facilmente le informazioni secondo modalità prestabilite ed in
accordo con i diritti di accesso concordati.
Le attività fondamentali in un sistema di gestione documentale sono:
– Acquisizione
– Memorizzazione
– Indicizzazione
– Ricerca
– Controllo d’accesso
Il ruolo del documento
Ricerca
documenti
Archiviazione
documenti
Processi
Utilizzo
documenti
Creazione
documenti
– Documenti come Memoria
– Documenti come Processi
– Documenti come Prodotti
Organizzazione e strutturazione
• Misurare per comprendere  rendere il documento
“misurabile”
• Cosa intendiamo per misurabile:
– Interrogabile
– Confrontabile
– Valutabile
• Un esempio su larga scala: il web e i sistemi di
information retrieval (motori di ricerca)
• Come si raggiunge la “misurabilità”?
• Attraverso il riconoscimento della struttura del documento
• Attraverso l’identificazione del contenuto del documento
Organizzazione e strutturazione
• Necessità di strutturare l’informazione per agevolarne il
riuso, a vari livelli, sia nella produzione di documenti
elettronici che nella acquisizione da documenti cartacei
• Template e omogeneita’ di forma
• Etichettatura (metadati)
– assegnazione di attributi per il riconoscimento e le ricerche
•
•
•
•
•
•
•
autore
data
versione
approvazione
titolo e descrizione
categorie e/o parole chiave
codice documento
Organizzazione e strutturazione
• …
• Catalogazione
– definizione di una struttura di categorie (tassonomia) documentali
secondo un criterio predefinito
La catalogazione determina una mappatura della
conoscenza
– permette di specificare tutte le informazioni gestite
– facilita la ricerca e la navigazione
– permette di distinguere tra
• l’organizzazione fisica dei documenti
• le “viste logiche” sui documenti
Esempio di tassonomia (classificazione)
• Classificazione in funzione dei contenuti della base di
conoscenza
– (Organizzazione dell’azienda; Soluzioni ; Partner; Personale,
Fornitori)
• Classificazione in funzione della provenienza del
documento
– (Interno, Esterno, Processo di appartenenza, localizzazione,...)
• Classificazione in base alla finalità del documento
– (Condivisione, comunicazione, ricerca, riutilizzo, trasmissione...)
• Classificazione in base alla destinazione del documento
– (Tutti, specialisti, team tematici, famiglie interesse,...)
• Classificazione in base ad attributi specifici / strutturali
– (Data, argomento, forma, riservatezza,...)
Identificazione dei contenuti
• Obiettivi:
– Identificare informazioni di interesse in testi non strutturati
• Applicazioni tipiche:
Estrazione di informazione da flussi di notizie
Estrazione di informazioni da atti documentali
Estrazione di descrizioni di prodotti da cataloghi
• Difficoltà:
– Si trattano testi non strutturati o semi-strutturati
– Riconoscimento di entità e relazioni
– Di solito richiede una qualche forma di comprensione del testo
Esempio di estrazione di informazioni
•
CROSSMARC (IST 2000-25366)
– sistema di comparazazione tra prodotti di e-commerce, con l’obiettivo di fornire agli
utenti dell’informazione sintetica sui prodotti che maggiormente soddifano le proprie
esigenze
CROSSMARC partners: NCSR “Demokritos” (GR), University of Edinburgh (UK), Università di Roma Tor Vergata (IT),
Lingway (FR), and VeltiNet (GR).
Esempio di output strutturato
<?xml version="1.0" encoding="UTF-8" ?>
<page xmlns="http://www.crossmarc.com/FE"
xmlns:onto="http://www.crossmarc.com/ONTOLOGY"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://www.crossmarc.com/FE ..\XSD\FE.xsd">
<prodDescr language="IT">
<manufacturerName >Acer</manufacturerName>
<modelName >Travelmate 612 TX</modelName>
<weight unit="g" norm="2400">2,4kg</weight>
<processorName >INTEL Pentium III</processorName>
<processorSpeed unit="MHz" norm="900">900 MHZ</processorSpeed>
<ram unit="MB" norm="128">128 MB</ram>
<hdCapacity unit="GB" norm="20">20 GB</hdCapacity>
<screenSize unit="inch" norm="14.1">14,1"</screenSize>
<screenType >XTFT</screenType>
<price unit="Lit" norm="3899000">£. 3.899.000</price>
</prodDescr>
</page>
Archiviazione
• L’archiviazione presuppone uno strumento informatico appropriato
• L’archivio dovrebbe essere unico in modo che la tassonomia sia unica
e le ricerche possano essere condotte ogni volta su tutta la
conoscenza
• oppure possono essere molti ma con un sistema di accesso che
permette di accedere ad un unico archivio virtuale (e’ necessario
integrare eventuali archivi preesistenti separati)
• L’accesso all’archivio dev’essere controllato
– per ragioni di riservatezza e sicurezza
– per garantire una corretta archiviazione
– per garantire la correttezza delle informazioni archiviate
Visione estesa dei contenuti
T
E
C
N
O
L
O
G
I
A
M
A
T
U
R
A
•
•
•
•
•
•
Scannerizzazione
Gestione
Document.
Web Content
Management
Personalizzazione
Portali
Digital Asset
Management
+
COLD/ERM
Workflow
Acquisizione documentale
Indicizzazione
Ricerca
Gestione delle revisioni
Servizi di libreria
Archivi
+
•
•
•
•
•
•
Aggregazione
Syndication
Personalizzazione
implicita e esplicita
Templating
Ricerca avanzata
Profilazione dell’utenza
N
U
O
V
A
T
E
C
N
O
L
O
G
I
A
Architettura di Gestione della Conoscenza
Strumenti
d’accesso
Thin
client
Palmare/
PDA
Thick
client
Mobile
phone
WAP
Interfaccia
Utente
Funzioni
Gestione
Recupero
Delivery
Hard
Copy
Portali informativi d’impresa
GUI
CD-ROM
Gest.
Ciclo
Vita
Ricerca
Full Text
Sicurezza
& Ammin
Workflow
Metadati
Servizi
di libreria/
Gestione
Archivi
Ricerca
Contesto
Personalizzazione/
Profilaz.
Authoring
&
Composiz.
Ricerca
Audio/Video
Syndication
Contenuto
statico
Streaming
Archivi
Documenti
Video
Audio
E-mail
Disc.
DBs
Codice
Sorg.
Print
Streams
Contenuto
dinamico
Prime conclusioni
La “knowlege based organisation” è un modello organizzativo ove si
combinano:
• la convinzione strategica della rilevanza della conoscenza nella
formazione del vantaggio competitivo
• La convinzione che il KM è un sistema integrato di scelte di
progettazione (tecnologie, investimenti, portafoglio prodotti,
posizionamento)
• Mutano i parametri con cui si giudica: 1) la qualità
dell’organizzazione; 2) qualità delle persone; 3) la relazione personeorganizzazione
• La gestione documentale costituisce un primo, importantissimo passo
verso la gestione della conoscenza
Organizzazione della conoscenza nei
portali sanitari
Gli standard nei progetti internazionali
L’informazione di qualità deve passare il vaglio di standard,
norme e codici di condotta, griglie valutative, stabiliti come
strumento di garanzia del fruitore e per consentire la
massima precisione nella ricerca.
Per l’organizzazione dei portali sanitari occorre: definire il
target (anche con l’uso di modelli comunicativi su misura del
tipo di utenza), valutare l’informazione (che deve rispondere
a requisiti chiarezza, trasparenza, veridicità delle fonti,
attenzione alla tipologia di utente), strutturare l’informazione
con metadata standard tra cui il Dublin Core ….
Organizzazione della conoscenza nei
portali sanitari
… esempio di tipo di utenza
Cancer.gov fornisce parallelamente informazione
oncologica agli operatori sanitari e ai pazienti,
Medlineplus® per i consumatori di salute,
Quick insegna ai bambini come selezionare
l’informazione sanitaria in Internet)
….
Scarica

lezione2 - Università degli Studi di Roma Tor Vergata