URT – Sistemi di
indicizzazione
e classificazione
Attività di Progetto
Laboratorio di documentazione
Maria Taverniti
Erika Pasceri
5' Incontro ISKO Italia
Venezia : 1 aprile 2011
1
Presentazione L@bdoc
Laboratorio di documentazione
(1996)
e Centro di Eccellenza in
Gestione della Conoscenza
(2002)
URT (Unità di Ricerca presso
Terzi) del CNR – Sistemi di
indicizzazione e classificazione
(2007)
• Gestione della conoscenza, di informazione e
documenti
– Definizione di metodologie e costruzione di sistemi di organizzazione e
di accesso alla conoscenza/informazione
• Basi di conoscenza, Thesauri, Sistemi di indicizzazione e di
classificazione automatica, …
2
Progetti
FSE
Fascicolo Sanitario Elettronico
L’informatizzazione degli
uffici giudiziari:
il fascicolo del PM
CL.Au.D.Io
15248
CLassificazione
Automatica DI dOcumenti
CL.Au.D.Io
(2008)
Obiettivo
Soluzione
 Realizzazione di un
prototipo software, con
strumenti open source,
per la classificazione
automatica di documenti
all’interno di un sistema di
Document Management
 Sistema di protocollo
informatico
 Integrazione nei
prodotti presenti nelle
PA
 Rassegna stampa Barilla
Group
4
Thesaurus
efficienza energetica
(2010)
Obiettivi
Metodologia
5
Formalizzazione della
conoscenza
(2007)
 Obiettivi
◦ Prevalenza di conoscenza tacita
◦ Scarsa formalizzazione del
know-how
◦ Pochi esperti di dominio
 Progetti
◦ Laboratorio
Sperimentale
di
artigianato e Design
(L.R. 15 Marzo 2002 n.15)
 Artigianato Orafo
◦ Sviluppo dei saperi artigiani
tradizionali e integrazione dei
sistemi produttivi in Marocco e in
Italia
 Artigianato tessile
6
L’informatizzazione
degli uffici giudiziari:
Fascicolo del PM
(2009)
CNR
Avvio del Progetto
•Finanziamento all’interno del “Programma
Calabria per il Potenziamento delle misure di
Sicurezza”;
Soggetti coinvolti e motivazioni
•Procura della Repubblica con elevato carico di
lavoro;
•Organico non proporzionato al carico;
•Situazione logistica non ottimale:
•Elevati volumi documentali e informativi;
•Elevato numero di attori/produttori della
documentazione e scarsa
standardizzazione
Partner Industriale
Gruppo Abramo
7
FSE
Avvio
(Convenzione del 08/05/2009)
Continuazione
(Convenzione del 17/12/2010)
•
Task A7.3
– Definizione di modelli
ontologici e vocabolari a
supporto del FSE
•
•
Deliverable D9
– Versione italiana di un
linguaggio medico
interoperabile e di una
tassonomia di
classificazione
•
Linguaggio
medico/thesaurus
italiano di refertazione
WP 3
- Realizzazione network
interregionale per
l’interoperabilità delle soluzioni
territoriali di FSE
Attività 3.3
- Definizione delle specifiche,
progettazione e
sviluppo di metodologie e
componenti software
per la codifica univoca degli
assistiti
8
Knowledge Organization biomedica e
standard di rappresentazione
5' Incontro ISKO Italia, Venezia, 1 aprile 2011
9
Il Fascicolo Sanitario Elettronico
Piano e-government 2012
Ministero per la Pubblica amministrazione e l’innovazione:
• Semplificare e digitalizzare i servizi elementari (prescrizioni, certificati di
malattia digitali, sistemi di prenotazione online)
• Creare le infrastrutture per un’erogazione di servizi sanitari vicini alle
esigenze dei cittadini (fascicolo sanitario elettronico e innovazione delle
aziende sanitarie)
Consiglio Nazionale delle Ricerche
Progetto “Infrastruttura tecnologica del Fascicolo Sanitario Elettronico”
10
Il nostro obiettivo
Definizione di modelli ontologici e vocabolari a
supporto del Fascicolo Sanitario Elettronico
1.
Linguaggio
medico/thesaurus
italiano
di refertazione
2.
Codifica italiana
standardizzata dei
risultati degli esami
di laboratorio
11
1. Linguaggio medico/thesaurus italiano di
refertazione
12
Regole Tecniche
ICD-9 CM
(International Classification
of Diseases 9th Revision - Clinical Modification)
Diagnosi
LOINC
(Logical Observation Identifiers
Names and Codes)
Esami di
laboratorio
13
Perché aggiornare ICD9-CM2007:
Un campione di test
Totale termini ICD9-CM : 16037
Totale termini AOBO (codificati) : 5486
Totale termini AOBO (liberi): 30379
Sovrapposizioni AOBO / ICD9-CM
AOBO
Numero
Sovrapposizioni
% Lessico contenuta in ICD9
5054
90,54% *
278
0,92%**
(Codificato)
AOBO (Libere)
Tab.1:
* Corrispondenze ottenute mediante verifica automatica e manuale
** Corrispondenze ottenute mediante verifica automatica
14
Perché aggiornare ICD9-CM2007:
un secondo campione di test
Totale termini AOCS: 1082
Totale termini MMG: 3420
Sovrapposizioni AOCS / ICD9-CM
AOCS
(Libere)
Numero
Sovrapposizioni
% Lessico contenuta in ICD9
64
5,91%
Tab.2: Corrispondenze ottenute mediante verifica manuale
Sovrapposizioni MMG CS / ICD9-CM
MMG*
Numero
Sovrapposizioni
% Lessico contenuta in ICD9
108
3,15%
Tab.3: Corrispondenze ottenute mediante verifica automatica
* Campione estratto dai database di Medici di Medicina Generale
15
Gli esempi: Termini non presenti
in ICD9-CM2007
* Ipoema e Ifema sono sinonimi, manca la gestione delle variabili
** Obesità, manca termine singolo
16
Verso ICD9-CM Plus
Obiettivo : Creazione di un
Lessico/Thesaurus di destinazione
convenzionalmente definito ‘ICD9-CM Plus’
L1
.
ICD9-CM
+
.
.
ICD9-CM Plus
=
L10
17
Lo Strumento
V.I.L.M.A.
Vocabolari Italiani Lessici di Medicina e sAnità
18
Definizione delle relazioni

VM: il termine del corpus viene relazionato al
termine di ICD9-CM Plus come variante
morfologica, ma non inserito;

UF: il termine del corpus viene inserito come
sinonimo o quasi sinonimo del termine di ICD9-CM
Plus;

BT: il termine del corpus viene inserito come
termine sovraordinato del termine ICD9-CM Plus;

NT: il termine del corpus viene inserito come
termine subordinato del termine di ICD9-CM Plus;

RT: il termine del corpus viene inserito come
termine correlato al termine di ICD9-CM Plus (vedi
anche…);

Inserisci in ICD9-CM Plus: inserisce il termine
del corpus come termine principale all’interno di
ICD9-CM Plus senza relazionarlo.
19
La ricerca dei termini
Permette di filtrare i termini in ICD9-CM Plus da confrontare:
 Per inclusione: seleziona tutti i termini del ICD9-CM
Plus che contengono la parola, in qualunque
posizione;
 Per prefisso: contiene l’elenco di tutti i prefissi
medico-sanitari e cerca, all’interno del ICD9-CM Plus,
tutti i termini che iniziano per il prefisso selezionato.
(Es. iper-, ipo-, ecc.);
 Per suffisso: contiene l’elenco di tutti i suffissi
medico-sanitari e cerca, all’interno del ICD9-CM Plus,
tutti i termini che terminano per il suffisso
selezionato. (Es. –ite, -osi, ecc.).
20
ICD9-CM2007 Plus
•Totale termini di ICD9-CM Plus : 60241
•Totale termini AOBO (codificati) : 5486
•Totale termini AOBO (liberi): 30379
Sovrapposizioni AOBO / ICD9-CM Plus
Numero
Sovrapposizioni
% Lessico contenuta in ICD9 Plus
AOBO
5918
93,46%* (90,54%)
AOBO
863
2,84%** (0,92%)
(Codificato)
(Libere)
Tab.4:
* Corrispondenze ottenute mediante verifica automatica e manuale
** Corrispondenze ottenute mediante verifica automatica
21
ICD9-CM2007 Plus
•Totale termini AOCS: 1082
•Totale termini MMG: 3420
Sovrapposizioni MMG CS / ICD9-CM Plus
MMG*
Numero
Sovrapposizioni
% Lessico contenuta in ICD9 Plus
518
15,14% (5,91%)
Tab.5: Corrispondenze ottenute mediante verifica automatica
* Campione estratto dai database di Medici di Medicina Generale
Sovrapposizioni AOCS / ICD9-CM Plus
AOCS
(Libere)
Numero
Sovrapposizioni
% Lessico contenuta in ICD9
342
31,61% (3,15%)
Tab.6: Corrispondenze ottenute mediante verifica manuale
22
ICD9 – CM:
I MMG usano un linguaggio italiano nativo totalmente
disallineato rispetto alla codifica ICD9-CM;
La traduzione italiana di ICD9-CM non è allineata al
lessico di dominio corrente;
La codifica è, di fatto, una forzatura;
Possibili soluzioni:
1. Revisione e contestualizzazione della traduzione;
2. Obbligatoria gestione delle relazioni.
23
Indianapolis, IN
2. Codifica italiana standardizzata dei risultati
degli esami di laboratorio
24
LOINC
«The purpose of LOINC® is to facilitate
the exchange and pooling of clinical
results for clinical care, outcomes
management, and research by providing
a set of universal codes and names to
identify laboratory and other clinical
observations»
[Fonte: <http://loinc.org/>]
25
LOINC - URT
www.labdoc.it
26
LOINC: ?
•Facilita lo scambio e la condivisione dei dati clinici provenienti dai laboratori fra i
diversi operatori del settore biomedico;
• La banca dati LOINC fornisce un insieme di nomi universali e codici ID per
l’identificazione dei risultati di test clinici e di laboratorio
• Ogni record del database LOINC è identificato da un codice numerico
e da un formal name, costituito da 6 parti:
1.
2.
3.
4.
5.
6.
Component
Property
Time aspect
System
Scale type
Method type
27
LOINC: La traduzione
28
LOINC: La traduzione (2)
29
LOINC ITALIAN TOOL
30
Loinc Italian Tool: Il nostro obiettivo
• Realizzazione di un ambiente software condiviso
per la mappatura delle analisi effettuate da ogni
laboratorio italiano verso il rispettivo nomenclatore
tariffario regionale e verso lo standard LOINC
Creare un modello di
riferimento per gli
operatori del settore
esportabile
anche nelle altre
regioni italiane
31
Il problema della mappatura
I laboratori italiani codificano le analisi svolte autonomamente,
identificandole con un codice ad uso interno e associandole ai
codici del nomenclatore/tariffario regionale di afferenza.
Ad un singolo codice regionale
possono corrispondere
più analisi del laboratorio (1:N)
La singola analisi comprende
più voci del tariffario (N:1)
ASSOCIAZIONE TARIFFARIO
N:N ad ogni codice regionale possono corrispondere
più codici interni e viceversa
32
Il problema della mappatura LOINC
Ogni laboratorio mappa secondo le proprie esigenze senza tener
conto dei criteri utilizzati dagli altri.
Questo porta ad una forte eterogeneità della codifica italiana.
Ad un singolo codice interno del generico laboratorio
possono corrispondere più codici LOINC [(1:N) localmente]
ASSOCIAZIONE LOINC
Se la stessa analisi fatta da
Laboratorio diversi viene
mappata rispetto a codici
LOINC differenti
Se la stessa analisi fatta da
Laboratorio diversi viene
mappata rispetto a codici
LOINC uguali
(N:N) -> Errato
(1:N) -> Esatto
33
L’interfaccia
LOGIN
Laboratoristi
CNR
Comitato scientifico
34
L’interfaccia : Gestione delle analisi


Navigare all’interno del proprio catalogo analisi
Caricare nuove analisi
35
Dove si ricerca il codice LOINC?
LOINC
LOINC ENG
LOINC ITA
CUMUL
Altre assoc.
V. 2.30
V. 0.1
Parte italiana
Di tutti i
laboratori
36
L’interfaccia: Mappatura verso
un codice LOINC

Creare associazioni (N codici LOINC : N analisi di laboratorio) con il LOINC,
visualizzando:
 Le mappature fatte dagli altri utenti verso un generico codice LOINC
 I dettagli di ogni termine LOINC
 in inglese
 in italiano (se presente)
 nella traduzione cumul (se presente)
Elenco analisi del laboratorio X
Dettagli LOINC
Codici LOINC
37
URT (CS) – Molinette (TO)
Obiettivo:
Consentire la condivisione e lo scambio di informazioni tra istituzioni ed
organizzazioni che cooperano alla realizzazione di una codifica italiana
standardizzata degli esami di laboratorio basata su LOINC.
Azienda Ospedaliera Universitaria
Molinette,Torino
(dott.ssa Claudia Bessone)
38
URT – Sistemi di indicizzazione e classificazione
www.labdoc.it
Grazie per l’attenzione!
[email protected]
[email protected]
5' Incontro ISKO Italia, Venezia, 1 aprile 2011
Scarica

Il Laboratorio di documentazione UniCal-CNR