URT – Sistemi di indicizzazione e classificazione Attività di Progetto Laboratorio di documentazione Maria Taverniti Erika Pasceri 5' Incontro ISKO Italia Venezia : 1 aprile 2011 1 Presentazione L@bdoc Laboratorio di documentazione (1996) e Centro di Eccellenza in Gestione della Conoscenza (2002) URT (Unità di Ricerca presso Terzi) del CNR – Sistemi di indicizzazione e classificazione (2007) • Gestione della conoscenza, di informazione e documenti – Definizione di metodologie e costruzione di sistemi di organizzazione e di accesso alla conoscenza/informazione • Basi di conoscenza, Thesauri, Sistemi di indicizzazione e di classificazione automatica, … 2 Progetti FSE Fascicolo Sanitario Elettronico L’informatizzazione degli uffici giudiziari: il fascicolo del PM CL.Au.D.Io 15248 CLassificazione Automatica DI dOcumenti CL.Au.D.Io (2008) Obiettivo Soluzione Realizzazione di un prototipo software, con strumenti open source, per la classificazione automatica di documenti all’interno di un sistema di Document Management Sistema di protocollo informatico Integrazione nei prodotti presenti nelle PA Rassegna stampa Barilla Group 4 Thesaurus efficienza energetica (2010) Obiettivi Metodologia 5 Formalizzazione della conoscenza (2007) Obiettivi ◦ Prevalenza di conoscenza tacita ◦ Scarsa formalizzazione del know-how ◦ Pochi esperti di dominio Progetti ◦ Laboratorio Sperimentale di artigianato e Design (L.R. 15 Marzo 2002 n.15) Artigianato Orafo ◦ Sviluppo dei saperi artigiani tradizionali e integrazione dei sistemi produttivi in Marocco e in Italia Artigianato tessile 6 L’informatizzazione degli uffici giudiziari: Fascicolo del PM (2009) CNR Avvio del Progetto •Finanziamento all’interno del “Programma Calabria per il Potenziamento delle misure di Sicurezza”; Soggetti coinvolti e motivazioni •Procura della Repubblica con elevato carico di lavoro; •Organico non proporzionato al carico; •Situazione logistica non ottimale: •Elevati volumi documentali e informativi; •Elevato numero di attori/produttori della documentazione e scarsa standardizzazione Partner Industriale Gruppo Abramo 7 FSE Avvio (Convenzione del 08/05/2009) Continuazione (Convenzione del 17/12/2010) • Task A7.3 – Definizione di modelli ontologici e vocabolari a supporto del FSE • • Deliverable D9 – Versione italiana di un linguaggio medico interoperabile e di una tassonomia di classificazione • Linguaggio medico/thesaurus italiano di refertazione WP 3 - Realizzazione network interregionale per l’interoperabilità delle soluzioni territoriali di FSE Attività 3.3 - Definizione delle specifiche, progettazione e sviluppo di metodologie e componenti software per la codifica univoca degli assistiti 8 Knowledge Organization biomedica e standard di rappresentazione 5' Incontro ISKO Italia, Venezia, 1 aprile 2011 9 Il Fascicolo Sanitario Elettronico Piano e-government 2012 Ministero per la Pubblica amministrazione e l’innovazione: • Semplificare e digitalizzare i servizi elementari (prescrizioni, certificati di malattia digitali, sistemi di prenotazione online) • Creare le infrastrutture per un’erogazione di servizi sanitari vicini alle esigenze dei cittadini (fascicolo sanitario elettronico e innovazione delle aziende sanitarie) Consiglio Nazionale delle Ricerche Progetto “Infrastruttura tecnologica del Fascicolo Sanitario Elettronico” 10 Il nostro obiettivo Definizione di modelli ontologici e vocabolari a supporto del Fascicolo Sanitario Elettronico 1. Linguaggio medico/thesaurus italiano di refertazione 2. Codifica italiana standardizzata dei risultati degli esami di laboratorio 11 1. Linguaggio medico/thesaurus italiano di refertazione 12 Regole Tecniche ICD-9 CM (International Classification of Diseases 9th Revision - Clinical Modification) Diagnosi LOINC (Logical Observation Identifiers Names and Codes) Esami di laboratorio 13 Perché aggiornare ICD9-CM2007: Un campione di test Totale termini ICD9-CM : 16037 Totale termini AOBO (codificati) : 5486 Totale termini AOBO (liberi): 30379 Sovrapposizioni AOBO / ICD9-CM AOBO Numero Sovrapposizioni % Lessico contenuta in ICD9 5054 90,54% * 278 0,92%** (Codificato) AOBO (Libere) Tab.1: * Corrispondenze ottenute mediante verifica automatica e manuale ** Corrispondenze ottenute mediante verifica automatica 14 Perché aggiornare ICD9-CM2007: un secondo campione di test Totale termini AOCS: 1082 Totale termini MMG: 3420 Sovrapposizioni AOCS / ICD9-CM AOCS (Libere) Numero Sovrapposizioni % Lessico contenuta in ICD9 64 5,91% Tab.2: Corrispondenze ottenute mediante verifica manuale Sovrapposizioni MMG CS / ICD9-CM MMG* Numero Sovrapposizioni % Lessico contenuta in ICD9 108 3,15% Tab.3: Corrispondenze ottenute mediante verifica automatica * Campione estratto dai database di Medici di Medicina Generale 15 Gli esempi: Termini non presenti in ICD9-CM2007 * Ipoema e Ifema sono sinonimi, manca la gestione delle variabili ** Obesità, manca termine singolo 16 Verso ICD9-CM Plus Obiettivo : Creazione di un Lessico/Thesaurus di destinazione convenzionalmente definito ‘ICD9-CM Plus’ L1 . ICD9-CM + . . ICD9-CM Plus = L10 17 Lo Strumento V.I.L.M.A. Vocabolari Italiani Lessici di Medicina e sAnità 18 Definizione delle relazioni VM: il termine del corpus viene relazionato al termine di ICD9-CM Plus come variante morfologica, ma non inserito; UF: il termine del corpus viene inserito come sinonimo o quasi sinonimo del termine di ICD9-CM Plus; BT: il termine del corpus viene inserito come termine sovraordinato del termine ICD9-CM Plus; NT: il termine del corpus viene inserito come termine subordinato del termine di ICD9-CM Plus; RT: il termine del corpus viene inserito come termine correlato al termine di ICD9-CM Plus (vedi anche…); Inserisci in ICD9-CM Plus: inserisce il termine del corpus come termine principale all’interno di ICD9-CM Plus senza relazionarlo. 19 La ricerca dei termini Permette di filtrare i termini in ICD9-CM Plus da confrontare: Per inclusione: seleziona tutti i termini del ICD9-CM Plus che contengono la parola, in qualunque posizione; Per prefisso: contiene l’elenco di tutti i prefissi medico-sanitari e cerca, all’interno del ICD9-CM Plus, tutti i termini che iniziano per il prefisso selezionato. (Es. iper-, ipo-, ecc.); Per suffisso: contiene l’elenco di tutti i suffissi medico-sanitari e cerca, all’interno del ICD9-CM Plus, tutti i termini che terminano per il suffisso selezionato. (Es. –ite, -osi, ecc.). 20 ICD9-CM2007 Plus •Totale termini di ICD9-CM Plus : 60241 •Totale termini AOBO (codificati) : 5486 •Totale termini AOBO (liberi): 30379 Sovrapposizioni AOBO / ICD9-CM Plus Numero Sovrapposizioni % Lessico contenuta in ICD9 Plus AOBO 5918 93,46%* (90,54%) AOBO 863 2,84%** (0,92%) (Codificato) (Libere) Tab.4: * Corrispondenze ottenute mediante verifica automatica e manuale ** Corrispondenze ottenute mediante verifica automatica 21 ICD9-CM2007 Plus •Totale termini AOCS: 1082 •Totale termini MMG: 3420 Sovrapposizioni MMG CS / ICD9-CM Plus MMG* Numero Sovrapposizioni % Lessico contenuta in ICD9 Plus 518 15,14% (5,91%) Tab.5: Corrispondenze ottenute mediante verifica automatica * Campione estratto dai database di Medici di Medicina Generale Sovrapposizioni AOCS / ICD9-CM Plus AOCS (Libere) Numero Sovrapposizioni % Lessico contenuta in ICD9 342 31,61% (3,15%) Tab.6: Corrispondenze ottenute mediante verifica manuale 22 ICD9 – CM: I MMG usano un linguaggio italiano nativo totalmente disallineato rispetto alla codifica ICD9-CM; La traduzione italiana di ICD9-CM non è allineata al lessico di dominio corrente; La codifica è, di fatto, una forzatura; Possibili soluzioni: 1. Revisione e contestualizzazione della traduzione; 2. Obbligatoria gestione delle relazioni. 23 Indianapolis, IN 2. Codifica italiana standardizzata dei risultati degli esami di laboratorio 24 LOINC «The purpose of LOINC® is to facilitate the exchange and pooling of clinical results for clinical care, outcomes management, and research by providing a set of universal codes and names to identify laboratory and other clinical observations» [Fonte: <http://loinc.org/>] 25 LOINC - URT www.labdoc.it 26 LOINC: ? •Facilita lo scambio e la condivisione dei dati clinici provenienti dai laboratori fra i diversi operatori del settore biomedico; • La banca dati LOINC fornisce un insieme di nomi universali e codici ID per l’identificazione dei risultati di test clinici e di laboratorio • Ogni record del database LOINC è identificato da un codice numerico e da un formal name, costituito da 6 parti: 1. 2. 3. 4. 5. 6. Component Property Time aspect System Scale type Method type 27 LOINC: La traduzione 28 LOINC: La traduzione (2) 29 LOINC ITALIAN TOOL 30 Loinc Italian Tool: Il nostro obiettivo • Realizzazione di un ambiente software condiviso per la mappatura delle analisi effettuate da ogni laboratorio italiano verso il rispettivo nomenclatore tariffario regionale e verso lo standard LOINC Creare un modello di riferimento per gli operatori del settore esportabile anche nelle altre regioni italiane 31 Il problema della mappatura I laboratori italiani codificano le analisi svolte autonomamente, identificandole con un codice ad uso interno e associandole ai codici del nomenclatore/tariffario regionale di afferenza. Ad un singolo codice regionale possono corrispondere più analisi del laboratorio (1:N) La singola analisi comprende più voci del tariffario (N:1) ASSOCIAZIONE TARIFFARIO N:N ad ogni codice regionale possono corrispondere più codici interni e viceversa 32 Il problema della mappatura LOINC Ogni laboratorio mappa secondo le proprie esigenze senza tener conto dei criteri utilizzati dagli altri. Questo porta ad una forte eterogeneità della codifica italiana. Ad un singolo codice interno del generico laboratorio possono corrispondere più codici LOINC [(1:N) localmente] ASSOCIAZIONE LOINC Se la stessa analisi fatta da Laboratorio diversi viene mappata rispetto a codici LOINC differenti Se la stessa analisi fatta da Laboratorio diversi viene mappata rispetto a codici LOINC uguali (N:N) -> Errato (1:N) -> Esatto 33 L’interfaccia LOGIN Laboratoristi CNR Comitato scientifico 34 L’interfaccia : Gestione delle analisi Navigare all’interno del proprio catalogo analisi Caricare nuove analisi 35 Dove si ricerca il codice LOINC? LOINC LOINC ENG LOINC ITA CUMUL Altre assoc. V. 2.30 V. 0.1 Parte italiana Di tutti i laboratori 36 L’interfaccia: Mappatura verso un codice LOINC Creare associazioni (N codici LOINC : N analisi di laboratorio) con il LOINC, visualizzando: Le mappature fatte dagli altri utenti verso un generico codice LOINC I dettagli di ogni termine LOINC in inglese in italiano (se presente) nella traduzione cumul (se presente) Elenco analisi del laboratorio X Dettagli LOINC Codici LOINC 37 URT (CS) – Molinette (TO) Obiettivo: Consentire la condivisione e lo scambio di informazioni tra istituzioni ed organizzazioni che cooperano alla realizzazione di una codifica italiana standardizzata degli esami di laboratorio basata su LOINC. Azienda Ospedaliera Universitaria Molinette,Torino (dott.ssa Claudia Bessone) 38 URT – Sistemi di indicizzazione e classificazione www.labdoc.it Grazie per l’attenzione! [email protected] [email protected] 5' Incontro ISKO Italia, Venezia, 1 aprile 2011