Sistemi per l’elaborazione dell’informazione Maria Teresa Pazienza DISP - Dipartimento di Informatica, Sistemi e Produzione aa. 2008-09 La terminologia in medicina I dizionari di termini medici e/o sanitari sono raccolte organiche di definizioni di termini (loro significato) all’interno di un dominio o sottodominio medico realizzati da esperti e controllati da una comunità di riferimento. Consentono che due interlocutori associno ad uno stesso termine il medesimo significato Dizionari terminologici Consentire la condivisione del significato di un termine (parola, sigla, espressione terminologica,…) in un contesto specifico all’interno di una lingua od anche di un “gergo” tecnico. Dipendenza temporale del significato dei termini. Strutturazione (in genere gerarchica/ad albero) Rapporto termine/concetto Dizionari terminologici Dimensioni, struttura, organicità, livello di dettaglio, … sono funzioni del settore di interesse Dizionario di base (evocatore di conoscenza pregressa) Dizionari specialistici (di settore) Thesaurus Repertorio di termini connessi da relazioni relative ad uno specifico settore di conoscenza Struttura gerarchica Termini / concetti Il termine è uno dei modi in cui si può esprimere un concetto Un concetto ha una descrizione con proprietà ed attributi (ognuno con valori specifici) Es: Farmaco Farmaco attivo, scaduto, efficace, generico, per l’emicrania, ... Istanze di un concetto Identificatori Codici strutturati che identificano termini complessi (in medicina spesso chiamati concetti) Il progetto Unified Medical Language System (UMLS) http://www.nlm.nih.gov/research/umls Unified Medical Language System • Progetto per lo sviluppo di sistemi automatici in grado di comprendere il significato del linguaggio medico • Il Metathesaurus è un vocabolario multilingue che raccoglie oltre due milioni di termini e dodici milioni di relazioni • La traduzione italiana dei MeSH (medical subject headings) partecipa al progetto UMLS About the UMLS® Resources The purpose of Unified Medical Language System® (UMLS) is to facilitate the development of computer systems that behave as if they "understand" the meaning of the language of biomedicine and health. UMLS Knowledge Sources (databases and programs) for use by system developers in building information systems that create, process, retrieve, integrate, and/or aggregate biomedical and health data and information, as well as in informatics research. By design, the UMLS Knowledge Sources are multipurpose. About the UMLS® Resources There are three UMLS Knowledge Sources: 1. the Metathesaurus®, 2. the Semantic Network, 3. the SPECIALIST Lexicon. Metathesaurus Is a • very large, • multi-purpose, • multi-lingual vocabulary database that contains information about • biomedical and health related concepts, • their various names, • the relationships among them Metathesaurus It is organized by concept or meaning. In essence, its purpose is to link alternative names and views of the same concept together and to identify useful relationships between different concepts. All concepts in the Metathesaurus are assigned to at least one semantic type from the Semantic Network. This provides consistent categorization of all concepts in the Metathesaurus at the relatively general level represented in the Semantic Network. Semantic Network The purpose of the Semantic Network is to provide: 1) a consistent categorization of all concepts represented in the UMLS Metathesaurus 2) a set of useful relationships between these concepts. All information about specific concepts is found in the Metathesaurus; the Network provides information about the set of basic semantic types, or categories, which may be assigned to these concepts, and it defines the set of relationships that may hold between the semantic types. The Network defines these types, both with textual descriptions and by means of the information inherent in its hierarchies. Semantic Network The semantic types are the nodes in the Network, and the relationships between them are the links. There are major groupings of semantic types for • organisms, • anatomical structures, • biologic function, • chemicals, • events, • physical objects, • concepts or ideas. SPECIALIST Lexicon The SPECIALIST Lexicon has been developed to provide the lexical information needed for the SPECIALIST Natural Language Processing System (NLP). It is intended to be a general English lexicon that includes many biomedical terms. Coverage includes both commonly occurring English words and biomedical vocabulary. The lexicon entry for each word or term records the syntactic, morphological, and orthographic information needed by the SPECIALIST NLP System. La traduzione italiana dei MeSH: tappe principali (1) • 1997 Download dei dati dal sito della NLM e sviluppo in-house di un database Access • 1998 Inizio del lavoro di traduzione delle categorie A (Anatomia) e C (Malattie) • 1999-2001 Completamento della traduzione e invio annuale dei dati alla National Library of Medicine La traduzione italiana dei MeSH: tappe principali (2) • 1999- Aggiornamento annuale dei dati • 2000 Inserimento della traduzione nel Metathesaurus (UMLS) • 2004 Creazione di un sito Web dedicato all’utenza italiana www.iss.it/sitp/mesh Applicazioni della traduzione • ISS - Soggettazione Biblioteca • ISS - Relazione annuale delle attività istituzionali • ISS - Database delle pubblicazioni • ISS - Siti web PIRAMIDE e SIBIL • Indicizzazione di risorse Internet Azalea Consultazione della traduzione www.iss.it/sitp/mesh Inserimento di un termine di ricerca Risultato della ricerca Ricerca attraverso la struttura ad albero Il progetto SIBIL www.sibil.iss.it Il progetto SIBIL (Sistema Informativo Integrato per la Bioetica In Linea), è stato realizzato allo scopo di fornire una panoramica esauriente ed aggiornata dei diversi canali d'informazione e formazione documentazione bibliografica, siti internet, corsi, convegni, notizie dai mass media - sulla bioetica. Contiene al suo interno la omonima base di dati che indicizza la letteratura italiana sull'argomento, a partire dal 1995, utilizzando a tale scopo il Thesaurus Italiano di Bioetica, sulla base di analoghe esperienze americane ed europee. Pagina iniziale della base di dati SIBIL www.bioetica.iss.it Esempio di record – articolo di rivista Thesaurus Italiano di Bioetica (TIB) • • • E’ lo strumento di indicizzazione e di interrogazione della base di dati SIBIL E’ costruito in base alla norma UNI ISO 2788/1993 (Linee guida per la costruzione e lo sviluppo di thesauri monolingue) E’ accessibile all’indirizzo www.sibil.iss.it Thesaurus TIB in italiano Thesaurus TIB italiano-inglese