Sistemi per l’elaborazione
dell’informazione
Maria Teresa Pazienza
DISP - Dipartimento di Informatica, Sistemi e Produzione
aa. 2008-09
La terminologia in medicina
I dizionari di termini medici e/o sanitari sono
raccolte organiche di definizioni di termini
(loro significato) all’interno di un dominio o
sottodominio medico realizzati da esperti e
controllati da una comunità di riferimento.
Consentono che due interlocutori associno
ad uno stesso termine il medesimo
significato
Dizionari terminologici
Consentire la condivisione del significato di un
termine (parola, sigla, espressione
terminologica,…) in un contesto specifico
all’interno di una lingua od anche di un “gergo”
tecnico.
Dipendenza temporale del significato dei termini.
Strutturazione (in genere gerarchica/ad albero)
Rapporto termine/concetto
Dizionari terminologici
Dimensioni, struttura, organicità, livello
di dettaglio, … sono funzioni del settore
di interesse
Dizionario di base (evocatore di
conoscenza pregressa)
Dizionari specialistici (di settore)
Thesaurus
Repertorio di termini connessi da relazioni
relative ad uno specifico settore di
conoscenza
Struttura gerarchica
Termini / concetti
Il termine è uno dei modi in cui si può esprimere
un concetto
Un concetto ha una descrizione con
proprietà ed attributi (ognuno con valori
specifici)
Es: Farmaco
Farmaco attivo, scaduto, efficace, generico,
per l’emicrania, ...
Istanze di un concetto
Identificatori
Codici strutturati che identificano termini
complessi (in medicina spesso chiamati
concetti)
Il progetto Unified Medical
Language System (UMLS)
http://www.nlm.nih.gov/research/umls
Unified Medical Language System
• Progetto per lo sviluppo di sistemi automatici
in grado di comprendere il significato del
linguaggio medico
• Il Metathesaurus è un vocabolario
multilingue che raccoglie oltre due milioni di
termini e dodici milioni di relazioni
• La traduzione italiana dei MeSH (medical
subject headings) partecipa al progetto
UMLS
About the UMLS® Resources
The purpose of Unified Medical Language System®
(UMLS) is to facilitate the development of computer
systems that behave as if they "understand" the
meaning of the language of biomedicine and health.
UMLS Knowledge Sources (databases and programs)
for use by system developers in building information
systems that create, process, retrieve, integrate,
and/or aggregate biomedical and health data and
information, as well as in informatics research. By
design, the UMLS Knowledge Sources are multipurpose.
About the UMLS® Resources
There are three UMLS Knowledge Sources:
1. the Metathesaurus®,
2. the Semantic Network,
3. the SPECIALIST Lexicon.
Metathesaurus
Is a
• very large,
• multi-purpose,
• multi-lingual vocabulary database
that contains information about
• biomedical and health related concepts,
• their various names,
• the relationships among them
Metathesaurus
It is organized by concept or meaning.
In essence, its purpose is to link alternative names and
views of the same concept together and to identify
useful relationships between different concepts.
All concepts in the Metathesaurus are assigned to at
least one semantic type from the Semantic Network.
This provides consistent categorization of all
concepts in the Metathesaurus at the relatively
general level represented in the Semantic Network.
Semantic Network
The purpose of the Semantic Network is to provide:
1) a consistent categorization of all concepts represented in
the UMLS Metathesaurus
2) a set of useful relationships between these concepts.
All information about specific concepts is found in the
Metathesaurus; the Network provides information about the
set of basic semantic types, or categories, which may be
assigned to these concepts, and it defines the set of
relationships that may hold between the semantic types. The
Network defines these types, both with textual descriptions
and by means of the information inherent in its hierarchies.
Semantic Network
The semantic types are the nodes in the Network, and the
relationships between them are the links.
There are major groupings of semantic types for
• organisms,
• anatomical structures,
• biologic function,
• chemicals,
• events,
• physical objects,
• concepts or ideas.
SPECIALIST Lexicon
The SPECIALIST Lexicon has been developed to provide the
lexical information needed for the SPECIALIST Natural
Language Processing System (NLP).
It is intended to be a general English lexicon that includes
many biomedical terms. Coverage includes both commonly
occurring English words and biomedical vocabulary. The
lexicon entry for each word or term records the syntactic,
morphological, and orthographic information needed by the
SPECIALIST NLP System.
La traduzione italiana dei
MeSH: tappe principali (1)
• 1997 Download dei dati dal sito della NLM e
sviluppo in-house di un database Access
• 1998 Inizio del lavoro di traduzione delle
categorie A (Anatomia) e C (Malattie)
• 1999-2001 Completamento della traduzione
e invio annuale dei dati alla National Library
of Medicine
La traduzione italiana dei
MeSH: tappe principali (2)
• 1999- Aggiornamento annuale dei dati
• 2000 Inserimento della traduzione nel
Metathesaurus (UMLS)
• 2004 Creazione di un sito Web dedicato
all’utenza italiana
www.iss.it/sitp/mesh
Applicazioni della traduzione
• ISS - Soggettazione Biblioteca
• ISS - Relazione annuale delle attività
istituzionali
• ISS - Database delle pubblicazioni
• ISS - Siti web PIRAMIDE e SIBIL
• Indicizzazione di risorse Internet
Azalea
Consultazione della traduzione
www.iss.it/sitp/mesh
Inserimento di un termine di
ricerca
Risultato della ricerca
Ricerca attraverso la struttura
ad albero
Il progetto SIBIL www.sibil.iss.it
Il progetto SIBIL (Sistema Informativo Integrato per la
Bioetica In Linea), è stato realizzato allo scopo di
fornire una panoramica esauriente ed aggiornata dei
diversi canali d'informazione e formazione documentazione bibliografica, siti internet, corsi,
convegni, notizie dai mass media - sulla bioetica.
Contiene al suo interno la omonima base di dati che
indicizza la letteratura italiana sull'argomento, a partire
dal 1995, utilizzando a tale scopo il Thesaurus Italiano
di Bioetica, sulla base di analoghe esperienze
americane ed europee.
Pagina iniziale della base di dati SIBIL
www.bioetica.iss.it
Esempio di record – articolo di
rivista
Thesaurus Italiano di Bioetica (TIB)
•
•
•
E’ lo strumento di indicizzazione e di interrogazione della base di
dati SIBIL
E’ costruito in base alla norma UNI ISO 2788/1993 (Linee guida
per la costruzione e lo sviluppo di thesauri monolingue)
E’ accessibile all’indirizzo www.sibil.iss.it
Thesaurus TIB in italiano
Thesaurus TIB italiano-inglese
Scarica

lezione3