ISFOL – Chiara Carlucci 10 marzo 2009
Seminario Refernet
• Non è un dizionario
– raccolta delle parole di una determinata lingua
disposta secondo un certo criterio e accompagnata
generalmente dalla definizione del significato delle
parole stesse (LUI, vol. VI).
• Non è un glossario
– raccolta di vocaboli registrati in genere in ordine
alfabetico e seguiti dalla dichiarazione del significato
o da altre osservazion (LUI, vol. IX).
• Non è un lessico
– vocabolario che registra alfabeticamente le parole
di una lingua dando di ciascuna la spiegazione […]
si usa preferibilmente per indicare vocabolari di
lingue antiche (LUI, vol. XII).
• Non è un vocabolario
– libro che raccoglie in ordine alfabetico definizioni
ed esempi dei vocaboli di una lingua o traduce le
parole di una lingua nelle corrispondenti di
un’altra (LUI, vol. XXIV).
• Non è un soggettario
– elenco alfabetico dei termini e dei relativi richiami
e rinvii proposti come intestazione standard di
soggetto ritenuti concettualmente e
linguisticamente più idonei a esprimere il
contenuto di un documento.
• Il thesaurus è un thesaurus
– vocabolario controllato e dinamico di termini
correlati semanticamente da usarsi come strumento
per il controllo terminologico all’interno di un
dominio specifico della conoscenza in fase di
traduzione dal linguaggio naturale in linguaggio
sistematico (Unesco, 1976)
Il thesaurus è "un vocabolario di un linguaggio
di indicizzazione controllato in maniera
formalizzata in modo che le relazioni a priori
tra i concetti sono rese esplicite" (ISO 27881986)
In un linguaggio controllato ogni termine deve
avere un rapporto biunivoco con il concetto
che rappresenta, è necessario operare il
controllo degli omografi e dei polisemi, cioè
di quei termini rappresentati dallo stesso segno
grafico o che possono avere più di un
significato, attraverso la tecnica della
disambiguazione
Il criterio usato per la scelta del singolare o
plurale di un termine è il principio della
numerabilità. Tale principio prevede l’uso del
plurale per i termini numerabili che rispondono
alla domanda “quanti?” e l’uso del singolare
per i termini non numerabili che rispondono
alla domanda “quanto?”
Per la scelta dei termini semplici o composti sono state
seguite le indicazioni fornite dalla norma ISO 2788.
Tale scelta deriva dalla presenza nel linguaggio
naturale di termini composti per esprimere concetti
complessi e dalla necessità di decidere se tali termini
devono essere ammessi nel vocabolario, oppure
devono essere rappresentati dalla combinazione di
termini singoli indipendenti.
• Le note definitorie vengono usate per quei termini di
ambito tecnico e settoriale così specifico da rendere
necessario una definizione del loro significato
• Le note d’ambito sono usate per indicare con quale
significato il termine è stato inserito nel vocabolario o
per fornire indicazioni sull’uso del termine
- relazioni semantiche definite a priori
- rapporti di significato espliciti tra i concetti
mediante l’indicazione di legami formalizzati tra i
termini corrispondenti
- struttura classificatoria
- recupero dell’informazione
- implementazione coerente della terminologia
Ognuna di queste relazioni è considerata reciproca: il
thesaurus crea automaticamente le relazioni
reciproche tra i termini, costituendo una rete che
permette di visualizzare per ogni termine l’insieme di
tutti i termini collegati, di navigare tra questi e, infine,
di accedere al vocabolario da un termine non preferito
a uno preferito. Tali relazioni sono indicate
convenzionalmente da un sistema di simboli.
Modello simbolico a tre relazioni
– Sinonimica (o di equivalenza)
– Gerarchica
– Associativa
La relazione di equivalenza si ha quando due o più
termini hanno lo stesso significato; i termini
equivalenti formano il gruppo di equivalenza
all’interno del quale solo un termine è quello
preferito, mentre tutti gli altri sono termini non
preferiti. Questa relazione è reciproca e viene
espressa convenzionalmente con USE, che rimanda
dal termine non preferito a quello preferito e UF che
indica i termini non preferiti.
Modello simbolico a tre relazioni
– Sinonimica (o di equivalenza)
– Gerarchica
– Associativa
Le relazioni gerarchiche individuano le classi in base a criteri
classificatori formando una struttura in cui due termini sono
legati reciprocamente secondo un rapporto di inclusione, che
va dal termine più generale (BT) che rappresenta una classe o
un insieme, al termine più specifico (NT) che rappresenta una
parte o un membro di quella classe.
•
Relazione di genere
Stabilisce una relazione tra un genere e le sue
specie (“tutti e alcuni”)
•
Relazione parte-tutto
Stabilisce la relazione tra un intero e le sue parti ed
è ammessa solo in quattro casi: il corpo umano, le
località geografiche, le discipline e le strutture
sociali gerarchiche.
Modello simbolico a tre relazioni
– Sinonimica (o di equivalenza)
– Gerarchica
– Associativa
La relazione associativa (RT) lega termini che
appartengono a categorie diverse. Sinora
considerata residuale rispetto alle prime due
grazie alla dimensione web riceve nuovo
impulso
I principi di classificazione si dividono in :
– Gerarchici (ad albero)
– Multidimensionali (a faccette)
Nei sistemi gerarchici ogni elemento è inserito all’interno di
un’unica categoria. Gli elementi hanno una collocazione
corretta e univoca in uno schema ampio e gerarchicamente
profondo, che può essere reso attraverso un percorso “padre” “figlio”
In un sistema di classificazione multidimensionale ai
singoli elementi viene associata una serie di
caratteristiche che lo identificano da vari punti di vista.
Attraverso la selezione di alcune caratteristiche
all’utente viene restituito l’elemento o il gruppo di
elementi (classe) ricercato.
La logica multidimensionale delle faccette è
molto più familiare di quanto non si pensi, ha
per esempio trovato larga diffusione
soprattutto nei siti di e-commerce perché ideale
nella trattazione del prodotto mediante più
punti di vista o esigenze. Per esempio in Yoox
dove il prodotto appartiene a diverse categorie
contemporaneamente.
abito corto grigio dello stilista
XYZ, taglia M. In base a
queste caratteristiche il
prodotto si troverà nell’insieme
“abiti femminili”, sottoinsieme
“primavera-estate”. Farà
contemporaneamente parte
dell’insieme “vestiti corti” e di
quello “abiti grigi dello stilista
XYZ”. Infine tornerà in uno
degli insiemi che raggruppa i
prodotti per fasce di prezzo,
nella categoria “Ultimi arrivi” e
così via. Lo stesso prodotto è
presente in più pagine, in base
a caratteristiche che
rappresentano ciascuna una
“faccetta” di quel capo
d’abbigliamento, pur senza
essere stato moltiplicato tante
volte quante può comparire
I thesauri sono strumenti operativi utilizzati per
reperire documenti in base al loro contenuto
semantico
→ I thesauri devono essere proposti agli utenti
per identificare il loro bisogni informativi
I thesauri offrono un riferimento concettuale per
comprendere la realtà
attraverso presentazioni grafiche che ne
salvaguardino la specificità
dal cartaceo all’elettronico → livello repertoriale
ricerca in sistemi di informazioni strutturate → OPAC
ricerca in sistemi
di informazioni
non strutturate →
web
ricerca in sistemi
di informazioni
non strutturate →
web
• Indicizzazione nel web
– Bibliotecario “dall’alto”
– Autore “dal centro”
– Lettore “dal basso”
•Adattamento al contesto digitale per dimostrare la loro
versatilità
•Apertura all’interoperabilità perché il contesto informatico non
è solo un ambiente operativo ma un criterio organizzativo
•Integrazione con gli altri strumenti del recupero
dell’informazione
•Ottimizzazione economica
•Information retrieval in ambito web
e
- Metodo induttivo
- Modello classificatorio del Cedefop
Basic VET vocabulary
Training, Education, Learning, Information and
Work and labour environment
Labour, enterprise, occupations
Socioeconomic environment
Economic activities
Economy
Administration
comunication
ISFOL – Chiara Carlucci 10 marzo 2009
Seminario Refernet
Scarica

Carlucci_Thesaurus