ISFOL – Chiara Carlucci 10 marzo 2009 Seminario Refernet • Non è un dizionario – raccolta delle parole di una determinata lingua disposta secondo un certo criterio e accompagnata generalmente dalla definizione del significato delle parole stesse (LUI, vol. VI). • Non è un glossario – raccolta di vocaboli registrati in genere in ordine alfabetico e seguiti dalla dichiarazione del significato o da altre osservazion (LUI, vol. IX). • Non è un lessico – vocabolario che registra alfabeticamente le parole di una lingua dando di ciascuna la spiegazione […] si usa preferibilmente per indicare vocabolari di lingue antiche (LUI, vol. XII). • Non è un vocabolario – libro che raccoglie in ordine alfabetico definizioni ed esempi dei vocaboli di una lingua o traduce le parole di una lingua nelle corrispondenti di un’altra (LUI, vol. XXIV). • Non è un soggettario – elenco alfabetico dei termini e dei relativi richiami e rinvii proposti come intestazione standard di soggetto ritenuti concettualmente e linguisticamente più idonei a esprimere il contenuto di un documento. • Il thesaurus è un thesaurus – vocabolario controllato e dinamico di termini correlati semanticamente da usarsi come strumento per il controllo terminologico all’interno di un dominio specifico della conoscenza in fase di traduzione dal linguaggio naturale in linguaggio sistematico (Unesco, 1976) Il thesaurus è "un vocabolario di un linguaggio di indicizzazione controllato in maniera formalizzata in modo che le relazioni a priori tra i concetti sono rese esplicite" (ISO 27881986) In un linguaggio controllato ogni termine deve avere un rapporto biunivoco con il concetto che rappresenta, è necessario operare il controllo degli omografi e dei polisemi, cioè di quei termini rappresentati dallo stesso segno grafico o che possono avere più di un significato, attraverso la tecnica della disambiguazione Il criterio usato per la scelta del singolare o plurale di un termine è il principio della numerabilità. Tale principio prevede l’uso del plurale per i termini numerabili che rispondono alla domanda “quanti?” e l’uso del singolare per i termini non numerabili che rispondono alla domanda “quanto?” Per la scelta dei termini semplici o composti sono state seguite le indicazioni fornite dalla norma ISO 2788. Tale scelta deriva dalla presenza nel linguaggio naturale di termini composti per esprimere concetti complessi e dalla necessità di decidere se tali termini devono essere ammessi nel vocabolario, oppure devono essere rappresentati dalla combinazione di termini singoli indipendenti. • Le note definitorie vengono usate per quei termini di ambito tecnico e settoriale così specifico da rendere necessario una definizione del loro significato • Le note d’ambito sono usate per indicare con quale significato il termine è stato inserito nel vocabolario o per fornire indicazioni sull’uso del termine - relazioni semantiche definite a priori - rapporti di significato espliciti tra i concetti mediante l’indicazione di legami formalizzati tra i termini corrispondenti - struttura classificatoria - recupero dell’informazione - implementazione coerente della terminologia Ognuna di queste relazioni è considerata reciproca: il thesaurus crea automaticamente le relazioni reciproche tra i termini, costituendo una rete che permette di visualizzare per ogni termine l’insieme di tutti i termini collegati, di navigare tra questi e, infine, di accedere al vocabolario da un termine non preferito a uno preferito. Tali relazioni sono indicate convenzionalmente da un sistema di simboli. Modello simbolico a tre relazioni – Sinonimica (o di equivalenza) – Gerarchica – Associativa La relazione di equivalenza si ha quando due o più termini hanno lo stesso significato; i termini equivalenti formano il gruppo di equivalenza all’interno del quale solo un termine è quello preferito, mentre tutti gli altri sono termini non preferiti. Questa relazione è reciproca e viene espressa convenzionalmente con USE, che rimanda dal termine non preferito a quello preferito e UF che indica i termini non preferiti. Modello simbolico a tre relazioni – Sinonimica (o di equivalenza) – Gerarchica – Associativa Le relazioni gerarchiche individuano le classi in base a criteri classificatori formando una struttura in cui due termini sono legati reciprocamente secondo un rapporto di inclusione, che va dal termine più generale (BT) che rappresenta una classe o un insieme, al termine più specifico (NT) che rappresenta una parte o un membro di quella classe. • Relazione di genere Stabilisce una relazione tra un genere e le sue specie (“tutti e alcuni”) • Relazione parte-tutto Stabilisce la relazione tra un intero e le sue parti ed è ammessa solo in quattro casi: il corpo umano, le località geografiche, le discipline e le strutture sociali gerarchiche. Modello simbolico a tre relazioni – Sinonimica (o di equivalenza) – Gerarchica – Associativa La relazione associativa (RT) lega termini che appartengono a categorie diverse. Sinora considerata residuale rispetto alle prime due grazie alla dimensione web riceve nuovo impulso I principi di classificazione si dividono in : – Gerarchici (ad albero) – Multidimensionali (a faccette) Nei sistemi gerarchici ogni elemento è inserito all’interno di un’unica categoria. Gli elementi hanno una collocazione corretta e univoca in uno schema ampio e gerarchicamente profondo, che può essere reso attraverso un percorso “padre” “figlio” In un sistema di classificazione multidimensionale ai singoli elementi viene associata una serie di caratteristiche che lo identificano da vari punti di vista. Attraverso la selezione di alcune caratteristiche all’utente viene restituito l’elemento o il gruppo di elementi (classe) ricercato. La logica multidimensionale delle faccette è molto più familiare di quanto non si pensi, ha per esempio trovato larga diffusione soprattutto nei siti di e-commerce perché ideale nella trattazione del prodotto mediante più punti di vista o esigenze. Per esempio in Yoox dove il prodotto appartiene a diverse categorie contemporaneamente. abito corto grigio dello stilista XYZ, taglia M. In base a queste caratteristiche il prodotto si troverà nell’insieme “abiti femminili”, sottoinsieme “primavera-estate”. Farà contemporaneamente parte dell’insieme “vestiti corti” e di quello “abiti grigi dello stilista XYZ”. Infine tornerà in uno degli insiemi che raggruppa i prodotti per fasce di prezzo, nella categoria “Ultimi arrivi” e così via. Lo stesso prodotto è presente in più pagine, in base a caratteristiche che rappresentano ciascuna una “faccetta” di quel capo d’abbigliamento, pur senza essere stato moltiplicato tante volte quante può comparire I thesauri sono strumenti operativi utilizzati per reperire documenti in base al loro contenuto semantico → I thesauri devono essere proposti agli utenti per identificare il loro bisogni informativi I thesauri offrono un riferimento concettuale per comprendere la realtà attraverso presentazioni grafiche che ne salvaguardino la specificità dal cartaceo all’elettronico → livello repertoriale ricerca in sistemi di informazioni strutturate → OPAC ricerca in sistemi di informazioni non strutturate → web ricerca in sistemi di informazioni non strutturate → web • Indicizzazione nel web – Bibliotecario “dall’alto” – Autore “dal centro” – Lettore “dal basso” •Adattamento al contesto digitale per dimostrare la loro versatilità •Apertura all’interoperabilità perché il contesto informatico non è solo un ambiente operativo ma un criterio organizzativo •Integrazione con gli altri strumenti del recupero dell’informazione •Ottimizzazione economica •Information retrieval in ambito web e - Metodo induttivo - Modello classificatorio del Cedefop Basic VET vocabulary Training, Education, Learning, Information and Work and labour environment Labour, enterprise, occupations Socioeconomic environment Economic activities Economy Administration comunication ISFOL – Chiara Carlucci 10 marzo 2009 Seminario Refernet