GEOREF
American Geological Institute (AGI)
OvidSP new version (ver.3)
a cura di Anna Sala
Biblioteca di Scienze della Terra “A. Desio”
[email protected]
ALCUNE INFORMAZIONI

Banca dati costituita nel 1966 dall’American Geological Institute

Aggiornamento mensile di circa 5.000 record

Vengono aggiunti ogni anno più di 100.000 riferimenti bibliografici (per un totale di oltre 3 milioni di
record) tratte da 3.500 riviste in 40 lingue diverse

Contiene riferimenti ad articoli, libri, mappe, conference papers, reports, “letteratura grigia”, tesi di
laurea e di dottorato statunitensi e canadesi

La copertura cronologica per il Nord America parte dal 1669, per il resto del mondo dal 1933

Etichette tematiche (subjects headings) utilizzate nella BD:
Mineralogy and Crystallography; Geochemistry; Geochronology; Extraterrestrial geology; Petrology,
igneous and metamorphic; Petrology, sedimentary; Marine geology and oceanography; Paleontology,
general studies of both fossil plants and animals; Paleontology, paleobotany; Paleontology,
invertebrate; Paleontology, vertebrate; Stratigraphy, historical geology and paleoecology; Areal
geology, general; Areal geology, maps and charts; Miscellaneous and mathematical geology;
Structural geology; Geophysics, general; Geophysics, solid-Earth; Geophysics, seismology;
Geophysics, applied Hydrogeology and hydrology; Environmental geology; Surficial geology,
geomorphology; Surficial geology,Quaternary geology; Surficial geology, soils; Economic geology,
general--geology of deposits; Economic geology of metal ore deposits; Economic geology of nonmetal deposits; Economic geology of energy sources; Engineering geology
LE BANCHE DATI

Le Banche Dati sono archivi digitali costituiti da un insieme di dati in formato
elettronico organizzati e strutturati in maniera tale da rendere possibile il recupero
dell’informazione tramite la loro interrogazione.
Le BD si possono dividere in:

1) BD bibliografiche o di riferimento, (come Georef) così dette perché contengono
solo riferimenti bibliografici o al massimo abstract, ma non i documenti primari per
intero;

2) BD a testo pieno o fattuali, le sole che permettono di arrivare al testo completo
dei documenti trovati (interi articoli di periodici, collezioni di testi, scritti di un autore...).
Questa distinzione si sta facendo però sempre più sfumata perché, grazie alle
potenzialità ipertestuali degli ambienti elettronici è possibile arrivare ai testi completi
anche a partire da BD che inizialmente fornivano solo citazioni bibliografiche o
abstract.
Nel caso di Georef questo avviene grazie a SFX, uno strumento che permette di
recuperare il documento primario a partire dalla citazione bibliografica rintracciata
sulla BD e di accedere ai servizi aggiuntivi disponibili per il reperimento dello stesso
tramite document delivery.
OTTIMIZZARE LA RICERCA
Quando si effettua una ricerca si ha in genere in mente un argomento o
una o più parole chiave (che si presume compaiano nei risultati). Le parole
vengono quindi inserite nella maschera di ricerca con termini del linguaggio
naturale il più delle volte traducendoli nella lingua della BD (quasi sempre
l’inglese). I risultati possono però essere insoddisfacenti perché:



non si hanno risposte o se ne hanno troppo poche;
si hanno troppe risposte, fra le quali è impossibile scegliere;
le risposte non sono pertinenti alla ricerca.
E’ quindi importante conoscere come i riferimenti bibliografici sono immessi
nelle banche dati e in che modo vengono recuperati in fase di ricerca.
STRUMENTI DI RICERCA
1.
Campi
2.
Thesaurus (proprio di ciascuna BD)
3.
Operatori Booleani (AND,OR, NOT ecc.)
4.
Sintassi
(costituiscono il record)
1. CAMPI
Caratteristica comune delle BD è l’unità descrittiva dei documenti: il
record, ognuno dei quali corrisponde ad un riferimento bibliografico.
I record sono strutturati in campi contraddistinti da etichette (o tag).
I campi, identificando univocamente le parti del record, permettono il
recupero puntuale delle informazioni; in fase di ricerca vanno quindi
specificati di seguito alla parola chiave (attraverso uno speciale
carattere) per limitare l’indagine.
In Georef esiste poi una specifica funzione di Search Field pensata
proprio per questo tipo di ricerca.
RECORD E CAMPI
Accession Number
Book Title
Book Author
Book Author
1998-000132
Neogene evolution of the Northern Apennines on the Po Valley side.
Gasperi Gianfranco; Gelati Romano; Papani Giovanni.
Institution Istituto di Geologia, Modena, ITA, Italy; Dipartimento di Scienze della
Terra
Source
Pubblicazione Dipartimento de Scienze della Terra dell'Universita degli Studi Milano
Sezione di Geologia e Paleontologia Nuova Serie. 511; 1986.
Universita degli Studi Milano. Dipartimento de Scienze della Terra. Sezione di
Geologia e Paleontologia, [Milan], Italy. Pages: 9.
9
Italy
1986
English
Italian
Publisher
Total Pages
Country of Publication
Year
Language
Language of Summary
Subject Heading
Apennines. Cenozoic. diachronism. displacements. Europe. faults. Italy. Neogene. Northern
Apennines. plate tectonics. Po Valley. Southern Europe. tectonics. Tertiary. transverse faults
Classification Code
Publication
Bibliographic Level
Annotation
Reference Source
Coden
Update Code
16 Structural geology
TypeSerial
Monograph
Reprinted from Giornale di Geologia, Vol. 48, No. 1-2, 1986; presented at the Interim
colloquium on Paleogeography and geodynamics of the Perityrrhenian area,
Florence, Oct. 15-17, 1984 IllustrationRef: 24 sects., geol. sketch map
GeoRef, Copyright 2008, American Geological Institute.
#03456
199801
UNIT RECORD
Campo Issn
Tag.= IS
International
Standard
Serial
Number
Campo Title
Tag.= Ti
Titolo del lavoro in inglese
2. THESAURUS: COS’ E’?

Il Thesaurus è un dizionario di parole chiave, all’interno del quale un concetto
viene sempre ricondotto ad un unico termine.

Ogni record della BD viene indicizzato attraverso voci scelte dal Thesaurus.
Indicizzare significa descrivere un documento in forma di indici strutturati e
coordinati di tipo nominale, relative cioè alle persone, o semantico, relativo al
contenuto del documento.
Ogni termine risulta legato a più record.

E’ lo strumento migliore per effettuare una ricerca perché, essendo uno
strumento di controllo del vocabolario, identifica in maniera univoca un
concetto indipendentemente dalle varianti linguistiche che gli autori possono
utilizzare per esprimerlo e recupera tutte le varianti che possono essere
utilizzate nel linguaggio naturale (singolare/plurale, sinonimi ecc.).

Essendo specifico per ogni banca dati prevede, per essere utilizzato, la
selezione dei database presenti sulla piattaforma OVID SP.
A COSA SERVE?

A ridurre le dimensioni del vocabolario e a controllare la varietà del linguaggio
naturale;

A evitare la dispersione delle informazioni in base all’ordine alfabetico
mediante la costruzione di relazioni che raccolgono i concetti per mezzo di
criteri classificatori;

A permettere, a chi fa ricerca, di vedere la struttura del linguaggio e quindi di
poter accedere ai record da qualunque punto della struttura e poter
raggiungere le informazioni mediante il reticolo delle relazioni.
TIPI DI THESAURUS

FLAT (thesaurus piano)

HIERARCHICAL (con struttura ad albero o classificato). E’ il caso di Georef.

GRAPHIC (bidimensionale o tridimensionale)
HIERARCHICAL THESAURUS
(utilizzato in Georef)




Termine sovraordinato, più generale (broader terms)
Termine sottordinato, più specifico (narrower terms)
Termine collegato, associato (related terms)
Sinonimi, varianti
3. OPERATORI BOOLEANI
COSA SONO?
Connettori logici usati nell’algebra booleana che nelle BD vengono interpretati come comandi.
AND: esprime il prodotto logico, cioè l'intersezione tra due insiemi, si recuperano solo i documenti
che contengono entrambi i termini di ricerca.
Es: La ricerca “Desio AND Alps" fornirà come risultato l'elenco dei record relativi a lavori di Ardito Desio sulle Alpi.
OR: esprime la somma logica, si recuperano solo i documenti indicizzati con almeno uno dei
concetti indicati.
Es: La ricerca “Australia OR Nuova Zelanda" fornirà” come risultato l'elenco dei record sull’Australia o la Nuova
Zelanda.
NOT: esprime la differenza logica, l'esclusione di un concetto.
Da usare quando si vuole limitare la ricerca eliminando i documenti non pertinenti (ma attenzione a
non escludere citazioni potenzialmente utili !).
Nella ricerca per campi con questo operatore è d’obbligo racchiudere l’intera stringa tra parentesi.
Verrà altrimenti ricercato il primo termine contemporaneamente in una molteplicità di campi, e il
secondo termine solo nel campo selezionato.
Es: La ricerca “Oil NOT Gas " fornirà come risultato l'elenco dei record riguardanti i giacimenti di olio ma non il gas
naturale.
FREQ : consente di recuperare solo record nei quali, in un dato campo, il termine
da noi inserito compare almeno N volte (in genere i risultati che contengono più volte
il termine ricercato dovrebbero essere più rilevanti ai fini della ricerca).
Utile quando si cerca in campi Full-text e con il linguaggio naturale.
Sintassi: term.xy/freq=n (dove per xy si intende il campo di ricerca)
Es.: Himalaya.ab/freq=5 (ab= campo abstract)
ADJ: operatore “posizionale”, consente di recuperare i record che contengono un
dato termine A vicino ad un termine B (in qualsiasi ordine).
Es.: (sedimentary adj rocks).titl.
ADJn: consente di recuperare i record che contengono un dato termine A vicino ad
un termine B con N termini interposti, in qualsiasi ordine, in una frase o paragrafo.
L’operatore ADJn non conta le “stop words” (lista di parole che ignora quando esegue
la ricerca).
E’ necessario sapere se la BD utilizza le stop words; se non le usa, significa che non
le conta e si può ridurre il numero di termini da escludere.
Es.: (carrara adj2 marble).titl.
4. SINTASSI

Le parole chiave contemplate dal Thesaurus e quindi utili per la
ricerca nella BD sono in inglese. I record in altre lingue sono
indicizzati in inglese (oltre che con il titolo originale) con la traduzione
del titolo e dell’eventuale abstract.

Possono essere stabilite precedenze tra i termini mediante l’uso di
parentesi tonde per costruire gruppi di sinonimi e combinarli con gli
operatori booleani.

Nella funzione di basic search è necessario utilizzare il linguaggio
naturale in inglese.

Non si possono utilizzare accenti e segni diacritici (ä, ĝ ecc.) il
sistema infatti è americano e pertanto non vengono riconosciuti.

Omettere le stop words (articoli, preposizioni, congiunzioni ecc.), che
sono inutili ai fini della ricerca.
CARATTERI JOLLY

*, $ (carattere di troncamento illimitato), sostituisce zero o più caratteri alla fine o
all’interno di una parola. Recupera tutti i termini con la radice selezionata. Usare con
cautela, può recuperare troppi risultati.
Es.: Geo$= geological, geographical, geophisical, geologist, geophisics ecc.

$n (carattere di troncamento limitato), sostituisce fino a n caratteri
Es.: $4= paleontolog$= paleontology, paleontologist, paleontological ecc.

# all’interno o alla fine di una parola sostituisce un carattere (es. H#drocarbon).
Questo comando permette di recuperare forme speciali di plurale. Se è usato come ultima
lettera recupera solo la versione plurale.

? all’interno o alla fine di una parola sostituisce 0 o più caratteri
Es. Lit?ic

“ “ delimitano una stringa che contiene numeri
Es.: “333”.pg

. Dopo un termine da cercare introduce uno o più simboli di campi, se più di uno si
separano con una virgola
Es.: marble.ti,.bk
SVILUPPO DI UNA STRATEGIA DI RICERCA
•
•
OPZIONI DELLA MODALITA’ DI RICERCA
SEARCH HISTORY BOX E COMBINAZIONE DI SET DI RISULTATI
Logged in as anna sala at Università Milano
My Account
Help
Logoff
FILTRI (LIMITS)
E’ possibile utilizzare limiti per restringere i risultati della ricerca
ma anche selezionarli per personalizzare la Main search page di
default.
ADVANCED SEARCH

Consente di ricercare nei campi più comunemente usati: Keyword campo di ricerca di default,
Author, Title, Journal name.

Consente l’utilizzo degli operatori booleani.

Consente l’utilizzo della command-line sintax.

Keyword (.mp) : ricerca per parole, è utile per una ricerca generale per argomento, ricerca in:
abstract, author, book author, book title, corporate author, collection authors, collection title,
corporate author word, heading word, subject heading, title, year.
Non è possibile inserire 2 termini senza AND.
Se la funzione di ricerca attraverso Map term to subject heading è disponibile (è necessario
selezionare i database corrispondenti ai vari range cronologici di Georef) questa ci “suggerisce” un
vocabolario controllato di termini. Cliccando sul termine si raggiunge il tesauro con l’odinamento
alfabetico dei termini messi in relazione tra di loro.

Author: inserendo cognome, spazio e prima iniziale del nome (se conosciuta) si apre la
schermata di ricerca per campi.
Se non conosciamo il nome il comando recupererà tutti gli autori, in ordine alfabetico, a partire dal
cognome inserito.

Title: ricerca per parole o frasi del titolo del contributo.

Journal name: ricerca mediante la parte iniziale del titolo del periodico senza utilizzare
troncamenti; si aprirà la schermata di ricerca per campi.
BASIC SEARCH

Funzione utile quando non si sa nulla o quasi dell’argomento ma può
recuperare troppi risultati e creare confusione.

Fa uso dell’elaborazione in linguaggio naturale (NPL) e ordina i risultati in
base alla pertinenza (relevancy) alla domanda che li ha prodotti. L’algoritmo
proprietario di elaborazione in linguaggio naturale visualizza i risultati in base
a 5 criteri ordinandoli con stelline.

E’ possibile inserire una domanda o una locuzione completa in inglese;

Non è possibile usare gli operatori booleani;

È possibile includere i related terms. Il sistema farà una serie di ricerche per
includere sinonimi, plurali, varianti di spelling (questi saranno segnalati in
violetto).

E’ possibile fare copia e incolla di titolo da Internet;

Non è utile inserire nella linea di comando un solo termine, si avranno
troppi risultati e, ovviamente, tutti con la stessa rilevanza.
RELEVANCE RANKING
Come viene calcolata?
L’ordinamento dei risultati in base alla rilevanza si ottiene soltanto nella funzione di basic search.
Di default, OVID SP mostra i record di maggiore rilevanza nelle prime posizioni della schermata dei
risultati,visualizzando tramite stelline il grado di aderenza di ogni record ai termini immessi per la
ricerca.
*****
****
***
**
*
Tutti i concetti coinvolti nella ricerca sono presenti e completi
Tutti i concetti coinvolti nella ricerca sono presenti, ma alcuni sono incompleti
Uno dei concetti risulta mancante dal record
Due dei concetti risultano mancanti del record
Più di due concetti coinvolti nella ricerca risultano mancanti dal record
OVID SP dispone i record nella schermata dei risultati basandosi sui seguenti criteri
Quantità: Numero di concetti coinvolti nella ricerca presenti nel record
Frequenza: Ricorrenza dei concetti all’interno del record
Importanza: Rarità di riscontro dei termini impiegati per la ricerca nel complesso della BD
Coesione: Grado di vicinanza reciproca nel record dei termini impiegati per la ricerca
Aderenza verbale: Grado di identità dei termini contenuti nel record con quelli impiegati per la ricerca (la BD svolge le
ricerche anche utilizzando varianti e sinonimi dei termini immessi)
SEARCH TOOLS




Funzione che effettua la ricerca nel vocabolario della banca dati.
Aiuta a scoprire i rapporti tra i termini o gli argomenti presenti nella BD.
Per utilizzarli è necessario immettere un termine o una frase e selezionare
uno strumento nel menu’ a tendina.
Questi strumenti variano da una banca dati all'altra.
Georef mette a disposizione:



Map Term: (Associa termine) suggerisce, associa argomenti all'interno del
vocabolario della BD;
Tesauro: visualizza un termine o gruppo di termini all’interno di una struttura
gerarchica di contesti basati sul vocabolario controllato della BD;
Permuted Index (Indice permutato): permette di immettere un singolo
termine e visualizza un indice di termini composti che comprendono il
termine oltre a termini associati "vedi" e "vedi correlato“ (sempre basati sul
vocabolario controllato della BD).
GESTIONE DEI RISULTATI DELLA RICERCA
I risultati delle ricerche, previa selezione, possono essere:
• STAMPATI
• INVIATI VIA MAIL
• ESPORTATI in vari formati e gestiti con un bibliographic manager
• SALVATI NELL’AREA MY PROJECTS
Keep Selected: permette di visualizzare solo i record spuntati.
MY WORKSPACE
My workspace è un’area storage strutturata che contiene progetti e cartelle
in cui è possibile salvare testi, risultati, citazioni, grafici ecc.
Per utilizzarla è necessario innanzitutto loggarsi.
Offre le stesse opzioni di esportazione dei dati presenti nella pagina di ricerca
principale e la possibilità di rimuovere le voci salvate.
STRUMENTI DI INFORMAZIONE
ALL’UTENTE (ALERT)
Salvare le istruzioni di ricerca utilizzando Save, AutoAlerts o RSS.
E’ possibile:



salvare gruppi di criteri di ricerca spuntando i box del record e il Salva selezionato,
salvare la cronologia di ricerca attuale con il pulsante Salva cronologia o con RSS,
salvare le ricerche in modo temporaneo o permanente, come AutoAlert (SDI) o in
My Projects con diverse opzioni e impostazioni.
Gli AutoAlert sono ricerche automatizzate che avvisano (via email o RSS) quando nella
BD vengono aggiunti nuovi record che corrispondono ai criteri di ricerca salvati.
E’ possibile personalizzare gli AutoAlert con varie opzioni per: programma di consegna,
tipo di rapporto, per campi, formato dei risultati ecc.
Per avviare, cancellare o copiare una cronologia di ricerca o un AutoAlert salvati in
precedenza è necessario selezionare il collegamento Saved Searches & Alerts in My
Workspace sulla Barra principale di navigazione.
ESERCIZI
Completa le seguenti citazioni usando la ricerca per campi o la sintassi:

Pyroclastic floe transport mechanisms. Book author: Rosi Mauro, Freundt Armin

Farabegoli, E., Onorevoli, G., Ruffino, C., Costantini, B. (1997).

The 1944 eruption of Vesuvius, Italy: combining contemporary accounts and field studies…
***********************************************************************************************************************

Cerca (con l’uso degli operatori booleani) libri sui foraminiferi bentonici escludendo quelli
plantonici.

Salva in My project i risultati di alcune ricerche e imposta un Alert.

Ricerca, con l’uso della sintassi e l’operatore di frequenza, i record nei quali la Daonella compare
almeno 4 volte nell’abstract.

Ricerca, con l’uso della sintassi e l’operatore di adiacenza, materiale sul “calcare di Moltrasio”
Scarica

Georef (versione in ppt)