GEOREF American Geological Institute (AGI) OvidSP new version (ver.3) a cura di Anna Sala Biblioteca di Scienze della Terra “A. Desio” [email protected] ALCUNE INFORMAZIONI Banca dati costituita nel 1966 dall’American Geological Institute Aggiornamento mensile di circa 5.000 record Vengono aggiunti ogni anno più di 100.000 riferimenti bibliografici (per un totale di oltre 3 milioni di record) tratte da 3.500 riviste in 40 lingue diverse Contiene riferimenti ad articoli, libri, mappe, conference papers, reports, “letteratura grigia”, tesi di laurea e di dottorato statunitensi e canadesi La copertura cronologica per il Nord America parte dal 1669, per il resto del mondo dal 1933 Etichette tematiche (subjects headings) utilizzate nella BD: Mineralogy and Crystallography; Geochemistry; Geochronology; Extraterrestrial geology; Petrology, igneous and metamorphic; Petrology, sedimentary; Marine geology and oceanography; Paleontology, general studies of both fossil plants and animals; Paleontology, paleobotany; Paleontology, invertebrate; Paleontology, vertebrate; Stratigraphy, historical geology and paleoecology; Areal geology, general; Areal geology, maps and charts; Miscellaneous and mathematical geology; Structural geology; Geophysics, general; Geophysics, solid-Earth; Geophysics, seismology; Geophysics, applied Hydrogeology and hydrology; Environmental geology; Surficial geology, geomorphology; Surficial geology,Quaternary geology; Surficial geology, soils; Economic geology, general--geology of deposits; Economic geology of metal ore deposits; Economic geology of nonmetal deposits; Economic geology of energy sources; Engineering geology LE BANCHE DATI Le Banche Dati sono archivi digitali costituiti da un insieme di dati in formato elettronico organizzati e strutturati in maniera tale da rendere possibile il recupero dell’informazione tramite la loro interrogazione. Le BD si possono dividere in: 1) BD bibliografiche o di riferimento, (come Georef) così dette perché contengono solo riferimenti bibliografici o al massimo abstract, ma non i documenti primari per intero; 2) BD a testo pieno o fattuali, le sole che permettono di arrivare al testo completo dei documenti trovati (interi articoli di periodici, collezioni di testi, scritti di un autore...). Questa distinzione si sta facendo però sempre più sfumata perché, grazie alle potenzialità ipertestuali degli ambienti elettronici è possibile arrivare ai testi completi anche a partire da BD che inizialmente fornivano solo citazioni bibliografiche o abstract. Nel caso di Georef questo avviene grazie a SFX, uno strumento che permette di recuperare il documento primario a partire dalla citazione bibliografica rintracciata sulla BD e di accedere ai servizi aggiuntivi disponibili per il reperimento dello stesso tramite document delivery. OTTIMIZZARE LA RICERCA Quando si effettua una ricerca si ha in genere in mente un argomento o una o più parole chiave (che si presume compaiano nei risultati). Le parole vengono quindi inserite nella maschera di ricerca con termini del linguaggio naturale il più delle volte traducendoli nella lingua della BD (quasi sempre l’inglese). I risultati possono però essere insoddisfacenti perché: non si hanno risposte o se ne hanno troppo poche; si hanno troppe risposte, fra le quali è impossibile scegliere; le risposte non sono pertinenti alla ricerca. E’ quindi importante conoscere come i riferimenti bibliografici sono immessi nelle banche dati e in che modo vengono recuperati in fase di ricerca. STRUMENTI DI RICERCA 1. Campi 2. Thesaurus (proprio di ciascuna BD) 3. Operatori Booleani (AND,OR, NOT ecc.) 4. Sintassi (costituiscono il record) 1. CAMPI Caratteristica comune delle BD è l’unità descrittiva dei documenti: il record, ognuno dei quali corrisponde ad un riferimento bibliografico. I record sono strutturati in campi contraddistinti da etichette (o tag). I campi, identificando univocamente le parti del record, permettono il recupero puntuale delle informazioni; in fase di ricerca vanno quindi specificati di seguito alla parola chiave (attraverso uno speciale carattere) per limitare l’indagine. In Georef esiste poi una specifica funzione di Search Field pensata proprio per questo tipo di ricerca. RECORD E CAMPI Accession Number Book Title Book Author Book Author 1998-000132 Neogene evolution of the Northern Apennines on the Po Valley side. Gasperi Gianfranco; Gelati Romano; Papani Giovanni. Institution Istituto di Geologia, Modena, ITA, Italy; Dipartimento di Scienze della Terra Source Pubblicazione Dipartimento de Scienze della Terra dell'Universita degli Studi Milano Sezione di Geologia e Paleontologia Nuova Serie. 511; 1986. Universita degli Studi Milano. Dipartimento de Scienze della Terra. Sezione di Geologia e Paleontologia, [Milan], Italy. Pages: 9. 9 Italy 1986 English Italian Publisher Total Pages Country of Publication Year Language Language of Summary Subject Heading Apennines. Cenozoic. diachronism. displacements. Europe. faults. Italy. Neogene. Northern Apennines. plate tectonics. Po Valley. Southern Europe. tectonics. Tertiary. transverse faults Classification Code Publication Bibliographic Level Annotation Reference Source Coden Update Code 16 Structural geology TypeSerial Monograph Reprinted from Giornale di Geologia, Vol. 48, No. 1-2, 1986; presented at the Interim colloquium on Paleogeography and geodynamics of the Perityrrhenian area, Florence, Oct. 15-17, 1984 IllustrationRef: 24 sects., geol. sketch map GeoRef, Copyright 2008, American Geological Institute. #03456 199801 UNIT RECORD Campo Issn Tag.= IS International Standard Serial Number Campo Title Tag.= Ti Titolo del lavoro in inglese 2. THESAURUS: COS’ E’? Il Thesaurus è un dizionario di parole chiave, all’interno del quale un concetto viene sempre ricondotto ad un unico termine. Ogni record della BD viene indicizzato attraverso voci scelte dal Thesaurus. Indicizzare significa descrivere un documento in forma di indici strutturati e coordinati di tipo nominale, relative cioè alle persone, o semantico, relativo al contenuto del documento. Ogni termine risulta legato a più record. E’ lo strumento migliore per effettuare una ricerca perché, essendo uno strumento di controllo del vocabolario, identifica in maniera univoca un concetto indipendentemente dalle varianti linguistiche che gli autori possono utilizzare per esprimerlo e recupera tutte le varianti che possono essere utilizzate nel linguaggio naturale (singolare/plurale, sinonimi ecc.). Essendo specifico per ogni banca dati prevede, per essere utilizzato, la selezione dei database presenti sulla piattaforma OVID SP. A COSA SERVE? A ridurre le dimensioni del vocabolario e a controllare la varietà del linguaggio naturale; A evitare la dispersione delle informazioni in base all’ordine alfabetico mediante la costruzione di relazioni che raccolgono i concetti per mezzo di criteri classificatori; A permettere, a chi fa ricerca, di vedere la struttura del linguaggio e quindi di poter accedere ai record da qualunque punto della struttura e poter raggiungere le informazioni mediante il reticolo delle relazioni. TIPI DI THESAURUS FLAT (thesaurus piano) HIERARCHICAL (con struttura ad albero o classificato). E’ il caso di Georef. GRAPHIC (bidimensionale o tridimensionale) HIERARCHICAL THESAURUS (utilizzato in Georef) Termine sovraordinato, più generale (broader terms) Termine sottordinato, più specifico (narrower terms) Termine collegato, associato (related terms) Sinonimi, varianti 3. OPERATORI BOOLEANI COSA SONO? Connettori logici usati nell’algebra booleana che nelle BD vengono interpretati come comandi. AND: esprime il prodotto logico, cioè l'intersezione tra due insiemi, si recuperano solo i documenti che contengono entrambi i termini di ricerca. Es: La ricerca “Desio AND Alps" fornirà come risultato l'elenco dei record relativi a lavori di Ardito Desio sulle Alpi. OR: esprime la somma logica, si recuperano solo i documenti indicizzati con almeno uno dei concetti indicati. Es: La ricerca “Australia OR Nuova Zelanda" fornirà” come risultato l'elenco dei record sull’Australia o la Nuova Zelanda. NOT: esprime la differenza logica, l'esclusione di un concetto. Da usare quando si vuole limitare la ricerca eliminando i documenti non pertinenti (ma attenzione a non escludere citazioni potenzialmente utili !). Nella ricerca per campi con questo operatore è d’obbligo racchiudere l’intera stringa tra parentesi. Verrà altrimenti ricercato il primo termine contemporaneamente in una molteplicità di campi, e il secondo termine solo nel campo selezionato. Es: La ricerca “Oil NOT Gas " fornirà come risultato l'elenco dei record riguardanti i giacimenti di olio ma non il gas naturale. FREQ : consente di recuperare solo record nei quali, in un dato campo, il termine da noi inserito compare almeno N volte (in genere i risultati che contengono più volte il termine ricercato dovrebbero essere più rilevanti ai fini della ricerca). Utile quando si cerca in campi Full-text e con il linguaggio naturale. Sintassi: term.xy/freq=n (dove per xy si intende il campo di ricerca) Es.: Himalaya.ab/freq=5 (ab= campo abstract) ADJ: operatore “posizionale”, consente di recuperare i record che contengono un dato termine A vicino ad un termine B (in qualsiasi ordine). Es.: (sedimentary adj rocks).titl. ADJn: consente di recuperare i record che contengono un dato termine A vicino ad un termine B con N termini interposti, in qualsiasi ordine, in una frase o paragrafo. L’operatore ADJn non conta le “stop words” (lista di parole che ignora quando esegue la ricerca). E’ necessario sapere se la BD utilizza le stop words; se non le usa, significa che non le conta e si può ridurre il numero di termini da escludere. Es.: (carrara adj2 marble).titl. 4. SINTASSI Le parole chiave contemplate dal Thesaurus e quindi utili per la ricerca nella BD sono in inglese. I record in altre lingue sono indicizzati in inglese (oltre che con il titolo originale) con la traduzione del titolo e dell’eventuale abstract. Possono essere stabilite precedenze tra i termini mediante l’uso di parentesi tonde per costruire gruppi di sinonimi e combinarli con gli operatori booleani. Nella funzione di basic search è necessario utilizzare il linguaggio naturale in inglese. Non si possono utilizzare accenti e segni diacritici (ä, ĝ ecc.) il sistema infatti è americano e pertanto non vengono riconosciuti. Omettere le stop words (articoli, preposizioni, congiunzioni ecc.), che sono inutili ai fini della ricerca. CARATTERI JOLLY *, $ (carattere di troncamento illimitato), sostituisce zero o più caratteri alla fine o all’interno di una parola. Recupera tutti i termini con la radice selezionata. Usare con cautela, può recuperare troppi risultati. Es.: Geo$= geological, geographical, geophisical, geologist, geophisics ecc. $n (carattere di troncamento limitato), sostituisce fino a n caratteri Es.: $4= paleontolog$= paleontology, paleontologist, paleontological ecc. # all’interno o alla fine di una parola sostituisce un carattere (es. H#drocarbon). Questo comando permette di recuperare forme speciali di plurale. Se è usato come ultima lettera recupera solo la versione plurale. ? all’interno o alla fine di una parola sostituisce 0 o più caratteri Es. Lit?ic “ “ delimitano una stringa che contiene numeri Es.: “333”.pg . Dopo un termine da cercare introduce uno o più simboli di campi, se più di uno si separano con una virgola Es.: marble.ti,.bk SVILUPPO DI UNA STRATEGIA DI RICERCA • • OPZIONI DELLA MODALITA’ DI RICERCA SEARCH HISTORY BOX E COMBINAZIONE DI SET DI RISULTATI Logged in as anna sala at Università Milano My Account Help Logoff FILTRI (LIMITS) E’ possibile utilizzare limiti per restringere i risultati della ricerca ma anche selezionarli per personalizzare la Main search page di default. ADVANCED SEARCH Consente di ricercare nei campi più comunemente usati: Keyword campo di ricerca di default, Author, Title, Journal name. Consente l’utilizzo degli operatori booleani. Consente l’utilizzo della command-line sintax. Keyword (.mp) : ricerca per parole, è utile per una ricerca generale per argomento, ricerca in: abstract, author, book author, book title, corporate author, collection authors, collection title, corporate author word, heading word, subject heading, title, year. Non è possibile inserire 2 termini senza AND. Se la funzione di ricerca attraverso Map term to subject heading è disponibile (è necessario selezionare i database corrispondenti ai vari range cronologici di Georef) questa ci “suggerisce” un vocabolario controllato di termini. Cliccando sul termine si raggiunge il tesauro con l’odinamento alfabetico dei termini messi in relazione tra di loro. Author: inserendo cognome, spazio e prima iniziale del nome (se conosciuta) si apre la schermata di ricerca per campi. Se non conosciamo il nome il comando recupererà tutti gli autori, in ordine alfabetico, a partire dal cognome inserito. Title: ricerca per parole o frasi del titolo del contributo. Journal name: ricerca mediante la parte iniziale del titolo del periodico senza utilizzare troncamenti; si aprirà la schermata di ricerca per campi. BASIC SEARCH Funzione utile quando non si sa nulla o quasi dell’argomento ma può recuperare troppi risultati e creare confusione. Fa uso dell’elaborazione in linguaggio naturale (NPL) e ordina i risultati in base alla pertinenza (relevancy) alla domanda che li ha prodotti. L’algoritmo proprietario di elaborazione in linguaggio naturale visualizza i risultati in base a 5 criteri ordinandoli con stelline. E’ possibile inserire una domanda o una locuzione completa in inglese; Non è possibile usare gli operatori booleani; È possibile includere i related terms. Il sistema farà una serie di ricerche per includere sinonimi, plurali, varianti di spelling (questi saranno segnalati in violetto). E’ possibile fare copia e incolla di titolo da Internet; Non è utile inserire nella linea di comando un solo termine, si avranno troppi risultati e, ovviamente, tutti con la stessa rilevanza. RELEVANCE RANKING Come viene calcolata? L’ordinamento dei risultati in base alla rilevanza si ottiene soltanto nella funzione di basic search. Di default, OVID SP mostra i record di maggiore rilevanza nelle prime posizioni della schermata dei risultati,visualizzando tramite stelline il grado di aderenza di ogni record ai termini immessi per la ricerca. ***** **** *** ** * Tutti i concetti coinvolti nella ricerca sono presenti e completi Tutti i concetti coinvolti nella ricerca sono presenti, ma alcuni sono incompleti Uno dei concetti risulta mancante dal record Due dei concetti risultano mancanti del record Più di due concetti coinvolti nella ricerca risultano mancanti dal record OVID SP dispone i record nella schermata dei risultati basandosi sui seguenti criteri Quantità: Numero di concetti coinvolti nella ricerca presenti nel record Frequenza: Ricorrenza dei concetti all’interno del record Importanza: Rarità di riscontro dei termini impiegati per la ricerca nel complesso della BD Coesione: Grado di vicinanza reciproca nel record dei termini impiegati per la ricerca Aderenza verbale: Grado di identità dei termini contenuti nel record con quelli impiegati per la ricerca (la BD svolge le ricerche anche utilizzando varianti e sinonimi dei termini immessi) SEARCH TOOLS Funzione che effettua la ricerca nel vocabolario della banca dati. Aiuta a scoprire i rapporti tra i termini o gli argomenti presenti nella BD. Per utilizzarli è necessario immettere un termine o una frase e selezionare uno strumento nel menu’ a tendina. Questi strumenti variano da una banca dati all'altra. Georef mette a disposizione: Map Term: (Associa termine) suggerisce, associa argomenti all'interno del vocabolario della BD; Tesauro: visualizza un termine o gruppo di termini all’interno di una struttura gerarchica di contesti basati sul vocabolario controllato della BD; Permuted Index (Indice permutato): permette di immettere un singolo termine e visualizza un indice di termini composti che comprendono il termine oltre a termini associati "vedi" e "vedi correlato“ (sempre basati sul vocabolario controllato della BD). GESTIONE DEI RISULTATI DELLA RICERCA I risultati delle ricerche, previa selezione, possono essere: • STAMPATI • INVIATI VIA MAIL • ESPORTATI in vari formati e gestiti con un bibliographic manager • SALVATI NELL’AREA MY PROJECTS Keep Selected: permette di visualizzare solo i record spuntati. MY WORKSPACE My workspace è un’area storage strutturata che contiene progetti e cartelle in cui è possibile salvare testi, risultati, citazioni, grafici ecc. Per utilizzarla è necessario innanzitutto loggarsi. Offre le stesse opzioni di esportazione dei dati presenti nella pagina di ricerca principale e la possibilità di rimuovere le voci salvate. STRUMENTI DI INFORMAZIONE ALL’UTENTE (ALERT) Salvare le istruzioni di ricerca utilizzando Save, AutoAlerts o RSS. E’ possibile: salvare gruppi di criteri di ricerca spuntando i box del record e il Salva selezionato, salvare la cronologia di ricerca attuale con il pulsante Salva cronologia o con RSS, salvare le ricerche in modo temporaneo o permanente, come AutoAlert (SDI) o in My Projects con diverse opzioni e impostazioni. Gli AutoAlert sono ricerche automatizzate che avvisano (via email o RSS) quando nella BD vengono aggiunti nuovi record che corrispondono ai criteri di ricerca salvati. E’ possibile personalizzare gli AutoAlert con varie opzioni per: programma di consegna, tipo di rapporto, per campi, formato dei risultati ecc. Per avviare, cancellare o copiare una cronologia di ricerca o un AutoAlert salvati in precedenza è necessario selezionare il collegamento Saved Searches & Alerts in My Workspace sulla Barra principale di navigazione. ESERCIZI Completa le seguenti citazioni usando la ricerca per campi o la sintassi: Pyroclastic floe transport mechanisms. Book author: Rosi Mauro, Freundt Armin Farabegoli, E., Onorevoli, G., Ruffino, C., Costantini, B. (1997). The 1944 eruption of Vesuvius, Italy: combining contemporary accounts and field studies… *********************************************************************************************************************** Cerca (con l’uso degli operatori booleani) libri sui foraminiferi bentonici escludendo quelli plantonici. Salva in My project i risultati di alcune ricerche e imposta un Alert. Ricerca, con l’uso della sintassi e l’operatore di frequenza, i record nei quali la Daonella compare almeno 4 volte nell’abstract. Ricerca, con l’uso della sintassi e l’operatore di adiacenza, materiale sul “calcare di Moltrasio”