Internet Motori di ricerca I motori di ricerca (search engines) • I motori di ricerca sono programmi che hanno come obiettivo quello di indicizzare i siti mondiali e rendere possibile su di essi una ricerca full-text (per chiavi testuali) il più possibile veloce ed efficace • L’indicizzazione I computer di un motore di ricerca linkano i documenti della rete e li catalogano sulla base di parole o insiemi di parole che rappresentano il contenuto o le caratteristiche mediali di quel documento. Attualmente, prevalgono sistemi di indicizzazione basati sulla frequenza statistica di una parola • Il problema dei motori di ricerca è completezza della copertura (i siti in linea sono attualmente centinaia di milioni e le pagine indicizzate sono alcuni miliardi) Quale motore di ricerca? Nella scelta di un motore di ricerca bisogna tenere conto di alcuni concetti fondamentali. • Valutare le proprie esigenze • Che tipo di informazione voglio trovare? • Con quale livello di dettaglio? • In che lingua? • Considerare se esiste una strada migliore per trovare quello che cerchiamo • Scegliere il motore di ricerca più adatto alla nostra esigenza • Prendendo dimestichezza si impara a “capire” cosa si trova con un determinato motore di ricerca Due motori di ricerca validi… ma diversi • Altavista • Google Fra i motori di ricerca attualmente online i più validi ed usati sono Altavista e Google. Il primo è certamente molto famoso ma il secondo ha introdotto una serie di novità che lo stanno rendendo il motore di ricerca più usato e più facile da utilizzare. Altavista INGLESE: http://www.altavista.com ITALIANO: http://it.altavista.com/ • Nasce nel 1995 nei laboratori della Digital ed è il primo esempio di ricerca full-text. • E’ stato tra i primi (e resta tra i più efficaci) sistemi di indicizzazione automatica. Infatti l’indice non è creato manualmente ma viene generato dai così detti “ragni” (spider) ovvero programmi che scandagliano il Web per trovare e indicizzare le pagine dei siti. • Il motore di indicizzazione è in grado di esaminare un miliardo di caratteri l'ora, provvedendo anche ad indentificare la lingua originaria delle pagine e fornire così un criterio di impostazione in più per gli utenti. La versione italiana è specifica per le ricerche nei siti italiani • AltaVista inserisce nel suo indice 10 milioni di nuove pagine ogni giorno. Interfaccia ed accesso alle varie funzioni Modalità di ricerca Casella di immissione del testo dove inserire le parole che si riferiscono all'informazio ne che si sta cercando Scelta lingua Informazioni di aiuto per la ricerca I pulsanti cerca sotto la casella di ricerca servono a indicare dove cercare le informazioni. L'impostazione predefinita è “Italia". Ciò significa che AltaVista cercherà informazioni solo nei siti italiani. Basta cambiare opzione per ricercare in siti stranieri. Cercare con Altavista • Altavista consente di effettuare diversi livelli di ricerca. Le modalità principali sono due: • “ricerca semplice” • “ricerca avanzata” • Nel 1998 il motore ha poi inserito la possibilità di effettuare la ricerca di immagini, suoni e video. • Altro servizio utile è il traduttore di lingue automatico (Babel Fish) che oltre alla traduzione di una parola o di una frase, permette di ricercare sul web le stesse parole o frasi tradotte. Altavista: ricerca semplice Le regole per la ricerca sono • Se si scrive un termine, AltaVista cerca tutte le pagine che contengono quel termine • Se si scrivono più termini, AltaVista cerca tutte le pagine che contengono almeno una dei termini • Per cercare esattamente frasi composte da più termini occorre scriverle tra doppi apici es: “Cervignano del Friuli”. Le pagine ricercati conterranno la frase “Cervignano del Friuli”. • E’ possibile utilizzare dei connettivi logici Per cercare pagine in cui compaiono due o più termini, essi vanno scritti nella casella di ricerca preceduti da un segno “+” es.: +parola1 +parola2 • Con il segno meno (-) si escludono parole dalla ricerca… • Ma per ricerche più raffinate è preferibile usare la Ricerca avanzata Una ricerca in Altavista La ricerca è stata effettuata scrivendo “Cervignano del Friuli” (virgolette comprese) nella casella di testo Numero di risultati Di ogni risultato •viene messo il link alla pagina •viene citata la frase che contiene i termini •viene indicato il dominio •viene data la possibilità di cercare tutte le pagine nel dominio Altavista: ricerca avanzata • La ricerca avanzata serve per effettuare ricerche approfondite. • La ricerca avanzata consente di migliorare i risultati poiché spesso da una ricerca semplice il motore ricava una quantità enorme di pagine che sarebbe impossibile analizzare. • La differenza principale tra le due funzioni è la capacità della Ricerca avanzata di utilizzare le espressioni booleane (AND, OR, AND NOT). • AltaVista semplifica però la scrittura delle espressioni chiedendo all’utente di scrivere i termini in caselle diverse. • La Ricerca avanzata permette inoltre di specificare la data del documento, di scegliere il tipo di file, di cercare in un certo dominio, ecc. Altavista: il modulo per la ricerca avanzata tutte queste parole: I documenti dovranno contenere tutte le parole elencate qui. questa frase esatta: I documenti dovranno contenere esattamente la frase che è stata inserita. ognuna di queste parole: I documenti devono contenere almeno una delle parole che hai elencato qui. nessuna di queste parole: I documenti che contengono queste parole dovranno essere omessi dai risultati. Altavista: ricerche speciali Immagini Altavista: ricerche speciali MP3/Audio Altavista: ricerche speciali Video Google: la rivoluzione nei motori di ricerca http://www.google.com http://www.google.it • Google ha rivoluzionato il mondo dei motori di ricerca e si è subito distinto per la qualità dei risultati e la velocità. • Il successo delle ricerche effettuate con Google risiede in un meccanismo di rating innovativo. • Con il termine rating si indica il livello di corrispondenza del risultato con la stringa di ricerca. Le pagine con il rating più alto sono quelle che vengono visualizzate prima. • Un’altra caratteristica di Google è la velocità con cui visualizza i risultati favorita dall’assenza di banner pubblicitari. • Altro vantaggio è la facilità d’utilizzo da parte dell’utente. L’interfaccia di Google L’aspetto spartano di Google anticipa in un certo senso due sue caratteristiche principali ovvero la velocità e l’assenza di pubblicità. Accanto al pulsante “Cerca” c’è un pulsante con scritto “Mi sento fortunato”. Usando questo pulsante per effettuare la ricerca, Google aprirà automaticamente il primo risultato della ricerca, cioè quello che per lui è il più attendibile. Questo la dice lunga su quanto i programmatori di Google siano convinti della sua efficacia. Inoltre è presente la funzione di scelta per la lingua per effettuare la ricerca Google: ricerca di base • Google semplifica al massimo il concetto di ricerca. Non sono consentite sintassi complicate. Le opzioni sono poche. • Tra i concetti di base c’è quello dell’ “AND automatico”: se inserita come stringa di ricerca “ministero tesoro” verranno visualizzate le pagine che contengono sia “ministero” che “tesoro”. • Lo scopo del motore di ricerca è quello di ottenere dei risultati precisi quindi è inutile introdurre funzioni che introducano pagine inutili o non perfettamente rispondenti alla nostra richiesta. Per questo motivo è stata eliminata anche la funzione “OR” e i “caratteri jolly”. Google: esempio di ricerca di base Per cercare il Ministero del tesoro Il risultato: Google: ricerca avanzata Google: risultati della ricerca Titolo della pagina URL Righe di descrizione Pagine simili Strategie per una ricerca efficace • E’ essenziale imparare bene ad usare almeno un motore di ricerca. L’ideale è conoscerne almeno un paio poiché spesso un determinato motore è utile per determinate ricerche. Se dobbiamo cercare delle informazioni su aziende italiane o su musica italiana è probabile che si trovino più facilmente con un motore di ricerca italiano. Questa comunque non è una legge assoluta. • E’ importante avere le idee chiare su cosa cercare. E’ inutile impostare una ricerca sull’argomento “chitarre”… “chitarre” da solo non ha significato. Cosa ci serve sapere sulle chitarre? Ci servono degli accordi? Dobbiamo comprarne una? Cerchiamo un modello particolare? Cerchiamo una rivista chiamata “chitarre”?… • Impostare bene la ricerca fa risparmiare moltissimo tempo. I Metamotori I Metamotori consentono ricerche incrociate con più motori di ricerca. Un esempio è metacrawler (http://www.metacrawler.com). Se da un lato c’è il vantaggio di fare con un’unica richiesta la ricerca su più motori, dall’altro risulta impossibile fare richieste specifiche, infatti per mantenere la compatibilità tra i vari motori, i metamotori richiedono l’utilizzo di una sintassi spartana. Vantaggi • Cerca in contemporanea con più motori di ricerca • Elimina i risultati duplicati •Svantaggi • Minori opzioni di ricerca (per consentire la compatibilità con più motori)