Motori di ricerca
Titolo della sezione
Eventuale
non solosottotitolo
Google
Formazione Volontari SCN 2011
Centro Linguistico di Ateneo - Mediateca
Motori di ricerca
non solo Google
Formazione Volontari SCN 2011
Centro Linguistico di Ateneo - Mediateca
Centro Linguistico di Ateneo – Mediateca
Scrivere in rete
che cos’è un motore di ricerca
 il termine ricerca (search) in informatica significa esaminare
il contenuto di un pc, di un disco, di un file o di una rete di
computer per trovare informazioni volute
 il termine motore sta ad indicare qualcosa che fornisce la
forza per un movimento, un sistema, una azione...
 un motore di ricerca è qualcosa in base a termini che noi
inseriamo (motore di ricerca per parola) restituisce una serie di
informazioni / documenti un motore di ricerca su Internet è un
software che raccoglie informazioni, le organizza in database e
in base alle parole inserite restituisce elenchi di pagine web in
un certo ordine
Centro Linguistico di Ateneo – Mediateca
Scrivere in rete
tipi di motori di ricerca
 motori di ricerca generali, basati su indici automatici,
senza intervento umano (es. Google)
 motori di ricerca generali basati su indici controllati
dall’uomo, come una web directory (es. Dmoz)
 motori di ricerca specialistici, basati su indici in parte
creati in modo automatico e in parte creati dall’uomo (es.
Scirus)
 motori di ricerca basati su indici semantici (es. Hakia)
Centro Linguistico di Ateneo – Mediateca
Scrivere in rete
motori di ricerca (automatici)
 gli spiders girano 24 ore su 24 per la rete cercando contenuti: come
un ragno su una ragnatela seguono i link da un sito a un altro, entrano
nei siti e raccolgono informazioni da, di e su singole pagine statiche
 le pagine vengono indicizzate e classificate in archivi dagli indexer in
base alle parole rilevate e ai metadati delle singole pagine
 gli archivi vengono interrogati e viene fornita una lista di siti
organizzata in base a determinati criteri (page ranking) per dare le
risposte più adeguate
http://it.bing.com/
http://www.google.com/
http://it.yahoo.com/
Centro Linguistico di Ateneo – Mediateca
Scrivere in rete
web directory
 archivi di siti creato dall’uomo
 vengono indicizzati siti, non pagine
 si usano classificazioni controllate, generalmente in forma
gerarchica
 ricerca per parola (non nei siti...) e navigazione tra le varie
classi
 grande attendibilità e qualità però invecchiano spesso e i
tempi di controllo sono piuttosto lunghi
www.dmoz.org
http://www.galaxydirectory.info/
http://www.intute.ac.uk/
Centro Linguistico di Ateneo – Mediateca
Scrivere in rete
il web invisibile (opaco, nascosto...)
 quello che Google e gli altri non vedono perché:
 non sono pagine statiche, vengono create in base a singole
richieste (le singole richieste però possono avere dei link)
 non sono presenti nei link di nessun altro sito o pagina
 si tratta di reti interne o comunque riservate
 si tratta di documenti troppo profondi
 gli spider trovano degli sbarramenti tipo:
 siti controllati (password, captcha, ...)
 siti con opzioni per la navigazione
 siti con blocchi dichiarati
 ecc.
Centro Linguistico di Ateneo – Mediateca
Scrivere in rete
il web invisibile (opaco, nascosto...)
 è quello che i motori di ricerca non vedono
Centro Linguistico di Ateneo – Mediateca
Scrivere in rete
cos’è un motore di ricerca specialistico
 cerca singole pagine e documenti di aree o settori
specifici
 funziona come un motore di ricerca automatico i siti
dove cercare sono scelti dall’uomo
 qualità e attendibilità sono garantite in proporzione alle
presenza o meno di controlli sui siti
 spesso sono commerciali o hanno fini commerciali
 spesso indicizzano parte del web invisibile
 spesso hanno classificazioni / indicizzazioni
 www.scirus.com
Centro Linguistico di Ateneo – Mediateca
Scrivere in rete
motori di ricerca semantici
 generalizzano le parole di ricerca e le contestualizzano
 permettono di inquadrare la parola nell’ambito che ci
interessa
 cercano di dare risposte “logiche” e organizzare i
risultati
 ricerca della qualità contro la quantità
 differenti sistemi per selezionare i siti: core sites, page
vector, ecc.
 spesso interagiscono con strumenti di social web /
folksonomies
Centro Linguistico di Ateneo – Mediateca
Scrivere in rete
motori di ricerca semantici
 Hakia - http://hakia.com/
basato su una tecnologia “core” su diversi segmenti (web, news,
blog, siti affidabili, video, ecc.I
Teoma - http://www.teoma.com/
prova ad aggiungere ai normali risultati di un motore di ricerca i siti
più popolari tra gli esperti e in base alle domande già poste
 Wolfram Alpha - http://www.wolframalpha.com/
non un motore di ricerca vero e proprio ma un repository (sempre
aggiornato) che utilizza algoritmi basati sul linguaggio naturale
 Credo – http://credo.fub.it/
Conceptual REorganization of Documents, basato sul motore di
ricerca di Yahoo organizza le risposte per aree tematiche
Centro Linguistico di Ateneo – Mediateca
Scrivere in rete
motori “specialistici” per tutti i gusti
 filtrano le domande in base a criteri predefiniti (tipo risorsa,
settoriali, di utilizzo, di area geografica, ecc. ecc.)
 più che motori portali o metamotori che usano i motori veri e propri
 liste:
http://www.thesearchenginelist.com/
http://www.segnalidivita.com/motoridiricerca/index.htm
http://www.noodletools.com/debbie/literacies/information/5locate/adviceengine.html
 motori su misura
 http://webbrain.com/
 http://www.eurekster.com/
 ...risorse linguistiche ;-)
Scarica

Diapositiva 1 - WordPress.com