Internet e reti: concetti base,
struttura, applicazioni
1
Cosa è una rete
• Almeno due computer interconnessi
– In aree ben delimitate (LAN,ufficio, palazzo)
– In aree geografiche molto vaste (WAN,
paese,regione, continente)
• LAN : chiuse, anche come informazioni
• WAN : “tendenzialmente” aperte: a nuovi
elaboratori, a nuove banche dati (a parte
casi particolari quali ad esempio le reti
bancarie, per natura estese ma non inclini
all’“apertura”)
2
Un po’ di storia
• 1969 - Il progenitore della rete Internet è considerato il
progetto ARPANET, finanziato dalla Advanced Research
Projects Agency (ARPA), una agenzia del Dipartimento
della Difesa statunitense.
• La rete venne fisicamente costruita nel 1969 collegando
quattro nodi: l'Università della California di Los Angeles,
l'SRI di Stanford, l'Università della California di Santa
Barbara, e l'Università dello Utah.
• I primi nodi si basavano su un'architettura client/server, e
non supportavano quindi connessioni dirette (host-tohost). Le applicazioni eseguite erano fondamentalmente
il Telnet e i programmi di File Transfer Protocol (FTP).
• La posta elettronica fu inventata da Ray Tomlinson nel
1971.L'anno seguente Arpanet venne presentata al
pubblico, e Tomlinson adattò il suo programma per
3
funzionarvi: divenne subito popolare.
Un po’ di storia
• In pochi anni, ARPANET allargò i suoi nodi oltreoceano,
contemporaneamente all'avvento del primo servizio di
invio pacchetti a pagamento: Telenet
• L'espansione proseguì sempre più rapidamente, tanto
che il 26 marzo del 1976 la regina Elisabetta II
d'Inghilterra spedì un'email alla sede del Royal Signals
and Radar Establishment.
• Gli Emoticon vennero istituiti il 12 aprile 1979, quando
Kevin MacKenzie suggerì di inserire un simbolo nelle
mail per indicare gli stati d'animo.
• Tutto era pronto per il passaggio ad Internet. Definendo
il Transmission Control Protocol (TCP) e l'Internet
Protocol (IP), diedero il via ufficialmente ad Internet
come l'insieme di reti connesse tramite questi protocolli.
4
Caratteristiche di Internet
• Non ha un centro, quindi anche
responsabilità e compiti limitati nelle
varie sue componenti
• Diventa presto “punto di incontro” e
di scambi di informazioni non
“guidato”, spontaneo
5
Crescita ed evoluzione di
Internet
• I documenti evolvono con elementi
– di grafica
– Immagini
– Animazione
– Video
Collegati tra di loro (ipermedia)
• Aumenti delle connessioni e della
velocità (larga banda)
6
Come funziona Internet
• Abbiamo detto che
Internet è una rete
di reti telematiche
• Per capire meglio che
cosa si intende con
questa affermazione
utilizziamo una
similitudine con una
infrastruttura che ci è
molto più familiare: la
rete ferroviaria
7
Come funziona Internet
• Ogni sottorete che è parte di Internet è
assimilabile ad una rete ferroviaria nazionale
• Internet può essere assimilata al sistema
ferroviario mondiale
– Si noti che affinché i treni possano passare da una
rete nazionale ad un'altra, è necessario che esse
condividano le norme di costruzione dei binari e
che gli enti ferroviari si accordino sugli orari in cui
far passare i treni e così via: sono insomma
necessari dei protocolli
8
Come funziona Internet
• Un aspetto importante di Internet è la sua
topologia distribuita e decentrata
• In questo modo
se un percorso è
interrotto o troppo
trafficato i dati
possono prendere
strade alternative
N1
N5
N2 N7
N6
N3
N4
• Ad esempio per andare da N1 a N3 si può
prendere il percorso N1-N2-N6-N3 oppure N1N5-N4-N3 e così via
9
Come funziona Internet
• Per afferrare questo
aspetto, torniamo alla
nostra metafora
ferroviaria
• Le stazioni
corrispondono ai nodi
della rete
• Ogni stazione è
collegata a diverse
altre stazioni, come
ogni host di Internet è
connesso con più host
stazione = nodo
10
Come funziona Internet
• Se un viaggiatore volesse
andare da Roma a Torino
potrebbe prendere la linea
che passa lungo la costa
Tirrenica attraverso le stazioni
di Livorno, Pisa e Genova
• Ma se i posti sul treno fossero
esauriti potrebbe passare per
Milano lungo la linea che
passa per Firenze e Bologna,
e di lì andare a Torino
11
Gli indirizzi di Internet
• Ma come fanno i computer a trovare le strada
giusta per ogni messaggio?
• A questo fine viene impiegato uno schema di
indirizzamento dei computer collegati in rete
• Ogni host è dotato di un suo indirizzo
univoco, costituito da una sequenza di
quattro numeri da 0 a 255 denominato
indirizzo IP
12
Gli indirizzi di Internet
• Grazie agli indirizzi IP ogni computer, e
dunque ogni utente della rete, è in grado di
individuare un nodo in particolare tra milioni e
milioni, e di inviargli dati
• Ma se i computer si trovano perfettamente a
loro agio nel gestire numeri, lo stesso non
può dirsi degli esseri umani
• Per questo al sistema di indirizzi numerici è
stato affiancato un sistema di nomi simbolici,
assai più facili da ricordare per noi esseri
umani
13
I nomi di Internet
• Tale sistema si chiama Domain Name
Service, e i nomi assegnati ai computer
su Internet sono detti nomi di dominio
• Essi sono composti da sequenze di
caratteri alfanumerici divise da punti
14
I nomi di Internet
• Ogni suddivisione identifica in
modo gerarchico
– il singolo host
– la sottorete (o dominio) di cui fa
parte
– e così via a salire di livello fino ad
arrivare ad una delle macrosezioni
(o domini di primo livello) in cui
Internet è stata suddivisa
15
Classificazione delle
desinenze
• Livello più alto
– Edu
università e centri ricerca
– Com organizzazioni commerciali
– Gov
enti governativi
– Net
organizzazione di supporto e
gestione
della rete
– Org altre organizzazioni (non
governative,
non profit)
Name server : struttura di
database (gerarchica) che
contiene la decodifica “nome
logico-nome fisico” dei vari livelli
di indirizzo
16
La commutazione di pacchetto
• I messaggi su Internet non
viaggiano tutti interi
• Essi vengono divisi in pacchetti
che vengono spediti
autonomamente sulla rete
17
La commutazione di pacchetto
• Ciascun pacchetto che fa parte
di un determinato messaggio
viene dotato di una etichetta
che ne indica la destinazione e
il numero d’ordine
Destinazione
123.134.100.45
Numero: 3
• Così quando arriverà a
destinazione l’host
potrà ricomporre il
messaggio originario
rimettendo in ordine
tutti i pacchetti
18
IP : livello “applicazione”
• Si basa sull’architettura client/server
nella quale 2 computer stabiliscono una
connessione “logica”: un richiedente
(client) chiede ad un altro computer
(server) la esecuzione di un servizio.
• Viene utilizzato un linguaggio
(protocollo) comune a livello di
applicazione (diversamente dal livello
di trasmissione, TCP)
• Le applicazioni comuni sono: FTP,
HTTP,SMTP
19
FTP, HTTP,SMTP
• FTP( File Transfer Protocol) : permette il
trasferimento di file tra due computer
• HTTP (HyperText Transfer Protocol):
permette la visualizzazione di pagine web
• SMTP (Simple Mail Transfer Protocol) per la
gestione della posta elettronica
La presentazione all’utente (client)
avviene a cura di un apposito
programma installato sul client
stesso (il browser)
20
La tipologia di connessioni con Internet (fisiche)
• Linee dedicate : l’utente (computer) è collegato alla rete con
connessione permanente ( es. università )
eventuale rete locale
computer
utente
cavo
dedicato
Internet
21
• Linee commutate (doppino telefonico, ISDN, ADSL): l’utente
(PC) si collega all’host che a sua volta è collegato
permanentemente alla rete. L’host in questo caso è un
Internet Service Provider (ISP) che offre il servizio di
connessione a pagamento
Linea telefonica+modem
computer
utente
cavo
dedicato
Internet
22
Come avviene il collegamento
• L’utente finale (PC) attraverso un modem
si connette all’host che gli assegna un
indirizzo “dinamico” valido per il tempo
della connessione e poi liberato per altri
utenti
• Limiti : la velocità
– Modem analogico : 3 kbytes/sec = 24
kbit/sec
– ISDN : 64 kbit/sec (trasmissione
digitale)
– ADSL: NO LIMITS! ad esempio 2048 Kb/s
23
in download e 256 Kbps in upload
Cosa serve per il collegamento
• Linea telefonica
• Un computer
• Un modem
• Programmi che permettono il
controllo del modem, la
visualizzazione di pagine Internet,
la gestione della posta elettronica .
• Un fornitore di connettività (ISP o
Ente collegato permanentemente
alla rete)
24
Modem
• Modulatore/demodulatore:
permette il colloquio tra due
elaboratori
– Converte i dati binari (output
dell’elaboratore sorgente) in
impulsi analogici trasmissibili su
linea telefonica
– Riconverte (alla fine della linea
telefonica) gli impulsi analogici in
dati binari, interpretabili
dall’elaboratore (destinazione)
25
Tipi di modem
• Interni al computer, più economici e veloci
• Esterni al computer (connessione “seriale”),
più versatili
• ADSL: PERMETTONO DI DIVIDERE LA
TRASMISSIONE VOCE DA QUELLA DATI
26
Il collegamento ADSL
• La tecnologia ADSL (acronimo dell'inglese Asymmetric Digital Subscriber
Line) permette l'accesso ad Internet ad alta velocità (si parla di banda larga o
broadband). La velocità di trasmissione va dai 256 kilobit per secondo (kb/s)
in su, a differenza dei modem tradizionali di tipo dial-up, che consentono
velocità massime di 56 kb/s, e delle linee ISDN che arrivano fino a 128 kb/s.
• L'attivazione del servizio ADSL richiede però l'applicazione ai dispositivi
"standard" (prese di telefoni, fax e modem analogici) di un opportuno filtro (o
splitter) ADSL, che fa sì che a tali apparati arrivino soltanto le frequenze
relative al servizio telefonico di base, bloccando a monte quelle per la
trasmissione dati, che altrimenti possono generare disturbi e fruscii.
Il collegamento ADSL
•
•
•
Peculiarità della tecnologia ADSL è la possibilità di usufruirne senza dover
cambiare i cavi telefonici esistenti e senza dover usare linee separate per i dati e
per le comunicazioni-voce normali: sul doppino telefonico in rame, è infatti
possibile far viaggiare contemporaneamente sia i dati digitali che il segnale
telefonico analogico, grazie alla banda differente usata per i due segnali: la voce
usa infatti le frequenze tra 300 e 3400 Hertz (Hz), mentre ADSL sfrutta quelle
sopra i 4 KHz.
Ciò è dovuto al fatto che il doppino di rame consente frequenze fino a vari
megahertz (MHz). Già nei primi anni '70 lo stesso principio era stato utilizzato per
la filodiffusione, il cui segnale viene inviato usando le frequenze fino ai 15 KHz.
Un altro vantaggio della tecnologia ADSL è la separazione delle bande dedicate al
download e agli upload, a differenza ad esempio del V.90 che essendo molto
vicino al limite teorico di un canale telefonico non permette un sistema duplex alla
massima velocità.
• Wi-Fi, abbreviazione di Wireless Fidelity, è un termine
che indica dispositivi che possono collegarsi a reti
locali senza fili (WLAN - wireless local area network)
basate sulle specifiche IEEE 802.11.
• Le reti Wi-Fi sono infrastrutture relativamente
economiche e di veloce attivazione e permettono di
realizzare sistemi flessibili per la trasmissione di dati
usando frequenze radio, estendendo o collegando reti
esistenti ovvero creandone di nuove.
• L'architettura internet è del tutto simile ai tradizionali
ISP che forniscono un punto di accesso (il PoP) agli
utenti che si collegano da remoto.
29
• La fonte di connettività a banda larga può essere via
cavo (ADSL o HDSL), oppure via satellite. Oggi
esistono connessioni a internet satellitari bidirezionali,
che consentono alte velocità di trasferimento dei dati
sia in download che in upload. La trasmissione
satellitare ha, tuttavia, tempi di latenza elevati; il tempo
di attesa prima che inizi l'invio dei pacchetti, detto
tempo di latenza, è dell'ordine di 1-2 secondi, e quindi
un tempo molto grande se confrontato ai pochi
centesimi di secondo necessari ad una connessione
DSL.
• A partire dalla fonte di banda, si può espandere la rete
attraverso la tecnologia Wi-Fi.
30
• Il WiMAX (acronimo di Worldwide Interoperability for
Microwave Access) è una tecnologia che consente
l'accesso a reti di telecomunicazioni a banda larga e senza
fili
• WiMAX rispetto a Wi-Fi risulta superiore sotto due aspetti:
la velocità di trasmissione e il range di copertura delle
celle. In effetti però non è detto che WiMAX debba essere
in conflitto con Wi-Fi: dato che le reti IEEE 802.16
utilizzano lo stesso protocollo
• Negli ultimi anni, alcune province e amministrazioni
comunali hanno avviato progetti per la realizzazione di reti
civiche con tecnologia Wi-Fi. Tipicamente le reti realizzate
sono di proprietà pubblica, mentre la loro gestione è
affidata ad un concessionario privato. Le reti collegano le
pubbliche amministrazioni del territorio locale e forniscono
un accesso diffuso alla banda larga in quelle zone in cui gli
operatori nazionali non intendono investire per via degli alti
31
costi (es. territori montuosi).
•
Esistono inchieste, tra cui quella di BBC Panorama,[2] che investigano sulle
accuse di alcuni scienziati secondo i quali lo smog elettromagnetico potrebbe
provocare, a lungo termine, danni alla salute. In particolare va notato che le
frequenze del Wi-Fi sono le medesime (seppur con potenze decisamente
inferiori) usate dai forni a microonde e che permettono la cottura del cibo
(2450 MHz). Oltre a questo effetto termico, i tecnici evidenziano la possibilità
di un ulteriore effetto biologico non correlato all'aumento di temperatura ma
comunque significativo.
La trasmissione di Rai Tre Report, l'11 maggio 2008 ha riproposto l'inchiesta
BBC ed ha documentato gli allarmi, specialmente in relazione ai danni che si
possono creare a bambini ed a persone elettrosensibili, che chiedono a molte
istituzioni nel mondo di impedire l'installazione di reti Wifi nelle scuole o negli
asili.[3] Secondo alcuni,[4] durante questa inchiesta non sarebbero stati forniti
dati numerici precisi e dettagli tecnici. La gran parte dei tecnici interpellati si
sarebbero schierati esclusivamente sul versante dell'allarmismo e l'unico che
invece ha dato una versione tranquillizzante in materia sarebbe stato tacciato
di connivenza con le aziende del settore (in quanto in effetti costui ha lavorato
per alcune di esse). La stessa BBC ha poi dichiarato che il trattamento degli
intervistati non è stato equilibrato.[5]. Tuttavia, benché non fossero forniti dati
assoluti, è stato evidenziato come negli ambienti chiusi le emissioni del WiFi
fossero molto superiori a quelli della telefonia mobile: va infatti ricordato che le
bande radio attualmente utilizzate nel sistema UMTS hanno frequenze molto
vicine a quelle del Wi-Fi.
32
• Il governo tedesco nel 2007 ha deciso di informare i
cittadini tedeschi dei possibili rischi per la salute causati
dall’eccessiva esposizione alle radiazioni Wi-Fi.
• La decisione di Berlino segue l'apertura dell'inchiesta della
Health Protection Agency (HPA) inglese, tesa a valutare gli
effettivi pericoli di un utilizzo esteso del WiFi nelle scuole
del Regno. Il portavoce del governo tedesco ha dichiarato
«Non dimentichiamo che il Wi-fi è una tecnologia
relativamente nuova, ancora da sviluppare. Mentre gli hotspot pubblici hanno livelli ridotti di radiazioni, all'interno di
ambienti domestici o di lavoro si può facilmente
raggiungere una soglia critica»
33
UMTS e altre reti
• Universal Mobile Telecommunications System (UMTS) è
la tecnologia di telefonia mobile di terza generazione
(3G)
• Il sistema UMTS, con l'utilizzo del W-CDMA, supporta un
transfer rate (letteralmente: tasso di trasferimento)
massimo teorico di 21 Mb/s (con HSDPA), sebbene gli
utenti delle attuali reti hanno a disposizione un transfer
rate fino 384 kbit/s utilizzando dispositivi R99 e fino a 7.2
Mbit/s con dispositivi HSDPA nelle connessioni in
download.
• Le applicazioni tipiche attualmente implementate, usate
ad esempio dalle reti UMTS in Italia, sono tre: voce,
videoconferenza e trasmissione dati a pacchetto.
34
Gli strumenti di Internet
• Internet offre ai suoi utenti un insieme di
strumenti di comunicazione
• Ognuno di questi strumenti fornisce
diverse funzionalità e modalità di
comunicazione e accesso alle informazioni
35
Gli strumenti di Internet
• Posta elettronica
• Newsgroup
• Sistemi di interazione in tempo reale
• World Wide Web
36
Gli strumenti di Internet
• Per ciascuno di questi strumenti occorre utilizzare un
apposito programma o client
• Come avviene per altre applicazioni informatiche, i
programmi client disponibili per ciascuno strumento
di Internet sono molti
• … ma la loro interfaccia e le loro funzionalità sono
assai simili
37
La posta elettronica
• La posta elettronica o e-mail permette ad ogni utente
di inviare e ricevere messaggi scritti a e da ogni altro
utente di Internet
38
La posta elettronica
• Ogni utente della rete Internet
dispone di una casella di
posta elettronica collocata di
norma sul computer del suo
fornitore di accesso alla rete
• A ogni casella di posta
elettronica corrisponde, come
nella posta tradizionale, un
indirizzo
39
La posta elettronica
Nome utente
Nome host che ospita la casella
postale dell’utente
Separatore (simbolo a commerciale che si legge ‘at’)
40
La posta elettronica
• Per leggere i messaggi di posta elettronica
arrivati nella nostra casella, e per scrivere ed
inviarne ai nostri corrispondenti, dobbiamo usare
uno specifico programma o client mail che
preleva i messaggi e li porta sul nostro computer
• In alternativa possiamo visualizzare le mail
tramite una pagina web specifica (o webmail)
41
Cos'è un newsgroup?
• Usenet è quella parte di Internet che comprende i
newsgroup, detti anche NG per spirito di brevità. I NG si
possono immaginare come delle bacheche virtuali dove
ognuno può appendere dei messaggi (sono chiamati
post, oppure articoli) che tutti possono leggere.
Esistono al mondo decine di migliaia di NG e ogni
newsgroup ha un identificativo, più ho meno come
questi: alt.culture.african, comp.os.linux.setup,
it.hobby.cucina.
• Mentre agli inizi di internet i NG potevano essere
visualizzati solo con degli appositi programmi (anche
Outlook Express) ora si leggono come delle normali
pagine web.
• Un buon metodo di ricerca è usare
42
World Wide Web
• World Wide Web (WWW) è
una enorme rete o meglio
ragnatela di documenti,
contenenti testi, immagini
ma anche suoni ed
animazioni, distribuiti tra i
vari nodi di Internet, e
collegati tra loro a formare
una trama virtualmente
infinita
43
Nascita del World Wide Web
(1992)
• Nel 1992 presso il CERN di Ginevra il
ricercatore Tim Berners-Lee definì il protocollo
HTTP (HyperText Transfer Protocol), un
sistema che permette una lettura ipertestuale,
non-sequenziale dei documenti, saltando da
un punto all'altro mediante l'utilizzo di rimandi
(link o, più propriamente, hyperlink).
• Il primo browser con caratteristiche simili a
quelle attuali, il Mosaic, venne realizzato nel
1993. Esso rivoluzionò profondamente il modo
di effettuare le ricerche e di comunicare in rete.
Nacque così il World Wide Web.
44
World Wide Web
• Lungo questa trama ogni
utente può costruire i suoi
percorsi di lettura, guidato
dai suoi interessi e dalla sua
curiosità
• Un simile sistema di
organizzazione delle
informazioni viene
denominato ipertesto
• World Wide Web dunque è
un ipertesto multimediale
distribuito sulla rete
Internet
45
World Wide Web
• Ogni pagina di questa rete è dotata di
un indirizzo, denominato Uniform
Resource Locator (URL)
• Esso ci permette di individuarla tra tutte
le altre
46
World Wide Web
• Di norma le pagine Web sono riunite in
insiemi che presentano una unità
– di contenuto
– di paternità intellettuale
– di responsabilità editoriale
• Tali insiemi coerenti di pagine Web
sono denominati siti Web
47
World Wide Web
• Per consultare le pagine multimediali del World
Wide Web si usa un programma denominato
browser
Alcune porzioni di
testo o parti di
immagini in una
pagina Web
corrispondono ai
collegamenti, o link,
ad altre pagine, o ad
altre sezioni della
stessa pagina
48
I browser: applicativi
multiprotocollo
• tutti i browser implementano il protocollo HTTP, ma sono
in
• grado di comunicare anche con altri protocolli:
– di posta (SMTP/POP/IMAP)
• menu Strumenti > Posta elettronica e news in
Internet Explorer
• in Mozilla Application Suite (non in Mozilla Firefox)
– il trasferimento di file (FTP)
• es. ftp://ftp.microsoft.com/
– le news (NNTP)
49
I browser
• Internet Explorer
• Firefox
http://www.mozillaitalia.it/firefox/
• Safari
http://www.apple.com/it/safari/
• Opera
http://www.opera.com/
• Chrome
http://www.google.com/chrome/
50
I browser: applicazioni a finestre
51
I browser: funzionalità
•
•
•
•
•
•
•
•
•
•
•
barra dell’indirizzo/URL
pagina principale
nuova scheda/finestra
aggiorna/ricarica
stop/interrompi
salvataggio pagine e salvataggio oggetti
dimensione carattere, colore sfondo, ecc.
preferiti/segnalibri
visualizzazione sorgente pagina/HTML
stampa
proxy
es. http://proxy.unimi.it/
52
I browser: sicurezza
• blocco pop-up
• codifica crittografica SSL es.
https://auth.unimi.it/studenti/index.html
• cronologia/history
• file scaricati
• cache dei documenti
• cookie
• moduli
• password
• applet, javascript
53
Software dalla rete...
• Freeware: programmi distribuiti gratuitamente e utilizzabili
da chiunque senza limitazioni
• Shareware: programmi distribuiti gratuitamente così che sia
possibile provarli prima di acquistarli. Spesso hanno alcune
limitazioni di utilizzo:
– temporali → trial
– funzionali → demo.
• Adware: programma distribuito gratuitamente in bundle
(combinazione) con software di natura pubblicataria.
54
...ma occhio ai “cattivi”
• Virus: codice inserito all’interno di un programma o file in modo che si
diffonda da un computer all’altro a seguito di un’azione umana (es.
aprire un allegato)
• Worm: come un virus, ma non necessita dell’intervento umano per
l’infezione, bensì sfrutta alcune vulnerabilità del sistema (es. i client di
posta)
• Trojan: codice nascosto all’interno di un’applicazione innocua con lo
scopo di ingannare l’utente e indurne l’esecuzione.
• Spyware: software che raccoglie informazioni relative ai dati o all’attività
dell’utente.
• Phishing: un messaggio o sito web che cerca di indurre l'utente a
rivelare informazioni personali in modo fraudolento camuffando la 55
propria reale identità dietro a una fonte legittima autorevole, come es. le
Protezione
•
usate
– Antivirus
– Antispyware
– Firewall
(Avast, Antivir, ...)
(Spybot, Adaware, ...)
(Sygate, Kerio, Zone Alarm ...)
• disabilitate salvataggio dei dati personali/sensibili quando
non siete sicuri che il computer sia protetto (internet cafè,
casa di amici, ...)
• phishing: osservate sempre l’URL della pagina
• laddove possibile, verificate certificati, codifica SSL, ecc.
56
Portali
• Portale: una ‘porta di ingresso’ al web,
propone agli utenti una selezione di
– informazioni: es. news, articoli, forum ...
– servizi: es. un motore di ricerca, posta
elettronica ...
– intrattenimento: es. giochi, chat, filmati ...
• sono spesso personalizzabili (→ cookie!)
57
Portali generalisti/orizzontali
• www.excite.com
• my.yahoo.com
• my.netscape.com
• www.msn.com
• www.libero.it
• www.virgilio.it
• www.kataweb.it
• ...
58
Portali specifici/verticali
• Servizio di pagine gialle www.paginegialle.it
• Trasporto ferroviario
www.trenitalia.com
• Consultazione quotidiani
www.repubblica.it
• Università
www.unimi.it
• Ministeri
www.ministerosalute.it
• libri
www.bol.it
•
...
59
URL
• un URL (Uniform Resource Locator) non è altro che
un indirizzo internet.
• esempio: http://www.units.it/storia
come
dove
chi/cosa
protocollo
nome host
percorso
http://
units.it
storia
60
I proxy
• Un proxy è un server che svolge la funzione di agente per
gli utenti di altri computer
• Configurando il proprio browser in modo che usi un proxy, le
richieste di un documento non saranno fatte dal proprio
computer direttamente al sito remoto, ma dal proxy server,
che si preoccupa poi di fornirci il documento → utile per:
– autenticazione
– privacy
61
Cookie
• informazione generata da un server Web e memorizzata nel
calcolatore dell’utente, pronta per essere reperita in un
accesso futuro
• permettono la personalizzazione dell’informazione ottenuta
dal Web
– Es. per personalizzare motori di ricerca con le proprie preferenze,
per memorizzare liste della spesa, per permettere che un utente
partecipi ad un concorso solo una volta.
• memorizzati nella cartella personale dell’utente
62
Applet, JavaScript
• Consentono di inserire dei programmi
all’interno di page web
– applet: programmi scritti in Java, vengono
eseguiti dall’interprete Java contenuto all’interno
del browser
es. www.javaonthebrain.com/brain.html
– JavaScript: linguaggio di scripting, il codice è
contenuto nella pagina web e viene interpretato ed
eseguito direttamente dal browser al caricamento
del documento.
63
HTML: HyperText Markup Language
• È un sistema di marcatura/formattazione del testo
• filosofia alternativa al WYSIWYG (what you see is what you
get = “ciò che vedi è ciò che ottieni”) tipica di editor come
Microsoft word
• Permette
–
–
–
–
formattazione del testo mediante l’uso di comandi (tag)
collegamenti (link) ad altre risorse disponibili sul WWW
definizione di maschere di inserimento dati
inclusione di altri oggetti complessi (immagini, suoni, etc)
64
Hyper Text Markup Language
• Serve per costruire una pagina web che ha
estensione .htm o .html

Può essere scritto con il semplice blocco notes o con
diversi software (editor) che sono specializzati per
favorire e controllare la sintassi del linguaggio (Front
Page, Dreamweaver, …)

La pagina web può essere visualizzata solo grazie ad
un particolare programma che interpreta i tags del
linguaggio html (browser) Internet Explorer,
Netscape,ecc
Hyper Text Markup Language
• I TAGS, o elementi, che compongono HTML
devono essere racchiusi fra parentesi
angolari <così>
Si tratta di parole chiave, termini in lingua
inglese.
• L'elemento (tag) smette di produrre il suo
effetto nel momento in cui lo stesso viene
ripetuto facendolo precedere da una barra
laterale / contenuta sempre all'interno delle
parentesi angolari </così>.
Struttura di un documento
<HTML>
<HEAD> ... </HEAD>
<BODY>
....
</BODY>
</HTML>
HTML Es.1
è formato da definizioni, elementi, tags, marcatori
<html>
<head>
<title> Primo esempio</title>
</head>
<body>
<p> PRIMA RIGA </p>
<p> SECONDA RIGA </p>
</body>
</html>
Hyper Text Markup Language
 HTML:
tutto il documento
 HEAD: testata (metainformazione)
 TITLE = titolo
 BODY = corpo dell'informazione
 P = paragrafo
HTML Es.2
<html>
<head>
<title> Secondo esempio</title>
</head>
<body>
<p align="left"> Riga a sinistra </p>
<p align="right"> Riga a destra </p>
<p align="center"> Riga al centro </p>
<p align="justify"> Riga in cui verifichiamo la struttura giustificata </p>
</body>
</html>
Da notare in esecuzione che gli allineamenti sono
rispettati qualsiasi dimensione abbia la finestra del
browser
HTML Es.3
<html>
<head>
<title> Quarto esempio</title>
</head>
<body>
<p align="center"> ITALIA TERRA DI EMIGRANTI </p>
<center>
<img src="http://altocasertano.files.wordpress.com/2010/09/immigratiitaliani-2.jpg" width="340"
height="219" border="2" alt="Italiani partono per l'America" >
</center>
</body>
</html>
HTML Es.4
<html>
<head>
<title> Sesto esempio</title>
</head>
<body>
<p align="center"> <b><u><i><font face="Comic Sans MS"
color="#008000" size="3" >
ITALIA TERRA DI EMIGRANTI </font></i></u></b></p>
<center>
<img src="http://altocasertano.files.wordpress.com/2010/09/immigrati-italiani-2.jpg"
width="340"
height="219" border="2" alt="Italiani partono per l'America"
>
</center>
</body>
</html>
HTML Es.4bis
<html>
<head>
<title> Sesto esempio</title>
</head>
<body>
<p align="center"> <b><u><i><font face="Comic Sans MS" color="#008000"
size="3" >ITALIA TERRA DI EMIGRANTI </font></i></u></b></p>
<center>
<a href=“http://www.emigranti.rai.it/">
<img src="http://altocasertano.files.wordpress.com/2010/09/immigrati-italiani-2.jpg"
width="340" height="219" border="2" alt="Italiani partono per l'America" >
</center>
</a>
</body>
</html>
HTML-Ancore
Fra le virgolette dell'attributo HREF oltre agli indirizzi URL validi come quello
dell'esempio <A HREF="http://...">, è possibile specificare anche :
<A HREF="ftp://...">
<A HREF="mailto:...">
<A HREF="news:...">
<A HREF="nomefile.zip">
<A HREF="nomepagina.html">
Che servono rispettivamente per:
<A HREF="ftp://...">
Collegamento ad un sito FTP.
<A HREF="mailto: [email protected]">
Indirizzo di posta elettronica per la spedizione di una e-mail all'indirizzo
specificato, facendo uso del proprio programma di posta elettronica.
<A HREF="news:...">
Collegamento ad un gruppo di discussione (newsgroup Usenet).
<A HREF="nomefile.zip">
Scaricamento (download) di un file in formato compresso.
<A HREF="nomepagina.html">
Collegamento ad altra pagina all'interno della stessa cartella.
HTML- Pubblicare
L'accesso al server che ospita la nostra pagina
web avviene di solito con programmi FTP (file
transfer protocol).
Parametri da fornire al programma
•nome del server ftp
•user ID
•Password
HTML-CSS
<html>
<head>
<title> Decimo esempio</title>
<link rel=stylesheet href="esempio.css" type="text/css">
</head>
<body>
<p align="left"> Riga a sinistra </p>
<p align="right"> Riga a destra </p>
<p align="center"> Riga al centro </p>
<p> Riga <br> <a href="primo.htm">in cui verifichiamo<br></a> la struttura
<br>giustificata </p>
</body>
</html>
HTML-Foglio di stile
BODY{
margin-left : .5cm;
margin-right : .5cm;
color : #000099;
font-family : Verdana,Arial,Helvetica;
font-size : 14pt;
background-image: url('nuvole.gif');
}
A:LINK{
text-decoration : none;
color : #009900 ;
}
A:VISITED{
text-decoration : none;
color : Gray;
}
A:HOVER{
Color : #ffff00;
text-decoration : none;
}
TD{
font-family : "MS Sans Serif";
font-size : 12pt;
}
p{
text-align: justify;
text-indent: 12px;
}
CSS, ovvero Cascading Style
Sheets
• Sono ormai divenuti molto comuni sul
web, servono per migliorare l'aspetto
estetico e al tempo stesso facilitare la
creazione e/o la manutenzione di siti.
• Se combinati con un linguaggio di
• quale JavaScript consentendo di superare
quelli che erano considerati un tempo i
limiti di html standard.
78
CSS, ovvero Cascading Style
Sheets
• Per prima cosa hanno un loro elemento
(tag) che viene specificato in html, si tratta
dell'elemento: <style> e relativa chiusura
</style> questo elemento serve ad
informare il browser che si tratta di stili e
che questi apporteranno le dovute
modifiche ai vari elementi (tags) di HTML
definiti al loro interno comprese immagini
e links, dipende soltanto dalle
combinazioni che se ne vorrà fare.
79
Hyper Text Markup Language
 due
sono le categorie in cui si suddividono gli
editor: visuali e testuali.


Quelli visuali sono sicuramente molto più semplici da adoperare,
assomigliano a dei programmi di grafica, è sufficiente trascinare al loro
interno testi ed immagini per avere un'impaginazione più che
soddisfacente
Gli editors testuali richiedono invece da parte di chi li adopera una minima
conoscenza di base, potrebbero sembrare più dispendiosi in termini di impegno,
ma alla lunga si rivelano invece un autentico investimento. Consentono di fare
cose che editors visuali non permetterebbero mai e danno la possibilità di avere il
controllo assoluto su ogni parte del codice
I motori di ricerca
• Il motore di ricerca è un server che periodicamente
ispeziona i documenti residenti sulla rete e li
indicizza in base al loro contenuto e alla struttura dei
loro link
• Un motore di ricerca fornisce un servizio di ricerca
sulla rete per parole chiave fornite dall’utente
• Ogni ricerca produce una lista di link (ordinata per
rilevanza) ai documenti contenenti quelle parole
chiave
81
I motori di ricerca
– http://www.google.com/
– http://www.bing.com
– http://www.altavista.com/
– http://www.yahoo.com/
– http://www.excite.com/
– http://www.lycos.it/
– http://www.virgilio.it/
– ...
82
I motori di ricerca: operatori booleani
AND, +
Restringe il campo di ricerca
igiene AND dentale oppure +igiene +dentale
entrambi i termini devono
essere presenti (default di Google)
OR
Estende il campo di ricerca
igiene OR dentale
AND NOT, Restringe il campo di ricerca
Non è riconosciuto da tutti i motori
igiene AND NOT dentale oppure igiene -dentale
“”
seguito
le parole chiave si devono trovare di
“igiene dentale”
83
MOTORI DI RICERCA: Google
• Settembre 1998, Menlo Park (CA): inizia la "Google
Story"
• Larry Page e Sergey Brin, due studenti di Stanford con il
pallino della matematica, avevano 25 anni quando nel
settembre del 1998 fondarono Google.
• Poco dopo aver fondato l’azienda, per mancanza dei
fondi necessari per l’acquisto di nuovi PC e di altro
materiale, cercarono di venderla per un milione di dollari
a diverse società finanziarie, oltre che a diretti
concorrenti come Altavista e Yahoo, ottenendo solo dei
rifiuti.
• Oggi Google vale oltre 100 miliardi di dollari
84
MOTORI DI RICERCA: Google
• La loro “impossible mission” era trovare un modo di catalogare tutte le
informazioni presenti in internet e renderle rapidamente e facilmente
disponibili a tutti. E ovviamente di farlo meglio di quanto già facessero
Yahoo, Altavista, etc
• La cosa più innovativa è stata sicuramente l’invenzione del “PageRank”.
• Il pagerank è un metodo per determinare “l’importanza” di una pagina
web. Mentre i motori esistenti, per indicizzare e posizionare i siti web nei
loro database, si limitavano a contare le ricorrenze, nel testo delle
pagine, dei termini cercati dagli utenti, e quindi mostravano ai primi posti
siti web non sempre pertinenti con le informazioni desiderate, Page e
Brin ebbero l’idea di verificare e contare non solo le ripetizioni delle
parole ma anche i link che provenivano da altri siti e che puntavano ad
una determinata pagina. Il loro ragionamento era semplice: se un certo
sito è citato e consigliato da molti altri significa che ha dei contenuti
interessanti e quindi è giusto farlo vedere prima di altri.
85
MOTORI DI RICERCA: Google
• In realtà il metodo adottato dai due studenti per calcolare il Page
Rank è molto più complesso ed articolato; non si limita a contare i
link ma tiene conto anche della “qualità” dei contenuti e
dell’importanza dei siti da cui provengono i link. Ad esempio, se il
sito della Microsoft consiglia o cita il mio sito, lo stesso acquista agli
occhi di Google un valore maggiore rispetto al sito di un concorrente
consigliato da un’azienda sconosciuta, e quindi avrà un PageRank
più elevato del concorrente.
• Ci sono poi altri fattori che contribuiscono a determinare il
PageRank, come l’anzianità del sito, il numero dei visitatori, ecc..
Credo che nessuno li conosca tutti, anche se sono stati ormai scritti
migliaia di articoli e di libri sui “segreti del PageRank di Google”.
• Ciò che conta è che gli utenti, usando Google, si rendevano conto
che era più facile e richiedeva meno tempo trovare le informazioni
desiderate e pertanto abbandonavano gli altri motori e consigliavano
agli amici e conoscenti di fare altrettanto.
86
MOTORI DI RICERCA: Google
• Oggi Google reperisce e gestisce le informazioni presenti su
internet grazie ad una propria rete composta da oltre 100.000 PC.
Una potenza di calcolo che nessun’altra azienda al mondo
possiede.
• Google riesce parzialmente ad esplorare il DEEP WEB, ossia
quelle informazioni contenute nel web, ma non indicizzate dai
motori di ricerca e contenute nei database. Google riesce ad
indicizzare anche documenti in formati non testuali (PDF,
presentazioni, fogli di calcolo, immagini), ma si ferma (per ora) di
fronte ai contenuti audio e video.
• Google ha nel suo database oltre 8 miliardi di pagine web e ogni
giorno i suoi utenti effettuano 200 milioni di ricerche in oltre 80
lingue. Attualmente è in atto il più ambizioso dei progetti mai
attuati: la digitalizzazione dei volumi di intere biblioteche al fine di
rendere il sapere umano alla portata di tutti.
87
MOTORI DI RICERCA: Google
• Ma chi paga? Da dove provengono i soldi?
• Ma tutti questi miliardi di dollari da dove arrivano, considerato
che l’utilizzo di Google è gratuito?
• Chi paga?
• Questa è la domanda che spesso mi è stata posta da clienti,
amici e conoscenti, e sono certo che anche molti di voi
qualche volta se la saranno posta.
• La risposta è molto semplice: Google non fa pubblicità a se
stesso ma incassa molto per la pubblicità che fa agli altri.
88
MOTORI DI RICERCA: Google
• La pubblicità contestuale
• Un’altra delle idee brillanti di Google è stata la pubblicità contestuale, o
mirata. Provate a immaginare… state guardando un film di fantascienza
alla TV e c’è un’interruzione pubblicitaria con uno spot che parla di un
fascicolo con DVD allegato, in edicola da domani; il titolo è “ai confini
della realtà” (un mito degli anni ’60 per gli amanti di fantascienza).
• Quanti di voi cambierebbero canale per evitare questa pubblicità?
• Google fa la stessa cosa: se state cercando ad esempio “noleggio
macchine per caffè” vedrete sulla parte destra della pagina dei risultati
alcuni link pubblicitari di aziende che noleggiano macchine per caffè o che
vendono cialde di caffè. Le probabilità che questa pubblicità dia fastidio
sono quindi minime e nello stesso tempo, le probabilità che qualcuno
clicchi su questi link sono alte.
•
Questo consente a Google di far accettare ai suoi inserzionisti di pagare
un “tot” per click più elevato rispetto a ciò che pagherebbero per la stessa
pubblicità inserita su siti o portali che parlano di calcio, di libri, di corsi,
89 di
telefonini o di cronaca.
MOTORI DI RICERCA: Google
• Il sito di GOOGLE - un esempio da imitare
• Il sito di Google si presenta in modo spartano, senza
animazioni in flash, senza musichette, senza sfondi
multicolori, senza banner pubblicitari. Non c’è nulla che
possa distrarre l’utente, che lo costringa a pensare dove
cliccare. Ci sono soltanto informazioni. Google sa cosa
vogliono gli utenti e li accontenta.
• Pensate a quanti milioni di dollari Google sta rinunciando pur
di non "sporcare" e rendere pesante la sua home page con
l'inserimento di banner pubblicitari statici o animati in Flash,
come invece fanno altri motori (MSN, YAHOO, ecc..).
90
GOOGLE: la ricerca
•
-
Ricerche di base
Operatore AND automatico;
Google ignora le “stop words”*
Google non supporta la ricerca di radici di
parole (per es. aziend*)
*Stop words o stopwords, è il nome dato alle parole che vengono filtrate a priori o
conseguentemente ad un processo di analisi dei testi di documenti presenti in un
data base, come ad esempio: - da, in, per, il, chi, su, ecc..
91
GOOGLE: la ricerca
• La ricerca avanzata:
92
GOOGLE: gli strumenti
•Google libri (http://books.google.it/)
Consente la ricerca e la lettura di libri resi
disponibili online dagli editori aderenti
all'iniziativa.
In alcuni casi, per motivi legali, viene
richiesta l’autenticazione per poter leggere i
libri trovati
93
Google libri
• I problemi incontrati sembrano essere fondamentalmente di
tre tipi:
• 1) quelli, ben noti, legati alle iniziative legali attraverso le
quali la Authors Guild e la Association of American
Publishers (oltre ad alcuni autori individuali) stanno cercando
di bloccare la digitalizzazione dei testi sotto diritti;
• 2) quelli, purtroppo assai meno noti, legati alle difficoltà
tecniche del progetto e alle caratteristiche degli strumenti
software e dei formati di codifica utilizzati;
• 3) quelli, ovviamente influenzati anche dalle prime due
tipologie, legati alla focalizzazione dell’esatta fisionomia del
progetto stesso.
94
GOOGLE: gli strumenti
•Google scholar (http://scholar.google.com/)
-Che cos'è Google Scholar?
Google Scholar offre un modo semplice per effettuare un'ampia ricerca sulla
letteratura accademica. Con un unico servizio, puoi effettuare ricerche tra molte
discipline e fonti: documenti approvati per la pubblicazione, tesi, libri, abstract e
articoli di case editrici accademiche, ordini professionali, database di studi non
ancora pubblicati, università e altre organizzazioni accademiche..
Funzioni di Google Scholar
Cerca in diverse fonti utilizzando un unico e pratico sito
Trova documenti, abstract e citazioni
Individua un documento completo nella tua biblioteca oppure sul web
Scopri documenti importanti in qualsiasi area di ricerca
Come vengono classificati gli articoli?
Google Scholar mira ad elencare gli articoli in base alla stessa classificazione
adottata dal mondo scientifico, ossia valutando il testo completo di un articolo,
l'autore, la pubblicazione in cui è riportato e il numero di volte in cui viene citato in
altri documenti accademici. I risultati più pertinenti vengono sempre visualizzati
nella prima pagina.
95
Liber Liber
• Liber Liber, è una o.n.l.u.s. (organizzazione non lucrativa
di utilità sociale) che ha come obiettivo la promozione di
ogni espressione artistica e intellettuale. In particolare,
Liber Liber si propone di favorire l'utilizzazione
consapevole delle tecnologie informatiche in campo
umanistico e di avvicinare la cultura umanistica e quella
scientifica.
• Grazie alla collaborazione di volontari e sponsor come la
E-text, i capolavori della letteratura e le altre opere edite
dal progetto Manuzio vengono prelevate mensilmente da
oltre 150.000 utenti / mese (secondo una statistica
datata dicembre 2007).
96
• www.liberliber.it
I metamotori
•
•
•
•
•
Un metamotore è un'interfaccia che svolge la sua interrogazione su più
motori di ricerca contemporaneamente.
L'utente digita il testo da cercare nel matamotore che lancia la ricerca,
collegandosi al sito di Google, Yahoo e altri, i quali inviano una risposta che
può essere direttamente presentata all'utente, oppure filtrata secondo alcuni
criteri, in primis l'eliminazione delle ripetizioni.
Il metamotore filtra i risultati forniti da più di un motore di ricerca, per eliminare
eventuali ripetizioni.
Una ricerca su un metamotore può coinvolgere più database insieme, tanti
quanti sono i database dei motori coinvolti. Questo è il principale vantaggio di
questo tipo di motori: raggiungere una quota maggiore di siti della rete,
rispetto all'interrogazione di un solo motore.
Come svantaggio bisogna evidenziare la mancanza di strumenti per la ricerca
avanzata, di cui sono invece dotati i singoli motori.
• http://www.metacrawler.com/
• http://www.ixquick.com/
97
L’obiettivo della ricerca bibliografica
• La ricerca bibliografica ha come
obiettivo l'individuazione di fonti
informative relative ad un determinato
argomento.
1. GLI OPAC (Online Public Acess
Catalog)
• Sono risorse gratuite e quindi consultabili
anche al di fuori della biblioteca
• Consentono di accertare l’esistenza di
documenti all’interno delle biblioteche
• La ricerca può avvenire per: autore, parole
del titolo, soggetti e voci di classificazione
Dewey
2. GLI OPAC e I METAOPAC
• L’OPAC è il catalogo di una biblioteca
• I metaOPAC permettono di interrogare più
cataloghi contemporaneamente; la
schermata di interrogazione è simile a
quella di un opac con l’aggiunta di un
elenco delle biblioteche sulle quali verrà
effettuata la ricerca.
5. GLI OPAC: gli operatori logici
• Di default gli OPAC compiono le ricerche
utilizzano l’operatore AND
• E’ possibile, però, compiere una ricerca
utilizzando anche gli operatori “OR” e
“NOT” e gli operatori di prossimità “ADJ” e
“WITH”
9.GLI OPAC di biblioteche
straniere
• Library of Congress on line Catalog
(http://catalog.loc.gov/)
• The British Library
(http://catalogue.bl.uk/F/?func=file&file_na
me=login-bl-list)
• Karlsruhe Virtual Catalog
(http://www.ubka.unikarlsruhe.de/hylib/en/kvk.html)
1. CATALOGHI COMMERCIALI
• Consentono di individuare libri e riviste in
commercio editi in Italia o all’estero.
• E’ possibile visualizzare gli abstract, gli
indici dei volumi e talvolta anche un
capitolo di prova
2. CATALOGHI COMMERCIALI
• Cataloghi generali
- Amazon (http://www.amazon.com )
- BOL (www.bol.it )
- IBS (www.ibs.it )
Scarica

Introduzione a Internet: concetti base, struttura, applicazioni