Intanto…………Benvenuti !!
Oggi cercherò di «convicervi» che:
1. Siamo sotto un diluvio
2. Abbiamo bisogno di acqua
3. Non sappiamo bene come raccoglierla
4. Forse la statistica potrebbe aiutarci
5. La Statistica è una capacità «naturale»
1. Il diluvio:
Vorrei cominciare con 2
copertine di riviste importanti
Science Magazine
11 febbraio 2011
The Economist
25 febbraio 2010
IBM (e non solo) stima che ogni giorno , l’umanità crea
2,5 x 1018 cioè 2,5 quintilioni di dati elementari (bytes)
2.500.000.000.000.000.000
2,5 miliardi di miliardi (circa 600 miliardi di DVD)
Messi uno sull’altro (senza custodia) sarebbe una colonna di oltre 700.000
KM 2volte la distanza terra-luna
Secondo le stime di Science (Hilbert & Lopez - 2010):
La quantità totale di informazioni archiviate nel mondo nel 2007 sarebbe
stata pari a pari a:
2,95 x 1020 = 295.000.000.000.000.000.000
295 miliardi di miliardi
Se la stima IBM è (anche approssimativamente) corretta
nel 2012 dovremmo stimare 20.000 miliardi di miliardi
Circa 100 volte il 2007 e
circa il 50% accumulato negli ultimi 2 anni
(l’incremento è esponenziale)
Praticamente ormai qualsiasi attività umana lascia traccia digitale
archiviabile grazie ad una tecnologia PERVASIVA:
(esempi mmmmolto parziali)
Sensori del clima
posts nei social media
Foto e video digitali
Registrazione di acquisti
Segnali GPS
E-mail
Analisi del genoma umano
Ricerche Internet
Transazioni di borsa
Esami Universitari
Visite mediche
…………..
Tanto??? SI e NO
1022 bit
10.000.000.000.000.000.000.000 bit;
decine di triliardi di bit
1,8 × 1022 bit (2,25 zettabit)
Informazioni che (se esistesse una tecnica per farlo) potrebbero essere
contenute in un grammo di DNA.
Generati da:
Generati da
Che hanno scaricato
1.760.000.000
40.000.000.000
di apps nella settimana di Natale
39 milioni in Italia
di apps dall’apertuta dell’I-store
230.000.000
di brani musicali scaricati
illegalmente ogni giorno
Inoltre tra chi ha internet, ha effettuato almeno 1 acquisto in rete:
80% in USA
89% in UK
87% in Francia
In Italia 1 abitante su 3, circa il 50% di chi ha Internet
2. Abbiamo sete
Vabbè, ma tutta questa esplosione di informazioni ci riguarda??????
Ho paura di sì, perché l’effetto più impressionante è sullo studio e l’analisi dei
fenomeni, o meglio sui dati a disposizione per “capire” il mondo
Oggi il tema fondamentale della conoscenza e del governo dei fenomeni è il
trattamento della informazione
Forse aveva ragione Hal Varian, chief economist at Google che nel 2009 diceva:
“I keep saying that the sexy job in the next 10 years will be statisticians, and
I’m not kidding.”
Walmart
la più grande catena del pianeta operante nella grande distribuzione
organizzata.
gestisce più di 1 milione di transazioni con i clienti ogni ora, dati che
alimentano archivi da più di 2,5 petabyte L'equivalente di 200 volte le
informazioni contenute in tutti i libri della Biblioteca del Congresso degli
Stati Uniti
Il Falcon Credit Card Fraud Detection System controlla più di 2 miliardi
di carte di credito in tutto il mondo
Sono dati in tempo reale sul comportamento di milioni di consumatori in
tutto il mondo
Un esempio:
Le ricerche della frase «offerta di lavoro» su Google
«prevedono» il tasso di disoccupazione
Oppure la diffusione dell’influenza
O gli effetti di una campagna pubblicitaria
3. NON SAPPIAMO COME RACCOGLIERE E USARE LE INFORMAZIONI
INSOMMA….. UN OCEANO DI INFORMAZIONI
E tutti sono convintissimi che in quell’oceano ci sia una miniera d’oro favolosa!
Facciamo 2 considerazioni:
1.
Per quanto enorme questa quantità è risibile di fronte alla complessità di
alcuni fenomeni: ad esempio rappresenta appena l’1% delle informazioni
codificate nel DNA delle cellule di un uomo
2.
Solo per leggere le informazioni fin qui accumulate un essere umano
impiegherebbe circa 50.000 miliardi di anni (non facendo altro). Cioè Più
di 2.000 volte l’età dell’Universo (a far data dal Big Bang)
Certo non tutto è importante, ma come si fa a capire se una cosa è importante
senza conoscerla???
E’ una situazione da
“BIBLIOTECA DI BABELE” (J.L.Borges)
si descrive un allucinante universo che essenzialmente è
una biblioteca spazialmente infinita composta di
sale esagonali, che raccoglie disordinatamente tutti i
possibili libri di 410 pagine che contengono tutte le
sequenze di caratteri senza ordine, in tutte le possibili
combinazioni.
Naturalmente molti libri sono sequenze di caratteri senza
senso, però ci sono tutti i libri famosi già scritti e quelli
ancora da scrivere, c’è anche il libro che dice la
“VERITA’”
Ma come si trova un libro nella Biblioteca di Babele????
Semplice, si consulta il catalogo!
Ma…
Come è fatto il catalogo della Biblioteca di Babele ???
Poiché contiene tutte le possibili sequenze di caratteri che riempiono 410 pagine,
vi sono libri che differiscono anche per un solo carattere.
Come si distinguono libri diversi per una sola lettera???
Non c’è modo se non leggere tutto il libro!!!
Il catalogo della Biblioteca di Babele è la biblioteca stessa!
4.FORSE LA STATISTICA PUO’ SERVIRE……
Tutte le combinazioni, cioè la totale casualità, il massimo di entropia non consente
di selezionare alcuna informazione, né di utilizzare conoscenza per definire
strategie di comportamento.
Tutto il processo evolutivo umano è una lotta per identificare un segnale in una
marea di stimoli casuali.
Come si fa??? Occorre trovare un mondo più semplice, una biblioteca meno “piena”
E dove sta? Nella nostra testa! Probabilmente la nostra arma evolutiva vincente è
stata la possibilità di semplificare mediante CONCETTI situazioni complicate.
Ciò ci ha permesso di fissare situazioni ripetitive nella memoria e di scoprire
REGOLARITA’
Cioè cioò che rimane immutato quando tutto il resto cambia, il “succo” della
situazione, la sintesi migliore che ne possiamo fare.
BENE: Vedremo che mutamento (Variabilità) e Regolarità (Sintesi) sono le parole
chiave della Statistica
5. LA STATISTICA E’ ATTIVITA’ NATURALE COME CONTARE
Esempio di rappresentazione di Variabilità e regolarità : I NUMERI
Quanti sono gli oggetti nei cerchi ????
E qui?
v
v
v
v
v
v
Uhmm un po’ più complicato…….no?
v
v
Non è difficile dimostrare che è presente in ognuno di noi
una percezione diretta del numero, una capacità
immediata di distinguere insiemi con una quantità diversa
di elementi, che però non è legata al contare. Primo caso
Nel secondo caso, NON percepiamo direttamente i
numeri, dobbiamo contare CONTARE
Questo perché una percezione immediata della quantità
esiste, ma non supera il numero quattro.
Esistono una miriade di esperimenti in proposito e altre prove derivano
dai linguaggi ad esempio :
In latino solo i numeri da 1 a 4 hanno genere e declinazione, mentre da 5
in poi no.
Inoltre i romani chiamavano i figli dal primo al quarto con nomi senza
rapporto con i numerali; dal quinto in poi i nomi diventavano Quintus,
Sextus, Septimius, Octavius etc.
Stesso discorso per l’anno romano che, prima della riforma giuliana, era di
10 mesi: il primo era Martius, poi Aprilis, Maius e Iunius; dal quinto mese
in poi troviamo non a caso Quintilis, Sextilis, September, October etc.
Questo tipo di percezione non è una vera e propria "struttura culturale", e
nemmeno è una prerogativa umana: molti animali la hanno e la usano;
il saper distinguere ad "occhio" le quantità di insiemi piccoli, non rende le
nostre capacità aritmetiche superiori a quelle di un gatto o di una gallina.
Anche qui molti esperimenti cito solo un aneddoto diventato famoso:
Un contadino voleva uccidere un corvo che aveva fatto il suo nido in
cima a una torre, dentro ai suoi poderi.
Ma ogni volta che si avvicinava, l’uccello volava via, fuori dalla portata
del suo fucile, finché non si allontanava. Solo allora il corvo ritornava
nella torre, riprendendo le sue dannose incursioni sui terreni del
contadino.
Questi pensò allora di chiedere aiuto a un suo vicino. I due uomini
armati entrarono insieme nella torre, ma poco dopo ne uscì soltanto
uno. Il corvo però non si lasciò ingannare, e non ritornò al nido finché
non fu uscito anche il secondo contadino.
Per riuscire ad ingannarlo entrarono poi tre uomini e poi quattro e
cinque. Ma il corvo ogni volta aspettava che fossero usciti tutti prima
di far ritorno al nido.
Soltanto in sei finalmente, i contadini ebbero la meglio, infatti il corvo
aspettò che cinque di loro fossero usciti e quindi fiducioso rientrò
sulla torre, dove il sesto contadino lo uccise.
Quindi il corvo sapeva contare “solo” fino a 5 …
Se la percezione, il conteggio “innato” dei numeri arrivo fino a 4-5, significa che
il resto è frutto di una astrazione concettuale, di un modello di conteggio
Che NON prevede di percepire e conoscere “direttamente” e a memoria tutti i
numeri, ma
Di conoscere il il modo (modello) in cui i numeri si susseguono, cioè come si
passa da un numero al successivo,
QUALUNQUE SIA IL NUMERO DI PARTENZA….
Non si conoscono i numeri se si sanno tutti…. Si conoscono se si sa “COME
COSTRUIRLI” !!!
Questo NON è “CONTARE” è il
“MODO (MODELLO) DI CONTARE”
Non sottovalutate il problema:
Il “MODO (MODELLO) DI CONTARE”
Lo conosciamo bene e ci sembra naturale però…..
Potrebbe essere descritto come segue:
Se devi contare delle cose:
1. Prima devi definire (capire) cosa accomuna quelle cose
2. Poi per contarle devi definire (capire) cose le distingue
Uno Statistico direbbe:
1. Prima devi definire il collettivo di interesse
2. Poi devi definire le unità statistiche di quel collettivo
BANALE E SEMPLICE??? UHM …. NON SEMPRE:
Definisco il collettivo arance:
1. Non considero i limoni (perché non-arance)
2. Distinguo due oggetti sferici nel collettivo
3. CONTO 2 “arance”
Idem per i limoni e conto 3 “limoni”
MA se definisco il collettivo “AGRUMI”?????
Nonostante le regole della maestra elementare (“non si possono sommare le
pere con le mele!”
CONTERO’ 5 “agrumi”
Vedremo che il conteggio è il fondamento della statistica.
DUNQUE CONTARE NON E’ UNA OPERAZIONE COSI’ SEMPLICE COME
L’ABITUDINE CI PORTA A PENSARE
INOLTRE C’E’ IL PROBLEMA CHE, UNA VOLTA CONTATI DEGLI OGGETTI, IL
LORO NUMERO VA RAPPRESENTATO IN UN SIMBOLO……
PER:
NON CONTARE DUE VOLTE
RACCONTARLO AD ALTRI
CONTROLLARE QUELLO CHE SI FA
ETC…
Nasce il linguaggio del modello dei numeri….
E ci abbiamo messo un sacco di tempo per inventarlo…..
Cos’è la Statistica ?
Statistica = (deriva da Stato -> Collettività) analisi quantitativa
(misura) dei fenomeni collettivi variabili, allo scopo di descriverli
e di individuare le leggi che permettono di spiegarli e governarli
Misura = (deriva dal sanscrito MAS…vedremo dopo) rapporto fra una
grandezza e un'altra a essa omogenea, scelta convenzionalmente come
unità
Rapporto= (deriva da ri-apportare, portare di nuovo) operazione
aritmetica elementare, con la quale si conta quante volte un numero
contiene un altro numero, e se vi è un resto indivisibile
Convenzione = (deriva da convenire=incontrarsi) ciò che trae origine
da un accordo comune, da una regola generalmente accettata
Il problema del conteggio
Contare è associare un numero alla quantità di oggetti contenuti in un
insieme
Problema 1: Chi fa parte dell’insieme?
Problema 2: Come si distinguono le unità che fanno parte dell’insieme?
Contare è SIMULTANEAMENTE riconoscere la somiglianza
(appartenenza ad uno stesso insieme) e la diversità (i singoli oggetti che
compongono l’insieme).
Solo chi conosce e condivide questi criteri di omogeneità/diversità può
attribuire un significato ai numeri cioè alle misure.
UNA OPERAZIONE FORTEMENTE CONVENZIONALE!
Parliamo ad esempio del metro
Nasce tardissimo! 1792 Dopo la rivoluzione francese.
Uno dei primi atti della neonata assemblea legislativa francese
Prima:
Misura era il rapporto tra parti del corpo e distanze:
Inghilterra:
•pollice rappresenta la l’ampiezza del dito (2,54 cm)
•il piede (12 inches) circa 30,48 cm.
•La iarda (3 feet) anticamente la distanza tra la punta del naso e l’estremità
del dito medio
•Fathom (6 piedi) apertura delle braccia
Romani:
•Cubito (avambraccio) 44,4 cm
•Miglio (miliua) distanza di mille passi (circa 1 KMi)
Col passare del tempo la situazione PEGGIORA:
in Francia,
in Germania,
in Russia,
1 inch = 2.708 cm;
1 inch = 2.6 cm ;
1 foot = da 25 a 34 cm
1 foot = 30 cm.
1 foot = 32.5 cm.
il miglio (senza aggiungervi –si badi bene- quell’ aggettivo
che ne distingueva l’ origine territoriale)!!!
Così abbiamo:
Miglio romano antico 1000 passi circa
Miglio austriaco
Miglio danese e del Reno (di Prussia)
Miglio di posta austriaco
Miglio di Rumenia
Miglio geografico
Miglio inglese e Stati Uniti d’America
Miglio italiano
Miglio marittimo internazionale
Corrisponde ad 1/60 grado dell'Equatore.
1 nodo = 1 miglio nautico/ora = c. 1,85
Miglio norvegese
Miglio nuovo olandese
Miglio olandese
1,480 KM
7,585 km.
7,532 km.
7,58594 km.
7,848 km.
7,420 km.
1,609 km.
1,850 km.
1,855 km.
km/h
11,295 km.
1,000 km.
7,408 km.
La convenzione della misura
Occorre mettersi d’accordo, di più, firmare un contratto, una obbligazione.
E tutti noi l’abbiamo fatto! RIASSUMIAMO:
IL MITO: Caino ha inventato la misura! (e l’omicidio)
LA STORIA: Misura e potere: tasse e proprietà terriera
Misura e commercio: tante misure di grano (moggio) quanti erano i rapporti
commerciali. Ad es. il moggio all’ingrosso era più capiente di quello al minuto
(a parità di prezzo)
Misura e politica: prima unificazione nell’impero romano
Misura e ragione: gli illuministi propongono il sistema metrico
Misura e globalizzazione: nel 1875 44 paesi firmano la “convenzione
metrologica universale” come strumento per gli scambi commerciali
Ancora oggi, non tutti i paesi del mondo hanno aderito
1790: la Commissione di scienziati nominata a Parigi dall’Assemblea Costituente,
decise di assumere come unità di lunghezza la quaranta milionesima parte del
meridiano terrestre.
1889: Qualche anno più tardi venne depositato negli archivi francesi un campione di
metro costituito da una sbarra di platino, detto “metro legale” o “metro degli
archivi”
1960: definito come la distanza pari esattamente a 1.650.763,73 lunghezze
d’onda della radiazione elettromagnetica corrispondente alla transizione fra
i livelli 2p10 e 5d5 dell’isotopo 86 del Kripto.
Nel 1984 la definizione di metro è stata cambiata per la quarta volta: a quella data
l’unità di misura di lunghezza è stata messa in relazione con la velocità della luce nel
vuoto, di cui era possibile misurare il valore con grande precisione.
Il metro diventava quindi lo spazio che la luce percorre nel vuoto
nell’intervallo di tempo di 1/299.792.458 secondi.
Una convenzione non facile……
In Italia le nuove misure si affermano solo nel 1840
altrove anche molto dopo:
nel 1965 quando la Gran Bretagna ha avviato un programma di metrication che ha
il compito di convertire l'economia del paese al SI nel giro di dieci anni.
Nel 1978 non avevano preso una decisione legislativa in favore dell'adozione del
SI: Birmania, Gambia, Liberia, Oman, Sierra Leone, Stati Uniti, Tonga, Rep. Dem.
Pop. dello Yemen.
Il Canada si è espresso nel 1970 in favore del sistema metrico, la cui introduzione,
avviata nel 1974, dovrebbe terminare entro il 1980.
Negli USA, che ammisero l'uso del sistema metrico nel 1866, la metrication è
oggetto di dibattito; il sistema SI è reso obbligatorio nelle forniture a taluni enti
statali, si diffonde, in particolare per le misure di temperatura, ma non è obbligatorio
per legge.
Scarica

Introduzione