Intanto…………Benvenuti !! Oggi cercherò di «convicervi» che: 1. Siamo sotto un diluvio 2. Abbiamo bisogno di acqua 3. Non sappiamo bene come raccoglierla 4. Forse la statistica potrebbe aiutarci 5. La Statistica è una capacità «naturale» 1. Il diluvio: Vorrei cominciare con 2 copertine di riviste importanti Science Magazine 11 febbraio 2011 The Economist 25 febbraio 2010 IBM (e non solo) stima che ogni giorno , l’umanità crea 2,5 x 1018 cioè 2,5 quintilioni di dati elementari (bytes) 2.500.000.000.000.000.000 2,5 miliardi di miliardi (circa 600 miliardi di DVD) Messi uno sull’altro (senza custodia) sarebbe una colonna di oltre 700.000 KM 2volte la distanza terra-luna Secondo le stime di Science (Hilbert & Lopez - 2010): La quantità totale di informazioni archiviate nel mondo nel 2007 sarebbe stata pari a pari a: 2,95 x 1020 = 295.000.000.000.000.000.000 295 miliardi di miliardi Se la stima IBM è (anche approssimativamente) corretta nel 2012 dovremmo stimare 20.000 miliardi di miliardi Circa 100 volte il 2007 e circa il 50% accumulato negli ultimi 2 anni (l’incremento è esponenziale) Praticamente ormai qualsiasi attività umana lascia traccia digitale archiviabile grazie ad una tecnologia PERVASIVA: (esempi mmmmolto parziali) Sensori del clima posts nei social media Foto e video digitali Registrazione di acquisti Segnali GPS E-mail Analisi del genoma umano Ricerche Internet Transazioni di borsa Esami Universitari Visite mediche ………….. Tanto??? SI e NO 1022 bit 10.000.000.000.000.000.000.000 bit; decine di triliardi di bit 1,8 × 1022 bit (2,25 zettabit) Informazioni che (se esistesse una tecnica per farlo) potrebbero essere contenute in un grammo di DNA. Generati da: Generati da Che hanno scaricato 1.760.000.000 40.000.000.000 di apps nella settimana di Natale 39 milioni in Italia di apps dall’apertuta dell’I-store 230.000.000 di brani musicali scaricati illegalmente ogni giorno Inoltre tra chi ha internet, ha effettuato almeno 1 acquisto in rete: 80% in USA 89% in UK 87% in Francia In Italia 1 abitante su 3, circa il 50% di chi ha Internet 2. Abbiamo sete Vabbè, ma tutta questa esplosione di informazioni ci riguarda?????? Ho paura di sì, perché l’effetto più impressionante è sullo studio e l’analisi dei fenomeni, o meglio sui dati a disposizione per “capire” il mondo Oggi il tema fondamentale della conoscenza e del governo dei fenomeni è il trattamento della informazione Forse aveva ragione Hal Varian, chief economist at Google che nel 2009 diceva: “I keep saying that the sexy job in the next 10 years will be statisticians, and I’m not kidding.” Walmart la più grande catena del pianeta operante nella grande distribuzione organizzata. gestisce più di 1 milione di transazioni con i clienti ogni ora, dati che alimentano archivi da più di 2,5 petabyte L'equivalente di 200 volte le informazioni contenute in tutti i libri della Biblioteca del Congresso degli Stati Uniti Il Falcon Credit Card Fraud Detection System controlla più di 2 miliardi di carte di credito in tutto il mondo Sono dati in tempo reale sul comportamento di milioni di consumatori in tutto il mondo Un esempio: Le ricerche della frase «offerta di lavoro» su Google «prevedono» il tasso di disoccupazione Oppure la diffusione dell’influenza O gli effetti di una campagna pubblicitaria 3. NON SAPPIAMO COME RACCOGLIERE E USARE LE INFORMAZIONI INSOMMA….. UN OCEANO DI INFORMAZIONI E tutti sono convintissimi che in quell’oceano ci sia una miniera d’oro favolosa! Facciamo 2 considerazioni: 1. Per quanto enorme questa quantità è risibile di fronte alla complessità di alcuni fenomeni: ad esempio rappresenta appena l’1% delle informazioni codificate nel DNA delle cellule di un uomo 2. Solo per leggere le informazioni fin qui accumulate un essere umano impiegherebbe circa 50.000 miliardi di anni (non facendo altro). Cioè Più di 2.000 volte l’età dell’Universo (a far data dal Big Bang) Certo non tutto è importante, ma come si fa a capire se una cosa è importante senza conoscerla??? E’ una situazione da “BIBLIOTECA DI BABELE” (J.L.Borges) si descrive un allucinante universo che essenzialmente è una biblioteca spazialmente infinita composta di sale esagonali, che raccoglie disordinatamente tutti i possibili libri di 410 pagine che contengono tutte le sequenze di caratteri senza ordine, in tutte le possibili combinazioni. Naturalmente molti libri sono sequenze di caratteri senza senso, però ci sono tutti i libri famosi già scritti e quelli ancora da scrivere, c’è anche il libro che dice la “VERITA’” Ma come si trova un libro nella Biblioteca di Babele???? Semplice, si consulta il catalogo! Ma… Come è fatto il catalogo della Biblioteca di Babele ??? Poiché contiene tutte le possibili sequenze di caratteri che riempiono 410 pagine, vi sono libri che differiscono anche per un solo carattere. Come si distinguono libri diversi per una sola lettera??? Non c’è modo se non leggere tutto il libro!!! Il catalogo della Biblioteca di Babele è la biblioteca stessa! 4.FORSE LA STATISTICA PUO’ SERVIRE…… Tutte le combinazioni, cioè la totale casualità, il massimo di entropia non consente di selezionare alcuna informazione, né di utilizzare conoscenza per definire strategie di comportamento. Tutto il processo evolutivo umano è una lotta per identificare un segnale in una marea di stimoli casuali. Come si fa??? Occorre trovare un mondo più semplice, una biblioteca meno “piena” E dove sta? Nella nostra testa! Probabilmente la nostra arma evolutiva vincente è stata la possibilità di semplificare mediante CONCETTI situazioni complicate. Ciò ci ha permesso di fissare situazioni ripetitive nella memoria e di scoprire REGOLARITA’ Cioè cioò che rimane immutato quando tutto il resto cambia, il “succo” della situazione, la sintesi migliore che ne possiamo fare. BENE: Vedremo che mutamento (Variabilità) e Regolarità (Sintesi) sono le parole chiave della Statistica 5. LA STATISTICA E’ ATTIVITA’ NATURALE COME CONTARE Esempio di rappresentazione di Variabilità e regolarità : I NUMERI Quanti sono gli oggetti nei cerchi ???? E qui? v v v v v v Uhmm un po’ più complicato…….no? v v Non è difficile dimostrare che è presente in ognuno di noi una percezione diretta del numero, una capacità immediata di distinguere insiemi con una quantità diversa di elementi, che però non è legata al contare. Primo caso Nel secondo caso, NON percepiamo direttamente i numeri, dobbiamo contare CONTARE Questo perché una percezione immediata della quantità esiste, ma non supera il numero quattro. Esistono una miriade di esperimenti in proposito e altre prove derivano dai linguaggi ad esempio : In latino solo i numeri da 1 a 4 hanno genere e declinazione, mentre da 5 in poi no. Inoltre i romani chiamavano i figli dal primo al quarto con nomi senza rapporto con i numerali; dal quinto in poi i nomi diventavano Quintus, Sextus, Septimius, Octavius etc. Stesso discorso per l’anno romano che, prima della riforma giuliana, era di 10 mesi: il primo era Martius, poi Aprilis, Maius e Iunius; dal quinto mese in poi troviamo non a caso Quintilis, Sextilis, September, October etc. Questo tipo di percezione non è una vera e propria "struttura culturale", e nemmeno è una prerogativa umana: molti animali la hanno e la usano; il saper distinguere ad "occhio" le quantità di insiemi piccoli, non rende le nostre capacità aritmetiche superiori a quelle di un gatto o di una gallina. Anche qui molti esperimenti cito solo un aneddoto diventato famoso: Un contadino voleva uccidere un corvo che aveva fatto il suo nido in cima a una torre, dentro ai suoi poderi. Ma ogni volta che si avvicinava, l’uccello volava via, fuori dalla portata del suo fucile, finché non si allontanava. Solo allora il corvo ritornava nella torre, riprendendo le sue dannose incursioni sui terreni del contadino. Questi pensò allora di chiedere aiuto a un suo vicino. I due uomini armati entrarono insieme nella torre, ma poco dopo ne uscì soltanto uno. Il corvo però non si lasciò ingannare, e non ritornò al nido finché non fu uscito anche il secondo contadino. Per riuscire ad ingannarlo entrarono poi tre uomini e poi quattro e cinque. Ma il corvo ogni volta aspettava che fossero usciti tutti prima di far ritorno al nido. Soltanto in sei finalmente, i contadini ebbero la meglio, infatti il corvo aspettò che cinque di loro fossero usciti e quindi fiducioso rientrò sulla torre, dove il sesto contadino lo uccise. Quindi il corvo sapeva contare “solo” fino a 5 … Se la percezione, il conteggio “innato” dei numeri arrivo fino a 4-5, significa che il resto è frutto di una astrazione concettuale, di un modello di conteggio Che NON prevede di percepire e conoscere “direttamente” e a memoria tutti i numeri, ma Di conoscere il il modo (modello) in cui i numeri si susseguono, cioè come si passa da un numero al successivo, QUALUNQUE SIA IL NUMERO DI PARTENZA…. Non si conoscono i numeri se si sanno tutti…. Si conoscono se si sa “COME COSTRUIRLI” !!! Questo NON è “CONTARE” è il “MODO (MODELLO) DI CONTARE” Non sottovalutate il problema: Il “MODO (MODELLO) DI CONTARE” Lo conosciamo bene e ci sembra naturale però….. Potrebbe essere descritto come segue: Se devi contare delle cose: 1. Prima devi definire (capire) cosa accomuna quelle cose 2. Poi per contarle devi definire (capire) cose le distingue Uno Statistico direbbe: 1. Prima devi definire il collettivo di interesse 2. Poi devi definire le unità statistiche di quel collettivo BANALE E SEMPLICE??? UHM …. NON SEMPRE: Definisco il collettivo arance: 1. Non considero i limoni (perché non-arance) 2. Distinguo due oggetti sferici nel collettivo 3. CONTO 2 “arance” Idem per i limoni e conto 3 “limoni” MA se definisco il collettivo “AGRUMI”????? Nonostante le regole della maestra elementare (“non si possono sommare le pere con le mele!” CONTERO’ 5 “agrumi” Vedremo che il conteggio è il fondamento della statistica. DUNQUE CONTARE NON E’ UNA OPERAZIONE COSI’ SEMPLICE COME L’ABITUDINE CI PORTA A PENSARE INOLTRE C’E’ IL PROBLEMA CHE, UNA VOLTA CONTATI DEGLI OGGETTI, IL LORO NUMERO VA RAPPRESENTATO IN UN SIMBOLO…… PER: NON CONTARE DUE VOLTE RACCONTARLO AD ALTRI CONTROLLARE QUELLO CHE SI FA ETC… Nasce il linguaggio del modello dei numeri…. E ci abbiamo messo un sacco di tempo per inventarlo….. Cos’è la Statistica ? Statistica = (deriva da Stato -> Collettività) analisi quantitativa (misura) dei fenomeni collettivi variabili, allo scopo di descriverli e di individuare le leggi che permettono di spiegarli e governarli Misura = (deriva dal sanscrito MAS…vedremo dopo) rapporto fra una grandezza e un'altra a essa omogenea, scelta convenzionalmente come unità Rapporto= (deriva da ri-apportare, portare di nuovo) operazione aritmetica elementare, con la quale si conta quante volte un numero contiene un altro numero, e se vi è un resto indivisibile Convenzione = (deriva da convenire=incontrarsi) ciò che trae origine da un accordo comune, da una regola generalmente accettata Il problema del conteggio Contare è associare un numero alla quantità di oggetti contenuti in un insieme Problema 1: Chi fa parte dell’insieme? Problema 2: Come si distinguono le unità che fanno parte dell’insieme? Contare è SIMULTANEAMENTE riconoscere la somiglianza (appartenenza ad uno stesso insieme) e la diversità (i singoli oggetti che compongono l’insieme). Solo chi conosce e condivide questi criteri di omogeneità/diversità può attribuire un significato ai numeri cioè alle misure. UNA OPERAZIONE FORTEMENTE CONVENZIONALE! Parliamo ad esempio del metro Nasce tardissimo! 1792 Dopo la rivoluzione francese. Uno dei primi atti della neonata assemblea legislativa francese Prima: Misura era il rapporto tra parti del corpo e distanze: Inghilterra: •pollice rappresenta la l’ampiezza del dito (2,54 cm) •il piede (12 inches) circa 30,48 cm. •La iarda (3 feet) anticamente la distanza tra la punta del naso e l’estremità del dito medio •Fathom (6 piedi) apertura delle braccia Romani: •Cubito (avambraccio) 44,4 cm •Miglio (miliua) distanza di mille passi (circa 1 KMi) Col passare del tempo la situazione PEGGIORA: in Francia, in Germania, in Russia, 1 inch = 2.708 cm; 1 inch = 2.6 cm ; 1 foot = da 25 a 34 cm 1 foot = 30 cm. 1 foot = 32.5 cm. il miglio (senza aggiungervi –si badi bene- quell’ aggettivo che ne distingueva l’ origine territoriale)!!! Così abbiamo: Miglio romano antico 1000 passi circa Miglio austriaco Miglio danese e del Reno (di Prussia) Miglio di posta austriaco Miglio di Rumenia Miglio geografico Miglio inglese e Stati Uniti d’America Miglio italiano Miglio marittimo internazionale Corrisponde ad 1/60 grado dell'Equatore. 1 nodo = 1 miglio nautico/ora = c. 1,85 Miglio norvegese Miglio nuovo olandese Miglio olandese 1,480 KM 7,585 km. 7,532 km. 7,58594 km. 7,848 km. 7,420 km. 1,609 km. 1,850 km. 1,855 km. km/h 11,295 km. 1,000 km. 7,408 km. La convenzione della misura Occorre mettersi d’accordo, di più, firmare un contratto, una obbligazione. E tutti noi l’abbiamo fatto! RIASSUMIAMO: IL MITO: Caino ha inventato la misura! (e l’omicidio) LA STORIA: Misura e potere: tasse e proprietà terriera Misura e commercio: tante misure di grano (moggio) quanti erano i rapporti commerciali. Ad es. il moggio all’ingrosso era più capiente di quello al minuto (a parità di prezzo) Misura e politica: prima unificazione nell’impero romano Misura e ragione: gli illuministi propongono il sistema metrico Misura e globalizzazione: nel 1875 44 paesi firmano la “convenzione metrologica universale” come strumento per gli scambi commerciali Ancora oggi, non tutti i paesi del mondo hanno aderito 1790: la Commissione di scienziati nominata a Parigi dall’Assemblea Costituente, decise di assumere come unità di lunghezza la quaranta milionesima parte del meridiano terrestre. 1889: Qualche anno più tardi venne depositato negli archivi francesi un campione di metro costituito da una sbarra di platino, detto “metro legale” o “metro degli archivi” 1960: definito come la distanza pari esattamente a 1.650.763,73 lunghezze d’onda della radiazione elettromagnetica corrispondente alla transizione fra i livelli 2p10 e 5d5 dell’isotopo 86 del Kripto. Nel 1984 la definizione di metro è stata cambiata per la quarta volta: a quella data l’unità di misura di lunghezza è stata messa in relazione con la velocità della luce nel vuoto, di cui era possibile misurare il valore con grande precisione. Il metro diventava quindi lo spazio che la luce percorre nel vuoto nell’intervallo di tempo di 1/299.792.458 secondi. Una convenzione non facile…… In Italia le nuove misure si affermano solo nel 1840 altrove anche molto dopo: nel 1965 quando la Gran Bretagna ha avviato un programma di metrication che ha il compito di convertire l'economia del paese al SI nel giro di dieci anni. Nel 1978 non avevano preso una decisione legislativa in favore dell'adozione del SI: Birmania, Gambia, Liberia, Oman, Sierra Leone, Stati Uniti, Tonga, Rep. Dem. Pop. dello Yemen. Il Canada si è espresso nel 1970 in favore del sistema metrico, la cui introduzione, avviata nel 1974, dovrebbe terminare entro il 1980. Negli USA, che ammisero l'uso del sistema metrico nel 1866, la metrication è oggetto di dibattito; il sistema SI è reso obbligatorio nelle forniture a taluni enti statali, si diffonde, in particolare per le misure di temperatura, ma non è obbligatorio per legge.