Elaborazione Statistica dei Dati Sperimentali Facoltà di Scienze MM FF e NN, Università Sannio Introduzione al Corso Giovanni Filatrella ([email protected]) G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 1 A chi è rivolto questo corso • Studenti di Biotecnologie immatricolati nel 2004/2005 e quindi iscritti al primo anno; • Studenti di Biotecnologie immatricolati nel 2003/2004 e quindi iscritti al secondo anno; • Studenti di Scienze Biologiche che hanno inserito questo corso fra quelli “a scelta”. G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 2 Durata del corso • Studenti di Biotecnologie (4 crediti): 16 lezioni – 8 settimane • Studenti di Scienze Biologiche (3 crediti): 12 lezioni – 6 settimane • Vi potrebbero essere delle brevi interruzioni del corso, che saranno comunicate con tutto l’anticipo possibile G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 3 Orari Il corso: • Lunedì: 11-13 • Mercoledì: 11-13 Ricevimento e tutoraggio: • Lunedì: 14-16 • Mercoledì: 14-16 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 4 Testi • I testi base sono: – “Elaborazione statistica dei dati sperimentali” G. Filatrella e P. Romano, EdiSES – “Introduzione all’elaborazione dei dati sperimentali” Cesare Cametti e Antonio di Biasio, CISU • Per gli esercizi: "Statistica“ M.R. Spiegel, Collana "Shaum's", McGraw-Hill Italia • Un testo alternativo di teoria ed esercizi: “Biostatistica” W.W. Daniel, EdiSES G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 5 Altri testi • “Metodi statistici per la sperimentazione biologica”, A. Camussi, F. Moeller, E. Ottaviano, M. Sari Gorla, Zanichelli. Un testo molto ampio orientato verso le applicazioni biologiche • “Laboratorio di Fisica: Statistica”, F. Barone, L. Milano, G. Russo, EdiSES Un manuale sintetico per l’elaborazioni di misure soprattutto fisiche • “Incertezza e probabilità”, R. Scozzafava, Zanichelli Una rigorosa introduzione alla teoria della probabilità G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 6 Siti internet Molti siti internet, ad esempio del prof. Soliani http://www.dsa.unipr.it/soliani/soliani.html Con molto materiale gratis o disponibile alla casa editrice UNI.NOVA di Parma (e-mail) [email protected] (tel.) 0521/293315 (fax) 0521/503199 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 7 Siti internet in inglese Un testo dettagliatissimo disponibile gratis on-line: C. M. Grinstead, J. Laurie Snell “Introduction to Probability“ http://www.dartmouth.edu/~chance/teaching_aids /books_articles/probability_book/book.html Un corso on-line a Berkeley con molti dettagli ed una buona presentazione on-line: http://www.stat.Berkeley.EDU/users/stark/SticiG ui G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 8 Ulteriori informazioni • Guida dello studente • Sito per le lezioni e le news sul corso: www.ecampus.unisannio.it • E-mail: [email protected] • Pagina web del docente: www.sa.infn.it/giovanni.filatrella G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 9 Il portale didattico www.ecampus.unisannio.it • Per accedere occorre registrarsi ed iscriversi al corso; • Sono disponibili anche altri corsi nello stesso portale; • Il sito è tenuto dal Prof. Ceccarelli e dai suoi collaboratori; • Materiale disponibile sul sito: – Le trasparenze delle lezioni, nella versione ragionevolmente aggiornata – Gli esercizi assegnati agli esami – Un’area per scambiare informazioni (mai usata finora) – Una bacheca virtuale per gli avvisi (cambiamenti di orario delle lezioni, calendario degli appelli) G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 10 Scopo del corso Acquisire i primi elementi per l'elaborazione di dati provenienti da misure soggette ad errori casuali G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 11 Prerequisiti al corso Il corso non ha esami propedeutici MA • Si ricorre spesso a manipolazioni algebriche • Il legame con il metodo sperimentale (soprattutto della Fisica, ma anche della Chimica e della Biologia) è rilevante G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 12 Programma del corso 3 C 1. Statistica descrittiva R a) Eventi deterministici e fenomeni aleatori. Definizione di frequenza di un evento casuale. D b) Scopi della statistica descrittiva. Tabelle di dati. Definizione di percentile. Distribuzioni di frequenza. Lettura di un istogramma e sua realizzazione a partire dai dati grezzi. I c) Indici di posizione (Moda, Mediana e Media) e misure di dispersione (Range, Range Interquartile, Scarto Quadratico Medio). T 2. Teoria della probabilità I a) b) c) Definizione di probabilità. Teoria assiomatica della probabilità. Legge dei grandi numeri. Probabilità condizionata. Eventi indipendenti. Variabili casuali. Distribuzioni di probabilità. Valore aspettato e varianza. Esempi di distribuzioni di probabilità discrete: Binomiale, Poisson. Distribuzioni di probabilità continue. Densità di probabilità. Valore aspettato e varianza per le distribuzioni continue. Distribuzione uniforme e di Gauss. Integrale gaussiano ed uso delle tavole. Teorema del limite centrale e sue applicazioni. S C. B I O L. 3. Statistica inferenziale a) b) c) d) Il principio di massima verosimiglianza. Applicazione del principio di massima verosimiglianza alla determinazione dei parametri di una distribuzione binomiale, di Poisson, e di Gauss. Intervalli di confidenza. Metodo dei minimi quadrati per la determinazione dei parametri di una relazione lineare. G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 13 Verifiche • L’esame scritto consiste nella risposta ad una serie di domande su tabelle di dati e nella successiva discussione dell’elaborato; • Ulteriori informazioni al sito: www.e-campus.unisannio.it G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 14 Come studiare questo corso • Individuare le definizioni fondamentali ed i concetti di base. Concentrarsi su questi (pochi) • Costruire la preparazione con ordine: è inutile provare a studiare concetti avanzati se non si padroneggiano quelli più elementari • Porre l’accento sulle applicazioni e gli esercizi • Usare i testi, le trasparenze e le lezioni con giudizio: sono strumenti complementari e ciascuno da solo incompleto G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 15 Struttura del corso 3) Statistica inferenziale 2) Teoria della probabilità 1) Statistica descrittiva Statistica descrittiva: Come si rappresentano i dati quando si conosce “tutto” Probabilità Satistica Inferenziale: Come si prevedono i dati sconosciuti sulla base di quelli conosciuti G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 16 Quali dati vengono analizzati con i metodi statistici • • • I dati soggetti a variabilità, per i quali non esiste una risposta univoca a domande tipo: quanto vale? Quanto misura? Esempi: a) La temperatura il 6 Ottobre b) Il numero di figli per famiglia c) L’altezza di un individuo Ognuna di queste grandezze è però misurabile G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 17 Cos’è la statistica? La statistica è la scienza di raccogliere ed analizzare i dati sperimentali allo scopo di trarre conclusioni e prendere decisioni. Come fare? 1. Raccogliere i dati sperimentali 2. Ordinare i dati 3. Elaborare i dati con un procedimento appropriato per trarne informazioni quantitative Queste fasi hanno una terminologia propria: • Statistica descrittiva: la raccolta dei dati • Teoria della probabilità: l’analisi matematica dei fenomeni casuali • Statistica inferenziale:il procedimento di previsione G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 18 Esistono applicazioni della statistica in diversi settori “Statistical thinking will one day be as necessary for efficient citizenship as the ability to read and write.” H. G. Wells • Economico • • • • • Previsioni su sistemi in evoluzione Sociologico Campioni rappresentativi Biologico Estrema variabilità Fisico Effetti molto piccoli Controllo di qualità Semplicità di applicazione …. G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 19 What the Experts Say There are two kinds of statistics: the kind you look up and the kind you make up --Rex Stout (1886-1975), Death of a Doxy There are three kinds of lies: lies, damned lies, and statistics --Mark Twain (1835-1910), American novelist and humorist, Autobiography G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 20 La statistica analizza ciò che non si presenta in maniera sempre identica Gary Larson "You're new here, aincha, kid? Well, on some days the sandwiches contain a dead scorpion...Not every day; but some days -- that's why it's hell, kid." 21 G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali Buon lavoro! G. Filatrella: Corso di Elaborazione Statistica dei Dati Sperimentali 22