Indici di posizione Dove si trova la distribuzione? Qual è l’ordine di grandezza dei dati? x La media aritmetica X assume n valori x1, x2, …, xn 1 1 n x x1 x2 xn xi n n i1 La media indica qual è l’ordine di grandezza dei dati Esempio 3.1a Tabella 2.10 – Consumi alimentari pro-capite (consumo annuo in chilogrammi) 1992-93. Burro Belgio 7 Danimarca 3 Germania 7 Grecia 1 Spagna 1 Francia 9 Irlanda 3 Italia 2 Paesi Bassi 3 Portogallo 1 Regno Unito 3 Finlandia 6 Austria 4 Svezia 2 Norvegia 2 Svizzera 6 Consumo medio di burro 1 x 7 3 7 1 1 9 3 2 16 3 1 3 6 4 2 2 6 60 3.75. 16 Esempio 3.1b: In una test di apprendimento le risposte sono state codificate 0 o 1 a seconda che siano errate oppure esatte. 1–0–0–1–1–1–1–1–0–1 – 0 – 1 – 1 – 1 – 0 – 0 -1 La media aritmetica, pari a 11/17, rappresenta la proporzione di risposte esatte e si definisce “indice di difficoltà dell’item” Media da distribuzione di frequenza X assume k valori x1, x2, …, xk con frequenze n1, n2, …, nk 1 k x xi ni n i1 Ciascuna osservazione è ponderata per la frequenza corrispondente Esempio 3.2 Tabella 3.1 – Anni impiegati per laurearsi. xi ni xi ni 4 2 42 5 21 521 6 51 651 7 58 758 8 46 846 9 7 97 11 1 111 15 1 151 187 1282 1 x 4 2 5 21 6 51 7 58 187 8 46 9 7 11 1 15 1 6.86 Tempo medio: 6 anni, 10 mesi e 10 giorni Media da distribuzione di frequenza relativa X assume k valori x1, x2, …, xk con frequenze f1, f2, …, fk k 1 k ni x xi ni xi n i1 n i1 k x xi fi i1 Esempio 3.2 – media da distribuzione di frequenze relative Tabella 3.1 – Anni impiegati per laurearsi. xi ni fi 4 2 0.0107 5 21 0.1123 6 51 0.2727 7 58 0.3102 8 46 0.2460 9 7 0.0374 11 1 0.00535 15 1 0.00535 187 x 4 0.0107 5 0.1123 6 0.2727 7 0.3102 8 0.2460 9 0.0374 11 0.00535 15 0.00535 6.86. Media da dati raggruppati in classi o k classi (x0 – x1), (x1 – x2), … , (xk-1 – xk) o con frequenze n1, n2, … , nk 1) Per ogni classe di calcola il valore centrale x0 x1 x1 x2 xk 1 xk x1 , x2 , , xk 2 2 2 2) Quindi si ottiene un’approssimazione della media x k 1 k xi ni xi fi n i1 i1 Esempio 3.3 – Media rendimenti Tabella 3.3 – Calcolo della media per i rendimenti dei fondi. xi x i ni ni Classi -1.0 |– 1.0 0.0 9 0.0 1.0 |– 2.0 1.5 23 34.5 2.0 |– 3.0 2.5 24 60.0 3.0 |– 4.0 3.5 8 28.0 4.0 |– 6.0 5.0 9 45.0 6.0 |– 8.0 7.0 3 21.0 8.0 |– 10.0 9.0 3 27.0 10.0 |– 12.0 11.0 1 11.0 Totale 80 226.5 x 1 k 226.5 xi ni 2.831 n i1 80 x 2.834 La mediana Def: E’ il valore centrale: divide i dati in due parti di eguale numerosità 1. Si ordinano i dati x1 x(2) x(n) 2. Si calcola la profondità della mediana n 1 prof(med) 2 3. La mediana è l’osservazione corrispondente alla posizione individuata dalla profondità. n dispari med x n 1 2 n pari xn /2 xn /21 med 2 Mediana - esempi n 1 prof(med) 2 n dispari med x n 1 2 n pari xn /2 xn /21 med 2 (4, 7, 12, 23, 61) n=5 dispari prof(med) = (5+1)/2=3 med = x(3) = 12 (5, 7, 12, 22, 36, 61) n=6 pari prof(med) = (6+1)/2=3.5 med = (x(3) + x(4))/2 = (12+22)/2=17 Esempio 3.4 – mediana cereali Cereali x7 ( 58, 64, 68, 70, 71, 71, 72, 74, 76, 78, 87, 103, 121 ) x 77.92 n=13 prof(med) 13 1 7 2 Med = x(7) = 72 Esempio 3.5 – mediana consumi di carne Carne ( 55, 61, 62, 66, 68, 75, 85, 86, 88, 91, 97, 107, 152, 231, 299, 329 ) n=16 16 1 prof(med) 8.5 2 Med = (x(7) + x (8))/2= (86+88)/2=87 x 122 Mediana da dati raggruppati in classi Tabella 2.5 – Distribuzione rendimenti dei fondi. Rendimento -1.0 |– 1.0 1.0 |– 2.0 2.0 |– 3.0 3.0 |– 4.0 4.0 |– 6.0 6.0 |– 8.0 8.0 |– 10.0 10.0 |– 12.0 Totale in classi dei ni 9 23 24 8 9 3 3 1 80 Prof(med)=(80+1)/2=40,5 Mediana da dati raggruppati in classi Tabella 2.5 – Distribuzione in classi dei rendimenti dei fondi. Rendimento ni Ni -1.0 |– 1.0 9 9 1.0 |– 2.0 23 32 2.0 |– 3.0 24 56 3.0 |– 4.0 8 64 4.0 |– 6.0 9 73 6.0 |– 8.0 3 76 8.0 |– 10.0 3 79 10.0 |– 12.0 1 80 Totale 80 Prof(med)=(80+1)/2=40,5 2.0 |- 3.0 è la classe mediana Resistenza della media e della mediana Osservazione anomale: osservazione distante dalla maggioranza degli altri dati. xxxxx x La mediana è resistente rispetto alle osservazioni anomale (1, 2, 3, 4, 5) med x 3 xxxxx (1, 2, 3, 4, 50) x med 3 x 12 N.B. Nelle applicazioni in ambito educativo, in cui si effettuano valutazioni attraverso punteggi (es. numero di risposte esatte in prove di apprendimento), può essere utile il confronto tra mediana e media aritmetica, perché è possibile dire in tal modo se sono sopra (mediana maggiore della media aritmetica) o sotto la media (mediana minore della media aritmetica) oltre il 50% dei soggetti valutati. La moda Considerata una variabile statistica X che assume • k valori x1, x2, …, xk • con frequenze n1, n2, …, nk La moda è il valore che ha massima frequenza Tabella 3.1 – Anni impiegati per laurearsi. moda xi 4 5 6 7 8 9 11 15 ni 2 21 51 58 46 7 1 1 187 Moda per caratteri qualitativi Considerato un carattere statistico che assume • k modalità m1, m2, …, mk • con frequenze n1, n2, …, nk La moda è la modalità che ha massima frequenza Telespettatori (in migliaia) delle emittenti televisive. Emittente Telespettatori RAI 1 7873 moda RAI 2 2377 RAI 3 2664 Canale 5 7665 Rete 4 2007 Italia 1 3162 La Sette 910 Altre emittenti terrestri 1857 Altre emittenti satellite 687 I quartili I quartili dividono i dati in quattro parti di eguale numerosità. Q1 x 1 Q2 med 4 1/4 E1 1/4 Q1 Q3 x 3 4 1/4 med 1/4 Q3 Profondità del quartile prof med 1 prof Q1 2 o Ottili o Sedicili o etc. E2 Esempio – quartili -cereali Cereali 5 6 7 8 9 10 11 12 n=13 8 48 0112468 7 Med=72 prof med 7 prof Q1 3 7 1 4 2 Q1=70 Q3=78 1 M Q E Sintesi 72 70 58 78 121 Esempio – quartili –consumi di carne Carne ( 55, 61, 62, 66, 68, 75, 85, 86, 88, 91, 97, 107, 152, 231, 299, 329 ) n=16 prof Q1 Med=85 prof med 85 . 8.5 1 4.5 2 66 68 Q1 67 2 107 152 Q3 129.5 2 Sintesi M Q E 85 67 55 129.5 329