SCALA INTERVALLO / A RAPPORTO STATISTICHE: Moda - Mediana - Media NdE – Quartili – Quantili – Range – Varianza – Deviazione standard Difficoltà nel riassumere i dati a causa di un numero di categorie elevato (nel caso di valori discreti NdE>18) o perché la variabile è di tipo continuo. Raccogliere i valori in Intervalli di Classe SCALA INTERVALLO / A RAPPORTO • Possibili rapporti di uguaglianza (livello nominale). • Possibili rapporti di ordine (livello ordinale). • Esiste un’unità di misura (intervallo) che permette di stabilire la distanza fra 2 categorie. • Per definire le statistiche bisogna definire se le variabili sono di tipo discreto o continuo. STATISTICHE: • Moda - Mediana – Media • Quartili – Quantili • NdE –– Range – Varianza – Deviazione standard Tre misure di tendenza centrale MEDIA MEDIANA MODA Indici di tendenza centrale 5 4,5 4 3,5 Casi Casi 3 2,5 6 12 5,5 11 5 10 4,5 9 4 8 3,5 7 3 6 2,5 f 2 f 5 2 4 1,5 1,5 3 1 1 2 0,5 1 0,5 0 0 1 2 3 4 5 Voto 6 7 8 9 0 1 2 3 4 5 6 7 8 9 Voto Qual è il punto centrale della distribuzione? 1 2 3 4 5 Voto 6 7 8 9 Indici di tendenza centrale: la media aritmetica Maritmetica = xi / n M aritmetica Ponderata Xf X= n Indici di tendenza centrale: la media aritmetica Allora potremmo estrapolare una grandezza M tale che Xtot = M + M + M + ….. + M Per cui M + M + M + ….. + M = x1 + x2 + x3 +……+ xn Da qui: nM = xi Maritmetica= xi / n La media • La media di una distribuzione è la somma dei valori osservati divisa dal numero delle osservazioni = X N X= X n Popolazione Campione N: La grandezza della popolazione n: La grandezza del campione La media Codice_studente (25 25 25 26 26 27 27 29 29 30) 10 269 = = 26,9 10 X= 7 8 9 3 5 1 6 10 4 2 Voto 25 25 25 26 26 27 27 29 29 30 Indici di tendenza centrale: la media aritmetica Perché si chiama così? Essa si chiama aritmetica perché se applicata ad una progressione aritmetica, costituita da un numero dispari di elementi, ne costituisce l’elemento centrale. Esempio: 13, 16, 19, 22, 25 Media = (13+16+19+22+25)/5= 19 (valore centrale della progressione) Indici di tendenza centrale: la media aritmetica Il concetto di SCARTO: Data una successione di dati x1, x2, x3, x4, ….. , xn si chiamano scarti dalla media i valori pari a l = x i- M (scarto semplice dalla media) Indici di tendenza centrale: la media aritmetica PROPRIETA’ IMPORTANTE DELLA MEDIA ARITMETICA DIMOSTRAZIONE: Indici di tendenza centrale: la media aritmetica ponderata Media aritmetica ponderata Quando i dati statistici si ripetono allora succede che x1, x1, x1, x1 n1 volte Valori Frequenze x1 x2 x3 …… xi n1 n2 n3 ……. ni x2, x2, x2, x2, x2, x2 n2 volte Xf Xf X= = n f Indici di tendenza centrale: la media aritmetica ponderata Esempio: Media aritmetica di voti di esami Voti di esame: 18; 22: 22; 24; 24; 24; 25; 25; 25;25; 27; 27. Potrei fare: Media aritmetica = (18+22+22+24+24+24+25+25+25+25+27+27) / 12 = 24 Però è più semplice e veloce fare: Media aritmetica ponderata = (18 + 222 +243+ 254+ 272) / 12 = 24 Indici di tendenza centrale: la media aritmetica ponderata Media aritmetica ponderata per dati continui suddivisi in intervalli di classi. La media X = 5,21 5 4,5 4 3,5 3 Casi • La media è una buona misura di tendenza di misura centrale per le distribuzioni “normalmente” distribuite 2,5 f 2 1,5 1 0,5 0 1 2 3 4 5 Voto 6 7 8 9 La media La media è una misura inadatta per le distribuzioni che contengono un numero esiguo di valori estremi Media = 88.72 MEDIANA MEDIE DI POSIZIONE MODA La moda per variabili intervallari La moda il valore x cui corrisponde la massima frequenza. Esistono distribuzioni di frequenza che, oltre alla moda principale, hanno una o più mode secondarie. La mediana per variabili intervallari discreti Mediana: data una successione ordinata crescente (che va dal valore più piccolo a quello più grande) si chiama Mediana, o termine centrale, quel valore che è preceduto o seguito dallo stesso numero di dati. Determinazione della mediana per i valori discreti di x. Numero dei valori DISPARI: x1, x2, x3, x4, x5, x6, x7 Mdn = x4 Numero dei valori PARI: per convenzione è definita mediana la semisomma dei due termini centrali. x1, x2, x3, x4, x5, x6, x7,x8 Mdn= (x4+x5)/2 La mediana per variabili intervallari discreti Mediana: data una successione ordinata crescente (che va dal valore più piccolo a quello più grande) si chiama Mediana, o termine centrale, quel valore che è preceduto o seguito dallo stesso numero di dati. Determinazione della mediana per i valori discreti di x. x1, x2, x3, x4, x5, x6, x7 Mdn = x4 Esempio: Valori: 18, 21, 3, 7, 35. Serie ordinata: 3, 7, 18, 21, 35. Mediana: 18. Questo è valido quando il numero dei termini è dispari per cui si può scrivere: N = 2n + 1 = n + 1 + n E quindi il termine mediano è n + 1. La mediana per variabili intervallari discreti Qualora il numero dei termini sia pari: N= n + n Per cui non esiste un termine mediano, ma per convenzione è definita mediana la semisomma dei due termini centrali. Esempio. Valori: 23, 35, 11, 7 Serie ordinata: 7, 11, 23, 35 Mediana = (11+23) / 2 = 17 La mediana per variabili intervallari continui (cenni) Per calcolare indici di posizione con variabili intervallari continue si usa l’interpolazione lineare: le ferquenze che cadono in un intervallo si considerano “uniformemente distribuite” all’interno dell’intervallo. Ogni valore xi che cade all’interno dell’intervallo occupa uno spazio pari a 1/fi. X F Fc Lim.inf Lim.sup A 1-3 6 6 0.5 3.5 B 4-6 6 12 3.5 6.5 C 7-9 8 20 6.5 9.5 D 10-12 7 27 9.5 12.5 E 13-15 3 30 12.5 15.5 N 30 La mediana si trova in posizione 15 ossia in classe C (tra la 13ima e la 20ima posizione). La classe C è costituita da 8 elementi per cui l’ampiezza di ogni elemento è pari a 1/8 (1/fi) che è 0.375. La posizione 15 è la terza all’interno dell’intervallo (15-12) per cui: 0.375+0.375+0.375=1.125. Questo valore va sommato al limite inferiore della classe C: 6.5 + 1.125 = 7.625 - Posizione 15 o MEDIANA La moda per variabili intervallari La moda il valore x cui corrisponde la massima frequenza. Esistono distribuzioni di frequenza che, oltre alla moda principale, hanno una o più mode secondarie. Confronto Media – Mediana – Moda Confronto Media – Mediana – Moda www.quadernodiepidemiologia.it