STATISTICHE DESCRITTIVE Parte I ARGOMENTI DELLA LEZIONE • concetti introduttivi • indici di tendenza centrale 2 concetti introduttivi Unità statistiche elementi che costituiscono l’oggetto dell’osservazione e le cui proprietà vengono rilevate; Popolazione insieme delle unità statistiche oggetto dell’osservazione; Variabili proprietà, caratteristiche, attributi delle unità di analisi che variano da caso a caso Modalità ogni diversa presentazione della variabile osservata su ciascuna unità di analisi 3 distribuzione di frequenza Le distribuzioni di frequenza dipendono dal tipo di dati che vengono raccolti ESEMPIO X = { 2, 1, 1, 1, 2, 2, 3, 3, 3, 4, 3, 4, 4, 5, 4, 4, 5, 5, 6, 7, 5, 5, 6, 7, 8} x 1 2 3 4 5 6 7 8 f 3 3 4 5 5 2 2 1 4 INDICI DI TENDENZA CENTRALE Si tratta di statistiche che consentono di rappresentare, con un unico valore, un insieme di misure. SOMMARIO • Moda • Mediana • Media - media aritmetica - media geometrica - media armonica 5 moda • La moda di un insieme di dati è il valore che si presenta con la massima frequenza • Si indica con il simbolo Mo. ESEMPIO Dato l’insieme A = 2, 3, 4, 5, 6, 8, 7, 8, 5, 8, 11 si ha Mo = 8 in quanto 8 è il valore che si presenta più frequentemente. 6 mediana • Se abbiamo un insieme di dati ordinati, definiamo mediana il dato che occupa la posizione centrale nella distribuzione dei dati stessi • si indica con il simbolo Mdn o Me • il calcolo della mediana differisce a seconda se si hanno dati non raggruppati in classi oppure dati raggruppati in classi 7 mediana Dati non raggruppati • se n è dispari la mediana è il valore centrale della serie stessa; il numero i fornisce la posizione del dato all’interno della serie con la seguente formula n 1 i 2 8 mediana Dati non raggruppati ESEMPIO Consideriamo la serie A = 3, 5, 9, 12, 15, 17, 18, 23, 24, 31, 34} abbiamo n = 11 e 11 1 i 6 2 pertanto Mdn = 17, ossia il sesto dato della serie. 9 mediana Dati non raggruppati • se n è pari nessuno dei valori è il valore centrale della serie stessa; la mediana si trova fra i due valori centrali e la sua posizione i sarà n n i 1 2 2 10 mediana Dati non raggruppati ESEMPIO Consideriamo la serie A = 1, 5, 8, 12, 23, 35} abbiamo n = 6 e 6 6 i 1 3 i 4 2 2 pertanto la mediana è compresa tra 8 e 12, ossia tra il terzo ed il quarto dato della serie. 11 mediana Dati non raggruppati Si tenga presente che, se i dati sono in scala a intervalli, è possibile definire il valore esatto della mediana come valore medio fra i due dati centrali: Mdn x n x n 1 2 2 2 Nell’Esempio precedente il valore esatto della mediana sarà : Mdn = (8 + 12)/2 = 10 12 mediana Dati raggruppati Se i dati sono continui, discretizzati e raggruppati in classi di frequenza la mediana si calcola per interpolazione lineare: n Finf 2 Mdn Linf fm dove Linf, fm e sono rispettivamente limite inferiore, frequenza e ampiezza della classe mediana; n la numerosità dei casi e Finf la frequenza cumulata fino al limite inferiore della classe. 13 Esempio[1] Nella seguente tabella sono raccolti i dati relativi al peso dei giocatori di una rosa di una squadra di calcio (n=23). Indice i Peso in Kg fi Fi 1 60 - 65 1 1 2 65 - 70 2 3 3 70 - 75 4 7 4 75 - 80 6 13 5 80 - 85 6 19 6 85 - 90 2 21 7 90 - 95 1 22 8 95 - 100 1 23 Calcolare la mediana della distribuzione data. Nota: gli intervalli di frequenza si intendono del tipo “primo valore incluso – secondo valore escluso”. 14 Esempio[2] • Per prima cosa, identifichiamo la classe mediana. posizione mediana 23 1 12 2 • Quindi la classe che contiene la mediana è la quarta ( i=4 ). • Applicando infine la formula per il calcolo della mediana otteniamo: 23 7 Mdn 75 2 5 78.75 6 Si può quindi affermare che il 50% dei calciatori della squadra pesa meno di 78.75 Kg. 15 media aritmetica • La media aritmetica è una funzione che associa ad ogni insieme di n dati un valore numerico pari alla somma dei dati diviso il numero n dei dati stessi. x1 x2 ... xn x n • il calcolo della media ha procedure diverse a seconda che i dati siano o meno raggruppati in classi 16 media aritmetica Dati non raggruppati n x x i 1 i n ESEMPIO Dato l’insieme A = 2, 3, 4, 5, 6, 8, 7, 8, 5, 8 si ha 2 3 ... 8 x 5 .6 10 17 media aritmetica Dati raggruppati se i dati sono raggruppati in una tabella del tipo xi x1 x2 … xj … xn fi f1 f2 … fj … fn la media si calcola con n x fx i 1 n i i f i 1 i 18 media aritmetica Dati raggruppati ESEMPIO sia data la seguente tabella di frequenza xi 3 7 10 22 30 fi 2 3 4 2 1 la media sarà 3 2 7 3 ... 30 1 x 11.75 12 19 Esempio[1] - dati raggruppati in classi Nella seguente tabella sono raccolti i dati relativi al peso dei giocatori di una rosa di una squadra di calcio (n=23). Indice i Peso in Kg fi Fi 1 60 - 65 1 1 2 65 - 70 2 3 3 70 - 75 4 7 4 75 - 80 6 13 5 80 - 85 6 19 6 85 - 90 2 21 7 90 - 95 1 22 8 95 - 100 1 23 Calcolare la media della distribuzione data. Nota: gli intervalli di frequenza si intendono del tipo “primo valore incluso – secondo valore escluso”. 20 Esempio[2] - dati raggruppati in classi Per calcolare la media dei dati si dovrà ricorrere alla seguente formula: n x fx i vc i i 1 n f i 1 i Dove xvci rappresenta il valore centrale della classe i-esima. (Per valore centrale di una classe di frequenza, si intende la media tra il limite inferiore e il limite superiore della classe stessa). Ad esempio il valore centrale della seconda classe ( i=2 ) sarà: xvc2 65 70 67.5 2 21 Esempio[3] - dati raggruppati in classi - Applicando la formula per il calcolo della media si ottiene: 62.5 1 67.5 2 72.5 4... 97.5 1 x 78.80 23 Il peso medio dei calciatori e quindi pari 78.8 Kg. 22 media geometrica • La media geometrica si usa quando le grandezze si susseguono in progressione geometrica o per grandezze che misurano variabili relative • per dati non raggruppati si usa G n x1 x2 ... xn n n x i i 1 • per dati raggruppati G n x1f1 x2f 2 ... xkf k n k fi x i i 1 23 media armonica • La media armonica si definisce con la seguente relazione: • se i dati non sono raggruppati in classi H n 1 1 1 ... x1 x2 xn n n 1 i 1 xi • se i dati sono raggruppati f1 f 2 ... f k n H k fk f1 f 2 fi ... x1 x2 xk i 1 xi 24 Moda, Mediana, Media - considerazioni finali • Sia la moda, sia la mediana, sia la media sono dette misure di tendenza centrale, ossia sono considerate un indice dell'andamento della parte centrale della distribuzione; tali indici differiscono fra loro in vari modi. • La moda è significante a livello della scala nominale, la mediana è significante a livello della scala ordinale e la media a livello della scala ad intervalli. 25