Indici Statistici Descrittivi Gli indici statistici descrittivi riassumono alcune caratteristiche delle distribuzioni di frequenza consentendo il confronto fra le diverse distribuzioni Esistono tre diversi tipi di indici descrittivi: a) quelli che tendono a “localizzare” la distribuzione e li chiameremo indici di posizione (medie algebriche e misure di posizione); b) quelli che tendono a misurare la “variabilità” o “dispersione” di una distribuzione e li chiameremo indici di variabilità; c) quelli che tendono a individuare la “forma” della distribuzione e li chiameremo indici sulla forma. 1 Breve richiamo alle sommatorie • Una simbologia molto utile e pratica, che permette di scrivere in modo piuttosto conciso le somme è l'espressione di sommatoria n xi x1 x2 ... xn i 1 • Proprietà delle sommatorie 1) La sommatoria di una somma è pari alla somma delle sommatorie. n n n X i Yi X i Yi i 1 i 1 i 1 2) Le costanti moltiplicative possono essere portate fuori dalla sommatoria n n aX i a X i i 1 i 1 2 Proprietà delle sommatorie 1) La sommatoria di una somma è pari alla somma delle sommatorie. n n n i 1 i 1 i 1 X i Yi X i Yi 2) La sommatoria del prodotto di una costate per una variabile è uguale al prodotto della costante per la somma della variabile. n n aX i a X i i 1 i 1 3) Sommare n volte una costante equivale a moltiplicare per n la costante n a na i 1 Da cui si ricava n n i 1 i 1 a X i na X i 3 Medie Algebriche Media aritmetica Media geometrica Media armonica Media quadratica Medie potenziate di ordine k 4 Media aritmetica semplice E’ la misura di tendenza centrale più utilizzata. È definita come la somma del valore di tutte le osservazioni, diviso il numero di unita: n xi x x ... xn i 1 M 1 2 n n Dove: M = media del campione xi=i-esima osservazione della variabile X n = numero di osservazioni 5 Esempio Calcolare il peso medio in Kg di 5 cani: 10,9; 11,5; 12,3; 12,8; 15,4. 10.9 11.5 12.3 12.8 15.4 M 12.58 5 Il peso medio è 12.58 Kg 6 Media Aritmetica Ponderata Nel caso di una distribuzione di frequenza di una variabile discreta non suddivisa in classi, la media aritmetica viene calcolata come la somma dei prodotti delle modalità osservate per le frequenze corrispondenti diviso il numero delle osservazioni. L’espressione matematica corrispondente è: n xi ni x1 n1 x2 n2 ... xn nn M i 1 n n1 n2 ... nn ni i 1 7 Esempio È stato rilevato il numero di esami sostenuti da 39 studenti iscritti al primo anno. Calcolare il numero medio di esami. Il numero medio di esami sostenuti è dato da: n xi ni 69 M i 1 1.77 n 39 ni i 1 xi ni Xi°ni 0 12 0 1 8 8 2 6 12 3 6 18 4 4 16 5 3 15 Totale 39 69 8 Media Aritmetica per distribuzione di freq. di una variabile quantitativa divisa in intervalli In caso di una distribuzione di frequenza di una variabile quantitativa discreta o continua suddivisa in intervalli, la media aritmetica viene calcolata come la somma dei prodotti dei valori centrali degli intervalli per le rispettive frequenze, diviso per il numero delle osservazioni, ossia: n . . . . x n1 x n2 ... x n nn x i ni 1 2 i 1 M n n1 n2 ... nn ni i 1 dove x1, x2, …,xn rappresentano i valori centrali degli intervalli in cui risulta suddivisa la variabile (il valore centrale è dato dalla semisomma di valori estremi di ogni intervallo) e n1, n2,…, nn sono le frequenze assolute corrispondenti ad ogni intervallo. 9 Esempio Si calcoli la media aritmetica del peso in Kg di 38 polli, raggruppati in classi di frequenza: Classi Valore centrale (xi) ni xi ×ni 1.5-2.0 (1.5+2.0)/2=1.75 5 8.75 2.1-2.5 (2.1+2.5)/2=2.3 12 27.60 2.6-3.0 (2.6+3.0)/2=2.8 15 42.00 3.1-3.5 (3.1+3.5)/2=3.3 6 19.80 38 98.15 Totale Il peso medio dei 38 polli è dato da: 98.15 M 2.58 38 10 I PROPRIETÀ DELLA MEDIA ARITMETICA n xi M 0 i 1 Dimostrazione: (dati semplici) n xi n n n xi M xi nM xi n i 1 n i 1 i 1 i 1 Nel caso di dati ponderati: n xi i 1 M ni 0 0 n xi ni n n n n n xi M ni xi ni M ni xi ni ni i 1 n i 1 i 1 i i i 1 i i ni i i 0 11 II PROPRIETÀ DELLA MEDIA ARITMETICA 2 n 2 n xi M xi A i i Dimostrazione: 2 n i i 2 n 2 n xi A xi M M - A xi M M A i i i i i i Svolgendo il quadrato: n n n xi M M - A 2M - A xi M 2 i 1 2 i 1 i 1 n … ma il termine rettangolare 2M - A xi M è nullo per la I proprietà i 1 n n 2 2 e ponendo M - A si ha: x i M M - A i 1 i 1 n n 2 2 2 … poiché ne2>0 xi - A x i M nε i 1 i 1 n xi i 1 M 2 n xi i 1 - A2 CVD 12 ALTRE PROPRIETÀ DELLA MEDIA ARITMETICA III Proprietà: La media aritmetica è associativa. Ciò significa che se una popolazione di N unità statistiche è divisa in più sottopopolazioni, la media aritmetica dell’intera popolazione è uguale alla media aritmetica delle singole sottopopolazioni ponderata con le rispettive numerosità. (Non è caratteristica della media aritmetica) IV Proprietà La media aritmetica non è esterna all’intervallo individuato dalla più piccola e dalla più grande delle modalità della distribuzione. (Non è caratteristica della media aritmetica) V proprietà Considerata una distribuzione di media M, se si moltiplica ogni modalità della distribuzione per una costante a e si aggiunge una costante b, la media aritmetica della distribuzione è: aM+b Si usa dire che la media aritmetica è invariante per trasformazioni affini. 13 Media Geometrica La media geometrica semplice si utilizza quando le variabili sono ottenuti da prodotti o rapporti di valori lineari. È utilizzata in modo particolare in microbiologia e in ematologia n M g n xi i 1 Es.: In 10 animali sono stati osservati i seguenti tassi di infusione di un dato preparato farmacologico espressi in microgrammi per minuto: 4.7; 3.8; 5.2; 4.7; 3.9; 5.1; 5.3; 5.5; 4.9; 5.1 M g 10 4.7 3.8 5.2 ... 5.1 4.79 mg / min In presenza di dati ponderati la media geometrica si calcola come: Mg n n N x i i i 1 14 Media Geometrica: proprietà • La media geometrica semplice è non superiore alla media aritmetica. • Il logaritmo della media geometrica è uguale alla media aritmetica dei logaritmi dei dati 1 n 1 n log M g log xi e per dati ponderati log M g ni log xi n i 1 N i 1 Riprendendo l’es. precedente log 4.7 log 3.8 ... log 5.1 log M g 0.677 10 M g anti log 0.677 M g 4.8mg / min •La media geometrica è invariante per trasformazioni del tipo: Y = a Xb (a>0) cioè se si moltiplicano tutte le modalità per a dopo averle elevate a b, la media geometrica subisce lo stesso tipo di trasformazione. •La media geometrica dei rapporti è uguale al rapporto delle medie geometriche e non è esterna all’intervallo individuato dalla più piccola e dalla più grande delle modalità. 15 Media Armonica È utilizzata quando la maggior parte dei valori da sintetizzare sono compresi in un intervallo abbastanza ristretto, mentre ci sono pochi valori (estremamente elevati) che si discostano dall’andamento complessivo della variabile. La media armonica è l’inverso della media aritmetica degli inversi delle modalità supposte diverse da zero. n Ma n 1 i 1 xi in generale per dati ponderati: Ma N n n i i 1 xi Per la media armonica valgono le seguenti proprietà: • È invariante al variare dell’unita di misura; • È non esterna all’intervallo individuato dalla più piccola e dalla più grande modalità • È non superiore alla media geometrica. 16 Esempio: Media Armonica Codice bambino X (giorni) Esempio: In un reparto di neonatologia sono stati osservati i tempi di degenza, espressi in giorni, di 15 neonati: 15 Ma 13.074 giorni di degenza 1.147 1/X 1 4 0.270 2 29 0.035 3 6 0.161 4 26 0.039 5 25 0.040 6 19 0.052 7 7 0.154 8 29 0.034 9 15 0.066 10 23 0.043 11 22 0.046 12 18 0.055 13 17 0.059 14 24 0.041 15 19 0.053 Totale 1.147 17 Media Quadratica • La media quadratica trova applicazione nell’analisi di superfici. • È la radice quadrata della media aritmetica dei quadrati: n 2 xi M q i 1 n Mq n 2 xi ni i 1 n ni i 1 (dati semplici) (dati ponderati) 18 Media Quadratica: esempio Supponiamo di voler conoscere la superficie media espressa in ettari di 14 allevamenti di bovini: Cod. allevamento x (ettari di superficie) x2 Mq 5864 418.857 20.466 14 La superficie media degli allevamenti è di 20.466 ettari. 1 14 196 2 19 361 3 16 256 4 26 676 5 25 625 6 19 361 7 17 289 8 29 841 9 15 225 10 23 529 11 22 484 12 18 324 13 11 121 14 24 576 Totale 5864 19 Media Potenziata di ordine k Con il nome di media potenziata d’ordine k, Mk si intende la radice di ordine k (presa con segno positivo) delle somme delle k-esime potenze dei dati, divisa per il numero dei termini. n Mk k xi k i 1 n xik i 1 n n 1 k per k=1 si ha la media aritmetica per k = -1 si ha la media armonica per k=2 si ha la media quadratica per k→0 si ha la media geometrica Si dimostra che le medie di potenze sono funzioni crescenti di k, cioè: x1 ... M a M g M M q ... xN 20