Indici di Variabilità • • • • • NdE Range (o campo di variabilità) Scarto medio assoluto Somma dei quadrati Varianza e deviazione standard Il concetto di variabilità 3 2,75 2,5 2,25 1,5 1,25 1 0,75 0,5 0,25 0 65 75 85 95 105 115 125 135 Q.I. Elevata variabilità 10 9 8 7 N. studenti • La variabilità è una misura della dispersione di una distribuzione di frequenza • La variabilità determina il grado in cui una singola misura è rappresentativa della popolazione N. studenti 2 1,75 6 5 4 3 2 1 0 65 75 85 95 105 115 125 135 Q.I. Bassa variabilità Variabilità e statistica inferenziale 10 3 9 2,75 2,5 8 2,25 2 6 5 Gruppo 1 Gruppo 2 4 N. studenti N. Studenti 7 1,75 1,5 Gruppo 1 Gruppo 2 1,25 1 3 0,75 2 0,5 1 0,25 0 0 65 75 85 95 105 115 125 135 Q.I. Nell’assenza di variabilità all’interno dei gruppi è evidente che i Q.I. del primo gruppo sono più elevati rispetto a quelli del secondo gruppo 65 75 85 95 105 115 125 135 Q.I. Nella presenza di una forte variabilità all’interno dei gruppi non è evidente in quale gruppo sono più elevati i Q.I. Indici di variabilità Due distribuzioni possono avere stessi indici di centralità (media, mediana, moda) ma essere diversamente dispersi. Il campo di variazione o RANGE Il campo di variazione di una distribuzione è la differenza fra il valore massimo e il valore minimo rilevati. Osservazioni: 1,2,5,7,8,9 Valore massimo: 9 Valore minimo: 1 Campo di variazione: 8 Range = Val max- Val min Il campo di variazione come misura della variabilità Il campo di variazione si esprime in valori assoluti. Non dice nulla su come i valori assunti dalla variabile sono distribuiti. Osservazioni di altezza (mm): 1600,1520, 1720,1670, 1700 Osservazioni di peso (kg) 50, 70, 110, 73, 80 Kg. Scarto medio assoluto dalla media aritmetica Lo scarto medio assoluto dalla media aritmetica è la somma degli scarti dei vari dati rispetto alla loro media aritmetica considerati in valore assoluto. Lo scarto medio assoluto non è altro che la media aritmetica delle distanza di ciascun dato dalla media. Scarto medio assoluto dalla media aritmetica Varianza e deviazione standard Valore medio 3 2,75 2,5 2,25 N. studenti 2 1,75 1,5 1,25 1 0,75 0,5 0,25 0 65 75 85 95 105 Q.I. Distanza rispetto alla media 115 125 135 Definizione intuitiva della variabilità: la variabilità come distanza media di un’”osservazione tipo” rispetto al valore medio per la popolazione Alcune distanze sono negative, alcune positive La somma di tutte le distanze è pari a zero La media delle distanze è pari a zero Non possiamo utilizzare la somma delle distanza come misura di dispersione Somma dei quadrati La somma dei quadrati della distanza fra la media (µ) e il valore dell’osservazione L’utilizzo del quadrato Elimina i valori negativi Da maggior peso alle osservazioni lontane dalla media Il valore della somma dei quadrati aumenta con il numero delle osservazioni. Osservazione1 2 3 4 5 6 7 8 9 10 X ¼ 14 17 18 22 12 4 6 30 33 0 X-¼ (X-¼)^2 15,6 -1,6 2,56 15,6 1,4 1,96 15,6 2,4 5,76 15,6 6,4 40,96 15,6 -3,6 12,96 15,6 -11,6 134,56 15,6 -9,6 92,16 15,6 14,4 207,36 15,6 17,4 302,76 15,6 -15,6 243,36 ( X ) 2 La varianza di una popolazione • La varianza si calcola come la media del quadrato della distanza fra il valore della singola osservazione e il valore medio per l’insieme delle osservazioni • La varianza è una misura finalizzata alla standardizzazione delle misure di variabilità • Il valore della varianza è indipendente rispetto al numero delle osservazioni (X ) 2 N Osservazione1 2 3 4 5 6 7 8 9 10 X ¼ 14 17 18 22 12 4 6 30 33 0 X-¼ 15,6 15,6 15,6 15,6 15,6 15,6 15,6 15,6 15,6 15,6 -1,6 1,4 2,4 6,4 -3,6 -11,6 -9,6 14,4 17,4 -15,6 Somma N Varianza (X-¼)^2 2,56 1,96 5,76 40,96 12,96 134,56 92,16 207,36 302,76 243,36 1044,4 10 104,44 La deviazione standard Osservazione1 2 3 4 5 6 7 8 9 10 (X ) 2 N X ? 14 17 18 22 12 4 6 30 33 0 X-? 15,6 15,6 15,6 15,6 15,6 15,6 15,6 15,6 15,6 15,6 (X-?)^2 -1,6 2,56 1,4 1,96 2,4 5,76 6,4 40,96 -3,6 12,96 -11,6 134,56 -9,6 92,16 14,4 207,36 17,4 302,76 -15,6 243,36 Somma N Varianza Dev. St. 1044,4 10 104,44 10,22 • La varianza non costituisce una misura “intuitiva” dalla distanza fra una “osservazione tipica” e il valore medio • Tale distanza è rappresentata dalla deviazione standard • La deviazione standard di una popolazione è rappresentata dal radice quadrata della varianza della popolazione Esempio 1. Calcolare la varianza e la deviazione standard del seguente insieme di dati – 10,10,10,10,10 2. Calcolare la varianza e la deviazione standard del seguente insieme di dati – 1,3,3,4,9 Prima esercitazione Osservazione X 1 2 3 4 5 Media= Somma distanze^2 N Varianza Dev. St. ¼ 10 10 10 10 10 X-¼ 10 10 10 10 10 10 0 5 0 0 Completa assenza di variabilità (X-¼)^2 0 0 0 0 0 0 0 0 0 0 Seconda esercitazione Osservazione X 1 2 3 4 5 Media= Somma distanze^2 N Varianza Dev. St. ¼ 1 3 3 4 9 4 36 5 7,2 2,68 X-¼ 4 4 4 4 4 (X-¼)^2 -3 -1 -1 0 5 9 1 1 0 25 Visualizzare la deviazione standard 3 2,75 2,5 2,25 N. studenti Questa osservazione è 2 distante 1 Dev. 1,75 St. rispetto alla media 1,5 1,25 1 0,75 0,5 =17,2 0,25 0 65 75 85 95 105 Q.I. 115 125 135 La Varianza e la Deviazione Standard La deviazione standard è l’indice normalmente utilizzato per calcolare la dispersione di una distribuzione di dati. Si può affermare che la deviazione standard calcola la “quantità” media di deviazione dalla media. E’ una misura lineare della dispersione dei dati. La varianza è invece una media di aree e non è mai negativa. La deviazione standard nella letteratura scientifica Forma standardizzata di presentazione forma breve forma tabellare Importante indicare la numerosità di ciascuno dei gruppi e sottogruppi “I bambini che hanno visionato il cartoon hanno mostrato un indice di aggressività (M=12,45, Dev St.=3,7) superiore rispetto al Gruppo di controllo (M=4,22, Dev. St.=1,04)” Cartoon Violento Maschi Femmine Controllo M=15,72 M=6,92 Dev. St.=4,43 Dev.St.=2,26 M=3,47 M=2,61 Dev. St.=1,12 Dev.DSt=0,98 Esempio1: distribuzione poco dispersa Peso (kg) Fa Fa*xi scarto Scarto quadrato Scarto quadrato Ponderato 48 0 0,0 -19,7 388,7 0,0 53 0 0,0 -14,7 216,5 0,0 55 0 0,0 -12,7 161,7 0,0 60 0 0,0 -7,7 59,5 0,0 65 24 1560,0 -2,7 7,4 176,8 68 60 4080,0 0,3 0,1 4,9 70 21 1470,0 2,3 5,2 109,7 74 0 0,0 6,3 39,5 0,0 78 0 0,0 10,3 105,8 0,0 80 0 0,0 12,3 150,9 0,0 84 0 0,0 16,3 265,2 0,0 105 7110,0 Somma quadrati 291,4 Media (kg) 67,7 Varianza 2,8 Dev. standard (kg) 1,7 Grafico 1: distribuzione poco dispersa Distribuzione "concentrata" 70 60 Frequenza 50 40 30 20 10 0 48 53 55 60 65 68 Peso (kg) 70 74 78 80 84 Esempio2: bassa dispersione Peso (kg) Fa Fa*xi Scarto Scarto quadrato Scarto quadrato ponderato 48 0 0,0 -19,7 389,8 0,0 53 0 0,0 -14,7 217,4 0,0 55 2 110,0 -12,7 162,4 324,8 60 5 300,0 -7,7 60,0 299,8 65 17 1105,0 -2,7 7,5 127,9 68 54 3672,0 0,3 0,1 3,6 70 20 1400,0 2,3 5,1 101,9 74 5 370,0 6,3 39,2 195,8 78 2 156,0 10,3 105,2 210,4 80 0 0,0 12,3 150,2 0,0 84 0 0,0 16,3 264,3 0,0 Totale 105 7113,0 Somma quadrati 1264,1 Media (kg) 67,7 Varianza 12,0 Dev. Standard (kg) 3,5 Grafico2: bassa dispersione Bassa dispersione 60 50 frequenza 40 30 20 10 0 48 53 55 60 65 68 peso (kg) 70 74 78 80 84 Esempio3: alta dispersione Peso (kg) Fa Fa*xi Scarto Scarto quadrato Scarto quadrato ponderato 48 2 96,0 -19,7 389,0 778,1 53 5 265,0 -14,7 216,8 1084,0 55 7 385,0 -12,7 161,9 1133,3 60 10 600,0 -7,7 59,7 596,6 65 15 975,0 -2,7 7,4 111,3 68 22 1496,0 0,3 0,1 1,7 70 18 1260,0 2,3 5,2 93,3 74 7 518,0 6,3 39,4 275,7 78 10 780,0 10,3 105,6 1056,0 80 5 400,0 12,3 150,7 753,5 84 4 336,0 16,3 264,9 1059,7 Totale 105 7111,0 Somma quadrati 6943,0 Media (kg) 67,7 Varianza 66,1 Dev. Standard (kg) 8,1 Grafico3: alta dispersione Alta dispersione 25 Frequenza 20 15 10 5 0 48 53 55 60 65 68 peso (kg) 70 74 78 80 84 Esempio4: dispersione molto elevata Peso (kg) Fa Fa*xi scarto Scarto quadrato Scarto quadrato ponderato 48 6 288,0 -19,7 389,8 2338,7 53 8 424,0 -14,7 217,4 1738,8 55 8 440,0 -12,7 162,4 1299,0 60 9 540,0 -7,7 60,0 539,6 65 9 585,0 -2,7 7,5 67,7 68 15 1020,0 0,3 0,1 1,0 70 13 910,0 2,3 5,1 66,2 74 11 814,0 6,3 39,2 430,7 78 10 780,0 10,3 105,2 1052,1 80 8 640,0 12,3 150,2 1201,9 84 8 672,0 16,3 264,3 2114,4 Totale 105 7113,0 Somma quadrati 10850,1 Media (kg) 67,7 Varianza 103,3 Dev. Standard (kg 10,2 Grafico4: dispersione molto elevata Molto dispersa 16 14 Frequenza 12 10 8 6 4 2 0 48 53 55 60 65 68 peso (kg) 70 74 78 80 84 Confronto Range – Deviazione standard - Percentili www.quadernodiepidemiologia.it