STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA Corso di Laurea Triennale in Infermieristica Anno III SECONDA LEZIONE INDICI DI POSIZIONE (variabili quantitative) Gli indici di posizione denotano un valore intorno a cui colloca la distribuzione di frequenza Gli indici di posizione più comuni sono la MEDIANA e la MEDIA La mediana e la media sono espresse nella stessa unità di misura della variabile (se la variabile è espressa in Kg anche la mediana e la media sono espresse in Kg) MEDIANA è il valore che occupa la posizione centrale nella sequenza delle osservazioni ordinate Es peso di n=5 neonati 2.6, 3.4, 2.8, 3.5, 4,2 si ordinano le osservazioni 2.6, 2.8, 3.4, 3.5, 4.2 ↑ la mediana è 3.4 Kg il valore centrale è il terzo REGOLA GENERALE Se n è dispari la mediana è l’osservazione di posto (n+1)/2 nella sequenza delle osservazioni ordinate Es. se n=9 la mediana è l’elemento di posto 10/2=5 se n=27 la mediana è l’elemento di posto 28/2=14 se n=389 la mediana è l’elemento di posto 390/2=195 Es peso di n=6 neonati 2.6, 3.4, 2.8, 3.5, 4.2, 3.2 si ordinano le osservazioni 2.6, 2.8, 3.2, 3.4, 3.5, 4.2 il valori centrali sono il terzo e il quarto ↑ ↑ la mediana è la semisomma (punto intermedio) tra i due (3.2+3.4)/2=6.6/2=3.3 Kg REGOLA GENERALE Se n è pari la mediana è la semisomma tra l’osservazione di posto n/2 e quella di posto n/2+1 nella sequenza delle osservazioni ordinate Es. se n=10 la mediana è la semisomma tra gli elemento di posto 10/2=5 e 6 se n=28 la mediana è la semisomma tra gli elementi di posto 28/2=14 e 15 se n=390 la mediana è la semisomma tra gli elementi di posto 390/2=195 e 196 MEDIA La media e la somma delle osservazioni diviso il numero delle stesse x1 x2 xn x n 1 n x xi n i 1 Es peso di n=5 neonati 2.6, 3.4, 2.8, 3.5, 4,2 (2.6+3.4+2.8+3.5+4.2)/5=16.5/5=3.3 la media è 3.3 Kg PROPRIETA’ DELLA MEDIA La media è sempre compresa tra l’osservazione più piccola e quella più grande xmin x xmax La somma degli scarti dalla media è nulla n ( xi x ) 0 i 1 Es peso di n=5 neonati 2.6, 3.4, 2.8, 3.5, 4,2 ↑ la media è 3.3 Kg che è un valore compreso tra 2.6 e 4.2 kg scarti dalla media -0.7, 0.1, -0.5, 0.2, 0.9 somma degli scarti -0.7+0.1-0.5+0.2+0.9 = 0 La media è più sensibile della mediana alle osservazioni estreme Es peso di n=5 neonati 2.6, 3.4, 2.8, 3.5, 4,2 ↑ media 3.3 kg mediana 3.4 kg 1.6, 3.4, 2.8, 3.5, 4,2 media 3.1 kg mediana 3.4 kg 2.6, 3.4, 2.8, 3.5, 5.2 media 3.5 kg mediana 3.4 kg La media segue l’unità di misura con cui sono espresse le osservazioni Es peso di n=5 neonati 2.6, 3.4, 2.8, 3.5, 4,2 media 3.3 kg si passa da Kg a g 2600, 3400, 2800,3500, 4200 media 3300 g INDICI DI VARIABILITA’ ↑ media stessa media ma diversa dispersione attorno alla media ↑ media gli scarti dalla media tendono ad essere maggiori nel secondo caso La media degli scarti dalla media potrebbe essere preso come indice di variabilità La somma degli scarti dalla media è sempre nulla, questo indice risulta sempre uguale a 0 Gli scarti positivi si compensano con quelli negativi Occorre fare perdere il segno agli scarti VARIANZA Media dei quadrati degli scarti dalla media n 1 2 2 s x ( xi x ) n i 1 varianza corretta (più utilizzata) n 1 2 2 sx ( xi x ) n 1 i 1 Es peso di n=5 neonati 2.6, 3.4, 2.8, 3.5, 4,2 la media è 3.3 Kg scarti dalla media -0.7, 0.1, -0.5, 0.2, 0.9 quadrati degli scarti 0.49, 0.01, 0.25, 0.04, 0.81 (0.49+0.01+0.25+0.04+0.81)/5 = 1.6/5 = 0.32 kg2 varianza (0.49+0.01+0.25+0.04+0.81)/4 = 1.6/4 = 0.4 kg2 varianza corretta PROBLEMA La varianza si interpreta con difficoltà perché è espressa nel quadrato dell’unità di misura delle osservazioni da m a m2 , da Kg a Kg2, da cm3 a cm6 , ecc Es peso di n=5 neonati 2.6, 3.4, 2.8, 3.5, 4,2 la media è 3.3 Kg che significa una varianza di 0.4 kg2 ?????? SCARTO QUADRATICO MEDIO (DEVIAZIONE STANDARD) E’ la radice quadrata della varianza sx E’ espresso nella stessa unità di misura delle osservazioni Es peso di n=5 neonati 2.6, 3.4, 2.8, 3.5, 4,2 la media è 3.3 Kg , la varianza è 0.4 Kg2 lo scarto quadratico medio è 0.63 Kg mediamente le osservazioni si discostano dalla media di 0.63 Kg OSSERVAZIONI Come la media lo scarto quadratico medio (sqm) segue l’unità di misura delle osservazioni Es peso di n=5 neonati la media è 3.3 Kg e lo sqm è 0.63 Kg se si passa da Kg a g la media è 3300 g e lo sqm è 630 g Se tutte le osservazioni sono uguali (assenza di variabilità) la varianza (e dunque lo sqm) sono nulli COEFFICIENTE DI VARIAZIONE (CV) E’ il rapporto tra lo sqm e la media delle osservazioni CV s x / x non dipende dall’unità di misura in cui sono espresse le osservazioni Es peso di n=5 neonati la media è 3.3 Kg e lo sqm è 0.63 Kg il cv è 0.63/3.3 = 0.19 se si passa da Kg a g la media è 3300 g e lo sqm è 630 g il cv è 630/3300 = 0.19 (invariato) in media le osservazioni si scostano dalla media del 19% della media stessa Non dipendendo dall’unità di misura il CV è idoneo a confrontare la variabilità tra variabili di diversa natura Es peso e altezze di n=5 neonati Pesi (Kg) 2.6, 3.4, 2.8, 3.5, 4,2 media 3.3 Kg, sqm 0.63 kg, Altezze (cm) 41, 48, 43, 46, 52 media 46 cm, sqm 4.3 cm, CV=0.19 CV=0.093 Le altezze sono meno variabili dei pesi INDICI DI FORMA gli scarti positivi tendono a essere più grandi coda rivolta verso destra asimmetria positiva ↑ media gli scarti negativi tendono a essere più grandi coda rivolta verso sinistra asimmetria negativa ↑ media simmetria degli scarti rispetto alla media ↑ media Gli scarti devono mantenere il segno INDICE DI ASIMMETRIA Media delle potenze terze degli scarti dalla media n 1 3 3 mx ( xi x ) n i 1 Altamente influenzato dall’unità di misura a3 3 mx 3 / sx non dipende dall’unità di misura valori superiori a 2 o inferiori a -2 indicano forte asimmetria Es peso di n=5 neonati 2.6, 3.4, 2.8, 3.5, 4,2 la media è 3.3 Kg lo sqm è 0.63 Kg scarti dalla media -0.7, 0.1, -0.5, 0.2, 0.9 potenze terze degli scarti -0.343, 0.001, -0.125, 0.008, 0.729 momento terzo 0.27/5 = 0.054 Kg3 indice di asimmetria a3 = 0.054/(0.63)3 = 2.16 DISTRIBUZIONI NORMALI (GAUSSIANE) Distribuzioni campanulari simmetriche attorno alla media, tali che media ± 2 sqm contiene il 95% delle osservazioni media ± 3 sqm contiene il 99% delle osservazioni sono rarissime le osservazioni che distano dalla media più di 3 volte lo sqm Es Altezza italiani maschi media 175 cm sqm 10 cm 175 ± 2x10 = 155 – 195 cm circa il 95 % degli italiani maschi 175 ± 3x10 = 145 – 205 cm circa il 99 % degli italiani maschi un individuo che fosse più basso della media di una quantità pari a 5 volte lo sqm avrebbe altezza 175 – 5x10 = 125 cm !!!!!!! un individuo che fosse più alto della media di una quantità pari a 5 volte lo sqm avrebbe altezza 175 + 5x10 = 225 cm !!!!!!!