STATISTICA PER LA RICERCA
SPERIMENTALE E TECNOLOGICA
Corso di Laurea Triennale in Infermieristica
Anno III
SECONDA LEZIONE
INDICI DI POSIZIONE
(variabili quantitative)
Gli indici di posizione denotano un valore intorno a cui
colloca la distribuzione di frequenza
Gli indici di posizione più comuni sono la MEDIANA e
la MEDIA
La mediana e la media sono espresse nella stessa
unità di misura della variabile (se la variabile è
espressa in Kg anche la mediana e la media sono
espresse in Kg)
MEDIANA è il valore che occupa la posizione
centrale nella sequenza delle osservazioni ordinate
Es peso di n=5 neonati
2.6, 3.4, 2.8, 3.5, 4,2
si ordinano le osservazioni
2.6, 2.8, 3.4, 3.5, 4.2
↑
la mediana è 3.4 Kg
il valore centrale è il terzo
REGOLA GENERALE
Se n è dispari la mediana è l’osservazione di posto
(n+1)/2 nella sequenza delle osservazioni ordinate
Es.
se n=9 la mediana è l’elemento di posto 10/2=5
se n=27 la mediana è l’elemento di posto 28/2=14
se n=389 la mediana è l’elemento di posto 390/2=195
Es peso di n=6 neonati
2.6, 3.4, 2.8, 3.5, 4.2, 3.2
si ordinano le osservazioni
2.6, 2.8, 3.2, 3.4, 3.5, 4.2 il valori centrali sono il terzo e il quarto
↑ ↑
la mediana è la semisomma (punto intermedio) tra i due
(3.2+3.4)/2=6.6/2=3.3 Kg
REGOLA GENERALE
Se n è pari la mediana è la semisomma tra l’osservazione di
posto n/2 e quella di posto n/2+1 nella sequenza delle
osservazioni ordinate
Es.
se n=10 la mediana è la semisomma tra gli elemento di posto 10/2=5 e 6
se n=28 la mediana è la semisomma tra gli elementi di posto 28/2=14 e 15
se n=390 la mediana è la semisomma tra gli elementi di posto 390/2=195 e 196
MEDIA
La media e la somma delle osservazioni diviso il
numero delle stesse
x1  x2    xn
x
n
1 n
x   xi
n i 1
Es peso di n=5 neonati
2.6, 3.4, 2.8, 3.5, 4,2
(2.6+3.4+2.8+3.5+4.2)/5=16.5/5=3.3
la media è 3.3 Kg
PROPRIETA’ DELLA MEDIA
La media è sempre compresa tra l’osservazione più
piccola e quella più grande
xmin  x  xmax
La somma degli scarti dalla media è nulla
n
 ( xi  x )  0
i 1
Es peso di n=5 neonati
2.6, 3.4, 2.8, 3.5, 4,2
↑
la media è 3.3 Kg che è un valore compreso tra 2.6 e 4.2 kg
scarti dalla media
-0.7, 0.1, -0.5, 0.2, 0.9
somma degli scarti
-0.7+0.1-0.5+0.2+0.9 = 0
La media è più sensibile della mediana alle
osservazioni estreme
Es peso di n=5 neonati
2.6, 3.4, 2.8, 3.5, 4,2
↑
media 3.3 kg
mediana 3.4 kg
1.6, 3.4, 2.8, 3.5, 4,2
media 3.1 kg
mediana 3.4 kg
2.6, 3.4, 2.8, 3.5, 5.2
media 3.5 kg
mediana 3.4 kg
La media segue l’unità di misura con cui sono espresse
le osservazioni
Es peso di n=5 neonati
2.6, 3.4, 2.8, 3.5, 4,2
media 3.3 kg
si passa da Kg a g
2600, 3400, 2800,3500, 4200
media 3300 g
INDICI DI VARIABILITA’
↑
media
stessa media ma diversa
dispersione attorno alla
media
↑
media
gli scarti dalla media tendono ad essere maggiori nel secondo caso
La media degli scarti dalla media potrebbe essere
preso come indice di variabilità
La somma degli scarti dalla media è sempre nulla,
questo indice risulta sempre uguale a 0
Gli scarti positivi si compensano con quelli negativi
Occorre fare perdere il segno agli scarti
VARIANZA
Media dei quadrati degli scarti dalla media
n
1
2
2
s x   ( xi  x )
n i 1
varianza corretta (più utilizzata)
n
1
2
2
sx 
( xi  x )

n  1 i 1
Es peso di n=5 neonati
2.6, 3.4, 2.8, 3.5, 4,2
la media è 3.3 Kg
scarti dalla media
-0.7, 0.1, -0.5, 0.2, 0.9
quadrati degli scarti
0.49, 0.01, 0.25, 0.04, 0.81
(0.49+0.01+0.25+0.04+0.81)/5 = 1.6/5 = 0.32 kg2 varianza
(0.49+0.01+0.25+0.04+0.81)/4 = 1.6/4 = 0.4 kg2
varianza corretta
PROBLEMA
La varianza si interpreta con difficoltà perché è espressa
nel quadrato dell’unità di misura delle osservazioni
da m a m2 , da Kg a Kg2, da cm3 a cm6 , ecc
Es peso di n=5 neonati
2.6, 3.4, 2.8, 3.5, 4,2
la media è 3.3 Kg
che significa una varianza di 0.4 kg2
??????
SCARTO QUADRATICO MEDIO
(DEVIAZIONE STANDARD)
E’ la radice quadrata della varianza sx
E’ espresso nella stessa unità di misura delle osservazioni
Es peso di n=5 neonati
2.6, 3.4, 2.8, 3.5, 4,2
la media è 3.3 Kg , la varianza è 0.4 Kg2
lo scarto quadratico medio è 0.63 Kg
mediamente le osservazioni si discostano dalla media di 0.63 Kg
OSSERVAZIONI
Come la media lo scarto quadratico medio (sqm) segue
l’unità di misura delle osservazioni
Es peso di n=5 neonati
la media è 3.3 Kg e lo sqm è 0.63 Kg
se si passa da Kg a g
la media è 3300 g e lo sqm è 630 g
Se tutte le osservazioni sono uguali (assenza di
variabilità) la varianza (e dunque lo sqm) sono nulli
COEFFICIENTE DI VARIAZIONE (CV)
E’ il rapporto tra lo sqm e la media delle osservazioni
CV  s x / x
non dipende dall’unità di misura in cui sono
espresse le osservazioni
Es peso di n=5 neonati
la media è 3.3 Kg e lo sqm è 0.63 Kg
il cv è 0.63/3.3 = 0.19
se si passa da Kg a g
la media è 3300 g e lo sqm è 630 g
il cv è 630/3300 = 0.19 (invariato)
in media le osservazioni si scostano dalla media del 19% della
media stessa
Non dipendendo dall’unità di misura il CV è idoneo a
confrontare la variabilità tra variabili di diversa natura
Es peso e altezze di n=5 neonati
Pesi (Kg)
2.6, 3.4, 2.8, 3.5, 4,2
media 3.3 Kg,
sqm 0.63 kg,
Altezze (cm)
41, 48, 43, 46, 52
media 46 cm,
sqm 4.3 cm,
CV=0.19
CV=0.093
Le altezze sono meno variabili dei pesi
INDICI DI FORMA
gli scarti positivi tendono a essere più grandi
coda rivolta verso destra
asimmetria positiva
↑
media
gli scarti negativi tendono a essere più grandi
coda rivolta verso sinistra
asimmetria negativa
↑
media
simmetria degli scarti rispetto alla media
↑
media
Gli scarti devono mantenere il segno
INDICE DI ASIMMETRIA
Media delle potenze terze degli scarti dalla media
n
1
3
3
mx   ( xi  x )
n i 1
Altamente influenzato dall’unità di misura
a3 
3
mx
3
/ sx
non dipende dall’unità di misura
valori superiori a 2 o inferiori a -2 indicano forte asimmetria
Es peso di n=5 neonati
2.6, 3.4, 2.8, 3.5, 4,2
la media è 3.3 Kg
lo sqm è 0.63 Kg
scarti dalla media
-0.7, 0.1, -0.5, 0.2, 0.9
potenze terze degli scarti
-0.343, 0.001, -0.125, 0.008, 0.729
momento terzo 0.27/5 = 0.054 Kg3
indice di asimmetria a3 = 0.054/(0.63)3 = 2.16
DISTRIBUZIONI NORMALI (GAUSSIANE)
Distribuzioni campanulari simmetriche attorno alla
media, tali che
media ± 2 sqm contiene il 95% delle osservazioni
media ± 3 sqm contiene il 99% delle osservazioni
sono rarissime le osservazioni che distano dalla
media più di 3 volte lo sqm
Es Altezza italiani maschi
media 175 cm
sqm 10 cm
175 ± 2x10 = 155 – 195 cm circa il 95 % degli italiani maschi
175 ± 3x10 = 145 – 205 cm circa il 99 % degli italiani maschi
un individuo che fosse più basso della media di una quantità pari a 5
volte lo sqm avrebbe altezza
175 – 5x10 = 125 cm
!!!!!!!
un individuo che fosse più alto della media di una quantità pari a 5
volte lo sqm avrebbe altezza
175 + 5x10 = 225 cm
!!!!!!!
Scarica

Document