STATISTICA PER LA RICERCA
SPERIMENTALE E TECNOLOGICA
Corso di Laurea Triennale in Infermieristica
Anno III
PRIMA LEZIONE
VARIABILE : caratteristica di tipo qualitativo o
quantitativo dei soggetti analizzati
Le variabili si distinguono appunto in v. qualitative o
categoriali e v. quantitative
Una variabile è qualitativa quando si estrinseca
attraverso un insieme finito di modalità o categorie
Le variabili qualitative si distinguono in ordinali
quando esiste una gerarchia tra le categorie e non
ordinali in caso contrario
VARIABILI
ESEMPI DI VARIABILI QUALITATIVE
Sesso di un paziente (non ordinale)
Maschio, Femmina
Stato di un paziente (non ordinale)
In cinta, No
Diabetico, No
Iperteso, Normoteso
Stato di un paziente (ordinale)
non fumatore, ex-fumatore, fumatore moderato, fumatore forte
Grado di dolore (ordinale)
Minimo, Moderato, Forte, Molto forte
Stadio tumorale (ordinale)
I, II, III, IV
Una variabile è quantitativa quando si estrinseca
attraverso delle quantità
Le variabili quantitative si distinguono in v. discrete e
v continue
Le variabili discrete derivano in genere da conteggi
ESEMPI DI VARIABILI DISCRETE
Numero di cesarei effettuati giornalmente in una clinica ostetrica
0, 1, 2, 3, …
Numero di figli di una paziente
0, 1, 2, 3, …
Le variabili continue derivano in genere da misurazioni
Peso corporeo, Statura, Temperatura corporea, Pressione arteriosa, Livello
di colesterolo, ecc.
Per esprimere le variabili
specificare l’unità di misura
quantitative
Esempio: peso di 3 neonati (1 lb = 0.4536 kg)
kg
1
2.9
2
3.3
3
3.1
g
2900 3300 3100
lb
6.39
7.28
6.83
si
deve
SIMBOLOGIA
In genere la variabile oggetto di studio si indica con il
simbolo X, per cui se si misura tale variabile su n soggetti,
si indica con x1 il valore di tale variabile rilevato sul soggetto
1, con x2 il valore rilevato sul soggetto 2, con xn il valore
rilevato sul soggetto n.
Dunque la sequenza x1,x2,…,xn costituisce il nostro
protocollo sperimentale
da sintetizzare con le metodologie della
STATISTICA DESCRITTIVA
DISTRIBUZIONI DI FREQUENZA
VARIABILI QUALITATIVE
Nel caso di una variabile qualitativa rilevata su n soggetti,
le categorie tendono a ripetersi.
Il protocollo sperimentale è dunque costituito da sigle che
si susseguono in modo disordinato ripetendosi.
ESEMPIO 1
Rileviamo su 80 pazienti ricoverati in una clinica per malattie
cardiovascolari la variabile FUMO, utilizzando 4 categorie ordinali: non
fumatore (NF), ex fumatore (EF), fumatore moderato (FM), fumatore forte
(FF)
Protocollo sperimentale (dati):
FM,NF,FF,NF,EF,NF,FF,FM,NF,NF,NF,NF,FM,EF,NF,FM,NF,FM,NF,FF,
FM,FM,FM,NF,NF,FF,FF,NF,NF,NF,NF,FF,FF,NF,EF,EF,NF, FM,NF,FM,
NF,EF,NF,NF,EF,NF, FM,NF,FM,NF,FM,NF,FM,NF,NF,FF,FM,NF,FF,FM,
FM,FF,FM,FF,NF,FM,FF,EF,FF,FM,FF,NF,FF,EF,FM,FM,FF,FM,FM,NF
???
Per mettere ordine nei dati possiamo considerare le
frequenze assolute o le frequenze relative delle
singole categorie e riportarle in una tabella detta
distribuzione di frequenza
La distribuzione di frequenza può essere
rappresentata graficamente con un diagramma a
barre verticali di altezza proporzionale alle
frequenze (relative o assolute)
ESEMPIO 1
X
NF
EF
FM
FF
tot
f.a.
32
8
24
16
80
f.r
0.4
0.1
0.3
0.2
1
f.r %
40%
10%
30%
20%
100%
Ovviamente la somma delle frequenze assolute è uguale al numero di
soggetti mentre la somma delle frequenze relative è uguale a 1 (o a
100 se percentualizzate)
FREQUENZE ASSOLUTE
35
30
25
20
fumo
15
10
5
0
NF
EF
FM
FF
FREQUENZE RELATIVE
0.43
0.36
0.28
0.21
fumo
0.14
0.07
0.00
NF
EF
FM
FF
ESEMPIO 2
In una clinica ostetrica si sono verificati in due anni 60 morti perinatali.
Per ogni caso è stato rilevato il giorno della settimana in cui la morte è
avvenuta.
Protocollo sperimentale (dati)
sab,dom,gio,lun,sab,gio,mer,mar,ven,sab,mer,lun,sab,ven,mar,
sab,dom,mar,dom,dom,dom,mer,sab,ven,mer,gio,gio,mar,sab,mer,
dom,ven,dom,dom,gio,lun,mer,sab,dom,sab,sab,dom,lun,sab,dom,
ven,lun,dom,dom,mar,dom,lun,mer,sab,gio,mer,ven,dom,mar,mer
???
X
lun
mar
mer
gio
ven
sab
dom
tot
f.a
6
6
9
6
6
12
15
60
f.r.
0.10
0.10
0.15
0.10
0.10
0.20
0.25
1
f.r. %
10%
10%
15%
10%
10%
20%
25%
100%
16
14
12
10
8
giorno
6
4
2
0
l
ma me
g
v
s
d
VARIABILI DISCRETE
Anche nel caso di una variabile discreta
rilevata su n soggetti, i valori tendono a
ripetersi.
Il protocollo sperimentale è dunque costituito
da numeri interi che si susseguono in modo
disordinato ripetendosi.
ESEMPIO 3
In una clinica ostetrica è stato rilevato il numero di figli su 120
partorienti.
Protocollo sperimentale (dati)
1,1,0,5,2,0,1,2,0,1,3,1,0,4,1,0,0,2,3,1,0,2,4,1,1,0,3,2,1,0,
5,1,4,1,1,0,2,0,3,0,2,1,2,0,1,0,2,1,0,2,2,1,1,2,0,0,0,1,2,1,
2,1,1,1,2,2,2,0,2,1,1,0,1,0,3,0,1,3,0,2,1,4,1,2,1,3,0,1,2,0,
0,3,1,1,1,2,0,5,1,4,1,0,2,1,3,0,3,1,2,3,1,4,2,1,3,2,1,0,2,1
???
X
0
1
2
3
4
5
tot
f.a.
30
42
27
12
6
3
120
f.r.
0.250
0.350
0.225
0.100
0.050
0.025
1
f.r.%
25%
35%
22.5%
10%
5%
2.5%
100%
45
40
35
30
25
n. figli
20
15
10
5
0
0
1
2
3
4
5
VARIABILI CONTINUE
Al contrario, nel caso di una variabile discreta
rilevata su n soggetti, i valori tendono a essere tutti
distinti
Il protocollo sperimentale è dunque costituito da
numeri reali quasi tutti distinti che si susseguono in
modo disordinato.
In questo caso le frequenze dei valori distinti sono
quasi tutte uguali a 1
DISTRIBUZIONE DI FREQUENZA PER CLASSI
Si considera un intervallo che contenga tutti i valori
osservati e lo si divide in intervalli o classi non
necessariamente di uguale ampiezza
Si considerano poi le frequenze assolute o relative
delle varie classi
ESEMPIO 4
In un reparto di chirurgia sono stati rilevati i valori di glicemia su 40 pazienti
operati nella giornata precedente
Protocollo sperimentale (dati)
70, 71, 72, 73, 89, 88, 68 84, 96, 74,81,69,77,92,68,82,79,93,85,95
66, 95, 86, 90, 75, 65, 94, 57, 80, 86,88,54,71,67,66,89,70,68,80,91
???
Valore minimo 54, valore massimo 96
Tutti i dati sono compresi tra 50 e 100
Si divide l’intervallo 50-100 in 5 classi di ampiezza 10
Si contano le frequenze in tali intervalli
Classi
f.a
f.r
f.r %
50-60
2
0.05
5%
60-70
8
0.20
20%
70-80
10
0.25
25%
80-90
12
0.30
30%
90-100
8
0.20
20%
tot
40
1
100%
ISTOGRAMMA
rettangolo con area A proporzionale alla
frequenza (p.es frequenza percentuale) e base B
uguale all’ampiezza della classe
Altezza H ?
Quando le classi sono di uguale ampiezza
l’altezza è proporzionale alla frequenza
H
H
B
B
ESEMPIO 5
Sono stati rilevati i livelli di IgM (mg/dl) su 40 bambini
Protocollo sperimentale (dati)
111, 109, 63, 107, 125, 112, 170, 193, 119, 199,
106, 16, 110, 107, 37, 101, 292, 75, 116, 208,
45, 98, 115, 312, 307, 68, 77, 381, 129, 135,
220, 59, 148, 103, 94, 241, 88, 83, 259, 267
???
Valore minimo 16, valore massimo 381
Tutti i dati sono compresi tra 0 e 400
Si divide l’intervallo 0-400 in 5 classi di varia ampiezza
Si contano le frequenze in tali intervalli
ISTOGRAMMA
rettangolo con area A proporzionale alla frequenza (p.es
frequenza percentuale) e base B uguale all’ampiezza
della classe
Altezza H ?
Dal momento che A=BxH, allora H=A/B
H
densità della frequenza
H
A
B
H
A
B
Classe
0-60
60-100
100-120
120-270
270-400
Tot
f.a.
4
8
12
12
4
40
f.r.
0.10
0.20
0.30
0.30
0.10
1
f.r. %
10%
20%
30%
30%
10%
100%
ISTOGRAMMA CLASSE 0-60
B=60, A=10 → H=10/60=1/6~0.17
ISTOGRAMMA CLASSE 60-100
B=40, A=20 → H=20/40=1/2=0.5
ISTOGRAMMA CLASSE 100-120
B=20, A=30 → H=30/20=3/2=1.5
ISTOGRAMMA CLASSE 120-270
B=150, A=30 → H=30/150=0.2
ISTOGRAMMA CLASSE 270-400
B=130, A=10 → H=10/130=1/13~0.07
0
100
200
IgM
300
400
0.000
0.005
Density
0.010
0.015
MODA
Categoria o valore con la massima frequenza
CLASSE MODALE
Classe con la massima densità delle frequenze
(istogramma più alto)
20
18
16
14
12
10
8
6
4
2
0
X
x1
x2
x3
↑
moda
x4
x5
x6
↑
classe modale
UNITA’ DI MISURA
Il cambiamento dell’unità di misura si effettua con una
trasformazione lineare del tipo Y=bX
Es.
Per passare da Kg a grammi b=1000
3.4 kg divengono 3400 grammi
Per passare da Kg a lb b=2.204
3.4 kg diventano 7.49 lb
PROBLEMA
Molti indici statistici sono influenzati dall’unità di misura
(cambia la convenzione cambia l’indice)
Scarica

Diapositiva 1