STATISTICA PER LA RICERCA
SPERIMENTALE E ECNOLOGICA
Corso di Laurea Triennale in Infermieristica
Anno III
QUARTA LEZIONE
RELAZIONI TRA VARIABILI
QUALITATIVE
COEFFICIENTE DI CORRELAZIONE PER RANGHI
(SPEARMAN)
Misura la correlazione tra due variabili di tipo ordinale
E’ semplicemente il coefficiente di correlazione lineare
calcolato sui ranghi di X e di Y
Rango: posizione nella sequenza delle osservazioni
ordinate
di differenza tra i ranghi di X e Y per il soggetto i
Es. Su n=8 soggetti è stata rilevata la variabile X (fumo) che può assumere
le seguenti categorie NF(non fumatore), EF (ex fumatore), FM (fumatore
moderato), FF (fumatore forte) e la variabile Y (sensibilità olfattiva) che può
assumere le categorie S (scarsa), M (moderata), B (buona)
X
Y
Rango X
Rango Y
Diff
Diff2
NF
B
2
7
-5
25
NF
S
2
2.5
-0.5
0.25
NF
B
2
7
-5
25
EF
S
4
2.5
1.5
2.25
FM
B
6
7
-1
1
FM
S
6
2.5
3.5
12.25
FM
M
6
5
1
1
FF
S
8
2.5
5.5
30.25
97
rs = 1 – (6 x 97)/(8 x 63) = 1 – 1.15 = - 0.15
Esiste una lieve dipendenza lineare negativa tra i ranghi che implica
una lieve dipendenza negativa tra X e Y
In pratica la sensibilità olfattiva mostra una lieve diminuisce
tendenza a diminuire al crescere del grado di dipendenza al fumo
Es. Su 5 pazienti è stato rilevato lo stadio tumorale X (I,II,III,IV) e il livello
di dolore (A=assente, M=moderato, F=forte, MF=molto forte)
X
Y
Rango X
Rango Y
dif2
dif
I
A
1
1
0
0
II
M
2.5
2
0.5
0.25
II
F
2.5
3.5
1
1
III
F
4
3.5
0.5
0.25
IV
MF
5
5
0
0
1.5
rs = 1 – (6 x 1.5)/(5 x 24) = 1 – 0.075 = 0.925
Esiste una forte dipendenza lineare positiva tra i ranghi che
implica una forte dipendenza positiva tra X e Y
In pratica il dolore tende ad aumentare con lo stadio tumorale
TABELLE DI CONTINGENZA (variabili dicotomiche)
Si ottengono incrociando le distribuzioni di frequenza di
due variabili X e Y per analizzare il loro livello di
associazione
Sia X la v. dicotomica che indica la presenza o l’assenza
di una causa (?) di una patologia e sia Y la v. dicotomica
che indica la presenza o l’assenza della patologia stessa
Studiare l’associazione tra X e Y equivale a determinare
l’effetto che ha X sull’insorgenza della patologia
Es. Dipendenza tra fumo (X) e cancro polmonare (Y)
n=1092 soggetti
cancro
fumo
SI
NO
tot
SI
459
534
993
NO
18
81
99
tot
477
615
1093
Rischio tra i fumatori 459/993=0.46
Rischio tra non fumatori 18/99=0.18
(46%)
(18%)
Rapporto di rischio RR=0.46/0.18=2.55
La percentuale di tumori tra i fumatori e 2 volte e mezzo più alta di
quella osservata tra i non fumatori
Es. Dipendenza tra tossicodipendenza e AIDS
n=30 soggetti
AIDS
toss
SI
NO
tot
SI
7
2
9
NO
5
16
21
tot
12
18
30
Rischio tra i toss. 7/9=0.78
Rischio tra non toss 5/21=0.24
(78%)
(24%)
Rapporto di rischio RR=78/24=3.25
La percentuale di sieropositivi tra i toss. è circa 3 volte più alta di
quella osservata tra i non toss
RAPPORTO DI RISCHIO
X causa (?)
Y patologia
n soggetti
a/(a  b)
RR 
c/(c  d)
SI-NO
SI-NO
X
SI
NO
tot
SI
a
b
a+b
NO
c
d
c+d
tot
a+c
b+d
tot
In caso di assenza di associazione RR=1
Es Dipendenza tra attività fisica (X) e infarto (Y)
n=100 casi
infarto
att fis
SI
NO
tot
SI
6
32
38
NO
11
51
62
tot
17
83
100
Rischio tra coloro che fanno att. fis. 6/38=0.16
Rischio tra coloro che non fanno att.fis 11/62=0.18
(16%)
(18%)
Rapporto di rischio RR=18/16=1.1
La percentuale di infarti tra coloro che non fanno att. fis è simile
a quella di coloro che la effettuano
SENSITIVITA’ – SPECIFICITA’
Sia X la v. dicotomica che indica la positività ad un
certo test diagnostico (esame clinico) e sia Y la v.
dicotomica che indica la presenza o l’assenza di
una patologia
Studiare l’associazione tra X e Y equivale a
determinare l’efficienza del test diagnostico
MASSIMA EFFICIENZA
Y
X
SI
NO
tot
SI
a
0
a
NO
0
d
d
tot
a
d
tot
Tutti i patologici sono stati correttamente identificati dal
test
Tutti i non patologici sono stati correttamente identificati
dal test
patologici
SI
NO
tot
SI
a
b
a+b
NO
c
d
c+d
tot
a+c
b+d
Tot
positivi
Se = a/(a+c) SENSITIVITA’
proporzione di patologici correttamente identificati dal
test
Se = d/(b+d) SPECIFICITA’
proporzione di non patologici correttamente identificati
dal test
Es. Il livello di colesterolo (mg/dl) è stato misurato su un campione di
n=344 Individui considerando come positivi (Y) valori superiori a 240
mg/dl. Nel follow up successivo sono stati registrati i casi di
cardiopatia ischemica (X) rilevati nei 344 individui
patologici
positivi
SI
NO
tot
SI
31
97
128
NO
21
195
216
tot
52
292
344
Se = 31/52 = 0.67 SENSITIVITA’
60% di cardiopatici correttamente identificati
Sp = 195/292 = 0.67 SPECIFICITA’
67% di sani correttamente identificati
Es. Se si fossero considerati positivi livelli di colesterolo superiori a 200
mg/dl si sarebbero ottenuti i seguenti risultati
patologici
positivi
SI
NO
tot
SI
37
155
192
NO
15
137
152
tot
52
292
344
Se = 37/52 = 0. 71 SENSITIVITA’
71% di cardiopatici correttamente identificati
Sp = 137/292 = 0.47 SPECIFICITA’
47% di sani correttamente identificati
Scarica

Document