STATISTICA PER LA RICERCA SPERIMENTALE E ECNOLOGICA Corso di Laurea Triennale in Infermieristica Anno III QUARTA LEZIONE RELAZIONI TRA VARIABILI QUALITATIVE COEFFICIENTE DI CORRELAZIONE PER RANGHI (SPEARMAN) Misura la correlazione tra due variabili di tipo ordinale E’ semplicemente il coefficiente di correlazione lineare calcolato sui ranghi di X e di Y Rango: posizione nella sequenza delle osservazioni ordinate di differenza tra i ranghi di X e Y per il soggetto i Es. Su n=8 soggetti è stata rilevata la variabile X (fumo) che può assumere le seguenti categorie NF(non fumatore), EF (ex fumatore), FM (fumatore moderato), FF (fumatore forte) e la variabile Y (sensibilità olfattiva) che può assumere le categorie S (scarsa), M (moderata), B (buona) X Y Rango X Rango Y Diff Diff2 NF B 2 7 -5 25 NF S 2 2.5 -0.5 0.25 NF B 2 7 -5 25 EF S 4 2.5 1.5 2.25 FM B 6 7 -1 1 FM S 6 2.5 3.5 12.25 FM M 6 5 1 1 FF S 8 2.5 5.5 30.25 97 rs = 1 – (6 x 97)/(8 x 63) = 1 – 1.15 = - 0.15 Esiste una lieve dipendenza lineare negativa tra i ranghi che implica una lieve dipendenza negativa tra X e Y In pratica la sensibilità olfattiva mostra una lieve diminuisce tendenza a diminuire al crescere del grado di dipendenza al fumo Es. Su 5 pazienti è stato rilevato lo stadio tumorale X (I,II,III,IV) e il livello di dolore (A=assente, M=moderato, F=forte, MF=molto forte) X Y Rango X Rango Y dif2 dif I A 1 1 0 0 II M 2.5 2 0.5 0.25 II F 2.5 3.5 1 1 III F 4 3.5 0.5 0.25 IV MF 5 5 0 0 1.5 rs = 1 – (6 x 1.5)/(5 x 24) = 1 – 0.075 = 0.925 Esiste una forte dipendenza lineare positiva tra i ranghi che implica una forte dipendenza positiva tra X e Y In pratica il dolore tende ad aumentare con lo stadio tumorale TABELLE DI CONTINGENZA (variabili dicotomiche) Si ottengono incrociando le distribuzioni di frequenza di due variabili X e Y per analizzare il loro livello di associazione Sia X la v. dicotomica che indica la presenza o l’assenza di una causa (?) di una patologia e sia Y la v. dicotomica che indica la presenza o l’assenza della patologia stessa Studiare l’associazione tra X e Y equivale a determinare l’effetto che ha X sull’insorgenza della patologia Es. Dipendenza tra fumo (X) e cancro polmonare (Y) n=1092 soggetti cancro fumo SI NO tot SI 459 534 993 NO 18 81 99 tot 477 615 1093 Rischio tra i fumatori 459/993=0.46 Rischio tra non fumatori 18/99=0.18 (46%) (18%) Rapporto di rischio RR=0.46/0.18=2.55 La percentuale di tumori tra i fumatori e 2 volte e mezzo più alta di quella osservata tra i non fumatori Es. Dipendenza tra tossicodipendenza e AIDS n=30 soggetti AIDS toss SI NO tot SI 7 2 9 NO 5 16 21 tot 12 18 30 Rischio tra i toss. 7/9=0.78 Rischio tra non toss 5/21=0.24 (78%) (24%) Rapporto di rischio RR=78/24=3.25 La percentuale di sieropositivi tra i toss. è circa 3 volte più alta di quella osservata tra i non toss RAPPORTO DI RISCHIO X causa (?) Y patologia n soggetti a/(a b) RR c/(c d) SI-NO SI-NO X SI NO tot SI a b a+b NO c d c+d tot a+c b+d tot In caso di assenza di associazione RR=1 Es Dipendenza tra attività fisica (X) e infarto (Y) n=100 casi infarto att fis SI NO tot SI 6 32 38 NO 11 51 62 tot 17 83 100 Rischio tra coloro che fanno att. fis. 6/38=0.16 Rischio tra coloro che non fanno att.fis 11/62=0.18 (16%) (18%) Rapporto di rischio RR=18/16=1.1 La percentuale di infarti tra coloro che non fanno att. fis è simile a quella di coloro che la effettuano SENSITIVITA’ – SPECIFICITA’ Sia X la v. dicotomica che indica la positività ad un certo test diagnostico (esame clinico) e sia Y la v. dicotomica che indica la presenza o l’assenza di una patologia Studiare l’associazione tra X e Y equivale a determinare l’efficienza del test diagnostico MASSIMA EFFICIENZA Y X SI NO tot SI a 0 a NO 0 d d tot a d tot Tutti i patologici sono stati correttamente identificati dal test Tutti i non patologici sono stati correttamente identificati dal test patologici SI NO tot SI a b a+b NO c d c+d tot a+c b+d Tot positivi Se = a/(a+c) SENSITIVITA’ proporzione di patologici correttamente identificati dal test Se = d/(b+d) SPECIFICITA’ proporzione di non patologici correttamente identificati dal test Es. Il livello di colesterolo (mg/dl) è stato misurato su un campione di n=344 Individui considerando come positivi (Y) valori superiori a 240 mg/dl. Nel follow up successivo sono stati registrati i casi di cardiopatia ischemica (X) rilevati nei 344 individui patologici positivi SI NO tot SI 31 97 128 NO 21 195 216 tot 52 292 344 Se = 31/52 = 0.67 SENSITIVITA’ 60% di cardiopatici correttamente identificati Sp = 195/292 = 0.67 SPECIFICITA’ 67% di sani correttamente identificati Es. Se si fossero considerati positivi livelli di colesterolo superiori a 200 mg/dl si sarebbero ottenuti i seguenti risultati patologici positivi SI NO tot SI 37 155 192 NO 15 137 152 tot 52 292 344 Se = 37/52 = 0. 71 SENSITIVITA’ 71% di cardiopatici correttamente identificati Sp = 137/292 = 0.47 SPECIFICITA’ 47% di sani correttamente identificati