Studi caso-controllo Con gli studi di tipo descrittivo e trasversale si possono formulare ipotesi sulla presenza di fattori di rischio, ma non dimostrare la presenza reale di un nesso causale tra il fattore e la malattia: ciò può essere possibile invece negli studi caso-controllo e di coorte. Lo studio caso-controllo è tipicamente retrospettivo, nel senso che si raccolgono informazioni sul passato, ovvero dopo che la malattia si è già verificata e sono noti coloro che sono malati (i casi) e coloro che non lo sono (i controlli). Esempio: Grande cena per un matrimonio. Il giorno dopo la cena, tra i 600 invitati si verificano 200 casi di intossicazione alimentare con febbre, dissenteria e dolori addominali. Questi 200 ammalati rappresentano i “casi”, mentre i 400 sani sono i “controlli”. La prima azione in questi casi è raccogliere informazioni sugli alimenti consumati durante la cena, e creare una serie di tabelle 2x2 per ogni alimento. Dalla tabella 2x2 del gelato alla crema, ad esempio, si nota come la percentuale di soggetti che hanno consumato il gelato sia 7 volte più elevata tra i casi (i malati) rispetto ai controlli (i sani). Casi (malati) Controlli (sani) Totale Esposti (consumo di gelato) 140 40 180 Non esposti (no gelato) 60 360 420 Totale 200 400 600 In questo caso, è ovvio ipotizzare che il gelato alla crema possa essere stato contaminato. Ma sono necessarie a questo punto due ulteriori precisazioni. In primo luogo, 60 soggetti hanno contratto l’intossicazione nonostante non abbiano consumato il gelato. Per tale motivo, si dovrebbe valutare se anche altri alimenti risultano associati alla patologia. In secondo luogo, occorre tenere presente bias ecologico (o l’eventualità di un confondimento). Se infatti, valutando le altre tabelle 2x2 relative agli altri alimenti, risultasse che tutti e 200 i casi avevano consumato le tartine al salmone e solo 10 dei 400 controlli le avevano toccate, sembra evidente ritenere che l’alimento realmente responsabile dell’intossicazione non sia il salmone, bensì le tartine. Il fatto che dei 200 che avevano consumato le tartine 140 avessero consumato anche il gelato, ci ha fatto incorrere nel più classico dei confondimenti. Le persone alle quali piaceva il gelato erano evidentemente le stesse alle quali piacevano le tartine. Casi (malati) Controlli (sani) Totale Esposti (consumo di tartine) 200 10 210 Non esposti (no tartine) 0 390 390 Totale 200 400 600 La metodologia tipica degli studi caso-controllo è retrospettiva, e prevede che si sappia già chi sono i casi e chi sono i controlli. E’ chiaro che tale metodologia può non essere semplice come nell’esempio appena illustrato: i casi e i controlli devono essere il più possibile simili per quanto concerne gli aspetti demografici e devono provenire dalla stessa popolazione. Per chiarire meglio questo concetto, veniamo a pregi e difetti di questo tipo di studio. Gli studi caso-controllo sono abbastanza semplici, solitamente brevi e poco costosi. Tuttavia, hanno una serie di difetti molto importanti. In primo luogo, poiché devono essere già noti i malati e i sani, non permettono di calcolare l’incidenza, cioè il numero di nuovi casi nella popolazione in un determinato periodo di tempo, perché si conosce solo il numero di casi che già ci sono. In secondo luogo, poiché i rilevamenti sono svolti sul passato, i dati potrebbero non essere attendibili. Infine, nel caso l’espisizione fosse rara (ovvero nel caso in cui l’alimento incriminato fosse stato, ad esempio, consumato solo da 5 persone), sarebbe molto difficile provare l’esistenza reale di un’associazione. Visti dei numeri così scarsi, il margine di errore sarebbe molto elevato. Per queste ragioni, quando è possibile si preferisce svolgere uno studio di coorte, più preciso e affidabile. Tuttavia, gli studi caso-controllo sono molto diffusi in diverse situazioni in cui non è possibile effettuare uno studio di coorte. In primo luogo, quando vi sono pochi fondi e non si è certi della relazione che si intende studiare, è sempre utile svolgere prima uno studio casocontrollo, e solo nel caso che questo confermi l’ipotesi, provare uno studio di coorte. In secondo luogo, esistono tante situazioni in cui davvero uno studio di coorte risulta impossibile, e l’unico disegno di studio praticabile è il casocontrollo. Ciò si verifica, ad esempio, quando la patologia da studiare è rara. Tipicamente, tante patologie di tumori rare sono studiate tramite studi caso-controllo Studi Caso-Controllo Esposti Non esposti Esposti Non esposti Passato Malati Non malati Presente Retrospettivi Futuro Uno studio caso-controllo Casi Controlli Misure di frequenza: prevalenza e incidenza Le misure epidemiologiche fondamentali, che derivano solitamente dalle tabelle 2x2, rappresentano i risultati finali che si ottengono dagli studi epidemiologici. In altri termini, si conducono gli studi epidemiologici proprio per arrivare ad ottenere queste misure. Conoscere il significato dei termini prevalenza, incidenza e rischio relativo è un prerequisito indispensabile per chiunque si trovi a decidere di (o a commentare su…) politiche di intervento, perché esse devono basarsi sui risultati di evidenze scientifiche, e queste evidenze sono proprio gli studi epidemiologici. Prevalenza Sebbene esprimano due concetti simili, si distinguono due tipi di prevalenza: la prevalenza puntuale e quella periodale. La prevalenza puntuale ad es. di una determinata patologia è il rapporto tra il n. di malati presenti in una popolazione in un certo momento e il n. totale di individui (malati e non) in quella popolazione in quel momento. Si tratta quindi della fotografia di una particolare situazione in un momento specifico, da noi scelto. La prevalenza puntuale è una semplice percentuale e varia da 0 a 100% (o da 0 a 1). La prevalenza che incorpora il fattore “tempo” viene chiamata prevalenza periodale. E’ data dal rapporto tra il n. di malati (vecchi e nuovi) presenti in una popolazione durante un determinato periodo di tempo, e il n. totale di soggetti di quella popolazione nello stesso periodo di tempo. In ogni caso, sia la prevalenza puntuale che quella periodale esprimono lo stesso concetto di fondo: la prevalenza è un indice della probabilità di essere malati in un certo momento (puntuale) o periodo (periodale). Prevalenza puntuale = N. di malati presenti nella popolazione in un determinato momento _________________________________________ N. totale di persone (malati e sani) nella popolazione Prevalenza periodale= N. di malati (vecchi e nuovi) presenti nella popolazione in un certo periodo _________________________________________________ N. totale di persone (malati e sani) nella popolazione in quel periodo Per chiarire quanto detto, prendiamo come esempio una patologia di lunga durata come la tubercolosi (può durare da pochi mesi a diversi anni). Se noi volessimo calcolare la prevalenza periodale di tubercolotici in Italia nell’anno 2005, al numeratore dovremmo sommare i casi già esistenti di TBC al 1 gennaio, e tutti i casi che invece si sono ammalati durante l’anno, fino al 31 dicembre (i “nuovi” casi). Al denominatore dovremmo invece mettere la media della popolazione italiana durante l’anno 2005. In conclusione, è chiaro che la prevalenza puntuale comprende al numeratore solo coloro che sono già malati in quel momento, ed è quindi una stima della probabilità di essere malati in quel momento preciso. Se essa, ad es., è pari a 3.3%, ciò significa che ogni individuo di quella popolazione ha il 3.3% di probabilità di essere malato della patologia che si sta valutando. La prevalenza periodale è molto simile: il fatto che essa includa al numeratore sia i casi vecchi sia quelli nuovi fa sì che anch’essa sia una misura della probabilità di essere malati, ma in un determinato periodo. In ogni caso, il dato è molto importante: per es., conoscere la prevalenza di malati di TBC nell’anno 2012 permette di programmare quanti farmaci ordinare per l’anno successivo, il n. di posti letto dedicati ai reparti di Pneumologia etc. Incidenza Mentre la prevalenza include al numeratore tutti i casi di malattia, sia vecchi sia nuovi, l’incidenza viene invece calcolata escludendo tutti i casi “vecchi”, ovvero gli individui già malati al momento della rilevazione, sia dal numeratore che dal denominatore. Infatti, l’incidenza è il rapporto tra il n. di nuovi casi di malattia che si verificano in un certo periodo di tempo in una popolazione e il n. complessivo di persone che compongono questa popolazione e che possono essere a rischio di insorgenza di malattia in quel periodo. Incidenza cumulativa= N. di nuovi casi malattia nella popolazione in un determinato periodo _____________________________________________ N. totale di persone sane nella popolazione all’inizio di quel periodo Tasso di incidenza= N. di nuovi casi malattia nella popolazione in un determinato periodo _________________________________________________ N. totale di unità di tempo di osservazione Esempio: L’incidenza di TBC in Italia nel 2005 è pari al n. di persone che si sono ammalate di TBC nel corso del 2005, diviso per un n. che deriva dalla media della popolazione italiana nel 2005, sottratta di quegli individui che erano già malati all’inizio dell’anno, e che non potevano quindi riammalarsi. L’incidenza quindi, rispetto alla prevalenza, misura solo i nuovi casi e non tutti i casi. Per questo motivo, i casi vecchi devono anche essere esclusi dal totale della popolazione (dal denominatore), poiché essendo già malati non potrebbero riammalarsi. Misure di associazione: rischio relativo e affini Insieme alle principali misure di frequenza (prevalenza e incidenza), le misure di associazione rappresentano le misure fondamentali di tutti gli studi epidemiologici. Rischio relativo: Il Rischio relativo (RR) viene calcolato partendo da una tabella 2x2. Esso è sempre riferito a una patologia (o evento che ci interessa, comunemente chiamato outcome), e a un fattore di rischio o esposizione. Se ad es. la nostra esposizione è il fumo e la nostra patologia è il tumore del polmone, il rischio relativo ci dice quanto i fumatori (gli esposti) sono a rischio di sviluppare un tumore rispetto ai non fumatori (i non esposti). Facendo un altro esempio, prendiamo stavolta come esposizione le radiazioni ionizzanti (a basse dosi); la patologia è il tumore della tiroide. Le radiazioni ionizzanti sono associate a un maggior rischio di sviluppare il cancro della tiroide. Tuttavia, se questo rischio non fosse più alto dello 0.01% non ci preoccuperemmo più di tanto, mentre se fosse del 10% dovremmo fare molta attenzione. Tutta l’epidemiologia si basa sul concetto di esposizione associata a malattia, ma questa associazione va assolutamente quantificata. Il rischio relativo risulta quindi fondamentale poiché fornisce una stima della forza dell’associazione tra fattore di rischio e malattia. Esso non è altro che il rapporto tra l’incidenza di malattia negli esposti e l’incidenza di malattie nei non esposti. Esempio: richiamiamo la tabella già fornita per gli studi di coorte. In questa tabella avevamo visto che l’incidenza di patologie respiratorie negli esposti (tassisti di città più inquinate) era pari al 25%, mentre la percentuale nei non esposti (tassisti di città meno inquinate) era pari al 20%. Studi di coorte: tabella 2x2 Malati Sani Totale Esposti (residenti in città inquinate) 100 300 400 Non esposti (residenti in città meno inquinate) 60 240 300 Totale 160 540 700 Riferendoci a questo esempio, il RR è molto facile da calcolare: basta dividere l’incidenza negli esposti (100/400 x 100) per quella nei non esposti (60/300 x 100). Nel nostro caso, quindi, il RR sarà 25%/20% = 1.25%. Il dato ottenuto significa che gli esposti hanno un rischio di sviluppare patologie respiratorie più alto del 25% rispetto ai non esposti. Come è facilmente intuibile considerando che esso è un rapporto, il RR può assumere valori compresi tra 0 e infinito. RR = 1 ---------- l’esposizione non è associata alla malattia RR > 1 ---------- l’esposizione è associata a un maggior rischio di malattia – fattore di rischio RR < 1 ---------- l’esposizione è associata a un minor rischio di malattia – fattore protettivo Se il RR risulta un valore maggiore di 1, questo significa che la percentuale di malati negli esposti (numeratore) è più grande della percentuale di malati nei non esposti (denominatore). Di conseguenza, concluderemo che l’esposizione è associata a un maggior rischio di malattia, ovvero essa è un fattore che predispone allo sviluppo della stessa. Se invece il RR risulta minore di 1, questo significa che il denominatore (malati tra i non esposti) è più alto del numeratore (malati tra gli esposti). Ovviamente ciò ci porta a pensare che il rischio sia minore tra gli esposti, e quindi che l’esposizione sia un fattore protettivo (es. carnagione scura associata a un RR < 1 per il melanoma) Odds Ratio: Nonostante il RR sia una misura fondamentale, esso può essere calcolato negli studi di coorte ma non negli studi trasversali o caso-controllo. Questo perché solo negli studi di coorte è possibile calcolare l’incidenza, da cui il RR deriva. Per gli studi caso-controllo o trasversali, la misura utilizzata è l’Odds ratio (OR). Anche l’OR come il RR, è una stima della forza di un’associazione tra un’esposizione e una patologia, e va interpretata in tutto e per tutto in modo analogo al RR. Per comprendere questa misura, occorre introdurre il concetto di "odds" (termine che non ha un corrispondente in italiano; può essere reso con "probabilità a favore"). Gli odds sono rappresentati dal il rapporto fra il numero di volte in cui l'evento si verifica (o si è verificato) ed il numero di volte in cui l'evento non si verifica ( o si è verificato). Gli odds si utilizzano nel mondo delle scommesse, perché consentono allo scommettitore di calcolare facilmente la somma da incassare. Ad esempio, la vittoria della nazionale italiana di calcio nella semifinale Italia-Francia ai mondiali del 1998 era data dai bookmakers a 4:1 "a sfavore". Questo equivale a dire che, su una scala da 1 a 5, le probabilità di sconfitta (p) dell'Italia erano considerate 4 volte più alte di quelle di una sua vittoria (1-p), e quindi la vittoria dell’Italia sarebbe stata pagata 4 volte la cifra scommessa [per i curiosi: vinse la Francia 4-3 ai rigori]. L'"odds ratio" si calcola attraverso i semplici rapporti (odds) fra le frequenze osservate e non attraverso le proporzioni. Notare che si utilizzano i semplici rapporti tra le frequenze osservate (a/c, b/d) e non le proporzioni (a/a+c e b/b+d). Notare anche che, applicando le proprietà delle frazioni, l'odds ratio può venire più facilmente calcolato attraverso i prodotti delle celle incrociate della tabella (a*d e b*c); perciò viene anche detto, in italiano, "rapporto incrociato". Calcolo dell’Odds ratio: Malattia Esposizione OR = a/c + - + A B - C D axd ------ = ------- b/d bxc In termini matematici, non è importante se l'OR viene calcolato come (a/c)/(b/d) oppure come (a/b)/(c/d), perché in entrambi i casi si ottiene lo stesso rapporto incrociato: ad/bc. Tuttavia, in termini razionali non ha senso usare la seconda formula. Infatti in uno studio retrospettivo, il rapporto a/b (così come il rapporto c/d), non dipende dalla malattia né dall'esposizione, ma bensì soltanto dallo sperimentatore stesso che ha avuto libertà di reclutare un numero di casi e di controlli a suo piacimento. Esempio: Vogliamo capire se l’uso di lampade abbronzanti superiore a 5 volte al mese con regolarità è associata a un maggior rischio di melanoma. Finito lo studio, con i dati dei 600 partecipanti possiamo costruire una tabella 2x2. La frequenza di esposti tra i casi è del 10%, mentre tra i controlli è solo del 2.5% E’ possibile calcolare la nostra OR che sarà pari a 4.3 (20x390)/(10x180). Questo valore significa che chi fa uso di lampade abbronzanti almeno 5 volte al mese ha circa 4 volte in più il rischio di ammalarsi di melanoma rispetto a chi ne fa un uso minore. Casi Controlli Totale Esposti (5 o più lampade UV al mese) 20 10 30 Non esposti (meno di 5 lampade UV al mese) 180 390 570 Totale 200 400 600 Riprendiamo la tabella 2x2 relativa a uno studio trasversale. Se dobbiamo calcolare il RR di essere stressati, questo sarebbe pari a 16.7%/3% = 5.6. Ciò significherebbe che gli esposti rispetto ai non esposti hanno un rischio pari circa a 6, ovvero superiore del 500% di avere un forte stato di stress. Questo RR in particolare descrive il rapporto tra due prevalenze, non tra due incidenze, ed è anch’esso denominato RR, più specificatamente RR di prevalenza (Prevalence Ratio). Il Prevalence Ratio esprime la forza dell’associazione tra un fattore e la presenza di malattia, non l’insorgenza della stessa (che è misurata dal RR classico, basato sull’incidenza) Malati (forte stress) Non malati (no stress) Totale Esposti (fumatori) 50 250 300 Non esposti (non fumatori) 21 679 700 Totale 71 929 1000 Risultati dello studio Percentuale (prevalenza puntuale) di stressati nel campione totale = 71/1000 = 7.1% Percentuale (prevalenza puntuale) di stressati negli esposti = 50/250 = 16.7% Percentuale (prevalenza puntuale) di stressati nei non esposti = 21/700 = 3% Rischio relativo di essere stressati = 16.7%/3% = 5.6 (prevalence ratio) Odds ratio di essere stressati = (50x679)/(21x250) = 6.5 Essendo anche l’OR una misura di rischio relativo, esso può assumere valori da 0 a infinito, e l’interpretazione è identica al RR. Però, a causa della modalità di calcolo, l’OR è spesso meno preciso dell’RR nella stima della forza di un’associazione, e questo deve assolutamente essere tenuto presente. In particolare, l’OR tende ad aumentare i risultati: l’OR è sempre più alto del RR se questo è maggiore di 1; è invece sempre più basso se questo è minore di 1. Tale approssimazione è trascurabile negli studi in cui l’incidenza o la prevalenza della malattia siano relativamente basse (meno del 15%) nel campione (sia negli esposti sia nei non esposti): in questi casi l’OR e il RR sono quasi coincidenti. La differenza tra OR e RR diviene invece tanto più grande quanto più l’incidenza e la prevalenza sono elevate. La sovrastima della forza dell’associazione da parte dell’OR è tanto più marcata quanto più si nota un’incidenza o prevalenza elevata. Nell’esempio precedente, si può notare come, a un valore di prevalenza puntuale pari al 16.% negli esposti, l’RR sia pari a 5.6, mentre l’OR risulti 6.5. Se ci basiamo sul RR concludiamo che il rischio per gli esposti è maggiore del 460%, mentre se ci basiamo sull’OR concludiamo invece che il rischio è superiore del 560% A rigore, l‘OR non è una autentica misura del rischio in quanto si riferisce alla probabilità di avere già una malattia, mentre nel termine "rischio" è implicita l'idea di un evento che si verificherà in futuro. Tuttavia, se si suppone che la durata media della malattia negli esposti sia simile a quella nei non-esposti (e che la malattia non influenzi lo stato di esposizione), allora l‘OR rappresenta una buona misura del rischio relativo. Negli studi retrospettivi caso-controllo, dove non viene studiata l'efficacia di un intervento ma piuttosto il nesso causale tra un outcome già presente al tempo zero e una pregressa esposizione a qualche fattore che si suppone in grado di condizionare l'outcome, l'OR è l'unica unità di misura che può essere utilizzata per descrivere l'avvenuta esposizione.