Fonti di distorsione nella misura delle disuguaglianze di salute: il confronto temporale e spaziale, l’aggiustamento per altre covariate, il bias ecologico Annibale Biggeri Dipartimento di Statistica “G. Parenti” Università di Firenze Unità di Biostatistica, CSPO Firenze Convegno AIE - Roma 16 maggio 2008 introduzione • Consideriamo solo la associazione tra indice di deprivazione (o variabili socio-economiche) ed esiti sanitari (mortalità). • Lo scopo del ricercatore può essere la quantificazione dell’effetto oppure il controllo del confondimento da variabili socio-economiche. • Consideriamo nell’ordine: – Stabilità temporale dell’associazione – Stabilità spaziale o, meglio, significato dell’indice (semplice o complesso) – Confondimento dell’età e distorsione ecologica – La sezione di censimento L’indice di deprivazione come confondente negli studi di epidemiologia descrittiva. Esempio: Grisotto et al., 2007 Rosso:cause di morte significative con standard Regione e non con agg. per depriv. Verde: significativo SMR agg. per depriv. ma non con standard regione. l’uso dello standard regionale porti a dichiarare significativi degli SMR che sono spiegati da differenze di deprivazione materiale. Diagramma di dispersione tra SMR aggiustati per deprivazione e SMR con standard regionale o locale (scala logaritmica). Retta di perfetta concordanza (in continuo) e Retta RMA (in tratteggio) Stabilità temporale La distribuzione geografica dei livelli di deprivazione materiale è sorprendentemente stabile per tempo di calendario andamenti secolari nella mortalità La tendenza alla omogeneizzazione dei livelli di mortalità e la migrazione dei fattori di rischio portano ad un diminuzione del valore predittivo dei differenziali geografici di deprivazione materiale log-RR per deprivazione materiale tumore del polmone, maschi, Toscana (Dreassi et al. SIM 2005) tempi di latenza L’associazione tra deprivazione materiale e mortalità causa-specifica mostra caratteristici tempi di latenza log-RR (intervalli di credibilità al 95%) e probabilità a posteriori per differenti lag temporali Mortalità 1970-1996 Toscana Deprivazione mat. 1961-1991 (Biggeri e Dreassi, 2002 IBC) le coorti di nascita (Catelan et al. Stat Mod 2006) Le associazioni con variabili socio-economiche possono essere più evidenti nella dimensione temporale della coorte di nascita. le coorti di nascita indici relativi (Catelan et al. Stat Mod 2006) stabilità spaziale – significato dell’indice • Il suo significato non è costante nelle differenti Regioni effetto della deprivazione - livello comunale. per regione. Italia 1997-2001 -.02 0 .02 log RR .04 .06 .08 Piemonte V Aosta Lombardia Trentino A Adige Veneto Friuli V Giulia Liguria Emilia R Toscana Umbria Marche Lazio Abruzzo Molise Campania Puglia Basilicata Calabria Sicilia Sardegna -5 5 0 deprivazione materiale 10 0 5 10 regioni 15 20 significato degli indicatori: la correlazione si inverte, è presente distorsione ecologica titolo di godimento dell’abitazione e bassa istruzione (Ocello, 2008) Tumore polmonare 1,1 1 0,9 0,8 0,7 0,6 0,5 0,4 1 2 uomini 3 donne Tumore del polmone 1,8 1,6 1,4 1,2 1 0,8 1 (.0965583,.35] (.0620525,.0965583] [0,.0620525] (.4683754,.6545454] (.4261682,.4683754] [.2533284,.4261682] 2 uomini 3 donne > 1.31 0.40 - 1.31 -0.35 - 0.40 -1.35 - -0.35 < -1.35 indice di deprivazione l’aggiustamento per altre covariate Nelle regressioni ecologiche usare una variabile di risposta standardizzata per età (es. SMR) porta a una distorsione nella stima dell’associazione con l’indice di deprivazione a meno che anche l’indice sia stato standardizzato per età. la distorsione ecologica Il coefficiente di regressione ottenuto sui dati aggregati differisce dal coefficiente ottenuto sui dati individuali a causa di confondimento o modificazione di effetto generati dalla aggregazione. Materiali Coorte censuaria della città di Firenze (Studio longitudinale toscano SLTo) arruolamento: censimento 1991 follow-up: 31 dicembre 1995 esito in studio: mortalità per tutte le cause restrizioni: uomini, 18-75 anni di età 144.001 soggetti con 568.713 anni persona e 4312 decessi (un tasso grezzo di 7,6 per mille) su 2752 sezioni di censimento Metodi • Abbiamo definito un indice di deprivazione su base individuale come la somma di condizioni di svantaggio (da zero a quattro): bassa istruzione (licenza elementare o inferiore), disoccupazione, abitazione piccola (<25 mq), assenza di bagno nell’appartamento. n nessuna 123.111 una 19.429 due o più 1.461 % 85 13 1 d 3710 549 53 attesi 3828,2 451,3 32,5 sull’indice come lineare RR=1,31 (logRR=0.27) SMR 0.97 1.22 1.63 Modelli statistici yisa xisa a agea 1 Individuale yisa I xisa C xsa a agea 2 Contestuale 3 Cronbach yisa I xisa xsa A xsa x a agea 4 Aggregato per età e sezione ysa xsa a agea 5 Aggregato per sezione ys xs ages 6 Aggregato per sezione, y ages x ages deprivazione aggiustata per età 7 Aggregato per sezione y ages xs 8 Aggregato per sezione, y ages xs ages età come covariata ecologica Risultati: 1. modelli individuali e distorsione ecologica Coeff. Coeff. su indice/sd xisa 0.238 0.093 xisa xsa 0.166 0.672 0.065 0.082 xisa xsa xsa x 0.166 0.838 0.062 0.102 modelli 1 Individuale 2 Contestuale 3 Cronbach commento alla distorsione ecologica • Il coefficiente del modello sui dati individuali non tiene conto dell’effetto contestuale veicolato dal valor medio per sezione di censimento. • Vi è un importante effetto contestuale. • Il modello di Cronbach fornisce il coefficiente totale che si ottiene sui dati aggregati ed è la somma dell’effetto netto individuale più l’effetto contestuale. 0.838 = 0.166 + 0.672 • I coefficienti per unità di dev. standard corrispondono ai confronti usuali (sui quartili, sezioni censuarie molto vs poco). Risultati: 2. modelli aggregati senza standardizzazione modelli Coeff. Coeff. su indice/sd 3 Cronbach 0.166 0.838 0.062 0.102 4 aggregato per età e sezione 0.504 0.085 5 aggregato per sezione 0.792 0.097 Risultati: 3. modelli aggregati con standardizzazione modelli Coeff. Coeff. su indice/sd 3 Cronbach 0.166 0.838 0.062 0.102 6 deprivazione standardizzata 0.830 0.119 7 deprivazione non standardizzata 0.799 0.143 8 deprivazione non std e età ecologica 0.787 0.140 commento alla distorsione da mancata standardizzazione per età • L’analisi sui dati aggregati non riproduce l’analisi sui dati individuali. E’ meno distorta, sui nostri dati, l’analisi sui tassi grezzi per sezione. Il modello aggregato per età (m. 4) sembra portare alla sola stima dell’effetto contestuale. • L’analisi che utilizza come variabile di risposta i tassi standardizzati per età produce risultati distorti. Nei nostri dati usando la covariata per unità di dev. standard si ha una sovrastima dell’effetto. • Il modello con l’indice di deprivazione standardizzato per età porta a risultati non distorti. riassumendo i differenti modelli indice per unità di dev. standard RR ind. 1 Individuale 2 Contestuale 3 Cronbach 4 Aggregato per età e sezione 5 Aggregato per sezione 6 Aggregato per sezione, 1.097 1.067 1.063 RR aggr. 1.085 1.107 1.089 1.101 1.126 deprivazione aggiustata per età 7 Aggregato per sezione 8 Aggregato per sezione, età come covariata ecologica 1.154 1.151 Incidenza tumore polmonare 2004 e Indice di deprivazione 2001 tabelle relative agli uomini <75 anni “TOSCANA” 1° Casi 271 TSD 47.20 RR 1.00 LI LS “Città” Casi TSD RR LI LS 2° 304 51.12 1.08 0.92 1.27 3° 401 66.61 1.42 1.22 1.66 indice per sezione (Paci et al SLTo 2007) “Provincia” 1° 2° 3° 1° 146 91 154 184 54.27 57.16 72.86 52.04 1.00 1.05 1.34 1.00 0.81 1.07 1.36 1.69 2° 125 50.51 0.98 0.78 1.24 3° 173 65.33 1.25 1.02 1.54 Georeferenziazione dei dati del RTRT 2004 (sedi principali) http://mappe.rete.toscana.it/ • • • • Attribuzione della Sezione di censimento 2001 Inviati n° 9072 Georeferenziati n° 7815 (86.1%) Cause per non georeferenziazione – 621 (49.4%) indirizzi non validi – 341 (27.1) indirizzo ‘non rilevato’ – 269 (21.4%) indirizzo mancante – 26 (2.1%) lettere senza significato conclusioni Abbiamo considerato solo la associazione tra indice di deprivazione (o variabili socio-economiche) ed esiti sanitari (mortalità). • Stabilità temporale dell’associazione vi è una tendenza alla diminuzione della grandezza dell’associazione – latenza – coorte di nascita • Stabilità spaziale o significato dell’indice (semplice o complesso) varia da regione a regione • Confondimento dell’età e distorsione ecologica effetti contestuali su piccola scala – standardizzazione dell’indice • La sezione di censimento potenzialmente soggetta a distorsione ecologica Ringraziamenti Ricerca finalizzata Regione Valle d’Aosta SLTo 2005-2007 MIUR PRIN 2002134337 2004137478 PON ATAS EU ESA 2003-2005