Potenzialità e prospettive derivanti dall’integrazione di dati su sanità e salute Alessandra Burgio Roberta Crialesi Paola Di Filippo Lidia Gargiulo Laura Iannucci Gabriella Sebastiani Alessandro Solipaca ISTAT, Servizio Sanità, Salute e Assistenza Integrazione tra fonti di dati sanitari: aspetti metodologici e prospettive di analisi Roma, 24 giugno 2014 Obiettivo dello studio Integrazione dei dati dell’indagine Istat sulla salute (IS) con i dati Health Search (HS) al fine di ampliare le informazioni disponibili e consentire l’analisi integrata di dati su sanità e salute IS informazioni sulle condizioni di salute, sui consumi sanitari, prevenzione e stili di vita riportate dall’intervistato («soggettive») HS informazioni sulle condizioni di salute diagnosticate e sui consumi sanitari prescritti dal medico di medicina generale («oggettive») IS Percezione individuale HS Spesa a carico del Servizio Sanitario Nazionale La percezione individuale influenza i comportamenti, quindi modifica la domanda sanitaria e di conseguenza la spesa a carico del SSN Prerequisiti per l’integrazione Le due fonti di dati devono essere rappresentative della stessa popolazione IS campione probabilistico rappresentativo della popolazione residente HS campione non probabilistico post-stratificazione dei dati per età e sesso HS_corretto Le variabili comuni devono avere lo stesso significato nelle due fonti Condizione non rispettata per le malattie croniche HS Malattie croniche diagnosticate dal Medico di Medicina Generale IS Malattie croniche dichiarate dall’intervistato. L’intervistato dichiara che la malattia è stata diagnosticata da un medico Una misura di confronto «Soggettivo» vs «Oggettivo» (1) IPERTENSIONE (>20 anni) Prevalenza IS Prevalenza HS_corretto X=18,5% X*=24,0% Pj(X=1|X*=1)= 0,77235 età Maschi Femmine 40-59 0,70168 0,83501 60-69 0,65009 0,83784 70+ 0,77677 0,78036 Totale 0,71043 0,82097 La probabilità di un individuo appartenente al profilo j di dichiarare di essere iperteso dato che un individuo dello stesso profilo j in HS ha una diagnosi medica di ipertensione è maggiore nelle donne… Una misura di confronto «Soggettivo» vs «Oggettivo» (1) IPERTENSIONE (>20 anni) Prevalenza IS Prevalenza HS_corretto X=18,5% X*=24,0% P(X=1|X*=1)= 0,77235 età Maschi Femmine 40-59 0,70168 0,83501 60-69 0,65009 0,83784 70+ 0,77677 0,78036 Totale 0,71043 0,82097 …ma la distanza rispetto agli uomini si riduce dopo i 70 anni di età Una misura di confronto «Soggettivo» vs «Oggettivo» (2) DIABETE (>20 anni) Prevalenza IS Prevalenza HS_corretto X=4,4% X*=6,3% P(X=1|X*=1)= 0,69148 età Maschi Femmine 40-59 0,58611 0,73586 60-69 0,53921 0,67337 70+ 0,67738 0,88731 Totale 0,60886 0,78597 La probabilità di un individuo appartenente al profilo j di dichiarare di essere diabetico dato che un individuo dello stesso profilo j in HS ha una diagnosi medica di diabete è maggiore nelle donne… Una misura di confronto «Soggettivo» vs «Oggettivo» (2) DIABETE (>20 anni) Prevalenza IS Prevalenza HS_corretto X=4,4% X*=6,3% P(X=1|X*=1)= 0,69148 età Maschi Femmine 40-59 0,58611 0,73586 60-69 0,53921 0,67337 70+ 0,67738 0,88731 Totale 0,60886 0,78597 …la distanza rispetto agli uomini si mantiene costante con l’età Fattore di convergenza «Soggettivo» vs «Oggettivo» PRESENZA DI ALMENO UNA MALATTIA CRONICA (diabete, enfisema, Parkinson, cirrosi epatica, asma, ipertensione, ictus, tumore, calcolosi, malattie della tiroide) Prevalenza IS Prevalenza HS X=34,4% X*=38,2% P(X=1|X*=1)= Prevalenza IS 0,90003 X^=38,3% L’utilizzo del fattore di convergenza della variabile «presenza di almeno una malattia cronica» nell’indagine Istat migliora il suo utilizzo come variabile comune per la successiva operazione di matching statistico tra i dati dell’indagine Istat e i dati Health Search Il matching statistico tra IS e HS (1) Le VARIABILI COMUNI IN IS E HS Sesso Età (20-95 anni) Ripartizione geografica (Nord-Ovest, Nord-Est, Centro, Mezzogiorno) Presenza di almeno una malattia cronica (tra diabete, enfisema, Parkinson, cirrosi epatica, asma, ipertensione, ictus, tumore, calcolosi, malattie della tiroide) Presenza di almeno una malattia del cuore (tra infarto, angina pectoris, altre malattie del cuore) Presenza di almeno una invalidità (tra cecità, sordomutismo, sordità) Il matching statistico tra IS e HS (2) Le VARIABILI COMUNI utilizzate per il matching Sesso Età (20-39, 40-59, 60-69, 70+) Ripartizione geografica (Nord-Ovest, Nord-Est, Centro, Mezzogiorno) Regione: Lombardia Presenza di almeno una malattia cronica (in IS «modificata» per il fattore di convergenza) Presenza di almeno una malattia del cuore Presenza di almeno una invalidità (tra cecità, sordomutismo, sordità) Il matching statistico tra IS e HS (3) Le VARIABILI DI IS utilizzate per i risultati preliminari Salute percepita (Male o Molto Male vs NO Male o Molto Male) Livello di istruzione (Alto, Medio, Basso) Presenza di diabete per numero di malattie croniche (solo diabete, diabete + 1 malattia cronica, diabete + almeno 2 malattie croniche) Le VARIABILI DI HS utilizzate per i risultati preliminari Spesa totale SSN di cui: spesa per farmaci SSN spesa per accertamenti diagnostici ed esami di laboratorio SSN spesa per visite specialistiche Il matching statistico tra IS e HS (4) Dataset contenente le variabili sia di IS che di HS Lombardia: 10.417 record (7.659.228 individui di 20 anni e più) Sesso: 48% uomini, 52% donne Età: 20-39 anni 35,7% 40-59 anni 34,8% 60-69 anni 13,3% 70+ anni 16,2% Presenza di almeno una malattia cronica (38,3%) Presenza di almeno una malattia del cuore (7,6%) Salute percepita (Male o Molto Male=4,99%) Livello di istruzione (Alto=37,2%, Medio=37,1%, Basso=25,7%) Presenza di diabete per numero di malattie croniche (presenza di diabete 4,4%. Solo diabete=24,5%, diabete + 1 malattia cronica=33,4%, diabete + almeno 2 malattie croniche=42,1%) Spesa totale SSN (2.318 milioni di euro, 303 euro procapite), di cui: spesa per farmaci SSN (1.594 milioni di euro, 208 euro procapite) spesa per accertamenti diagnostici ed esami di laboratorio SSN (598 milioni di euro, 78 euro procapite) spesa per visite specialistiche (126 milioni di euro, 17 euro procapite) Il matching statistico tra IS e HS: risultati preliminari (1) Spesa media totale SSN (farmaci + visite specialistiche + accertamenti) per genere, classi di età e percezione dello stato di salute Lombardia – anni 2004-2005 La spesa media totale è molto più elevata per chi dichiara di stare male o molto male Nel complesso la spesa è maggiore per le donne (effetto struttura per età)… …ma tra coloro che dichiarano di stare male o molto la male: la spesa è maggiore per gli uomini (anche per età) il gap di genere è massimo nella classe di età 60-69 anni Uomini Donne di cui Male o Molto Totale Male 274 747 329 664 Il matching statistico tra IS e HS: risultati preliminari (2) Spesa media totale SSN (farmaci + visite specialistiche + accertamenti) per genere, classi di età e titolo di studio Lombardia – anni 2004-2005 Donne Donne Uomini Uomini Titolo di studio La spesa media totale è più elevata per chi ha un basso titolo di studio… Uomini Donne Alto 213 201 Medio 227 283 …ma ciò dipende dalla struttura per età più anziana di questo gruppo di popolazione… Basso Totale nelle donne sembrerebbe che la spesa media sia più elevata in presenza di un titolo di studio basso in corrispondenza delle età 60-69 anni 479 274 533 329 …difatti la distribuzione per età non mostra differenze significative rispetto a chi ha un titolo di studio medio o alto, in particolare negli uomini; Il matching statistico tra IS e HS: risultati preliminari (3) Spesa media SSN per persone affette da diabete per numero di malattie croniche e percezione dello stato di salute Lombardia – anni 2004-2005 SI Male o Molto Male SI SI NO SI NO NO NO • • • La spesa media totale SSN per un malato di diabete è pari a circa 700 euro… …sale a circa 950 euro se dichiara di stare male o molto male… … e a 1150 euro se ha almeno altre 2 malattie croniche % Male o Molto Male solo diabete 24,5 14,5 diabete + 1 cronica 33,4 17,1 diabete + 2 o più croniche 42,1 26,7 100,0 20,5 diabete totale Analisi dell’incertezza Doppia valenza dei risultati: 1. Intervalli di frequenza 2. Misura indiretta del grado di incertezza del matching sotto l’ipotesi di indipendenza condizionata • • Salute percepita: per chi dichiara di stare «male o molto male» le frequenze più elevate sono in corrispondenza delle classi di spesa più alte (>100 euro); per gli altri la frequenza più bassa è in corrispondenza della classe di spesa «>500 euro» Titolo di studio: per chi ha un titolo di studio «medio» o «alto» le frequenze sono più elevate nelle classi di spesa <500 euro, mentre per chi ha un titolo di studio «basso» le frequenze sono più elevate nelle classi di spesa «101-500 euro» e «>500 euro» A conclusioni simili si giunge con il matching sotto l’ipotesi di indipendenza condizionata. Classi di spesa (euro) NO Male o Molto Male 0 1-100 101-500 >500 0 1-100 101-500 >500 24,38 26,19 30,65 18,79 24,56 25,96 28,36 16,13 0,00 3,11 0,00 3,39 0,00 5,18 0,00 5,18 TITOLO DI STUDIO 0,47 0,71 1,39 2,41 Alto 0 1-100 101-500 >500 0,00 0,00 2,11 0,00 23,23 25,38 23,93 10,70 10,66 11,72 10,64 4,20 Medio 0 1-100 101-500 >500 Pertanto le relazioni che si vanno a studiare tra «titolo di studio» e «spesa totale SSN» sotto l’ipotesi di indipendenza condizionata sono affette un grado di incertezza maggiore. 0 1-100 101-500 >500 • 21,27 22,80 25,46 13,60 Male o Molto Male «salute percepita»: intervalli di frequenza minore ampiezza (intervallo medio=4,22) «titolo di studio»: intervalli di frequenza particolarmente ampi (intervallo medio=18,63) • Indipendenza Minimo Massimo condizionata SALUTE PERCEPITA 0,00 0,00 0,00 0,00 23,80 25,66 26,96 12,74 10,26 10,48 11,00 5,31 Basso 0,10 0,00 0,99 3,70 10,78 11,61 18,28 17,43 4,11 4,47 8,12 9,04 Prospettive 1. Estendere i risultati ad altre regioni o a tutta l’Italia (richiede un approfondimento della verifica della rappresentatività di HS) 2. Studiare altre possibili variabili comuni per aumentare qualità del matching statistico 3. Effettuare l’integrazione per diverse replicazioni dell’indagine salute (2004-2005, 2012-2013) dinamica dei fenomeni 4. Utilizzare informazione aggiuntive presenti nell’indagine salute 20122013 (esenzione del ticket, spesa out of pocket, spesa per ticket): In caso di forte relazione con le variabili di spesa di HS migliora la qualità dell’integrazione sotto l’ipotesi di indipendenza condizionata Ricostruzione della spesa complessiva (spesa SSN di HS e spesa out of pocket di IS) per visite mediche, analisi del sangue, accertamenti specialistici, farmaci, effettuando anche approfondimenti per singole patologie ed articolando le analisi secondo le caratteristiche individuali e/o familiari