Potenzialità e prospettive derivanti
dall’integrazione di dati su sanità e salute
Alessandra Burgio
Roberta Crialesi
Paola Di Filippo
Lidia Gargiulo
Laura Iannucci
Gabriella Sebastiani
Alessandro Solipaca
ISTAT, Servizio Sanità, Salute e Assistenza
Integrazione tra fonti di dati sanitari: aspetti metodologici e prospettive di analisi
Roma, 24 giugno 2014
Obiettivo dello studio
Integrazione dei dati dell’indagine Istat sulla salute (IS) con i dati
Health Search (HS) al fine di ampliare le informazioni disponibili e
consentire l’analisi integrata di dati su sanità e salute

IS  informazioni sulle condizioni di salute, sui consumi sanitari,
prevenzione e stili di vita riportate dall’intervistato («soggettive»)

HS  informazioni sulle condizioni di salute diagnosticate e sui
consumi sanitari prescritti dal medico di medicina generale
(«oggettive»)
IS
Percezione
individuale
HS
Spesa a carico del
Servizio Sanitario
Nazionale
La percezione individuale influenza i comportamenti,
quindi modifica la domanda sanitaria e di
conseguenza la spesa a carico del SSN
Prerequisiti per l’integrazione

Le due fonti di dati devono essere rappresentative della stessa
popolazione

IS  campione probabilistico rappresentativo della popolazione
residente
HS  campione non probabilistico  post-stratificazione dei dati per
età e sesso  HS_corretto



Le variabili comuni devono avere lo stesso significato nelle due
fonti
Condizione non rispettata per le malattie croniche
HS
Malattie croniche
diagnosticate dal
Medico di Medicina
Generale
IS
Malattie croniche
dichiarate dall’intervistato.
L’intervistato dichiara che
la malattia è stata
diagnosticata da un
medico
Una misura di confronto «Soggettivo» vs «Oggettivo» (1)
IPERTENSIONE (>20 anni)
Prevalenza IS
Prevalenza HS_corretto
X=18,5%
X*=24,0%
Pj(X=1|X*=1)=
0,77235
età
Maschi
Femmine
40-59
0,70168
0,83501
60-69
0,65009
0,83784
70+
0,77677
0,78036
Totale
0,71043
0,82097
La probabilità di un
individuo appartenente al
profilo j di dichiarare di
essere iperteso dato che
un individuo dello stesso
profilo j in HS ha una
diagnosi medica di
ipertensione è maggiore
nelle donne…
Una misura di confronto «Soggettivo» vs «Oggettivo» (1)
IPERTENSIONE (>20 anni)
Prevalenza IS
Prevalenza HS_corretto
X=18,5%
X*=24,0%
P(X=1|X*=1)=
0,77235
età
Maschi
Femmine
40-59
0,70168
0,83501
60-69
0,65009
0,83784
70+
0,77677
0,78036
Totale
0,71043
0,82097
…ma la distanza
rispetto agli
uomini si riduce
dopo i 70 anni di
età
Una misura di confronto «Soggettivo» vs «Oggettivo» (2)
DIABETE (>20 anni)
Prevalenza IS
Prevalenza HS_corretto
X=4,4%
X*=6,3%
P(X=1|X*=1)=
0,69148
età
Maschi
Femmine
40-59
0,58611
0,73586
60-69
0,53921
0,67337
70+
0,67738
0,88731
Totale
0,60886
0,78597
La probabilità di un
individuo appartenente al
profilo j di dichiarare di
essere diabetico dato che
un individuo dello stesso
profilo j in HS ha una
diagnosi medica di diabete
è maggiore nelle donne…
Una misura di confronto «Soggettivo» vs «Oggettivo» (2)
DIABETE (>20 anni)
Prevalenza IS
Prevalenza HS_corretto
X=4,4%
X*=6,3%
P(X=1|X*=1)=
0,69148
età
Maschi
Femmine
40-59
0,58611
0,73586
60-69
0,53921
0,67337
70+
0,67738
0,88731
Totale
0,60886
0,78597
…la distanza
rispetto agli
uomini si
mantiene
costante con l’età
Fattore di convergenza «Soggettivo» vs «Oggettivo»
PRESENZA DI ALMENO UNA MALATTIA CRONICA
(diabete, enfisema, Parkinson, cirrosi epatica, asma, ipertensione, ictus,
tumore, calcolosi, malattie della tiroide)
Prevalenza IS
Prevalenza HS
X=34,4%
X*=38,2%
P(X=1|X*=1)=
Prevalenza IS
0,90003
X^=38,3%
L’utilizzo del fattore di convergenza della variabile
«presenza di almeno una malattia cronica» nell’indagine
Istat migliora il suo utilizzo come variabile comune per la
successiva operazione di matching statistico tra i dati
dell’indagine Istat e i dati Health Search
Il matching statistico tra IS e HS (1)
Le VARIABILI COMUNI IN IS E HS






Sesso
Età (20-95 anni)
Ripartizione geografica (Nord-Ovest, Nord-Est, Centro, Mezzogiorno)
Presenza di almeno una malattia cronica (tra diabete, enfisema, Parkinson,
cirrosi epatica, asma, ipertensione, ictus, tumore, calcolosi, malattie della tiroide)
Presenza di almeno una malattia del cuore (tra infarto, angina pectoris,
altre malattie del cuore)
Presenza di almeno una invalidità (tra cecità, sordomutismo, sordità)
Il matching statistico tra IS e HS (2)
Le VARIABILI COMUNI utilizzate per il matching







Sesso
Età (20-39, 40-59, 60-69, 70+)
Ripartizione geografica (Nord-Ovest, Nord-Est, Centro, Mezzogiorno)
Regione: Lombardia
Presenza di almeno una malattia cronica (in IS «modificata» per il fattore
di convergenza)
Presenza di almeno una malattia del cuore
Presenza di almeno una invalidità (tra cecità, sordomutismo, sordità)
Il matching statistico tra IS e HS (3)
Le VARIABILI DI IS utilizzate per i risultati preliminari



Salute percepita (Male o Molto Male vs NO Male o Molto Male)
Livello di istruzione (Alto, Medio, Basso)
Presenza di diabete per numero di malattie croniche (solo diabete,
diabete + 1 malattia cronica, diabete + almeno 2 malattie croniche)
Le VARIABILI DI HS utilizzate per i risultati preliminari




Spesa totale SSN di cui:
spesa per farmaci SSN
spesa per accertamenti diagnostici ed esami di laboratorio SSN
spesa per visite specialistiche
Il matching statistico tra IS e HS (4)
Dataset contenente le variabili sia di IS che di HS
Lombardia: 10.417 record (7.659.228 individui di 20 anni e più)
Sesso: 48% uomini, 52% donne
Età:
20-39 anni 35,7%
40-59 anni 34,8%
60-69 anni 13,3%
70+ anni 16,2%
Presenza di almeno una malattia cronica (38,3%)
Presenza di almeno una malattia del cuore (7,6%)
Salute percepita (Male o Molto Male=4,99%)
Livello di istruzione (Alto=37,2%, Medio=37,1%, Basso=25,7%)
Presenza di diabete per numero di malattie croniche (presenza di diabete
4,4%. Solo diabete=24,5%, diabete + 1 malattia cronica=33,4%, diabete + almeno 2
malattie croniche=42,1%)
Spesa totale SSN (2.318 milioni di euro, 303 euro procapite), di cui:
spesa per farmaci SSN (1.594 milioni di euro, 208 euro procapite)
spesa per accertamenti diagnostici ed esami di laboratorio SSN (598 milioni di
euro, 78 euro procapite)
spesa per visite specialistiche (126 milioni di euro, 17 euro procapite)
Il matching statistico tra IS e HS: risultati preliminari (1)
Spesa media totale SSN (farmaci + visite specialistiche + accertamenti) per
genere, classi di età e percezione dello stato di salute
Lombardia – anni 2004-2005
La spesa media totale è molto più elevata per chi dichiara di stare male o molto
male
 Nel complesso la spesa è maggiore per le donne (effetto struttura per età)…
 …ma tra coloro che dichiarano di stare male o molto la male:
 la spesa è maggiore per gli uomini (anche per età)
 il gap di genere è massimo nella classe di età 60-69 anni

Uomini
Donne
di cui
Male o
Molto
Totale
Male
274
747
329
664
Il matching statistico tra IS e HS: risultati preliminari (2)
Spesa media totale SSN (farmaci + visite specialistiche + accertamenti) per
genere, classi di età e titolo di studio
Lombardia – anni 2004-2005
Donne
Donne
Uomini
Uomini

Titolo di
studio
La spesa media totale è più elevata per chi ha un basso titolo di studio…
Uomini Donne

Alto
213
201
Medio
227
283 
…ma ciò dipende dalla struttura per età più anziana di questo gruppo di popolazione…
Basso
Totale
nelle donne sembrerebbe che la spesa media sia più elevata in presenza di un titolo di
studio basso in corrispondenza delle età 60-69 anni
479
274
533 
329
…difatti la distribuzione per età non mostra differenze significative rispetto a chi ha un
titolo di studio medio o alto, in particolare negli uomini;
Il matching statistico tra IS e HS: risultati preliminari (3)
Spesa media SSN per persone affette da diabete per numero di malattie
croniche e percezione dello stato di salute
Lombardia – anni 2004-2005
SI
Male o Molto Male
SI
SI
NO
SI
NO
NO
NO
•
•
•
La spesa media totale SSN per un malato di diabete è pari
a circa 700 euro…
…sale a circa 950 euro se dichiara di stare male o
molto male…
… e a 1150 euro se ha almeno altre 2 malattie croniche
%
Male o Molto Male
solo diabete
24,5
14,5
diabete + 1 cronica
33,4
17,1
diabete + 2 o più croniche
42,1
26,7
100,0
20,5
diabete totale
Analisi dell’incertezza
Doppia valenza dei risultati:
1.
Intervalli di frequenza
2.
Misura indiretta del grado di incertezza del matching
sotto l’ipotesi di indipendenza condizionata
•
•
Salute percepita: per chi dichiara di stare «male o molto
male» le frequenze più elevate sono in corrispondenza delle
classi di spesa più alte (>100 euro); per gli altri la frequenza
più bassa è in corrispondenza della classe di spesa «>500
euro»
Titolo di studio: per chi ha un titolo di studio «medio» o
«alto» le frequenze sono più elevate nelle classi di spesa
<500 euro, mentre per chi ha un titolo di studio «basso» le
frequenze sono più elevate nelle classi di spesa «101-500
euro» e «>500 euro»
A conclusioni simili si giunge con il matching sotto l’ipotesi di
indipendenza condizionata.
Classi di
spesa
(euro)
NO Male o Molto Male
0
1-100
101-500
>500
0
1-100
101-500
>500
24,38
26,19
30,65
18,79
24,56
25,96
28,36
16,13
0,00
3,11
0,00
3,39
0,00
5,18
0,00
5,18
TITOLO DI STUDIO
0,47
0,71
1,39
2,41
Alto
0
1-100
101-500
>500
0,00
0,00
2,11
0,00
23,23
25,38
23,93
10,70
10,66
11,72
10,64
4,20
Medio
0
1-100
101-500
>500
Pertanto le relazioni che si vanno a studiare tra «titolo di studio»
e «spesa totale SSN» sotto l’ipotesi di indipendenza
condizionata sono affette un grado di incertezza maggiore.
0
1-100
101-500
>500
•
21,27
22,80
25,46
13,60
Male o Molto Male
«salute percepita»: intervalli di frequenza minore ampiezza
(intervallo medio=4,22)
«titolo di studio»: intervalli di frequenza particolarmente
ampi (intervallo medio=18,63)
•
Indipendenza
Minimo
Massimo condizionata
SALUTE PERCEPITA
0,00
0,00
0,00
0,00
23,80
25,66
26,96
12,74
10,26
10,48
11,00
5,31
Basso
0,10
0,00
0,99
3,70
10,78
11,61
18,28
17,43
4,11
4,47
8,12
9,04
Prospettive
1.
Estendere i risultati ad altre regioni o a tutta l’Italia (richiede un
approfondimento della verifica della rappresentatività di HS)
2.
Studiare altre possibili variabili comuni per aumentare qualità del
matching statistico
3.
Effettuare l’integrazione per diverse replicazioni dell’indagine salute
(2004-2005, 2012-2013)  dinamica dei fenomeni
4.
Utilizzare informazione aggiuntive presenti nell’indagine salute 20122013 (esenzione del ticket, spesa out of pocket, spesa per ticket):

In caso di forte relazione con le variabili di spesa di HS migliora la
qualità dell’integrazione sotto l’ipotesi di indipendenza condizionata

Ricostruzione della spesa complessiva (spesa SSN di HS e spesa out
of pocket di IS) per visite mediche, analisi del sangue, accertamenti
specialistici, farmaci, effettuando anche approfondimenti per singole
patologie ed articolando le analisi secondo le caratteristiche
individuali e/o familiari
Scarica

Presentazione