Brescia 11-12 Aprile 2008
orso di
Evidence-based Medicine
Azienda Spedali Civili di Brescia
Nicola Latronico
Cosetta Minelli
Dipartimento di Anestesia, Rianimazione e Medicina Perioperatoria
SSVD Neuroanestesia & Neurorianimazione
Università di Brescia, Spedali Civili
Respiratory Epidemiology & Public Health Group
National Heart and Lung Institute at Imperial College London
Brescia, Italia
London, England
1
rogramma
Statistica descrittiva
Statistica inferenziale e test d’ipotesi
Dimensione campionaria
Classificazione degli studi primari
Studi secondari: revisioni sistematiche e meta-analisi
Definizione di outcome
Misure di rischio
2
EBM
La statistica descrittiva
Comprende tutte le analisi condotte su un determinato gruppo di osservazioni
(persone, oggetti, eventi, etc) a fine puramente descrittivo: ci limitiamo a
descrivere in modo sintetico ciò che osserviamo.
Un esempio: il report di fine anno di un reparto (n. di ricoveri, durata della
degenza, mortalità, etc.) .
POPOLAZIONE oggetto di studio: tutti i pazienti ricoverati in quel reparto
durante l’anno.
VARIABILI oggetto do studio: n. di ricoveri, durata della degenza, mortalità, etc.

Definizione di VARIABILE:
Caratteristica tipica di un fenomeno (essere vivente, oggetto, evento, etc) che
può manifestarsi in modo diverso.
3
EBM
I 3 tipi di variabile
Operatori possibili
A
Variabilità
Qualitativa
1 Qualitativa p.d.
= 
moda
distribuzione di frequenza
2 Ordinale
> <
mediana
range, percentili
Operatori possibili
B
Tendenza centrale
Quantitativa
+ - x ¸ ecc.
Tendenza centrale
media
Variabilità
varianza,
deviazione standard
Bertolini G, Nardi D. Statistica applicata alla ricerca educativa. Guerini Studio. 1998. Milano
Variabile qualitativa propriamente detta (p.d.): es. sesso
Variabile ordinale: es. Glasgow Coma Scale
Variabile quantitativa: es. peso
4
EBM
Misure di TENDENZA CENTRALE
Definizione:
Indicatori statistici che forniscono una rappresentatività sintetica dell’intero
gruppo di osservazione.
•
MODA (variabili qualitative) : categoria della variabile più frequente nel gruppo
di osservazioni.
•
MEDIANA (variabili ordinali) : categoria di mezzo della variabile ordinata in
modo crescente o decrescente.
•
MEDIA (variabili quantitative) :
 =
 xi
n
5
EBM
Misure di VARIABILITA’
Definizione:
Indicatori statistici che forniscono una misura del grado di variabilità delle
osservazioni rispetto al fenomeno osservato.

DISTRIBUZIONE DI FREQUENZA (variabili qualitative):
numero di categorie e numerosità (assoluta e relativa) all’interno di ciascuna categoria.
Viene rappresentata da una tabella o grafico.
6
EBM
Misure di VARIABILITA’

RANGE e PERCENTILI (variabili ordinali) :
• RANGE: semplice = valori minimo e massimo osservati; interquartile = intervallo di
valori che stanno tra il 1 e il 3 quartile (25° e 75° percentile)
• PERCENTILE: valore sotto il quale si trova una certa percentuale di popolazione
•
VARIANZA e DEVIAZIONE STANDARD (variabili quantitative) :
•
VARIANZA =
 (xi -  )2
n
•
 (xi -  ) 2
DEVIAZIONE STANDARD =

n
7
Glasgow Coma Scale
EBM
VARIABILE
A.
B.
C.
D.
E.
Discreta
Continua
Ordinale
Nominale
Dicotomica
Teasdale G, Jennett B. Lancet 1974; i: 81-84
8
Indice di Apgar
0
1
2
Frequenza cardiaca
Assente
<100 bpm
>100 bpm
Respiro
Assente
Bradipnea irregolare
Pianto valido
Tono muscolare
Ipotonia
Modica flessione
delle estremità
Movimenti
attivi
Risposta riflessa
all’introduzione del
catetere nel naso
Nessuna risposta
Smorfie
Tosse,
starnuto
Colore
Pallido, cianotico
Tronco eritrosico,
estremità cianotiche
Completamen
te eritrosico
Virginia Apgar
1909-1974
Columbia University
Anesthesiologist
VARIABILE
A.
B.
C.
D.
E.
Discreta
Continua
Ordinale
Nominale
Dicotomica
9
TIPO DI PARTO
taglio cesareo
naturale
indotto
1D
VARIABILE
2C
A.
B.
C.
D.
E.
Discreta
Continua
Ordinale
Nominale
Dicotomica
3B
10
Neurosurgery 2001; 49:864–871
HDM/CDM=
GCS=
MAP=
PaCO2=
PaO2=
Hgb=
Midline shift=
CBC=
UPW=
BPW=
high-, conventional-dose mannitol.
postresuscitation Glasgow Coma Scale
mean arterial pressure
arterial carbon dioxide tension
arterial oxygen tension
total hemoglobin content
shift of midline structures on brain CT
compromised basilar cisterns
unilateral pupillary widening
bilateral pupillary widening.
No statistically significant differences were observed.
11
rogramma
Statistica descrittiva
Statistica inferenziale e test d’ipotesi
Dimensione campionaria
Classificazione degli studi primari
Studi secondari: revisioni sistematiche e meta-analisi
Definizione di outcome
Misure di rischio
12
EBM
La statistica inferenziale
La STIMA di un parametro in POPOLAZIONE

Mentre il parametro di interesse viene misurato nel campione studiato, questo
può solo essere stimato in popolazione, a partire dal valore ottenuto nel nostro
campione.

Come?
Identificando un intervallo di valori possibili attorno al valore del parametro
trovato nel campione (intervallo di confidenza). La “confidenza” che l’intervallo
davvero contenga il valore vero in popolazione è definita da un valore
convenzionalmente fissato a 95 o 99% (possibilità di errore rispettivamente del
5 o 1%).

L’intervallo sarà tanto più stretto quanto più grande è il campione
13
EBM
p<0.05
IL TEST DI IPOTESI

E’ la parte della statistica che valuta il grado di significatività di una differenza
osservata fra due gruppi (es: pts trattati con un farmaco vs non trattati;
rischio della malattia in maschi/femmine).

La statistica procede a valutare un’ipotesi contraria rispetto a quanto
normalmente atteso, e cioè valuta l’ipotesi che tra i due gruppi a confronto
NON vi sia differenza statisticamente significativa (ipotesi nulla).

La statistica mette a disposizione diversi tipi di test d’ipotesi a seconda del
tipo di variabile del parametro di interesse (es.: misura di outcome della
malattia in oggetto)
Cos’è la “p”?

Definizione:
La p è la probabilità di ottenere per il puro effetto del caso i dati che abbiamo
osservato (o dati ancora più estremi) quando l’ipotesi nulla è vera.
14
EBM
P<0.05 e 95% C.I.
Significato della significatività statistica
• Un test "significativo" dimostra la presenza di differenza e la direzione di
questa, ma non può dirci di che entità
• Un test "non significativo" non dimostra l'assenza di differenza
• La p va valutata in base al suo valore (non solo come < o > di 0.5!)
• Significatività statistica non significa rilevanza conoscitiva
• La significatività statistica non permette di stabilire alcun rapporto causale
15
EBM
Intervallo di confidenza
L’intervallo di confidenza può essere calcolato per qualsiasi stima.
Nel caso di un rapporto la soglia per un effetto significativo è 1,
negli altri casi è 0.
Il rischio di SGI in pazienti in condizioni critiche trattati con sucralfato è 3,8% (Rsu); in
quelli trattati con ranitidina (Rran) è 1,7%; il rischio relativo R.R. (Rsu/Rran) è:
R.R. 2.27 (95% C.I. 1.09-4.73)
R.R. 2.27 (95% C.I. 1.00-4.01)
R.R. 2.27 (95% C.I. 0.50-9.34)
16
Data Synthesis: 9 studies (n= 19 958) were included.
significant
During anticoagulant prophylaxis, patients had xxxxxxxxxxxxx
reductions in any PE (relative risk, 0.43 [CI, 0.26 to 0.71]) and
fatal PE (relative risk, 0.38 [CI, 0.21 to 0.69]),
non
significant reduction in symptomatic deep venous
xxxxxxxxxxxxx
thrombosis (relative risk, 0.47 [CI, 0.22 to 1.00]),
significant increase in major bleeding (relative risk,
and a non
xxxxxxxxxxxxx
1.32 [CI, 0.73 to 2.37]).
no effect on all-cause mortality
Anticoagulant prophylaxis had xxxxxxxx
(relative risk, 0.97 [CI, 0.79 to 1.19]).
Ann Intern Med. 2007;146:278-2
17
EBM
Test parametrici e non parametrici
Test parametrici

Sono molto potenti, ma si possono usare soltanto:


quando il parametro di interesse è una variabile quantitativa;
quando sono soddisfatte due assunzioni :
 distribuzione normale del parametro in popolazione;
 omoscedasticità (cioè uguale varianza nei due gruppi a confronto).
Test non parametrici

Sono meno potenti, ma si possono usare sempre, cioè con tutti i tipi di variabile.

Non richiedono alcuna assunzione.

Nel caso di variabili quantitative, sono da utilizzare soltanto quando sia
impossibile utilizzare i test parametrici (assunzioni non soddisfatte).
18
EBM
Test per dati appaiati e non appaiati
Campioni “non appaiati” (o indipendenti)
I 2 gruppi a confronto sono costituiti da soggetti diversi
Campioni “appaiati” (o dipendenti)
I 2 gruppi a confronto sono costituiti dagli stessi soggetti
(valutazioni ripetute sugli stessi soggetti).
Sono più potenti a parità di numerosità campionaria
19
EBM
Test a 1 o 2 code
Test a 2 code
Quando l’ipotesi nulla può essere falsa in tutte e 2 le direzioni
Test a 1 coda
L’ipotesi nulla è vera soltanto in una direzione.
Tale situazione è molto rara!
20
EBM
I diversi tipi di Test
Quadro generale
TIPO DI
CAMPIONE
TIPO DI VARIABILE
Variabili qualitative p.d.
Variabili ordinali
Variabili quantitative
Test parametrici:
t di Student
2 sample or unpaired
Campioni
non appaiati
(o indipendenti)
Test non parametrico:
Chi-quadrato di
Pearson
Test non parametrico:
U di Mann-Whitney
(per il confronto di 2 campioni)
ANOVA
(per il confronto di più campioni)
Test non parametrico:
U di Mann-Whitney
Test parametrici:
t di Student
one sample or paired
Campioni
Appaiati
(o dipendenti)
Test non parametrico:
Chi-quadrato di
McNemar
(per il confronto di 2 campioni)
Test non parametrico:
Test dei segni

ANOVA per misure ripetute
(per il confronto di più campioni)
Test non parametrico:
Test di Wilcoxon
21
Objective: Evaluation of selective decontamination of the digestive tract (SDD) on late mortality
in ventilated trauma patients.
Methods: A multicenter, randomized controlled trial in 401 severe trauma patients. Patients were
randomized to control (n = 200) or SDD (n = 201). Primary endpoint was late mortality excluding
early death from hemorrhage or craniocerebral injury. Secondary endpoints were infection and
organ dysfunction.
Results: Late mortality was 15.3% (57/372) as 29 patients died from cerebral injury, 16 SDD
and 13 control.
22
Late death
Yes
No
SDD
26
159 185
Control
31
156 187
57
315 372
Quadro generale
TIPO DI
CAMPIONE
TIPO DI VARIABILE
Variabili qualitative p.d.
Variabili ordinali
Variabili quantitative
Test parametrici:
t di Student
Risk A = 14.1%
Risk B = 16.6%
Absolute risk reduction = 2.5%
2 sample or unpaired
Campioni
non appaiati
(o indipendenti)
Test non parametrico:
Chi-quadrato di
Pearson
Test non parametrico:
U di Mann-Whitney
(per il confronto di 2 campioni)
ANOVA
(per il confronto di più campioni)
Test non parametrico:
U di Mann-Whitney
Test parametrici:
Quale test?
t di Student
one sample or paired
Campioni
Appaiati
(o dipendenti)
Test non parametrico:
Chi-quadrato di
McNemar
(per il confronto di 2 campioni)
Test non parametrico:
Test dei segni
ANOVA per misure ripetute

(per il confronto di più campioni)
Test non parametrico:
Test di Wilcoxon
23
Stoutenbeek CP, et al. Intensive Care Med 2007; 33:261-270
Quadro generale
TIPO DI
CAMPIONE
TIPO DI VARIABILE
Variabili qualitative p.d.
Variabili ordinali
Variabili quantitative
Test parametrici:
t di Student
2 sample or unpaired
Campioni
non appaiati
(o indipendenti)
Test non parametrico:
Chi-quadrato di
Pearson
Test non parametrico:
U di Mann-Whitney
(per il confronto di 2 campioni)
ANOVA
(per il confronto di più campioni)
Test non parametrico:
U di Mann-Whitney
Test parametrici:
t di Student
one sample or paired
Campioni
Appaiati
(o dipendenti)
Test non parametrico:
Chi-quadrato di
McNemar
(per il confronto di 2 campioni)
Test non parametrico:
Test dei segni

ANOVA per misure ripetute
(per il confronto di più campioni)
Test non parametrico:
Test di Wilcoxon
24
rogramma
Statistica descrittiva
Statistica inferenziale e test d’ipotesi
Dimensione campionaria
Classificazione degli studi primari
Studi secondari: revisioni sistematiche e meta-analisi
Definizione di outcome
Misure di rischio
25
EBM
Dimensione campionaria
Perché stimare a priori la dimensione
del campione da studiare?

Nell’analisi dei risultati di uno studio, la dimensione campionaria è il fattore che
maggiormente influenza il potere di un test statistico, cioè la capacità del test
di evidenziare come “statisticamente significativa” una differenza realmente
esistente tra i gruppi di trattamento.
Tanto più grande la dimensione del campione, tanto maggiore il potere del test.

La letteratura medica contiene molti esempi di trial troppo piccoli per poter
avere buona probabilità di evidenziare (come “statisticamente significative”)
differenze clinicamente rilevanti tra i gruppi di trattamento studiati.
In altre parole: la “negatività” dei loro risultati potrebbe essere legata
esclusivamente all’inadeguatezza della dimensione campionaria e non alla
mancanza di effetto del trattamento oggetto di studio.

Questo problema viene risolto con il calcolo statistico eseguito a priori (cioè
nella fase di progettazione di un clinical trial) della dimensione del campione
appropriata per lo studio.
26
EBM
Dimensione campionaria
Come si calcola la dimensione campionaria

Il calcolo della dimensione campionaria può essere complesso e richiedere
l’assistenza di uno statistico.
Per ogni situazione vi sono a disposizione formule (spesso complesse), estese
tabelle, e metodi grafici più semplici (nomogrammi).

Il calcolo della dimensione campionaria varia a seconda di:
• tipo di dati da analizzare (es.: dati continui, dati categorici)
• tipo di campioni (indipendenti o dipendenti), e quindi di disegno dello
studio (a gruppi paralleli o cross-over)
• numero dei gruppi di trattamento da confrontare
• situazioni particolari, quali: tempo di sopravvivenza come outcome
principale di interesse
27
EBM
Dimensione campionaria
Quali sono i fattori che entrano nel
calcolo la dimensione campionaria?

Indipendentemente da quale sia la formula adatta al disegno di studio e al tipo di
dati di interesse, per calcolare la dimensione campionaria è necessario
specificare il valore di 3 fattori:
• Il potere del test che si desidera ottenere (è consigliabile mirare a un
potere del test compreso tra l’80% e il 90%).
• la differenza minima tra i trattamenti che sia “clinicamente rilevante”.
E’ il fattore più difficile da specificare.
Può essere espresso in generale come il grado di beneficio che il nuovo
trattamento dovrebbe fornire rispetto a quello vecchio perché valga la
pena di utilizzarlo.
• il valore di “alfa” (= errore di primo tipo) che si vuole accettare, cioè la
probabilità di ottenere una differenza “statisticamente significativa”
quando di fatto differenza non c’è.
28
Dimensione campionaria
EBM
In conclusione…….

Il fine ultimo del calcolo della dimensione campionaria è quello di:
• avere un’alta probabilità di evidenziare, come “statisticamente
significativo”, un effetto definito come rilevante, se questo esiste;
• essere ragionevolmente sicuri che non esista un beneficio del genere se
non riscontrato nel trial.
(maggiore la dimensione campionaria
maggiore il potere dello studio
maggiore la nostra confidenza in quanto sopra)
29
EBM
Errore alfa e beta
Errore alfa

Definizione:
E’ l’errore che commettiamo dicendo che un risultato è significativo quando
invece non lo è.

L’errore alfa che siamo disposti ad accettare corrisponde al limite che fissiamo
per la significatività della p: 5 o 1%, a seconda che decidiamo di essere più o
meno conservativi.
Errore beta

Definizione:
E’ l’errore che commettiamo dicendo che un risultato non è significativo quando
invece lo è.

Corrisponde a 1-potere dello studio ed è espresso in percentuale (es.: potere
dello studio=85%; errore beta=15%)
30
Late death
Yes
No
SDD
26
159 185
Control
31
156 187
57
315 372
Risk A = 14.1%
Risk B = 16.6%
Absolute risk reduction = 2.5%
31
Calcolo della dimensione campionaria
UN ESEMPIO
EBM
 INTERVENTO: SDD per ridurre la mortalità nei traumi gravi
 BRACCI DI TRATTAMENTO:
• braccio A - sperimentale: SDD
• braccio B - intervento standard: placebo
 OUTCOME: late mortality
I determinanti per il calcolo della dimensione campionaria:
• differenza attesa di efficacia tra i due trattamenti
• potere desiderato dello studio
• livello soglia per la significatività statistica
32
Calcolo della dimensione campionaria:
i determinanti per il calcolo
EBM
 efficacia attesa dei due trattamenti
• efficacia attesa trattamento B - standard: outcome positivo 80%
(p1=0.80)
• efficacia attesa trattamento A - sperimentale: outcome positivo 85%
(p2=0.85)
 Potere dello studio desiderato =
80%
 Livello soglia di significatività statistica =
Mortalità 20%
5%
Mortalità 15%
33
Calcolo della dimensione campionaria:
l’uso del nomogramma
EBM
 Calcolo della differenza standardizzata
D =
p2 - p1
0.85 - 0.80
= 0.132
=
p (1 - p)
dove : p = ( p2 + p1 ) / 2
0.825 (1 - 0.825)
=
0.85 + 0.80 / 2 = 0.825
 Potere dello studio desiderato =
80%
 Livello soglia di significatività statistica =
5%
34
EBM
http://biostat.mc.vanderbilt.edu/twiki/bin/view/Main/PowerSampleSize
RISULTATO:
n = 1800 pazienti (900 per braccio)
35
rogramma
Statistica descrittiva
Statistica inferenziale e test d’ipotesi
Dimensione campionaria
Classificazione degli studi primari
Studi secondari: revisioni sistematiche e meta-analisi
Definizione di outcome
Misure di rischio
36
EBM
Ignaz Philipp Semmelweis (1818-1865)
Parte I
Egli notò che la febbre puerperale era più comune nel reparto di
maternità dove medici e studenti di medicina assistevano le
donne per il parto (Divisione A) rispetto al reparto dove ad
assistere erano le ostetriche (Divisione B).
La mortalità periparto della Divisione A era del 18%, mentre
quella della Divisione B era del 3%.
A quel tempo la teoria prevalente per spiegare tale fenomeno era
quella dei miasmi (aria cattiva) in combinazione con le lenzuola
37
sporche, il basso stato sociale ed influenze climatiche.
EBM
Ignaz Philipp Semmelweis (1818-1865)
Morte per sepsi puerperale
Si
No
Reparto A
620
2880 3500
Reparto B
100
3400 3500
720
6280 7000
38
EBM
Ignaz Philipp Semmelweis (1818-1865)
Parte I
ienna 1846:
Mentre la febbre puerperale imperversava con violenza dentro gli
ospedali, fuori, nella città di Vienna, non si riscontrava tale epidemia.
Le madri che partorivano in casa avevano un rischio di mortalità molto
basso, e tra le madri che partorivano senza assistenza non si
riscontrava alcuna mortalità.
La mortalità non era in alcun modo collegata alle variazioni climatiche.
Maggiore era la lesione della cervice e dell’utero, maggiori le
probabilità che la madre sviluppasse la febbre puerperale.
La chiusura del reparto arrestava sempre la mortalità per un periodo.39
EBM
Ignaz Philipp Semmelweis (1818-1865)
ienna 1846:
Parte I
Da tali osservazioni, Semmelweis
comprese che la causa non poteva
essere attribuita né a epidemie né a
miasmi, ma doveva trovarsi in un
qualche fattore inspiegato esistente
nella I Divisione, ma non nella II
Divisione.
40
EBM
Ignaz Philipp Semmelweis (1818-1865)
ienna 1846:
Jakob Kolletschka, un
giovane docente di medicina
forense, subì un’accidentale
lacerazione durante
un’autopsia e morì
rapidamente per infezione.
Parte I
Studenti e maestri
sezionavano parecchi
cadaveri al giorno
(ovviamente non
refrigerati) e si lavavano
in modo approssimativo.
41
EBM
Ignaz Philipp Semmelweis (1818-1865)
Parte I
emmelweis comprese che dovevano esser
presenti 3 fattori:
la fonte di materia putrefatta;
un mezzo per trasportare fisicamente tale
materia dalla fonte alla vittima che doveva
venirvi in stretto contatto;
una superficie ferita, come la parete spoglia
di un utero post partum o di un dito ferito.
42
EBM
Ignaz Philipp Semmelweis (1818-1865)
ienna 15 Maggio 1847:
Parte II
Semmelweis ordinò che tutti i medici e gli
studenti si lavassero le mani con una soluzione
di cloro al 4% finché la pelle non fosse
scivolosa e l’odore di cadavere sparito.
Il tasso di mortalità per febbre puerperale alla
fine del 1° anno intero di profilassi fu
dell’1,2% nella I Divisione e del 3% nella II
Divisione
43
EBM
Ignaz Philipp Semmelweis (1818-1865)
Morte per sepsi puerperale
Si
No
Reparto A
620
2880 3500
Reparto B
100
3400 3500
720
6280 7000
Morte per sepsi puerperale
Si
No
Reparto A
42
3458 3500
Reparto B
100
3400 3500
142
6858 7000
44
EBM
Ignaz Philipp Semmelweis (1818-1865)
Parte III
Il mondo medico viennese non solo non riconosce come plausibili le
spiegazioni fornite per spiegare la riduzione del tasso di mortalità, che
viene invece attribuito a variazioni della composizione dei miasmi, ma
addirittura isola Semmelweis e lo deride. Di conseguenza si oppone
con forza all’implementazione del nuovo metodo.
Semmelweis, per contro, si rifiuta di pubblicare una spiegazione
logica dei suoi risultati e si rifiuta anche di dimostrare la sua teoria in
esperimenti animali.
Noto per il suo pessimo carattere entra in aperto dissenso con
l’establishment medico viennese apostrofando i suoi colleghi come
assassini.
45
EBM
Ignaz Philipp Semmelweis (1818-1865)
Licenziato, torna nella natia Ungheria, dove
nel 1854 diventa professore ordinario di
ginecologia all’Università di Pest.
Parte III
A Pest egli istituisce il suo metodo in 2
altri Ospedali, riducendo la mortalità dal
10% a meno dell’1%.
Nel 1861 pubblica il suo trattato sulle febbri
puerperali “Die Aetiologie der Begriff mid die
Prophylaxis des Kindbettfiebers”.
MUORE a 47 anni in manicomio
46
EBM
omande
Che tipo di studio fu quello realizzato da
Semmelweis nella I parte?
Che tipo di studio fu quello realizzato da
Semmelweis nella II parte?
Come avrebbe potuto migliorare le prove di
efficacia del trattamento antisettico?
Come avrebbe potuto migliorarne
l’adozione?
47
EBM
Della carne e del macellaio
Lo studio
L’analisi
48
L’articolo
EBM
Gerarchia degli studi
(1)
Review sistematica e Meta-analisi
(2)
Trial clinico randomizzato
(3)
Trial clinico non randomizzato
(4)
Studio osservazionale con gruppo di controllo
studio di coorte
caso-controllo
survey
(5)
Studio descrittivo
(6)
Case report
(7)
Opinione dell’esperto
Modificato da: United States Department of Health and Human Services. Agency for Health Care Policy and Research. Acute
pain management: operative or medical procedures and trauma. Rockville, MD: AHCPR, 1993:107. (Clinical practice
guideline No 1, AHCPR publication No 92.0023.)
49
50
(1) Review sistematica e Meta-analisi
?????????????????????????????????????????????????????????????????????????
(2) Trial clinico randomizzato
(3) Trial clinico non randomizzato
(4) Studio osservazionale con gruppo di
controllo
studio di coorte
??????????????????????????
caso-controllo
survey
(5) Studio descrittivo
(6) Case report
(7) Opinione dell’esperto
??????????
??????????????????????????????????????????????????????????????
Lancet 2006; 367: 413–418
51
(1) Review sistematica e Meta-analisi
????????????????????????????????????????????????
(2) Trial clinico randomizzato
(3) Trial clinico non randomizzato
(4) Studio osservazionale con gruppo di
controllo
studio di coorte
?????????????????????????????????????????
caso-controllo
survey
(5) Studio descrittivo
(6) Case report
(7) Opinione dell’esperto
Lancet 2007; 369: 920–26
52
??????????????????????????????????????????????????????
Am J Respir Crit Care Med 2007; 176: 886–891
The U.K. blood system has nearly
eliminated female donors from the
production of high plasma volume products
(FFP).
????????????????????????
The first reports suggest a significant
decrease in TRALI reactions reported to the
national transfusion surveillance system
(SHOT [serious hazards of transfusion]).
(1) Review sistematica e Meta-analisi
(2) Trial clinico randomizzato
(3) Trial clinico non randomizzato
(4) Studio osservazionale con gruppo di controllo
studio di coorte
caso-controllo
survey
(5) Studio descrittivo
(6) Case report
(7) Opinione dell’esperto
53
BACKGROUND: Large intervention studies suggest that
aspirin may reduce mortality when given to patients who
present with strokes or transient ischemic attacks. We
sought to determine whether patients who were already
using aspirin at the time of an ischemic stroke had a lower
mortality than those who were not.
METHODS: A prospective study was undertaken in
1,457 patients with acute ischemic stroke, 650 (45%) of
whom were using aspirin prior to the stroke. Mortality
was measured 4 weeks after the initial episode.
RESULTS: Prior use of aspirin was associated with lower
4-week mortality (14% versus 20%, P <0.01). The effect
of prior aspirin use on mortality was independent of age,
gender, other risk factors, and use of other medication.
CONCLUSIONS: Prior use of low-dose aspirin may be
associated with a small but significant reduction in stroke
mortality.
(1) Review sistematica e Meta-analisi
(2) Trial clinico randomizzato
(3) Trial clinico non randomizzato
(4) Studio osservazionale con gruppo di
controllo
studio di coorte
caso-controllo
survey
(5) Studio descrittivo
(6) Case report
(7) Opinione dell’esperto
Kalra L, et al. Does prior use of aspirin affect outcome in ischemic stroke? Am J Med 2000;
108:205
54
EBM
Ignaz Philipp Semmelweis (1818-1865)
BACKGROUND: La sepsi puerperale ha un’elevata
incidenza nelle donne che partoriscono nell’Ospedale di
Vienna, ma non nelle donne che partoriscono a casa.
METHODS: Ho riguardato tutti i documenti di donne
che sviluppano sepsi e di quelle che non la sviluppano; ho
anche parlato con il personale dell’Ospedale per cercare
di scoprire possibili cause.
RESULTS: Ho scoperto che la maggior parte delle sepsi
avviene nella I Divisione, dove ad assistere le gravide
sono medici e studenti. Questi eseguono tutti i giorni
numerose autopsie e non si lavano le mani al termine.
Questo non succede nella II Divisione dove sono le
ostetriche ad assistere le gravide.
CONCLUSIONS: Medici e studenti trasferiscono
materiale cadaverico letale dalla sala autoptica nel canale
vaginale delle gravide.
(1) Review sistematica e Meta-analisi
(2) Trial clinico randomizzato
(3) Trial clinico non randomizzato
(4) Studio osservazionale con gruppo di
controllo
studio di coorte
caso-controllo
survey
(5) Studio descrittivo
(6) Case report
(7) Opinione dell’esperto
Semmelweiss IP. Assassini. Wien Med J 1847
55
EBM
Ignaz Philipp Semmelweis (1818-1865)
BACKGROUND: Medici e studenti trasferiscono
materiale cadaverico letale dalla sala autoptica nel canale
vaginale delle gravide. La mortalità è molto alta.
METHODS: Ho obbligato tutti i medici e gli studenti a
lavarsi (disinfettarsi) le mani dopo l’autopsia e prima del
parto.
RESULTS: Il numero di sepsi puerperali è diminuito
drasticamente dal 18,0% all’1,1%
CONCLUSIONS: Coloro che non dovessero seguire il
metodo da me indicato sono da considerarsi degli
assassini
(1) Review sistematica e Meta-analisi
(2) Trial clinico randomizzato
(3) Trial clinico non randomizzato
(4) Studio osservazionale con gruppo di
controllo
studio di coorte
caso-controllo
survey
(5) Studio descrittivo
(6) Case report
(7) Opinione dell’esperto
Semmelweiss IP. Assassini2. Wien Med J 1848
56
(1)
Review sistematica e Meta-analisi
(2)
Trial clinico randomizzato
(3)
Trial clinico non randomizzato
(4)
Studio osservazionale con gruppo di controllo
studio di coorte
caso-controllo
survey
(5)
Studio descrittivo
(6)
Case report
(7)
Opinione dell’esperto
57
An early cohort in search of favourable outcomes
David A Grimes, Kenneth F Schulz. Cohort studies: marching towards outcomes. Lancet 2002; 359: 341–45
58
EBM
Gerarchia degli studi
Lo studio di coorte


E’ uno studio osservazionale in cui la popolazione oggetto di studio viene
suddivisa in due (o più) gruppi sulla base del grado di esposizione ad un certo
agente (fattore di rischio o trattamento), e seguita nel tempo per valutare
quanti individui in ciascun gruppo sviluppano la malattia (o l’outcome di
interesse).
Lo studio è spesso prospettico, ma può essere anche retrospettivo .
59
Schematic diagram of concurrent, retrospective, and ambidirectional cohort studies
David A Grimes, Kenneth F Schulz. Cohort studies: marching towards outcomes. Lancet 2002; 359: 341–45
60
EBM
Gerarchia degli studi
Lo studio caso-controllo

E’ uno studio osservazionale in cui pazienti affetti da una malattia (casi) sono
confrontati con un gruppo di controllo non affetto dalla malattia (controlli).
Una volta selezionati in base alla presenza/assenza della malattia, i due
gruppi vengono studiati per valutare il grado di esposizione a fattori di
rischio.

Lo studio è quasi sempre retrospettivo, ma potrebbe essere anche
prospettico (dove prospettico è il reclutamento dei casi e/o controlli).

E’ particolarmente adatto allo studio di condizioni patologiche relativamente
rare .
61
Schematic diagram of case-control study design
David A Grimes, Kenneth F Schulz. Case-control studies: research in reverse. Lancet 2002: 359: 431–34
62
Schematic diagram showing temporal direction of three study designs
David A Grimes, Kenneth F Schulz. An overview of clinical research: the lay of the land. Lancet 2002; 359: 57–61
63
EBM
Gerarchia degli studi
La survey (o cross sectional survey)



E’ uno studio condotto in un lasso di tempo molto breve su un campione
rappresentativo della popolazione, con lo scopo di “fotografare” la situazione
rispetto ad un quesito clinico specifico in un dato momento.
Permette di rilevare soltanto misure di prevalenza di una malattia, mancando
per definizione un periodo di osservazione (follow-up) (Esempio: interviste
postali o telefoniche.)
Lo studio viene condotto in un dato momento ma il quesito potrebbe riferirsi
ad un evento del passato.
64
EBM
Gerarchia degli studi
Il Case report

E’ lo studio che descrive il caso clinico di un singolo paziente sotto forma di
storia.

I singoli case report sono spesso uniti a formare un “case series” (viene
raccontata la storia clinica di pochi pazienti).
65
Case report
Sempre la cenerentola?
66
Branch retinal artery occlusion
Lancet 2007; 370: 590
An 82-year-old lady presented with sudden, partial, painless
visual loss in her right eye.
Fundoscopy revealed a reddish macula, typical of retinal artery
occlusion, and an embolus in a branch of the central retinal
artery. On general examination, a bruit was heard over the
right carotid artery.
The commonest cause of retinal artery occlusion is
thromboembolism.
Treatment should be immediate, because if the occlusion lasts
longer than about 1 h, the ischaemic part of the optic nerve
will atrophy, causing permanent visual loss.
There is no reliable treatment—but if the patient is seen within
about 1 h of onset, pressure on the eyeball, firm enough to
cause pain, with sudden release, can propel an embolus
distally.
(A) Ischaemic patch on the retina.
(B) Close-up view of macula.
(C) Fluorescein angiography,
showing very little filling
67
distal to the embolus.
Una bambina di 2 anni viene coinvolta
in un incidente a bassa velocità. L’airbag si apre violentemente. Al
momento dell’incidente era seduta nel
posto di fianco al guidatore, senza
cinture.
Prima dell’arrivo dell’ambulanza è in
coma e non respira più. Viene quindi
rianimata sul luogo dell’incidente. A
parte diverse abrasioni ed ustioni, non
vi sono altri segni di danno all’esame
clinico.
La radiografia della colonna vertebrale
cervicale mostra un distacco tra
l’occipite e l’atlante (frecce) di 4 cm.
All’esame TC si dimostrano emorragia
cerebrale, edema cerebrale grave,
ematoma intracranico. Inoltre il
midollo spinale era probabilmente
sezionato.
La bambina morirà ore dopo.
68
Angel CA, Ehlers. N Engl J Med 345: 1256 October 25, 2001
Dal 1998 tutte le nuove auto (negli USA, NdR) sono
equipaggiate con 2 air bags che si gonfiano in meno di 1/25
di secondo ad una velocità di 322 km/ora.
I bambini sono particolarmente a rischio per lesioni della
testa e del collo da air bag a causa di un rapporto
testa/tronco più alto che nell’adulto e per varie altre ragioni.
Il danno cervicale è causato da un’iperestensione violenta.
Per prevenire tali danni i bambini con meno di 12 anni
dovrebbero viaggiare solo dietro e con la cintura di
sicurezza allacciata.
69
Valutare la qualità
70
Valutare la fattibilità
BMJ 2003;327:1459–61
……we feel assured that those who
advocate evidence based medicine and
criticise use of interventions that lack an
evidence base will not hesitate to
demonstrate their commitment by
volunteering for a double blind,
randomised, placebo controlled,
crossover trial.
71
EBM
Gerarchia degli studi
Il trial clinico controllato randomizzato

Disegno di studio relativamente giovane, introdotto nella ricerca medica circa 50 anni
fa. Primo importante clinical trial nel 1948, con confronto tra streptomicina e riposo
a letto per il trattamento della tubercolosi.

E’ uno studio sperimentale sugli esseri umani disegnato per valutare l’efficacia di uno
o più forme di trattamento (inteso in senso generale).

Il campione di studio viene suddiviso in due (o più) gruppi: uno assegnato a ricevere
l’intervento (o gli interventi) oggetto di studio, l’altro il trattamento di controllo
(terapia standard o placebo).

Il trial viene definito randomizzato quando l’assegnazione del trattamento
(sperimentale e di controllo) ai due gruppi non viene decisa dal medico (o da altri) ma
avviene in modo del tutto casuale.

Il trial clinico controllato è il gold standard degli studi primari.
72
EBM
Gerarchia degli studi
RCT (Randomised Clinical Trial)

L’idea chiave del clinical trial randomizzato è confrontare gruppi di pazienti che
differiscono soltanto per il trattamento somministrato.

Questo si ottiene grazie all’allocazione randomizzata (i.e. totalmente casuale) ad
un trattamento o all’altro - tutti i pazienti reclutati nello studio hanno la stessa
probabilità di ricevere un trattamento o l’altro.

L’allocazione di un paziente ad un trattamento deve essere imprevedibile
(allocation concealment)
73
EBM
A cosa serve la randomizzazione ?
Se la dimensione del campione è
sufficientemente ampia, assicura, che i
determinanti dell’outcome, sia quelli noti che
quelli non noti, si distribuiscano a caso tra il
gruppo di trattamento e quello di controllo.
74
EBM
L’analisi secondo l’intention to treat
CONSORT II
A = stent coronarico
B = by pass aorto-coronarico
A
2000
B
1000
1000
70
100
955
875
75
In 2006, Arthur Amman, President of Global Strategies for HIV
Prevention, made a disquieting remark:
“I recently met a physician from southern Africa, engaged in perinatal
HIV prevention, whose primary access to information was abstracts
posted on the internet.
Based on a single abstract, they had altered their perinatal HIV
prevention program from an effective therapy to one with lesser efficacy.
Had they read the full text article they would have undoubtedly realized
that the study results were based on short-term follow-up, a small pivotal
group, incomplete data, and unlikely to be applicable to their country
situation.
Their decision to alter treatment based solely on the abstract’s
conclusions may have resulted in increased perinatal HIV transmission.
76
Lancet 2008; 371 (January 26):281-3
CONSORT for reporting randomised trials in journal and conference abstracts
Hopewell S, Clarke M, Moher M, Wager E, Middleton P, Altman DG, Schulz KF, and the CONSORT Group
Lancet 2008; 371 (January 26):281-3
Items to be included when
reporting randomised
trials in journal or
conference abstracts
77
78
EBM
Principio di incertezza
Un paziente dovrebbe essere arruolato in un trial clinico
randomizzato solo nel caso in cui vi sia sostanziale incertezza su
quale sia il trattamento migliore.
L’interesse che si protegge è quello futuro della popolazione dei
pazienti.
79
Lancet 2002; 360: 1267
We remain cautious and critical of the conclusion of the ISAT trial,
and believe that this study has not effectively answered the question
of what is the preferred mode of therapy because of fundamental
flaws in the study design……..
Of the 9559 patients who were eligible for inclusion, 78% were
excluded. Only 9% of the patients refused to participate, and the
remaining 69% were excluded by the treating physician. This is not
true randomisation, nor does it represent an intention-to-treat
randomised trial.
Britz GW, Newell DW, West GA, Lam A. Lancet 2003; 361:431
In ISAT, the required clinical equipoise allowing randomisation did not exist in
80% of the 9278 patients with aneurysmal subarachnoid haemorrhage assessed
for eligibility.
6352 patients were regarded as being better candidates for endovascular
coiling (2737) or neurosurgical clipping (3615), precluding them from
randomisation. Another 1064 were treated in some other unknown manner.
Brown RD Jr, Nichols DA, FB Meyer. Lancet 2003; 361:433
80
Lancet 2002; 360: 1267
In patients with a ruptured intracranial
aneurysm, for which endovascular coiling
and neurosurgical clipping are therapeutic
options, the outcome in terms of survival
free of disability at 1 year is significantly
better with endovascular coiling.
81
EBM
L’analisi di sottogruppi
N Engl J Med 2004;350:2247-56.
Background We conducted a multicenter, randomized, double-blind trial to compare the effect of fluid resuscitation
with albumin or saline on mortality in a heterogeneous population of patients in the ICU.
Methods We randomly assigned patients who had been admitted to the ICU to receive either 4 percent albumin or
normal saline for intravascular-fluid resuscitation during the next 28 days. The primary outcome measure was death
from any cause during the 28-day period after randomization.
Results Of the 6997 patients who underwent randomization, 3497 were assigned to receive albumin and 3500 to receive
saline; the two groups had similar baseline characteristics. There were 726 deaths in the albumin group, as compared
with 729 deaths in the saline group (relative risk of death, 0.99; 95 percent confidence interval, 0.91 to 1.09; P=0.87).
Conclusions In patients in the ICU, use of either 4 percent albumin or normal saline for fluid resuscitation results in
82
similar outcomes at 28 days.
N Engl J Med 2004;350:2247-56.
The primary outcome measure was death from any cause during the 28-day period
after randomization.
Death from any cause within 28 days after randomization was also examined in 6
predefined subgroups according to:
- the presence or absence of trauma,
- the presence or absence of severe sepsis,
- the presence or absence of the ARDS
at baseline.
83
This difference in the relative risk of death was due to the
greater number of patients with trauma and an associated
brain injury.
SAFE Study Investigators. A comparison of albumin and saline for fluid resuscitation in the ICU. N Engl J Med 2004;350:2247-56
84
Domandina
Usiamo o no
l’albumina nei
traumi cranici gravi?
85
EBM
L’analisi di sottogruppi
Un sottogruppo appropriato è rappresentato da un gruppo di pazienti con caratteristiche
di partenza comuni (baseline parameters); in altre parole i sottogruppi devono essere
definiti all’inizio (at baseline) prima della randomizzazione. Yusuf S, JAMA 1991; 266: 93
Il risultato complessivo di un trial clinico randomizzato è usualmente una stima più
affidabile dell’effetto del trattamento nei vari sottogruppi che non gli effetti osservati
nei vari sottogruppi. Yusuf S, JAMA 1991; 266: 93
Un’analisi di sottogruppo che dimostra un’interazione qualitativa (il trattamento è
positivo in un sottogruppo e negativo in un altro) difficilmente può essere vero, dato che
i partecipanti al trial condividono un numero sufficiente di caratteristiche tale da rendere
tale interazione improbabile. Horton R, Lancet 2000; 355:1033
Se si includono troppi sottogruppi, aumenta in modo sostanziale la probabilità di trovare
una differenza “statisticamente significativa” per puro effetto del caso (multiplicity o
multiple comparisons). Assmann SF, Lancet 2000;355:1064
86
SAFE Study Investigators. A comparison of albumin and saline for fluid resuscitation in the ICU. N Engl J Med 2004;350:2247-56
2007; 357:874-84
FARM6JS3R5. Gattinoni L, Pesenti A, Caironi P, Fumagalli R, Latini R, Tognoni G. Efficacia
della somministrazione di albumina nel rimpiazzo/espansione volemica dei pazienti con sepsi
severa e shock settico.
87
EBM
Il problema dei test multipli
• Per ogni test eseguito, l’errore α (fissato dal valore soglia di p) é basso. Se si
eseguono test multipli sugli stessi dati (es. analisi di sottogruppo), la
probabilità globale di errore α aumenta col numero dei tests.
• Esempio: su 100 analisi di sottogruppo eseguite sulla popolazione di studio
(maschi vs femmine, vecchi vs giovani, europei vs africani, etc), ci
aspettiamo che 5 siano positive per il solo effetto del caso.
• In presenza di test multipli, l’errore α va controllato riducendo il valore
soglia di p per ogni singolo test (es. correzione di Bonferroni: pcorr = p/n.
tests)
Esempio. ISIS-2 trial: aspirina vs placebo nell’infarto miocardico acuto
- Analisi di sottogruppo in base al segno zodiacale
- Differenza di mortalità statisticamente significativa per tutti i segni
(p<0.000001) tranne che per bilancia e gemelli (p>0.05)
88
Lancet 1988, ii: 349-360
89
David A Grimes, Kenneth F Schulz. An overview of clinical research: the lay of the land. Lancet 2002; 359: 57–61
90
(1) Review sistematica e Meta-analisi
(2) Trial clinico randomizzato
(3) Trial clinico non randomizzato
(4) Studio osservazionale con gruppo di
controllo
studio di coorte
caso-controllo
survey
(5) Studio descrittivo
(6) Case report
(7) Opinione dell’esperto
Lancet 2006; 367: 413–418
91
(1) Review sistematica e Meta-analisi
(2) Trial clinico randomizzato
(3) Trial clinico non randomizzato
(4) Studio osservazionale con gruppo di
controllo
studio di coorte
caso-controllo
survey
(5) Studio descrittivo
(6) Case report
(7) Opinione dell’esperto
Lancet 2007; 369: 920–26
92
Am J Respir Crit Care Med 2007; 176: 886–891
The U.K. blood system has nearly
eliminated female donors from the
production of high plasma volume products
(FFP).
The first reports suggest a significant
decrease in TRALI reactions reported to the
national transfusion surveillance system
(SHOT [serious hazards of transfusion]).
(1) Review sistematica e Meta-analisi
(2) Trial clinico randomizzato
(3) Trial clinico non randomizzato
(4) Studio osservazionale con gruppo di controllo
studio di coorte
caso-controllo
survey
(5) Studio descrittivo
(6) Case report
(7) Opinione dell’esperto
93
BACKGROUND: Large intervention studies suggest that
aspirin may reduce mortality when given to patients who
present with strokes or transient ischemic attacks. We
sought to determine whether patients who were already
using aspirin at the time of an ischemic stroke had a lower
mortality than those who were not.
METHODS: A prospective study was undertaken in
1,457 patients with acute ischemic stroke, 650 (45%) of
whom were using aspirin prior to the stroke. Mortality
was measured 4 weeks after the initial episode.
RESULTS: Prior use of aspirin was associated with lower
4-week mortality (14% versus 20%, P <0.01). The effect
of prior aspirin use on mortality was independent of age,
gender, other risk factors, and use of other medication.
CONCLUSIONS: Prior use of low-dose aspirin may be
associated with a small but significant reduction in stroke
mortality.
(1) Review sistematica e Meta-analisi
(2) Trial clinico randomizzato
(3) Trial clinico non randomizzato
(4) Studio osservazionale con gruppo di
controllo
studio di coorte
caso-controllo
survey
(5) Studio descrittivo
(6) Case report
(7) Opinione dell’esperto
Kalra L, et al. Does prior use of aspirin affect outcome in ischemic stroke? Am J Med 2000;
108:205
94
BACKGROUND: La sepsi puerperale ha un’elevata
incidenza nelle donne che partoriscono nell’Ospedale di
Vienna, ma non nelle donne che partoriscono a casa.
METHODS: Ho riguardato tutti i documenti di donne
che sviluppano sepsi e di quelle che non la sviluppano; ho
anche parlato con il personale dell’Ospedale per cercare
di scoprire possibili cause.
RESULTS: Ho scoperto che la maggior parte delle sepsi
avviene nella I Divisione, dove ad assistere le gravide
sono medici e studenti. Questi eseguono tutti i giorni
numerose autopsie e non si lavano le mani al termine.
Questo non succede nella II Divisione dove sono le
ostetriche ad assistere le gravide.
CONCLUSIONS: Medici e studenti trasferiscono
materiale cadaverico letale dalla sala autoptica nel canale
vaginale delle gravide.
(1) Review sistematica e Meta-analisi
(2) Trial clinico randomizzato
(3) Trial clinico non randomizzato
(4) Studio osservazionale con gruppo di
controllo
studio di coorte
caso-controllo
survey
(5) Studio descrittivo
(6) Case report
(7) Opinione dell’esperto
Semmelweiss IP. Assassini. Wien Med J 1847
95
BACKGROUND: Medici e studenti trasferiscono
materiale cadaverico letale dalla sala autoptica nel canale
vaginale delle gravide. La mortalità è molto alta.
METHODS: Ho obbligato tutti i medici e gli studenti a
lavarsi (disinfettarsi) le mani dopo l’autopsia e prima del
parto.
RESULTS: Il numero di sepsi puerperali è diminuito
drasticamente dal 18,0% all’1,1%
CONCLUSIONS: Coloro che non dovessero seguire il
metodo da me indicato sono da considerarsi degli
assassini
Semmelweiss IP. Assassini2. Wien Med J 1848
(1) Review sistematica e Meta-analisi
(2) Trial clinico randomizzato
(3) Trial clinico non randomizzato
(4) Studio osservazionale con gruppo di
controllo
studio di coorte
caso-controllo
survey
(5) Studio descrittivo
(6) Case report
(7) Opinione dell’esperto
Gruppo di controllo storico
96
ive me a break!
97
EBM
omande
Che tipo di studio fu quello realizzato da
Semmelweis nella I parte?
Osservazionale
caso-controllo
Che tipo di studio fu quello realizzato da
Semmelweis nella II parte?
Sperimentale con
controllo storico
Come avrebbe potuto migliorare le sue
prove di efficacia del trattamento
antisettico?
Introducendo un
gruppo di controllo
e randomizzando i
pazienti
Come avrebbe potuto migliorarne
l’adozione?
Pubblicando
98
LOUIS FERDINAD CÉLINE
pseudonimo di Louis Destouches
Lo scrittore maledetto 1894-1961
Tesi di laurea in Medicina, Sorbona 1924:
“Il dottor Semmelweis”.
99
EBM
ubblicare
1. scegliere outcome importanti per i malati
2. disegnare studi di qualità elevata
3. presentare i risultati in modo chiaro ed efficace
…ma è sufficiente?
100
FREAKONOMICS
Selling Soap
By STEPHEN J. DUBNER and STEVEN D. LEVITT
Published: September 24, 2006
How do you get doctors to wash their hands?
nce Semmelweis had these doctors wash their hands with an antiseptic solution, the mortality rate plummeted.
But Semmelweis’s mandate, as crucial and obvious as it now seems, has proved devilishly hard to enforce. A
multitude of medical studies have shown that hospital personnel wash or disinfect their hands in fewer than half the
instances they should. And doctors are the worst offenders, more lax than either nurses or aides.
Reasons? Arrogance? ‘Hey, I couldn’t be carrying the bad bugs. It’s the other hospital personnel.’
……So the hospital needed to devise some kind of incentive scheme that would increase compliance …………….
They’d try to “catch” a doctor who was washing up, giving him a $10 Starbucks card as reward. You might think
that the highest earners in a hospital wouldn’t much care about a $10 incentive — “but none of them turned down
the card”.
…….When the nurse spies reported back the latest data, it was clear that the hospital’s efforts were working — but
not nearly enough. Compliance had risen to about 80 percent from 65 percent, but the Joint Commission required
90 percent compliance.
…… after they finished their lunch, Murthy handed each of them an agar plate — a sterile petri dish loaded with
a spongy layer of agar. “I would love to culture your hand,” she told them. They pressed their palms into the
plates, and Murthy sent them to the lab to be cultured and photographed.
101
102
rogramma
Statistica descrittiva
Statistica inferenziale e test d’ipotesi
Dimensione campionaria
Classificazione degli studi primari
Studi secondari: revisioni sistematiche e meta-analisi
Definizione di outcome
Misure di rischio
103
La review sistematica
EBM
 Sintesi qualitativa: Revisione condotta in maniera sistematica, con
protocollo che preveda l’uso di metodologia standardizzata e
riproducibile
 Nasce in alternativa alla review tradizionale (“narrativa”) condotta
da esperti del settore. Rispetto a questa e’:


Decisamente piu’ impegnativa
Libera (se ben condotta) dalla soggettivita’ di giudizio
 Prevede la raccolta di (possibilmente) tutti gli studi effettuati su
un dato argomento
 Prevede definizione a priori di:




Tipo di studio da includere (es.: RCT)
Obiettivi della review, distinti in primari e secondari
Criteri di inclusione degli studi (popolazione oggetto di studio,
intervento utilizzato, outcome valutato e follow-up considerato)
Strategia da utilizzare per la ricerca bibliografica
104
Raccolta degli studi
EBM
 Strumenti di ricerca:
1. database computerizzati
2. voci bibliografiche
3. contatti con gli autori, meetings, dissertazioni, abstract, tesi, altro
(“gray literature”)
Ramritu et al.
Am J Infect Control 2008;36:104-17
105
Flow-chart di inclusione/esclusione degli studi
Meta-analysis: Effectiveness of Drugs for
Preventing Contrast-Induced Nephropathy
Kelly et al.
Ann Intern Med 2008; 148:284-94
106
EBM
Estrazione dei dati
From: Conducting the review. Data extraction. Centre for Reviews and
Dissemination (CRD). University of York, UK.
Available at: http://www.york.ac.uk/inst/crd/pdf/crd4_ph6.pdf
107
Valutazione della qualita’
EBM
 Definizione “a priori” dei criteri di valutazione della qualita’
 Problema: troppe scale di valutazione, con scarsa concordanza
nel giudizio
 In generale, sconsigliato l’uso di un punteggio di qualita’ nella
meta-analisi
Meta-analysis: Effectiveness of Drugs for
Preventing Contrast-Induced Nephropathy
Kelly et al.
Ann Intern Med 2008; 148:284-94
108
EBM
Guida alla valutazione della qualita’ di RCT
From: Conducting the review. Study quality assessment. Centre for
Reviews and Dissemination (CRD). University of York, UK.
Available at: http://www.york.ac.uk/inst/crd/pdf/crd4_ph5.pdf
109
La meta-analisi
EBM
 Sintesi quantitativa: Analisi statistica dei risultati di un insieme di
studi su un argomento specifico, ottenuta raggruppando i dati dei
singoli studi in un pool unico e calcolando una stima combinata
dell’effetto di interesse
 Non sempre possibile combinare i risultati dei differenti studi
(eterogeneità)
 Talvolta l'utilità si limita ad evidenziare fonti possibili di
disaccordo (eterogeneita’) tra gli studi
 Scopi principali:




Fornire stime dell'effetto più precise
Identificare possibili cause di eterogeneità dei risultati degli studi
Aumentare la generalizzabilità dei risultati
Studiare sottogruppi specifici di pazienti – questo scopo molto piu’
importante quando disponibili i dati dei singoli pazienti (Individual
Patient Data M-A)
110
Esempio di revisione sistematica con meta-analisi
111
Il Forest Plot
Benefit of anticoagulant
prophylaxis
Harm of anticoagulant
prophylaxis
112
L’analisi statistica
EBM
 Calcolo di una stima combinata dell’effetto


Stima combinata ottenuta come media pesata dei risultati degli studi
Il peso di ogni studio e’ basato sulla varianza del risultato, quindi
sulla dimensione campionaria dello studio
 Modelli statistici per la meta-analisi


Modello a effetto fisso – in assenza di eterogeneita’
Modello a effetti random – in presenza di eterogeneita’
 Importante quindi la valutazione dell’eterogeneita’ tra studi



Quantificare il grado di eterogeneita’
Capirne le cause (differenze di popolazione studiata, modalità di
trattamento, etc.)
In ogni caso, se eccessiva la meta-analisi non si puo’ fare!
113
EBM
Valutazione del grado di eterogeneità tra studi
 Test statistici


Test di eterogeneità – 2 test (significativo se p<0.10)
Basso potere statistico
 Analisi di sensibilità
Metanalisi sui ß-bloccanti nella
prevenzione secondaria dopo
infarto miocardico
Egger et al. British Medical Journal
1997; 315:1533-7
114
Bias di pubblicazione
EBM
 Studi con risultati positivi, negativi o di effetto nullo hanno minor
probabilità di essere pubblicati
 Verifica della presenza di bias di pubblicazione


Funnel plot
Tests – il piu’ comune e’ il test di Egger che valuta formalmente
l’asimmetria del funnel plot
Ramritu et al.
Am J Infect Control 2008;36:104-17
115
Quale impatto?
116
BMJ 1998;317:235–40
117
Bibliografia suggerita
EBM
 Libri

Altman D, Chalmers I (eds). Systematic reviews. BMJ Publishing Group, London
(UK) 1995

Sutton AJ, Abrams KR, Jones DR, Sheldon TA, Song F. Methods for metaanalysis in medical research. John Wiley & Sons Ltd, Chichester (UK) 2000
 Articoli

Chalmers I.
The Cochrane Collaboration: Preparing, maintaining and
disseminating systematic reviews of the effects of healthcare. Ann N Y Acad Sci
1993; 703:156-65 (stesso titolo: Bero L, Rennie D. JAMA 1995; 274(24):1935-8)

Egger M, Smith GD, Phillips AN. Meta-analysis – Principles and procedures. BMJ
1997; 315(7121): 1533-1537 (www.bmj.com)

Fleiss JL. The statistical basis of meta-analysis. Statistical Methods in Medical
Research 1993; 2(2):121-45
 Web-sites

http://www.update-software.com/ccweb/cochrane/resource.htm (The Reviewers’
handbook; software: RevMan)

http://www.prw.le.ac.uk/epidemio/personal/ajs22/meta
118
rogramma
Statistica descrittiva
Statistica inferenziale e test d’ipotesi
Dimensione campionaria
Classificazione degli studi primari
Studi secondari: revisioni sistematiche e meta-analisi
Definizione di outcome
Misure di rischio
119
Cos’è un outcome ?
EBM
Ciò a cui il paziente va incontro come conseguenza della
malattia e del suo trattamento
Nell’ambito di un trial clinico l’outcome è un evento che
si vuole modificare con il trattamento; esso deve dunque
essere clinicamente rilevante
120
Diverse misure di outcome

EBM
Le misure di outcome vengono suddivise in due categorie:
• Outcomes “oggettivi” (“hard” outcomes)
Es.: mortalità, giornate di degenza, etc.
• Outcomes “soggettivi” (“soft” outcomes)
Es.: grado di dolore, estensione di un rash, etc.

Indipendentemente dal tipo di outcome (“hard” o “soft”), le misure di outcome dovrebbero
essere sempre:
• clinicamente rilevanti
• sensibili al cambiamento clinicamente importante della condizione patologica, per
quanto minimo
• il meno possibile soggette a variabilità intra- e inter-osservatore (in particolare gli
outcome “soft”)

Tra gli outcomes considerati di interesse vengono spesso trascurati gli indici che tengono conto
del grado di benessere percepito dal paziente (es.: indici di qualità della vita)
121
EBM
Outcomes surrogati
Talvolta non è possibile o comunque fattibile misurare direttamente l’outcome di
interesse. In questi casi si ricorre a degli outcomes surrogati (o sostitutivi),
DEFINIZIONE:
Gli outcomes surrogati sono variabili relativamente facili da misurare,
considerate predittive di un effetto clinico difficile da determinare (es.: raro,
lontano nel tempo), ma che non sono di per sé misura diretta di beneficio (o
danno) in termini clinici.
VANTAGGI

Possono ridurre considerevolmente:



numerosità del campione richiesta
durata dello studio
costo dello studio
122
EBM
Outcomes surrogati
SVANTAGGI

Le modificazioni dell’outcome surrogato non rappresentano di per sé la risposta
di interesse al trattamento

Gli outcomes surrogati potrebbero non essere sufficientemente validi e/o
affidabili nel riflettere l’outcome di vero interesse

Gli outcomes surrogati vengono spesso sviluppati nell’ambito di modelli animali
della patologia e l’estrapolazione di questi risultati alla patologia umana potrebbe
non essere valida
Caratteristiche importanti di un outcome surrogato

La relazione tra outcome surrogato e outcome di interesse deve avere una
spiegazione biologicamente plausibile

La variazione dell’outcome surrogato dovrebbe riflettere, in maniera rapida e
accurata, la risposta al trattamento (in particolare, normalizzazione dei valori in
condizioni di remissione o cura della malattia)

Buona sensibilità, specificità e relazione dose-risposta
123
EBM
Definizione a priori degli outcome

Gli outcome di interesse dovrebbero sempre essere specificati a priori,
distinguendo tra outcome primario e outcome secondari.
Per outcome primario si intende la misura di outcome di maggior interesse, su
cui focalizzare l’attenzione in fase di analisi.

Tutte le eventuali analisi suggerite dai dati andrebbero descritte come “analisi
esploratorie”, e dovrebbero servire a generare ipotesi, non a testarle.
Lo stesso vale per gli effetti collaterali del trattamento.
124
ARDS
Design: Randomized, double-blinded, placebo-controlled
multicentered trial.
Patients: 40 MV patients with ARDS, whose serum
TP were <6.0 g/dL.
Measurements : The primary outcome was change in
oxygenation from baseline to day 1.
Main Results. Albumin-treated patients had greater
increases in oxygenation (mean change in PaO2/FIO2:
+43 vs. +24 mm Hg at 24 hrs and +49 vs. +13 mm Hg at
day 3), serum total protein (1.5 vs.0.5 g/dL at day 3), and
net fluid loss (-5480 vs. -1490 mL at day 3) throughout
the study period (all p <0.05).
Diuretici?
Albumina?
Outcome hard, soft, surrogato?
125
N Engl J Med 2001;345:568-73
The difference between
groups was not significant
(P=0.65 by the log-rank
test).
126
N Engl J Med 2000;3425:1301-8
127
Surrogate End Points and FDA Approval.
A Tale of 2 Lipid-Altering Drugs
Psaty BM, Lumley T
JAMA 2008; 299:14774-1479
Risk factors such as high blood pressure, elevated low-density lipoprotein
(LDL) cholesterol levels, and high blood glucose levels are strongly,
consistently, and directly associated with the risk of major cardiovascular
events, including myocardial infarction, stroke, and heart failure.
Over the last several decades, the development and widespread use of drugs to
reduce the level of these risk factors have been a mainstay of cardiovascular
disease prevention efforts.
128
Ezetimibe e torcetrapib
JAMA, March 26, 2008—Vol 299, No. 12
Ezetimibe, a drug that inhibits the absorption of cholesterol by the small intestine, was approved for
the treatment of hypercholesterolemia.
In two 12-week trials that randomized 892 and 827 patients with hypercholesterolemia to placebo or
active treatment, ezetimibe was associated with 16.5% and 16.9% greater reduction in LDL
cholesterol levels than placebo.
In January 2008, the sponsor disseminated a press release reporting the results of the ENHANCE
trial. In the 2-year trial that randomized 720 patients, ezetimibe plus simvastatin was associated
with a more pronounced reduction in LDL cholesterol levels than simvastatin alone. For the primary
end point of change in mean carotid intima media thickness (IMT) measured at 3 sites, there was no
significant difference (P=.29). Indeed, progression of carotid IMT was slightly but not significantly
more rapid among patients randomized to ezetimibe plus Simvastatin.
As a measure of subclinical disease, carotid IMT, like lipid levels, is a surrogate end point.
Biologically, measures of subclinical atherosclerosis are “closer” than lipid levels to measures of
health benefits such as cardiovascular events. The scientific expectation is that the effects on lipids,
on atherosclerosis, and on cardiovascular events should generally move in the same direction. But
wall thickness is not the only determinant of risk, so it is theoretically possible that effects on IMT
and clinical events could differ.
129
Ezetimibe e torcetrapib
JAMA, March 26, 2008—Vol 299, No. 12
A large, long-term trial in high-risk patients with acute
coronary syndrome will eventually evaluate ezetimibe on
the primary end point of major cardiovascular events, but
this trial was started in January 2006, and the estimated
completion date will not be until January 2011.
…. sales of ezetimibe or the combination reached $5 billion
in 2007.
130
Ezetimibe e torcetrapib
JAMA, March 26, 2008—Vol 299, No. 12
Although LDL levels rather than HDL levels have been the traditional targets of lipid-alerting
therapies,1 new drugs targeting HDL such as torcetrapib, an inhibitor of cholesteryl ester transfer
protein, have been under development.
1. In two 8-week studies of 162 and 174 patients with below-average HDL cholesterol levels,
torcetrapib dose was directly and strongly related to increases in HDL cholesterol levels
2.
Torcetrapib was also evaluated in several phase 3 trials of atherosclerosis progression. Despite
large differences in HDL cholesterol levels between patients treated with torcetrapib and placebo,
progression of coronary atherosclerosis and carotid atherosclerosis did not differ between treatments
in moderate-sized trials that enrolled 752 to 1188 patients. In these trials, systolic blood pressure
was significantly higher in the groups that had received torcetrapib.
3.
In the ILLUMINATE trial,15 15 057 patients with high cardiovascular risk were randomized to
receive torcetrapib plus atorvastatin or atorvastatin alone. After a median follow-up of 550 days, the
trial was stopped early because of an increase in the risk of the primary end point, major
cardiovascular events (hazard ratio, 1.25; 95% confidence interval, 1.09-1.44), and because of an
increase in total mortality (hazard ratio, 1.58; 95% confidence interval, 1.14-2.19).
4.
Torcetrapib was never approved.
131
rogramma
Statistica descrittiva
Statistica inferenziale e test d’ipotesi
Dimensione campionaria
Classificazione degli studi primari
Studi secondari: revisioni sistematiche e meta-analisi
Definizione di outcome
Misure di rischio
132
A comparison of sucralfate and ranitidine for the prevention of upper
gastrointestinal bleeding in patients requiring mechanical ventilation. Canadian
Critical Care Trials Group.
Cook D, et al.
N Engl J Med 1998;338:791
BACKGROUND: Critically ill patients who require mechanical ventilation are at increased risk for
gastrointestinal bleeding from stress ulcers. There are conflicting data on the effect of histamine H2-receptor
antagonists and the cytoprotective agent sucralfate on rates of gastrointestinal bleeding, ventilator-associated
pneumonia, and mortality.
METHODS: In a multicenter, randomized, blinded, placebo-controlled trial, we compared sucralfate with the
H2-receptor antagonist ranitidine for the prevention of upper gastrointestinal bleeding in 1200 patients who
required mechanical ventilation. Patients received either nasogastric sucralfate suspension (1 g every six hours)
and an intravenous placebo or intravenous ranitidine (50 mg every eight hours) and a nasogastric placebo.
RESULTS: The patients in the two groups had similar base-line characteristics. Clinically important
gastrointestinal bleeding developed in 10 of 596 (1.7 percent) of the patients receiving ranitidine, as compared
with 23 of 604 (3.8 percent) of those receiving sucralfate (relative risk, 0.44; 95 percent confidence interval,
0.21 to 0.92; P=0.02). In the ranitidine group, 114 of 596 patients (19.1 percent) had ventilator-associated
pneumonia, as compared with 98 of 604 (16.2 percent) in the sucralfate group (relative risk, 1.18; 95 percent
confidence interval, 0.92 to 1.51; P=0.19). There was no significant difference between the groups in mortality
in the intensive care unit (ICU) (23.5 percent in the ranitidine group and 22.9 percent in the sucralfate group) or
the duration of the stay in the ICU (median, nine days in both groups).
CONCLUSIONS: Among critically ill patients requiring mechanical ventilation, those receiving ranitidine had
a significantly lower rate of clinically important gastrointestinal bleeding than those treated with sucralfate.
There were no significant differences in the rates of ventilator-associated pneumonia, the duration of the stay in
the ICU, or mortality.
133
EBM
Rischio e rischio relativo (RR)
• Il rischio che un evento accada é dato semplicemente dal numero di
coloro che hanno l’evento diviso per il numero totale di persone a rischio di
avere quell’evento
• Il rischio relativo, o risk ratio, è il rapporto tra 2 rischi
Sanguinamento GI
Yes
No
ranit
10
586 596
sucral
23
581 604
33
1167 1200
Rischio ranit = 10:596 = 0,017
Rischio sucral = 23:604 = 0,038
Rischio ranit: Rischio sucral (RR)= 0,44
Rischio sucral: Rischio ranit (RR)= 2,27
Il rischio di sanguinamento nei pazienti che ricevono ranitidina è meno della metà
(0,44) rispetto a quelli che ricevono sucralfato
Detto in altro modo:
Il rischio è più che doppio (2,27) in quelli che ricevono sucralfato
134
EBM
Odds e odds ratio (OR)
• L’odds di un evento é dato semplicemente dal numero di coloro che
hanno l’evento diviso per il numero di coloro che non ce l’hanno. E’
espresso da un numero che va da 0 (l’evento non accadrà mai) all’infinito
(l’evento accadrà per certo).
•
L’odds ratio (OR) è il rapporto tra 2 odds.
Sanguinamento GI
Yes
No
ranit
10
586 596
sucral
23
581 604
33
1167 1200
Odds ranit = 10:586 = 0,017
Odds sucral = 23:581 = 0,040
Odds ranit: Odds sucral (OR)= 0,43
Odds sucral:Odds ranit(OR)= 2,32
135
Rischio Relativo o Odds Ratio?
EBM
Egger: BMJ, Volume
315(7121).December 6,
1997.1533-1537
• L’OR ha valore simile al RR quando l’outcome é relativamente raro
(<20%). Più frequente é l’outcome, più l’OR sovrastima il RR.
• Il RR non può essere direttamente calcolato in uno studio caso
controllo, poichè il rapporto tra soggetti affetti/non affetti dalla malattia è
fissato dal ricercatore  non riflette il rischio di malattia in popolazione
136
EBM
Rischio Relativo e Odds Ratio
Sanguinamento GI
Yes
No
ranit
10
586 596
sucral
23
581 604
33
1167 1200
Rischio Relativo
Rischio ranit = 10:596 = 0,017
Rischio sucral = 23:604 = 0,038
Rischio ranit: Rischio sucral (RR)= 0,44
Rischio sucral: Rischio ranit (RR)= 2,27
Odds Ratio
Odds ranit = 10:586 = 0,017
Odds sucral = 23:581 = 0,040
Odds ranit: Odds sucral (OR)= 0,43
Odds sucral:Odds ranit(OR)= 2,32
137
The Third National Health and Nutrition Examination survey was conducted in the USA in
the 1990s to examine the relationship between obesity and depression. The authors
investigated the association between major depression and body mass index (BMI) for males
and females. (American Journal of Epidemiology. 2003; 158:1139-1147)
BMI Category, kg/m2
Unadjusted Odds Ratio
95% Confidence Interval
What is the correct interpretation of the
overweight values of 0.86?
Normal weight
(BMI 18.5-24.9)
1.00
Underweight
(BMI <18.5)
1.17
0.49-2.80
Overweight
(BMI 25.0-29.9)
0.86
0.53-1.41
Obese
(BMI > 30)
1.88
1.02-3.46
Class 1
(BMI 30-34.9)
1.28
0.64-2.56
c. An overweight individual has a 0.86 probability of
having major depression.
Class 2
(BMI 35-39.9)
1.76
0.78-3.95
d. An overweight individual has a 0.86 odds of
having major depression.
Class 3
(BMI > 40)
4.98
2.07-11.99
a. Overweight individuals’ odds of having major
depression are 14% lower than the odds of having
major depression for individuals with normal
weight.
b. Overweight individuals’ odds of having major
depression are 14% higher than the odds of having
major depression for individuals with normal
weight
TABLE. Unadjusted Odds Ratios of Major Depression During
the Past Month
138
EBM
NNT, Number needed to treat
E’ il numero di pazienti che deve essere trattato per ottenere un
evento. Viene calcolato come il reciproco della riduzione del
rischio assoluto.
Sanguinamento GI
Yes
No
ranit
10
586 596
sucral
23
581 604
33
1167 1200
Rischio sucral = 0,038
Rischio ranit = 0,017
Riduzione del rischio assoluto = 0,038-0,017 = 0,021
NNT = 1/0,021 NNT = 47
Occorre trattare 47 pazienti con la ranitidina per evitare un sanguinamento
gastro-intestinale (evento)
139
EBM
NNH, number needed to harm
“Il rischio di tromboembolia nelle donne che usano contraccettivi orali che
contengono desogestrel e gestodene é doppio rispetto a quello nelle donne
che usano contraccettivi orali senza desogestrel e gestodene .”
RR= 2 (95% C.I. 1.1 to 3.7)
Tromboembolia
Pillola
Si
No
Rischio A = 0,03%
Si
39
132000 132039
No
20
136000 136020
Rischio B = 0,01%
59
268000 268059
RR=2
Aumento del rischio assoluto = 0,03% - 0,01% = 0,02%
NNH = 1/0,01
NNH = 6700 (95% C.I. 3600 -54000)
140
EBM
NNH, Number needed to harm
Dire ad una donna che ha un rischio tromboembolico raddoppiato perché prende un certo tipo di
pillola non é lo stesso che dire:
“Sì, c’é un rischio, ma è compreso tra 1 a 3.600 e 1 a 54.000.”
Per confronto, la probabilità di essere uccisi in
automobile in Gran Bretagna é di 1 a 16.000.
McQuay H, et al. Ann Int Med 1998; 128:72
141
EBM
Ignaz Philipp Semmelweis (1818-1865)
n ipotetico trial clinico randomizzato
Morte per sepsi puerperale
Si
No
Handwashing Sì
42
3458 3500 Rischio HW-sì = 0,012
Handwashing No
620
2880 3500 Rischio HW-no = 0,177
662
6338 7000
Rischio relativo (RR)= 0,177:0,012 = 14,76 (95% C.I. 10,84-20,11)
Riduzione del rischio assoluto = 0,177-0,012 = 0,165
NNT = 1/0,165 NNT = 6
142
http://www.pensiero.it/catalogo/scheda.asp?IDPubblicazione=543
143
Scarica

Dimensione campionaria - Area-c54