Brescia 11-12 Aprile 2008 orso di Evidence-based Medicine Azienda Spedali Civili di Brescia Nicola Latronico Cosetta Minelli Dipartimento di Anestesia, Rianimazione e Medicina Perioperatoria SSVD Neuroanestesia & Neurorianimazione Università di Brescia, Spedali Civili Respiratory Epidemiology & Public Health Group National Heart and Lung Institute at Imperial College London Brescia, Italia London, England 1 rogramma Statistica descrittiva Statistica inferenziale e test d’ipotesi Dimensione campionaria Classificazione degli studi primari Studi secondari: revisioni sistematiche e meta-analisi Definizione di outcome Misure di rischio 2 EBM La statistica descrittiva Comprende tutte le analisi condotte su un determinato gruppo di osservazioni (persone, oggetti, eventi, etc) a fine puramente descrittivo: ci limitiamo a descrivere in modo sintetico ciò che osserviamo. Un esempio: il report di fine anno di un reparto (n. di ricoveri, durata della degenza, mortalità, etc.) . POPOLAZIONE oggetto di studio: tutti i pazienti ricoverati in quel reparto durante l’anno. VARIABILI oggetto do studio: n. di ricoveri, durata della degenza, mortalità, etc. Definizione di VARIABILE: Caratteristica tipica di un fenomeno (essere vivente, oggetto, evento, etc) che può manifestarsi in modo diverso. 3 EBM I 3 tipi di variabile Operatori possibili A Variabilità Qualitativa 1 Qualitativa p.d. = moda distribuzione di frequenza 2 Ordinale > < mediana range, percentili Operatori possibili B Tendenza centrale Quantitativa + - x ¸ ecc. Tendenza centrale media Variabilità varianza, deviazione standard Bertolini G, Nardi D. Statistica applicata alla ricerca educativa. Guerini Studio. 1998. Milano Variabile qualitativa propriamente detta (p.d.): es. sesso Variabile ordinale: es. Glasgow Coma Scale Variabile quantitativa: es. peso 4 EBM Misure di TENDENZA CENTRALE Definizione: Indicatori statistici che forniscono una rappresentatività sintetica dell’intero gruppo di osservazione. • MODA (variabili qualitative) : categoria della variabile più frequente nel gruppo di osservazioni. • MEDIANA (variabili ordinali) : categoria di mezzo della variabile ordinata in modo crescente o decrescente. • MEDIA (variabili quantitative) : = xi n 5 EBM Misure di VARIABILITA’ Definizione: Indicatori statistici che forniscono una misura del grado di variabilità delle osservazioni rispetto al fenomeno osservato. DISTRIBUZIONE DI FREQUENZA (variabili qualitative): numero di categorie e numerosità (assoluta e relativa) all’interno di ciascuna categoria. Viene rappresentata da una tabella o grafico. 6 EBM Misure di VARIABILITA’ RANGE e PERCENTILI (variabili ordinali) : • RANGE: semplice = valori minimo e massimo osservati; interquartile = intervallo di valori che stanno tra il 1 e il 3 quartile (25° e 75° percentile) • PERCENTILE: valore sotto il quale si trova una certa percentuale di popolazione • VARIANZA e DEVIAZIONE STANDARD (variabili quantitative) : • VARIANZA = (xi - )2 n • (xi - ) 2 DEVIAZIONE STANDARD = n 7 Glasgow Coma Scale EBM VARIABILE A. B. C. D. E. Discreta Continua Ordinale Nominale Dicotomica Teasdale G, Jennett B. Lancet 1974; i: 81-84 8 Indice di Apgar 0 1 2 Frequenza cardiaca Assente <100 bpm >100 bpm Respiro Assente Bradipnea irregolare Pianto valido Tono muscolare Ipotonia Modica flessione delle estremità Movimenti attivi Risposta riflessa all’introduzione del catetere nel naso Nessuna risposta Smorfie Tosse, starnuto Colore Pallido, cianotico Tronco eritrosico, estremità cianotiche Completamen te eritrosico Virginia Apgar 1909-1974 Columbia University Anesthesiologist VARIABILE A. B. C. D. E. Discreta Continua Ordinale Nominale Dicotomica 9 TIPO DI PARTO taglio cesareo naturale indotto 1D VARIABILE 2C A. B. C. D. E. Discreta Continua Ordinale Nominale Dicotomica 3B 10 Neurosurgery 2001; 49:864–871 HDM/CDM= GCS= MAP= PaCO2= PaO2= Hgb= Midline shift= CBC= UPW= BPW= high-, conventional-dose mannitol. postresuscitation Glasgow Coma Scale mean arterial pressure arterial carbon dioxide tension arterial oxygen tension total hemoglobin content shift of midline structures on brain CT compromised basilar cisterns unilateral pupillary widening bilateral pupillary widening. No statistically significant differences were observed. 11 rogramma Statistica descrittiva Statistica inferenziale e test d’ipotesi Dimensione campionaria Classificazione degli studi primari Studi secondari: revisioni sistematiche e meta-analisi Definizione di outcome Misure di rischio 12 EBM La statistica inferenziale La STIMA di un parametro in POPOLAZIONE Mentre il parametro di interesse viene misurato nel campione studiato, questo può solo essere stimato in popolazione, a partire dal valore ottenuto nel nostro campione. Come? Identificando un intervallo di valori possibili attorno al valore del parametro trovato nel campione (intervallo di confidenza). La “confidenza” che l’intervallo davvero contenga il valore vero in popolazione è definita da un valore convenzionalmente fissato a 95 o 99% (possibilità di errore rispettivamente del 5 o 1%). L’intervallo sarà tanto più stretto quanto più grande è il campione 13 EBM p<0.05 IL TEST DI IPOTESI E’ la parte della statistica che valuta il grado di significatività di una differenza osservata fra due gruppi (es: pts trattati con un farmaco vs non trattati; rischio della malattia in maschi/femmine). La statistica procede a valutare un’ipotesi contraria rispetto a quanto normalmente atteso, e cioè valuta l’ipotesi che tra i due gruppi a confronto NON vi sia differenza statisticamente significativa (ipotesi nulla). La statistica mette a disposizione diversi tipi di test d’ipotesi a seconda del tipo di variabile del parametro di interesse (es.: misura di outcome della malattia in oggetto) Cos’è la “p”? Definizione: La p è la probabilità di ottenere per il puro effetto del caso i dati che abbiamo osservato (o dati ancora più estremi) quando l’ipotesi nulla è vera. 14 EBM P<0.05 e 95% C.I. Significato della significatività statistica • Un test "significativo" dimostra la presenza di differenza e la direzione di questa, ma non può dirci di che entità • Un test "non significativo" non dimostra l'assenza di differenza • La p va valutata in base al suo valore (non solo come < o > di 0.5!) • Significatività statistica non significa rilevanza conoscitiva • La significatività statistica non permette di stabilire alcun rapporto causale 15 EBM Intervallo di confidenza L’intervallo di confidenza può essere calcolato per qualsiasi stima. Nel caso di un rapporto la soglia per un effetto significativo è 1, negli altri casi è 0. Il rischio di SGI in pazienti in condizioni critiche trattati con sucralfato è 3,8% (Rsu); in quelli trattati con ranitidina (Rran) è 1,7%; il rischio relativo R.R. (Rsu/Rran) è: R.R. 2.27 (95% C.I. 1.09-4.73) R.R. 2.27 (95% C.I. 1.00-4.01) R.R. 2.27 (95% C.I. 0.50-9.34) 16 Data Synthesis: 9 studies (n= 19 958) were included. significant During anticoagulant prophylaxis, patients had xxxxxxxxxxxxx reductions in any PE (relative risk, 0.43 [CI, 0.26 to 0.71]) and fatal PE (relative risk, 0.38 [CI, 0.21 to 0.69]), non significant reduction in symptomatic deep venous xxxxxxxxxxxxx thrombosis (relative risk, 0.47 [CI, 0.22 to 1.00]), significant increase in major bleeding (relative risk, and a non xxxxxxxxxxxxx 1.32 [CI, 0.73 to 2.37]). no effect on all-cause mortality Anticoagulant prophylaxis had xxxxxxxx (relative risk, 0.97 [CI, 0.79 to 1.19]). Ann Intern Med. 2007;146:278-2 17 EBM Test parametrici e non parametrici Test parametrici Sono molto potenti, ma si possono usare soltanto: quando il parametro di interesse è una variabile quantitativa; quando sono soddisfatte due assunzioni : distribuzione normale del parametro in popolazione; omoscedasticità (cioè uguale varianza nei due gruppi a confronto). Test non parametrici Sono meno potenti, ma si possono usare sempre, cioè con tutti i tipi di variabile. Non richiedono alcuna assunzione. Nel caso di variabili quantitative, sono da utilizzare soltanto quando sia impossibile utilizzare i test parametrici (assunzioni non soddisfatte). 18 EBM Test per dati appaiati e non appaiati Campioni “non appaiati” (o indipendenti) I 2 gruppi a confronto sono costituiti da soggetti diversi Campioni “appaiati” (o dipendenti) I 2 gruppi a confronto sono costituiti dagli stessi soggetti (valutazioni ripetute sugli stessi soggetti). Sono più potenti a parità di numerosità campionaria 19 EBM Test a 1 o 2 code Test a 2 code Quando l’ipotesi nulla può essere falsa in tutte e 2 le direzioni Test a 1 coda L’ipotesi nulla è vera soltanto in una direzione. Tale situazione è molto rara! 20 EBM I diversi tipi di Test Quadro generale TIPO DI CAMPIONE TIPO DI VARIABILE Variabili qualitative p.d. Variabili ordinali Variabili quantitative Test parametrici: t di Student 2 sample or unpaired Campioni non appaiati (o indipendenti) Test non parametrico: Chi-quadrato di Pearson Test non parametrico: U di Mann-Whitney (per il confronto di 2 campioni) ANOVA (per il confronto di più campioni) Test non parametrico: U di Mann-Whitney Test parametrici: t di Student one sample or paired Campioni Appaiati (o dipendenti) Test non parametrico: Chi-quadrato di McNemar (per il confronto di 2 campioni) Test non parametrico: Test dei segni ANOVA per misure ripetute (per il confronto di più campioni) Test non parametrico: Test di Wilcoxon 21 Objective: Evaluation of selective decontamination of the digestive tract (SDD) on late mortality in ventilated trauma patients. Methods: A multicenter, randomized controlled trial in 401 severe trauma patients. Patients were randomized to control (n = 200) or SDD (n = 201). Primary endpoint was late mortality excluding early death from hemorrhage or craniocerebral injury. Secondary endpoints were infection and organ dysfunction. Results: Late mortality was 15.3% (57/372) as 29 patients died from cerebral injury, 16 SDD and 13 control. 22 Late death Yes No SDD 26 159 185 Control 31 156 187 57 315 372 Quadro generale TIPO DI CAMPIONE TIPO DI VARIABILE Variabili qualitative p.d. Variabili ordinali Variabili quantitative Test parametrici: t di Student Risk A = 14.1% Risk B = 16.6% Absolute risk reduction = 2.5% 2 sample or unpaired Campioni non appaiati (o indipendenti) Test non parametrico: Chi-quadrato di Pearson Test non parametrico: U di Mann-Whitney (per il confronto di 2 campioni) ANOVA (per il confronto di più campioni) Test non parametrico: U di Mann-Whitney Test parametrici: Quale test? t di Student one sample or paired Campioni Appaiati (o dipendenti) Test non parametrico: Chi-quadrato di McNemar (per il confronto di 2 campioni) Test non parametrico: Test dei segni ANOVA per misure ripetute (per il confronto di più campioni) Test non parametrico: Test di Wilcoxon 23 Stoutenbeek CP, et al. Intensive Care Med 2007; 33:261-270 Quadro generale TIPO DI CAMPIONE TIPO DI VARIABILE Variabili qualitative p.d. Variabili ordinali Variabili quantitative Test parametrici: t di Student 2 sample or unpaired Campioni non appaiati (o indipendenti) Test non parametrico: Chi-quadrato di Pearson Test non parametrico: U di Mann-Whitney (per il confronto di 2 campioni) ANOVA (per il confronto di più campioni) Test non parametrico: U di Mann-Whitney Test parametrici: t di Student one sample or paired Campioni Appaiati (o dipendenti) Test non parametrico: Chi-quadrato di McNemar (per il confronto di 2 campioni) Test non parametrico: Test dei segni ANOVA per misure ripetute (per il confronto di più campioni) Test non parametrico: Test di Wilcoxon 24 rogramma Statistica descrittiva Statistica inferenziale e test d’ipotesi Dimensione campionaria Classificazione degli studi primari Studi secondari: revisioni sistematiche e meta-analisi Definizione di outcome Misure di rischio 25 EBM Dimensione campionaria Perché stimare a priori la dimensione del campione da studiare? Nell’analisi dei risultati di uno studio, la dimensione campionaria è il fattore che maggiormente influenza il potere di un test statistico, cioè la capacità del test di evidenziare come “statisticamente significativa” una differenza realmente esistente tra i gruppi di trattamento. Tanto più grande la dimensione del campione, tanto maggiore il potere del test. La letteratura medica contiene molti esempi di trial troppo piccoli per poter avere buona probabilità di evidenziare (come “statisticamente significative”) differenze clinicamente rilevanti tra i gruppi di trattamento studiati. In altre parole: la “negatività” dei loro risultati potrebbe essere legata esclusivamente all’inadeguatezza della dimensione campionaria e non alla mancanza di effetto del trattamento oggetto di studio. Questo problema viene risolto con il calcolo statistico eseguito a priori (cioè nella fase di progettazione di un clinical trial) della dimensione del campione appropriata per lo studio. 26 EBM Dimensione campionaria Come si calcola la dimensione campionaria Il calcolo della dimensione campionaria può essere complesso e richiedere l’assistenza di uno statistico. Per ogni situazione vi sono a disposizione formule (spesso complesse), estese tabelle, e metodi grafici più semplici (nomogrammi). Il calcolo della dimensione campionaria varia a seconda di: • tipo di dati da analizzare (es.: dati continui, dati categorici) • tipo di campioni (indipendenti o dipendenti), e quindi di disegno dello studio (a gruppi paralleli o cross-over) • numero dei gruppi di trattamento da confrontare • situazioni particolari, quali: tempo di sopravvivenza come outcome principale di interesse 27 EBM Dimensione campionaria Quali sono i fattori che entrano nel calcolo la dimensione campionaria? Indipendentemente da quale sia la formula adatta al disegno di studio e al tipo di dati di interesse, per calcolare la dimensione campionaria è necessario specificare il valore di 3 fattori: • Il potere del test che si desidera ottenere (è consigliabile mirare a un potere del test compreso tra l’80% e il 90%). • la differenza minima tra i trattamenti che sia “clinicamente rilevante”. E’ il fattore più difficile da specificare. Può essere espresso in generale come il grado di beneficio che il nuovo trattamento dovrebbe fornire rispetto a quello vecchio perché valga la pena di utilizzarlo. • il valore di “alfa” (= errore di primo tipo) che si vuole accettare, cioè la probabilità di ottenere una differenza “statisticamente significativa” quando di fatto differenza non c’è. 28 Dimensione campionaria EBM In conclusione……. Il fine ultimo del calcolo della dimensione campionaria è quello di: • avere un’alta probabilità di evidenziare, come “statisticamente significativo”, un effetto definito come rilevante, se questo esiste; • essere ragionevolmente sicuri che non esista un beneficio del genere se non riscontrato nel trial. (maggiore la dimensione campionaria maggiore il potere dello studio maggiore la nostra confidenza in quanto sopra) 29 EBM Errore alfa e beta Errore alfa Definizione: E’ l’errore che commettiamo dicendo che un risultato è significativo quando invece non lo è. L’errore alfa che siamo disposti ad accettare corrisponde al limite che fissiamo per la significatività della p: 5 o 1%, a seconda che decidiamo di essere più o meno conservativi. Errore beta Definizione: E’ l’errore che commettiamo dicendo che un risultato non è significativo quando invece lo è. Corrisponde a 1-potere dello studio ed è espresso in percentuale (es.: potere dello studio=85%; errore beta=15%) 30 Late death Yes No SDD 26 159 185 Control 31 156 187 57 315 372 Risk A = 14.1% Risk B = 16.6% Absolute risk reduction = 2.5% 31 Calcolo della dimensione campionaria UN ESEMPIO EBM INTERVENTO: SDD per ridurre la mortalità nei traumi gravi BRACCI DI TRATTAMENTO: • braccio A - sperimentale: SDD • braccio B - intervento standard: placebo OUTCOME: late mortality I determinanti per il calcolo della dimensione campionaria: • differenza attesa di efficacia tra i due trattamenti • potere desiderato dello studio • livello soglia per la significatività statistica 32 Calcolo della dimensione campionaria: i determinanti per il calcolo EBM efficacia attesa dei due trattamenti • efficacia attesa trattamento B - standard: outcome positivo 80% (p1=0.80) • efficacia attesa trattamento A - sperimentale: outcome positivo 85% (p2=0.85) Potere dello studio desiderato = 80% Livello soglia di significatività statistica = Mortalità 20% 5% Mortalità 15% 33 Calcolo della dimensione campionaria: l’uso del nomogramma EBM Calcolo della differenza standardizzata D = p2 - p1 0.85 - 0.80 = 0.132 = p (1 - p) dove : p = ( p2 + p1 ) / 2 0.825 (1 - 0.825) = 0.85 + 0.80 / 2 = 0.825 Potere dello studio desiderato = 80% Livello soglia di significatività statistica = 5% 34 EBM http://biostat.mc.vanderbilt.edu/twiki/bin/view/Main/PowerSampleSize RISULTATO: n = 1800 pazienti (900 per braccio) 35 rogramma Statistica descrittiva Statistica inferenziale e test d’ipotesi Dimensione campionaria Classificazione degli studi primari Studi secondari: revisioni sistematiche e meta-analisi Definizione di outcome Misure di rischio 36 EBM Ignaz Philipp Semmelweis (1818-1865) Parte I Egli notò che la febbre puerperale era più comune nel reparto di maternità dove medici e studenti di medicina assistevano le donne per il parto (Divisione A) rispetto al reparto dove ad assistere erano le ostetriche (Divisione B). La mortalità periparto della Divisione A era del 18%, mentre quella della Divisione B era del 3%. A quel tempo la teoria prevalente per spiegare tale fenomeno era quella dei miasmi (aria cattiva) in combinazione con le lenzuola 37 sporche, il basso stato sociale ed influenze climatiche. EBM Ignaz Philipp Semmelweis (1818-1865) Morte per sepsi puerperale Si No Reparto A 620 2880 3500 Reparto B 100 3400 3500 720 6280 7000 38 EBM Ignaz Philipp Semmelweis (1818-1865) Parte I ienna 1846: Mentre la febbre puerperale imperversava con violenza dentro gli ospedali, fuori, nella città di Vienna, non si riscontrava tale epidemia. Le madri che partorivano in casa avevano un rischio di mortalità molto basso, e tra le madri che partorivano senza assistenza non si riscontrava alcuna mortalità. La mortalità non era in alcun modo collegata alle variazioni climatiche. Maggiore era la lesione della cervice e dell’utero, maggiori le probabilità che la madre sviluppasse la febbre puerperale. La chiusura del reparto arrestava sempre la mortalità per un periodo.39 EBM Ignaz Philipp Semmelweis (1818-1865) ienna 1846: Parte I Da tali osservazioni, Semmelweis comprese che la causa non poteva essere attribuita né a epidemie né a miasmi, ma doveva trovarsi in un qualche fattore inspiegato esistente nella I Divisione, ma non nella II Divisione. 40 EBM Ignaz Philipp Semmelweis (1818-1865) ienna 1846: Jakob Kolletschka, un giovane docente di medicina forense, subì un’accidentale lacerazione durante un’autopsia e morì rapidamente per infezione. Parte I Studenti e maestri sezionavano parecchi cadaveri al giorno (ovviamente non refrigerati) e si lavavano in modo approssimativo. 41 EBM Ignaz Philipp Semmelweis (1818-1865) Parte I emmelweis comprese che dovevano esser presenti 3 fattori: la fonte di materia putrefatta; un mezzo per trasportare fisicamente tale materia dalla fonte alla vittima che doveva venirvi in stretto contatto; una superficie ferita, come la parete spoglia di un utero post partum o di un dito ferito. 42 EBM Ignaz Philipp Semmelweis (1818-1865) ienna 15 Maggio 1847: Parte II Semmelweis ordinò che tutti i medici e gli studenti si lavassero le mani con una soluzione di cloro al 4% finché la pelle non fosse scivolosa e l’odore di cadavere sparito. Il tasso di mortalità per febbre puerperale alla fine del 1° anno intero di profilassi fu dell’1,2% nella I Divisione e del 3% nella II Divisione 43 EBM Ignaz Philipp Semmelweis (1818-1865) Morte per sepsi puerperale Si No Reparto A 620 2880 3500 Reparto B 100 3400 3500 720 6280 7000 Morte per sepsi puerperale Si No Reparto A 42 3458 3500 Reparto B 100 3400 3500 142 6858 7000 44 EBM Ignaz Philipp Semmelweis (1818-1865) Parte III Il mondo medico viennese non solo non riconosce come plausibili le spiegazioni fornite per spiegare la riduzione del tasso di mortalità, che viene invece attribuito a variazioni della composizione dei miasmi, ma addirittura isola Semmelweis e lo deride. Di conseguenza si oppone con forza all’implementazione del nuovo metodo. Semmelweis, per contro, si rifiuta di pubblicare una spiegazione logica dei suoi risultati e si rifiuta anche di dimostrare la sua teoria in esperimenti animali. Noto per il suo pessimo carattere entra in aperto dissenso con l’establishment medico viennese apostrofando i suoi colleghi come assassini. 45 EBM Ignaz Philipp Semmelweis (1818-1865) Licenziato, torna nella natia Ungheria, dove nel 1854 diventa professore ordinario di ginecologia all’Università di Pest. Parte III A Pest egli istituisce il suo metodo in 2 altri Ospedali, riducendo la mortalità dal 10% a meno dell’1%. Nel 1861 pubblica il suo trattato sulle febbri puerperali “Die Aetiologie der Begriff mid die Prophylaxis des Kindbettfiebers”. MUORE a 47 anni in manicomio 46 EBM omande Che tipo di studio fu quello realizzato da Semmelweis nella I parte? Che tipo di studio fu quello realizzato da Semmelweis nella II parte? Come avrebbe potuto migliorare le prove di efficacia del trattamento antisettico? Come avrebbe potuto migliorarne l’adozione? 47 EBM Della carne e del macellaio Lo studio L’analisi 48 L’articolo EBM Gerarchia degli studi (1) Review sistematica e Meta-analisi (2) Trial clinico randomizzato (3) Trial clinico non randomizzato (4) Studio osservazionale con gruppo di controllo studio di coorte caso-controllo survey (5) Studio descrittivo (6) Case report (7) Opinione dell’esperto Modificato da: United States Department of Health and Human Services. Agency for Health Care Policy and Research. Acute pain management: operative or medical procedures and trauma. Rockville, MD: AHCPR, 1993:107. (Clinical practice guideline No 1, AHCPR publication No 92.0023.) 49 50 (1) Review sistematica e Meta-analisi ????????????????????????????????????????????????????????????????????????? (2) Trial clinico randomizzato (3) Trial clinico non randomizzato (4) Studio osservazionale con gruppo di controllo studio di coorte ?????????????????????????? caso-controllo survey (5) Studio descrittivo (6) Case report (7) Opinione dell’esperto ?????????? ?????????????????????????????????????????????????????????????? Lancet 2006; 367: 413–418 51 (1) Review sistematica e Meta-analisi ???????????????????????????????????????????????? (2) Trial clinico randomizzato (3) Trial clinico non randomizzato (4) Studio osservazionale con gruppo di controllo studio di coorte ????????????????????????????????????????? caso-controllo survey (5) Studio descrittivo (6) Case report (7) Opinione dell’esperto Lancet 2007; 369: 920–26 52 ?????????????????????????????????????????????????????? Am J Respir Crit Care Med 2007; 176: 886–891 The U.K. blood system has nearly eliminated female donors from the production of high plasma volume products (FFP). ???????????????????????? The first reports suggest a significant decrease in TRALI reactions reported to the national transfusion surveillance system (SHOT [serious hazards of transfusion]). (1) Review sistematica e Meta-analisi (2) Trial clinico randomizzato (3) Trial clinico non randomizzato (4) Studio osservazionale con gruppo di controllo studio di coorte caso-controllo survey (5) Studio descrittivo (6) Case report (7) Opinione dell’esperto 53 BACKGROUND: Large intervention studies suggest that aspirin may reduce mortality when given to patients who present with strokes or transient ischemic attacks. We sought to determine whether patients who were already using aspirin at the time of an ischemic stroke had a lower mortality than those who were not. METHODS: A prospective study was undertaken in 1,457 patients with acute ischemic stroke, 650 (45%) of whom were using aspirin prior to the stroke. Mortality was measured 4 weeks after the initial episode. RESULTS: Prior use of aspirin was associated with lower 4-week mortality (14% versus 20%, P <0.01). The effect of prior aspirin use on mortality was independent of age, gender, other risk factors, and use of other medication. CONCLUSIONS: Prior use of low-dose aspirin may be associated with a small but significant reduction in stroke mortality. (1) Review sistematica e Meta-analisi (2) Trial clinico randomizzato (3) Trial clinico non randomizzato (4) Studio osservazionale con gruppo di controllo studio di coorte caso-controllo survey (5) Studio descrittivo (6) Case report (7) Opinione dell’esperto Kalra L, et al. Does prior use of aspirin affect outcome in ischemic stroke? Am J Med 2000; 108:205 54 EBM Ignaz Philipp Semmelweis (1818-1865) BACKGROUND: La sepsi puerperale ha un’elevata incidenza nelle donne che partoriscono nell’Ospedale di Vienna, ma non nelle donne che partoriscono a casa. METHODS: Ho riguardato tutti i documenti di donne che sviluppano sepsi e di quelle che non la sviluppano; ho anche parlato con il personale dell’Ospedale per cercare di scoprire possibili cause. RESULTS: Ho scoperto che la maggior parte delle sepsi avviene nella I Divisione, dove ad assistere le gravide sono medici e studenti. Questi eseguono tutti i giorni numerose autopsie e non si lavano le mani al termine. Questo non succede nella II Divisione dove sono le ostetriche ad assistere le gravide. CONCLUSIONS: Medici e studenti trasferiscono materiale cadaverico letale dalla sala autoptica nel canale vaginale delle gravide. (1) Review sistematica e Meta-analisi (2) Trial clinico randomizzato (3) Trial clinico non randomizzato (4) Studio osservazionale con gruppo di controllo studio di coorte caso-controllo survey (5) Studio descrittivo (6) Case report (7) Opinione dell’esperto Semmelweiss IP. Assassini. Wien Med J 1847 55 EBM Ignaz Philipp Semmelweis (1818-1865) BACKGROUND: Medici e studenti trasferiscono materiale cadaverico letale dalla sala autoptica nel canale vaginale delle gravide. La mortalità è molto alta. METHODS: Ho obbligato tutti i medici e gli studenti a lavarsi (disinfettarsi) le mani dopo l’autopsia e prima del parto. RESULTS: Il numero di sepsi puerperali è diminuito drasticamente dal 18,0% all’1,1% CONCLUSIONS: Coloro che non dovessero seguire il metodo da me indicato sono da considerarsi degli assassini (1) Review sistematica e Meta-analisi (2) Trial clinico randomizzato (3) Trial clinico non randomizzato (4) Studio osservazionale con gruppo di controllo studio di coorte caso-controllo survey (5) Studio descrittivo (6) Case report (7) Opinione dell’esperto Semmelweiss IP. Assassini2. Wien Med J 1848 56 (1) Review sistematica e Meta-analisi (2) Trial clinico randomizzato (3) Trial clinico non randomizzato (4) Studio osservazionale con gruppo di controllo studio di coorte caso-controllo survey (5) Studio descrittivo (6) Case report (7) Opinione dell’esperto 57 An early cohort in search of favourable outcomes David A Grimes, Kenneth F Schulz. Cohort studies: marching towards outcomes. Lancet 2002; 359: 341–45 58 EBM Gerarchia degli studi Lo studio di coorte E’ uno studio osservazionale in cui la popolazione oggetto di studio viene suddivisa in due (o più) gruppi sulla base del grado di esposizione ad un certo agente (fattore di rischio o trattamento), e seguita nel tempo per valutare quanti individui in ciascun gruppo sviluppano la malattia (o l’outcome di interesse). Lo studio è spesso prospettico, ma può essere anche retrospettivo . 59 Schematic diagram of concurrent, retrospective, and ambidirectional cohort studies David A Grimes, Kenneth F Schulz. Cohort studies: marching towards outcomes. Lancet 2002; 359: 341–45 60 EBM Gerarchia degli studi Lo studio caso-controllo E’ uno studio osservazionale in cui pazienti affetti da una malattia (casi) sono confrontati con un gruppo di controllo non affetto dalla malattia (controlli). Una volta selezionati in base alla presenza/assenza della malattia, i due gruppi vengono studiati per valutare il grado di esposizione a fattori di rischio. Lo studio è quasi sempre retrospettivo, ma potrebbe essere anche prospettico (dove prospettico è il reclutamento dei casi e/o controlli). E’ particolarmente adatto allo studio di condizioni patologiche relativamente rare . 61 Schematic diagram of case-control study design David A Grimes, Kenneth F Schulz. Case-control studies: research in reverse. Lancet 2002: 359: 431–34 62 Schematic diagram showing temporal direction of three study designs David A Grimes, Kenneth F Schulz. An overview of clinical research: the lay of the land. Lancet 2002; 359: 57–61 63 EBM Gerarchia degli studi La survey (o cross sectional survey) E’ uno studio condotto in un lasso di tempo molto breve su un campione rappresentativo della popolazione, con lo scopo di “fotografare” la situazione rispetto ad un quesito clinico specifico in un dato momento. Permette di rilevare soltanto misure di prevalenza di una malattia, mancando per definizione un periodo di osservazione (follow-up) (Esempio: interviste postali o telefoniche.) Lo studio viene condotto in un dato momento ma il quesito potrebbe riferirsi ad un evento del passato. 64 EBM Gerarchia degli studi Il Case report E’ lo studio che descrive il caso clinico di un singolo paziente sotto forma di storia. I singoli case report sono spesso uniti a formare un “case series” (viene raccontata la storia clinica di pochi pazienti). 65 Case report Sempre la cenerentola? 66 Branch retinal artery occlusion Lancet 2007; 370: 590 An 82-year-old lady presented with sudden, partial, painless visual loss in her right eye. Fundoscopy revealed a reddish macula, typical of retinal artery occlusion, and an embolus in a branch of the central retinal artery. On general examination, a bruit was heard over the right carotid artery. The commonest cause of retinal artery occlusion is thromboembolism. Treatment should be immediate, because if the occlusion lasts longer than about 1 h, the ischaemic part of the optic nerve will atrophy, causing permanent visual loss. There is no reliable treatment—but if the patient is seen within about 1 h of onset, pressure on the eyeball, firm enough to cause pain, with sudden release, can propel an embolus distally. (A) Ischaemic patch on the retina. (B) Close-up view of macula. (C) Fluorescein angiography, showing very little filling 67 distal to the embolus. Una bambina di 2 anni viene coinvolta in un incidente a bassa velocità. L’airbag si apre violentemente. Al momento dell’incidente era seduta nel posto di fianco al guidatore, senza cinture. Prima dell’arrivo dell’ambulanza è in coma e non respira più. Viene quindi rianimata sul luogo dell’incidente. A parte diverse abrasioni ed ustioni, non vi sono altri segni di danno all’esame clinico. La radiografia della colonna vertebrale cervicale mostra un distacco tra l’occipite e l’atlante (frecce) di 4 cm. All’esame TC si dimostrano emorragia cerebrale, edema cerebrale grave, ematoma intracranico. Inoltre il midollo spinale era probabilmente sezionato. La bambina morirà ore dopo. 68 Angel CA, Ehlers. N Engl J Med 345: 1256 October 25, 2001 Dal 1998 tutte le nuove auto (negli USA, NdR) sono equipaggiate con 2 air bags che si gonfiano in meno di 1/25 di secondo ad una velocità di 322 km/ora. I bambini sono particolarmente a rischio per lesioni della testa e del collo da air bag a causa di un rapporto testa/tronco più alto che nell’adulto e per varie altre ragioni. Il danno cervicale è causato da un’iperestensione violenta. Per prevenire tali danni i bambini con meno di 12 anni dovrebbero viaggiare solo dietro e con la cintura di sicurezza allacciata. 69 Valutare la qualità 70 Valutare la fattibilità BMJ 2003;327:1459–61 ……we feel assured that those who advocate evidence based medicine and criticise use of interventions that lack an evidence base will not hesitate to demonstrate their commitment by volunteering for a double blind, randomised, placebo controlled, crossover trial. 71 EBM Gerarchia degli studi Il trial clinico controllato randomizzato Disegno di studio relativamente giovane, introdotto nella ricerca medica circa 50 anni fa. Primo importante clinical trial nel 1948, con confronto tra streptomicina e riposo a letto per il trattamento della tubercolosi. E’ uno studio sperimentale sugli esseri umani disegnato per valutare l’efficacia di uno o più forme di trattamento (inteso in senso generale). Il campione di studio viene suddiviso in due (o più) gruppi: uno assegnato a ricevere l’intervento (o gli interventi) oggetto di studio, l’altro il trattamento di controllo (terapia standard o placebo). Il trial viene definito randomizzato quando l’assegnazione del trattamento (sperimentale e di controllo) ai due gruppi non viene decisa dal medico (o da altri) ma avviene in modo del tutto casuale. Il trial clinico controllato è il gold standard degli studi primari. 72 EBM Gerarchia degli studi RCT (Randomised Clinical Trial) L’idea chiave del clinical trial randomizzato è confrontare gruppi di pazienti che differiscono soltanto per il trattamento somministrato. Questo si ottiene grazie all’allocazione randomizzata (i.e. totalmente casuale) ad un trattamento o all’altro - tutti i pazienti reclutati nello studio hanno la stessa probabilità di ricevere un trattamento o l’altro. L’allocazione di un paziente ad un trattamento deve essere imprevedibile (allocation concealment) 73 EBM A cosa serve la randomizzazione ? Se la dimensione del campione è sufficientemente ampia, assicura, che i determinanti dell’outcome, sia quelli noti che quelli non noti, si distribuiscano a caso tra il gruppo di trattamento e quello di controllo. 74 EBM L’analisi secondo l’intention to treat CONSORT II A = stent coronarico B = by pass aorto-coronarico A 2000 B 1000 1000 70 100 955 875 75 In 2006, Arthur Amman, President of Global Strategies for HIV Prevention, made a disquieting remark: “I recently met a physician from southern Africa, engaged in perinatal HIV prevention, whose primary access to information was abstracts posted on the internet. Based on a single abstract, they had altered their perinatal HIV prevention program from an effective therapy to one with lesser efficacy. Had they read the full text article they would have undoubtedly realized that the study results were based on short-term follow-up, a small pivotal group, incomplete data, and unlikely to be applicable to their country situation. Their decision to alter treatment based solely on the abstract’s conclusions may have resulted in increased perinatal HIV transmission. 76 Lancet 2008; 371 (January 26):281-3 CONSORT for reporting randomised trials in journal and conference abstracts Hopewell S, Clarke M, Moher M, Wager E, Middleton P, Altman DG, Schulz KF, and the CONSORT Group Lancet 2008; 371 (January 26):281-3 Items to be included when reporting randomised trials in journal or conference abstracts 77 78 EBM Principio di incertezza Un paziente dovrebbe essere arruolato in un trial clinico randomizzato solo nel caso in cui vi sia sostanziale incertezza su quale sia il trattamento migliore. L’interesse che si protegge è quello futuro della popolazione dei pazienti. 79 Lancet 2002; 360: 1267 We remain cautious and critical of the conclusion of the ISAT trial, and believe that this study has not effectively answered the question of what is the preferred mode of therapy because of fundamental flaws in the study design…….. Of the 9559 patients who were eligible for inclusion, 78% were excluded. Only 9% of the patients refused to participate, and the remaining 69% were excluded by the treating physician. This is not true randomisation, nor does it represent an intention-to-treat randomised trial. Britz GW, Newell DW, West GA, Lam A. Lancet 2003; 361:431 In ISAT, the required clinical equipoise allowing randomisation did not exist in 80% of the 9278 patients with aneurysmal subarachnoid haemorrhage assessed for eligibility. 6352 patients were regarded as being better candidates for endovascular coiling (2737) or neurosurgical clipping (3615), precluding them from randomisation. Another 1064 were treated in some other unknown manner. Brown RD Jr, Nichols DA, FB Meyer. Lancet 2003; 361:433 80 Lancet 2002; 360: 1267 In patients with a ruptured intracranial aneurysm, for which endovascular coiling and neurosurgical clipping are therapeutic options, the outcome in terms of survival free of disability at 1 year is significantly better with endovascular coiling. 81 EBM L’analisi di sottogruppi N Engl J Med 2004;350:2247-56. Background We conducted a multicenter, randomized, double-blind trial to compare the effect of fluid resuscitation with albumin or saline on mortality in a heterogeneous population of patients in the ICU. Methods We randomly assigned patients who had been admitted to the ICU to receive either 4 percent albumin or normal saline for intravascular-fluid resuscitation during the next 28 days. The primary outcome measure was death from any cause during the 28-day period after randomization. Results Of the 6997 patients who underwent randomization, 3497 were assigned to receive albumin and 3500 to receive saline; the two groups had similar baseline characteristics. There were 726 deaths in the albumin group, as compared with 729 deaths in the saline group (relative risk of death, 0.99; 95 percent confidence interval, 0.91 to 1.09; P=0.87). Conclusions In patients in the ICU, use of either 4 percent albumin or normal saline for fluid resuscitation results in 82 similar outcomes at 28 days. N Engl J Med 2004;350:2247-56. The primary outcome measure was death from any cause during the 28-day period after randomization. Death from any cause within 28 days after randomization was also examined in 6 predefined subgroups according to: - the presence or absence of trauma, - the presence or absence of severe sepsis, - the presence or absence of the ARDS at baseline. 83 This difference in the relative risk of death was due to the greater number of patients with trauma and an associated brain injury. SAFE Study Investigators. A comparison of albumin and saline for fluid resuscitation in the ICU. N Engl J Med 2004;350:2247-56 84 Domandina Usiamo o no l’albumina nei traumi cranici gravi? 85 EBM L’analisi di sottogruppi Un sottogruppo appropriato è rappresentato da un gruppo di pazienti con caratteristiche di partenza comuni (baseline parameters); in altre parole i sottogruppi devono essere definiti all’inizio (at baseline) prima della randomizzazione. Yusuf S, JAMA 1991; 266: 93 Il risultato complessivo di un trial clinico randomizzato è usualmente una stima più affidabile dell’effetto del trattamento nei vari sottogruppi che non gli effetti osservati nei vari sottogruppi. Yusuf S, JAMA 1991; 266: 93 Un’analisi di sottogruppo che dimostra un’interazione qualitativa (il trattamento è positivo in un sottogruppo e negativo in un altro) difficilmente può essere vero, dato che i partecipanti al trial condividono un numero sufficiente di caratteristiche tale da rendere tale interazione improbabile. Horton R, Lancet 2000; 355:1033 Se si includono troppi sottogruppi, aumenta in modo sostanziale la probabilità di trovare una differenza “statisticamente significativa” per puro effetto del caso (multiplicity o multiple comparisons). Assmann SF, Lancet 2000;355:1064 86 SAFE Study Investigators. A comparison of albumin and saline for fluid resuscitation in the ICU. N Engl J Med 2004;350:2247-56 2007; 357:874-84 FARM6JS3R5. Gattinoni L, Pesenti A, Caironi P, Fumagalli R, Latini R, Tognoni G. Efficacia della somministrazione di albumina nel rimpiazzo/espansione volemica dei pazienti con sepsi severa e shock settico. 87 EBM Il problema dei test multipli • Per ogni test eseguito, l’errore α (fissato dal valore soglia di p) é basso. Se si eseguono test multipli sugli stessi dati (es. analisi di sottogruppo), la probabilità globale di errore α aumenta col numero dei tests. • Esempio: su 100 analisi di sottogruppo eseguite sulla popolazione di studio (maschi vs femmine, vecchi vs giovani, europei vs africani, etc), ci aspettiamo che 5 siano positive per il solo effetto del caso. • In presenza di test multipli, l’errore α va controllato riducendo il valore soglia di p per ogni singolo test (es. correzione di Bonferroni: pcorr = p/n. tests) Esempio. ISIS-2 trial: aspirina vs placebo nell’infarto miocardico acuto - Analisi di sottogruppo in base al segno zodiacale - Differenza di mortalità statisticamente significativa per tutti i segni (p<0.000001) tranne che per bilancia e gemelli (p>0.05) 88 Lancet 1988, ii: 349-360 89 David A Grimes, Kenneth F Schulz. An overview of clinical research: the lay of the land. Lancet 2002; 359: 57–61 90 (1) Review sistematica e Meta-analisi (2) Trial clinico randomizzato (3) Trial clinico non randomizzato (4) Studio osservazionale con gruppo di controllo studio di coorte caso-controllo survey (5) Studio descrittivo (6) Case report (7) Opinione dell’esperto Lancet 2006; 367: 413–418 91 (1) Review sistematica e Meta-analisi (2) Trial clinico randomizzato (3) Trial clinico non randomizzato (4) Studio osservazionale con gruppo di controllo studio di coorte caso-controllo survey (5) Studio descrittivo (6) Case report (7) Opinione dell’esperto Lancet 2007; 369: 920–26 92 Am J Respir Crit Care Med 2007; 176: 886–891 The U.K. blood system has nearly eliminated female donors from the production of high plasma volume products (FFP). The first reports suggest a significant decrease in TRALI reactions reported to the national transfusion surveillance system (SHOT [serious hazards of transfusion]). (1) Review sistematica e Meta-analisi (2) Trial clinico randomizzato (3) Trial clinico non randomizzato (4) Studio osservazionale con gruppo di controllo studio di coorte caso-controllo survey (5) Studio descrittivo (6) Case report (7) Opinione dell’esperto 93 BACKGROUND: Large intervention studies suggest that aspirin may reduce mortality when given to patients who present with strokes or transient ischemic attacks. We sought to determine whether patients who were already using aspirin at the time of an ischemic stroke had a lower mortality than those who were not. METHODS: A prospective study was undertaken in 1,457 patients with acute ischemic stroke, 650 (45%) of whom were using aspirin prior to the stroke. Mortality was measured 4 weeks after the initial episode. RESULTS: Prior use of aspirin was associated with lower 4-week mortality (14% versus 20%, P <0.01). The effect of prior aspirin use on mortality was independent of age, gender, other risk factors, and use of other medication. CONCLUSIONS: Prior use of low-dose aspirin may be associated with a small but significant reduction in stroke mortality. (1) Review sistematica e Meta-analisi (2) Trial clinico randomizzato (3) Trial clinico non randomizzato (4) Studio osservazionale con gruppo di controllo studio di coorte caso-controllo survey (5) Studio descrittivo (6) Case report (7) Opinione dell’esperto Kalra L, et al. Does prior use of aspirin affect outcome in ischemic stroke? Am J Med 2000; 108:205 94 BACKGROUND: La sepsi puerperale ha un’elevata incidenza nelle donne che partoriscono nell’Ospedale di Vienna, ma non nelle donne che partoriscono a casa. METHODS: Ho riguardato tutti i documenti di donne che sviluppano sepsi e di quelle che non la sviluppano; ho anche parlato con il personale dell’Ospedale per cercare di scoprire possibili cause. RESULTS: Ho scoperto che la maggior parte delle sepsi avviene nella I Divisione, dove ad assistere le gravide sono medici e studenti. Questi eseguono tutti i giorni numerose autopsie e non si lavano le mani al termine. Questo non succede nella II Divisione dove sono le ostetriche ad assistere le gravide. CONCLUSIONS: Medici e studenti trasferiscono materiale cadaverico letale dalla sala autoptica nel canale vaginale delle gravide. (1) Review sistematica e Meta-analisi (2) Trial clinico randomizzato (3) Trial clinico non randomizzato (4) Studio osservazionale con gruppo di controllo studio di coorte caso-controllo survey (5) Studio descrittivo (6) Case report (7) Opinione dell’esperto Semmelweiss IP. Assassini. Wien Med J 1847 95 BACKGROUND: Medici e studenti trasferiscono materiale cadaverico letale dalla sala autoptica nel canale vaginale delle gravide. La mortalità è molto alta. METHODS: Ho obbligato tutti i medici e gli studenti a lavarsi (disinfettarsi) le mani dopo l’autopsia e prima del parto. RESULTS: Il numero di sepsi puerperali è diminuito drasticamente dal 18,0% all’1,1% CONCLUSIONS: Coloro che non dovessero seguire il metodo da me indicato sono da considerarsi degli assassini Semmelweiss IP. Assassini2. Wien Med J 1848 (1) Review sistematica e Meta-analisi (2) Trial clinico randomizzato (3) Trial clinico non randomizzato (4) Studio osservazionale con gruppo di controllo studio di coorte caso-controllo survey (5) Studio descrittivo (6) Case report (7) Opinione dell’esperto Gruppo di controllo storico 96 ive me a break! 97 EBM omande Che tipo di studio fu quello realizzato da Semmelweis nella I parte? Osservazionale caso-controllo Che tipo di studio fu quello realizzato da Semmelweis nella II parte? Sperimentale con controllo storico Come avrebbe potuto migliorare le sue prove di efficacia del trattamento antisettico? Introducendo un gruppo di controllo e randomizzando i pazienti Come avrebbe potuto migliorarne l’adozione? Pubblicando 98 LOUIS FERDINAD CÉLINE pseudonimo di Louis Destouches Lo scrittore maledetto 1894-1961 Tesi di laurea in Medicina, Sorbona 1924: “Il dottor Semmelweis”. 99 EBM ubblicare 1. scegliere outcome importanti per i malati 2. disegnare studi di qualità elevata 3. presentare i risultati in modo chiaro ed efficace …ma è sufficiente? 100 FREAKONOMICS Selling Soap By STEPHEN J. DUBNER and STEVEN D. LEVITT Published: September 24, 2006 How do you get doctors to wash their hands? nce Semmelweis had these doctors wash their hands with an antiseptic solution, the mortality rate plummeted. But Semmelweis’s mandate, as crucial and obvious as it now seems, has proved devilishly hard to enforce. A multitude of medical studies have shown that hospital personnel wash or disinfect their hands in fewer than half the instances they should. And doctors are the worst offenders, more lax than either nurses or aides. Reasons? Arrogance? ‘Hey, I couldn’t be carrying the bad bugs. It’s the other hospital personnel.’ ……So the hospital needed to devise some kind of incentive scheme that would increase compliance ……………. They’d try to “catch” a doctor who was washing up, giving him a $10 Starbucks card as reward. You might think that the highest earners in a hospital wouldn’t much care about a $10 incentive — “but none of them turned down the card”. …….When the nurse spies reported back the latest data, it was clear that the hospital’s efforts were working — but not nearly enough. Compliance had risen to about 80 percent from 65 percent, but the Joint Commission required 90 percent compliance. …… after they finished their lunch, Murthy handed each of them an agar plate — a sterile petri dish loaded with a spongy layer of agar. “I would love to culture your hand,” she told them. They pressed their palms into the plates, and Murthy sent them to the lab to be cultured and photographed. 101 102 rogramma Statistica descrittiva Statistica inferenziale e test d’ipotesi Dimensione campionaria Classificazione degli studi primari Studi secondari: revisioni sistematiche e meta-analisi Definizione di outcome Misure di rischio 103 La review sistematica EBM Sintesi qualitativa: Revisione condotta in maniera sistematica, con protocollo che preveda l’uso di metodologia standardizzata e riproducibile Nasce in alternativa alla review tradizionale (“narrativa”) condotta da esperti del settore. Rispetto a questa e’: Decisamente piu’ impegnativa Libera (se ben condotta) dalla soggettivita’ di giudizio Prevede la raccolta di (possibilmente) tutti gli studi effettuati su un dato argomento Prevede definizione a priori di: Tipo di studio da includere (es.: RCT) Obiettivi della review, distinti in primari e secondari Criteri di inclusione degli studi (popolazione oggetto di studio, intervento utilizzato, outcome valutato e follow-up considerato) Strategia da utilizzare per la ricerca bibliografica 104 Raccolta degli studi EBM Strumenti di ricerca: 1. database computerizzati 2. voci bibliografiche 3. contatti con gli autori, meetings, dissertazioni, abstract, tesi, altro (“gray literature”) Ramritu et al. Am J Infect Control 2008;36:104-17 105 Flow-chart di inclusione/esclusione degli studi Meta-analysis: Effectiveness of Drugs for Preventing Contrast-Induced Nephropathy Kelly et al. Ann Intern Med 2008; 148:284-94 106 EBM Estrazione dei dati From: Conducting the review. Data extraction. Centre for Reviews and Dissemination (CRD). University of York, UK. Available at: http://www.york.ac.uk/inst/crd/pdf/crd4_ph6.pdf 107 Valutazione della qualita’ EBM Definizione “a priori” dei criteri di valutazione della qualita’ Problema: troppe scale di valutazione, con scarsa concordanza nel giudizio In generale, sconsigliato l’uso di un punteggio di qualita’ nella meta-analisi Meta-analysis: Effectiveness of Drugs for Preventing Contrast-Induced Nephropathy Kelly et al. Ann Intern Med 2008; 148:284-94 108 EBM Guida alla valutazione della qualita’ di RCT From: Conducting the review. Study quality assessment. Centre for Reviews and Dissemination (CRD). University of York, UK. Available at: http://www.york.ac.uk/inst/crd/pdf/crd4_ph5.pdf 109 La meta-analisi EBM Sintesi quantitativa: Analisi statistica dei risultati di un insieme di studi su un argomento specifico, ottenuta raggruppando i dati dei singoli studi in un pool unico e calcolando una stima combinata dell’effetto di interesse Non sempre possibile combinare i risultati dei differenti studi (eterogeneità) Talvolta l'utilità si limita ad evidenziare fonti possibili di disaccordo (eterogeneita’) tra gli studi Scopi principali: Fornire stime dell'effetto più precise Identificare possibili cause di eterogeneità dei risultati degli studi Aumentare la generalizzabilità dei risultati Studiare sottogruppi specifici di pazienti – questo scopo molto piu’ importante quando disponibili i dati dei singoli pazienti (Individual Patient Data M-A) 110 Esempio di revisione sistematica con meta-analisi 111 Il Forest Plot Benefit of anticoagulant prophylaxis Harm of anticoagulant prophylaxis 112 L’analisi statistica EBM Calcolo di una stima combinata dell’effetto Stima combinata ottenuta come media pesata dei risultati degli studi Il peso di ogni studio e’ basato sulla varianza del risultato, quindi sulla dimensione campionaria dello studio Modelli statistici per la meta-analisi Modello a effetto fisso – in assenza di eterogeneita’ Modello a effetti random – in presenza di eterogeneita’ Importante quindi la valutazione dell’eterogeneita’ tra studi Quantificare il grado di eterogeneita’ Capirne le cause (differenze di popolazione studiata, modalità di trattamento, etc.) In ogni caso, se eccessiva la meta-analisi non si puo’ fare! 113 EBM Valutazione del grado di eterogeneità tra studi Test statistici Test di eterogeneità – 2 test (significativo se p<0.10) Basso potere statistico Analisi di sensibilità Metanalisi sui ß-bloccanti nella prevenzione secondaria dopo infarto miocardico Egger et al. British Medical Journal 1997; 315:1533-7 114 Bias di pubblicazione EBM Studi con risultati positivi, negativi o di effetto nullo hanno minor probabilità di essere pubblicati Verifica della presenza di bias di pubblicazione Funnel plot Tests – il piu’ comune e’ il test di Egger che valuta formalmente l’asimmetria del funnel plot Ramritu et al. Am J Infect Control 2008;36:104-17 115 Quale impatto? 116 BMJ 1998;317:235–40 117 Bibliografia suggerita EBM Libri Altman D, Chalmers I (eds). Systematic reviews. BMJ Publishing Group, London (UK) 1995 Sutton AJ, Abrams KR, Jones DR, Sheldon TA, Song F. Methods for metaanalysis in medical research. John Wiley & Sons Ltd, Chichester (UK) 2000 Articoli Chalmers I. The Cochrane Collaboration: Preparing, maintaining and disseminating systematic reviews of the effects of healthcare. Ann N Y Acad Sci 1993; 703:156-65 (stesso titolo: Bero L, Rennie D. JAMA 1995; 274(24):1935-8) Egger M, Smith GD, Phillips AN. Meta-analysis – Principles and procedures. BMJ 1997; 315(7121): 1533-1537 (www.bmj.com) Fleiss JL. The statistical basis of meta-analysis. Statistical Methods in Medical Research 1993; 2(2):121-45 Web-sites http://www.update-software.com/ccweb/cochrane/resource.htm (The Reviewers’ handbook; software: RevMan) http://www.prw.le.ac.uk/epidemio/personal/ajs22/meta 118 rogramma Statistica descrittiva Statistica inferenziale e test d’ipotesi Dimensione campionaria Classificazione degli studi primari Studi secondari: revisioni sistematiche e meta-analisi Definizione di outcome Misure di rischio 119 Cos’è un outcome ? EBM Ciò a cui il paziente va incontro come conseguenza della malattia e del suo trattamento Nell’ambito di un trial clinico l’outcome è un evento che si vuole modificare con il trattamento; esso deve dunque essere clinicamente rilevante 120 Diverse misure di outcome EBM Le misure di outcome vengono suddivise in due categorie: • Outcomes “oggettivi” (“hard” outcomes) Es.: mortalità, giornate di degenza, etc. • Outcomes “soggettivi” (“soft” outcomes) Es.: grado di dolore, estensione di un rash, etc. Indipendentemente dal tipo di outcome (“hard” o “soft”), le misure di outcome dovrebbero essere sempre: • clinicamente rilevanti • sensibili al cambiamento clinicamente importante della condizione patologica, per quanto minimo • il meno possibile soggette a variabilità intra- e inter-osservatore (in particolare gli outcome “soft”) Tra gli outcomes considerati di interesse vengono spesso trascurati gli indici che tengono conto del grado di benessere percepito dal paziente (es.: indici di qualità della vita) 121 EBM Outcomes surrogati Talvolta non è possibile o comunque fattibile misurare direttamente l’outcome di interesse. In questi casi si ricorre a degli outcomes surrogati (o sostitutivi), DEFINIZIONE: Gli outcomes surrogati sono variabili relativamente facili da misurare, considerate predittive di un effetto clinico difficile da determinare (es.: raro, lontano nel tempo), ma che non sono di per sé misura diretta di beneficio (o danno) in termini clinici. VANTAGGI Possono ridurre considerevolmente: numerosità del campione richiesta durata dello studio costo dello studio 122 EBM Outcomes surrogati SVANTAGGI Le modificazioni dell’outcome surrogato non rappresentano di per sé la risposta di interesse al trattamento Gli outcomes surrogati potrebbero non essere sufficientemente validi e/o affidabili nel riflettere l’outcome di vero interesse Gli outcomes surrogati vengono spesso sviluppati nell’ambito di modelli animali della patologia e l’estrapolazione di questi risultati alla patologia umana potrebbe non essere valida Caratteristiche importanti di un outcome surrogato La relazione tra outcome surrogato e outcome di interesse deve avere una spiegazione biologicamente plausibile La variazione dell’outcome surrogato dovrebbe riflettere, in maniera rapida e accurata, la risposta al trattamento (in particolare, normalizzazione dei valori in condizioni di remissione o cura della malattia) Buona sensibilità, specificità e relazione dose-risposta 123 EBM Definizione a priori degli outcome Gli outcome di interesse dovrebbero sempre essere specificati a priori, distinguendo tra outcome primario e outcome secondari. Per outcome primario si intende la misura di outcome di maggior interesse, su cui focalizzare l’attenzione in fase di analisi. Tutte le eventuali analisi suggerite dai dati andrebbero descritte come “analisi esploratorie”, e dovrebbero servire a generare ipotesi, non a testarle. Lo stesso vale per gli effetti collaterali del trattamento. 124 ARDS Design: Randomized, double-blinded, placebo-controlled multicentered trial. Patients: 40 MV patients with ARDS, whose serum TP were <6.0 g/dL. Measurements : The primary outcome was change in oxygenation from baseline to day 1. Main Results. Albumin-treated patients had greater increases in oxygenation (mean change in PaO2/FIO2: +43 vs. +24 mm Hg at 24 hrs and +49 vs. +13 mm Hg at day 3), serum total protein (1.5 vs.0.5 g/dL at day 3), and net fluid loss (-5480 vs. -1490 mL at day 3) throughout the study period (all p <0.05). Diuretici? Albumina? Outcome hard, soft, surrogato? 125 N Engl J Med 2001;345:568-73 The difference between groups was not significant (P=0.65 by the log-rank test). 126 N Engl J Med 2000;3425:1301-8 127 Surrogate End Points and FDA Approval. A Tale of 2 Lipid-Altering Drugs Psaty BM, Lumley T JAMA 2008; 299:14774-1479 Risk factors such as high blood pressure, elevated low-density lipoprotein (LDL) cholesterol levels, and high blood glucose levels are strongly, consistently, and directly associated with the risk of major cardiovascular events, including myocardial infarction, stroke, and heart failure. Over the last several decades, the development and widespread use of drugs to reduce the level of these risk factors have been a mainstay of cardiovascular disease prevention efforts. 128 Ezetimibe e torcetrapib JAMA, March 26, 2008—Vol 299, No. 12 Ezetimibe, a drug that inhibits the absorption of cholesterol by the small intestine, was approved for the treatment of hypercholesterolemia. In two 12-week trials that randomized 892 and 827 patients with hypercholesterolemia to placebo or active treatment, ezetimibe was associated with 16.5% and 16.9% greater reduction in LDL cholesterol levels than placebo. In January 2008, the sponsor disseminated a press release reporting the results of the ENHANCE trial. In the 2-year trial that randomized 720 patients, ezetimibe plus simvastatin was associated with a more pronounced reduction in LDL cholesterol levels than simvastatin alone. For the primary end point of change in mean carotid intima media thickness (IMT) measured at 3 sites, there was no significant difference (P=.29). Indeed, progression of carotid IMT was slightly but not significantly more rapid among patients randomized to ezetimibe plus Simvastatin. As a measure of subclinical disease, carotid IMT, like lipid levels, is a surrogate end point. Biologically, measures of subclinical atherosclerosis are “closer” than lipid levels to measures of health benefits such as cardiovascular events. The scientific expectation is that the effects on lipids, on atherosclerosis, and on cardiovascular events should generally move in the same direction. But wall thickness is not the only determinant of risk, so it is theoretically possible that effects on IMT and clinical events could differ. 129 Ezetimibe e torcetrapib JAMA, March 26, 2008—Vol 299, No. 12 A large, long-term trial in high-risk patients with acute coronary syndrome will eventually evaluate ezetimibe on the primary end point of major cardiovascular events, but this trial was started in January 2006, and the estimated completion date will not be until January 2011. …. sales of ezetimibe or the combination reached $5 billion in 2007. 130 Ezetimibe e torcetrapib JAMA, March 26, 2008—Vol 299, No. 12 Although LDL levels rather than HDL levels have been the traditional targets of lipid-alerting therapies,1 new drugs targeting HDL such as torcetrapib, an inhibitor of cholesteryl ester transfer protein, have been under development. 1. In two 8-week studies of 162 and 174 patients with below-average HDL cholesterol levels, torcetrapib dose was directly and strongly related to increases in HDL cholesterol levels 2. Torcetrapib was also evaluated in several phase 3 trials of atherosclerosis progression. Despite large differences in HDL cholesterol levels between patients treated with torcetrapib and placebo, progression of coronary atherosclerosis and carotid atherosclerosis did not differ between treatments in moderate-sized trials that enrolled 752 to 1188 patients. In these trials, systolic blood pressure was significantly higher in the groups that had received torcetrapib. 3. In the ILLUMINATE trial,15 15 057 patients with high cardiovascular risk were randomized to receive torcetrapib plus atorvastatin or atorvastatin alone. After a median follow-up of 550 days, the trial was stopped early because of an increase in the risk of the primary end point, major cardiovascular events (hazard ratio, 1.25; 95% confidence interval, 1.09-1.44), and because of an increase in total mortality (hazard ratio, 1.58; 95% confidence interval, 1.14-2.19). 4. Torcetrapib was never approved. 131 rogramma Statistica descrittiva Statistica inferenziale e test d’ipotesi Dimensione campionaria Classificazione degli studi primari Studi secondari: revisioni sistematiche e meta-analisi Definizione di outcome Misure di rischio 132 A comparison of sucralfate and ranitidine for the prevention of upper gastrointestinal bleeding in patients requiring mechanical ventilation. Canadian Critical Care Trials Group. Cook D, et al. N Engl J Med 1998;338:791 BACKGROUND: Critically ill patients who require mechanical ventilation are at increased risk for gastrointestinal bleeding from stress ulcers. There are conflicting data on the effect of histamine H2-receptor antagonists and the cytoprotective agent sucralfate on rates of gastrointestinal bleeding, ventilator-associated pneumonia, and mortality. METHODS: In a multicenter, randomized, blinded, placebo-controlled trial, we compared sucralfate with the H2-receptor antagonist ranitidine for the prevention of upper gastrointestinal bleeding in 1200 patients who required mechanical ventilation. Patients received either nasogastric sucralfate suspension (1 g every six hours) and an intravenous placebo or intravenous ranitidine (50 mg every eight hours) and a nasogastric placebo. RESULTS: The patients in the two groups had similar base-line characteristics. Clinically important gastrointestinal bleeding developed in 10 of 596 (1.7 percent) of the patients receiving ranitidine, as compared with 23 of 604 (3.8 percent) of those receiving sucralfate (relative risk, 0.44; 95 percent confidence interval, 0.21 to 0.92; P=0.02). In the ranitidine group, 114 of 596 patients (19.1 percent) had ventilator-associated pneumonia, as compared with 98 of 604 (16.2 percent) in the sucralfate group (relative risk, 1.18; 95 percent confidence interval, 0.92 to 1.51; P=0.19). There was no significant difference between the groups in mortality in the intensive care unit (ICU) (23.5 percent in the ranitidine group and 22.9 percent in the sucralfate group) or the duration of the stay in the ICU (median, nine days in both groups). CONCLUSIONS: Among critically ill patients requiring mechanical ventilation, those receiving ranitidine had a significantly lower rate of clinically important gastrointestinal bleeding than those treated with sucralfate. There were no significant differences in the rates of ventilator-associated pneumonia, the duration of the stay in the ICU, or mortality. 133 EBM Rischio e rischio relativo (RR) • Il rischio che un evento accada é dato semplicemente dal numero di coloro che hanno l’evento diviso per il numero totale di persone a rischio di avere quell’evento • Il rischio relativo, o risk ratio, è il rapporto tra 2 rischi Sanguinamento GI Yes No ranit 10 586 596 sucral 23 581 604 33 1167 1200 Rischio ranit = 10:596 = 0,017 Rischio sucral = 23:604 = 0,038 Rischio ranit: Rischio sucral (RR)= 0,44 Rischio sucral: Rischio ranit (RR)= 2,27 Il rischio di sanguinamento nei pazienti che ricevono ranitidina è meno della metà (0,44) rispetto a quelli che ricevono sucralfato Detto in altro modo: Il rischio è più che doppio (2,27) in quelli che ricevono sucralfato 134 EBM Odds e odds ratio (OR) • L’odds di un evento é dato semplicemente dal numero di coloro che hanno l’evento diviso per il numero di coloro che non ce l’hanno. E’ espresso da un numero che va da 0 (l’evento non accadrà mai) all’infinito (l’evento accadrà per certo). • L’odds ratio (OR) è il rapporto tra 2 odds. Sanguinamento GI Yes No ranit 10 586 596 sucral 23 581 604 33 1167 1200 Odds ranit = 10:586 = 0,017 Odds sucral = 23:581 = 0,040 Odds ranit: Odds sucral (OR)= 0,43 Odds sucral:Odds ranit(OR)= 2,32 135 Rischio Relativo o Odds Ratio? EBM Egger: BMJ, Volume 315(7121).December 6, 1997.1533-1537 • L’OR ha valore simile al RR quando l’outcome é relativamente raro (<20%). Più frequente é l’outcome, più l’OR sovrastima il RR. • Il RR non può essere direttamente calcolato in uno studio caso controllo, poichè il rapporto tra soggetti affetti/non affetti dalla malattia è fissato dal ricercatore non riflette il rischio di malattia in popolazione 136 EBM Rischio Relativo e Odds Ratio Sanguinamento GI Yes No ranit 10 586 596 sucral 23 581 604 33 1167 1200 Rischio Relativo Rischio ranit = 10:596 = 0,017 Rischio sucral = 23:604 = 0,038 Rischio ranit: Rischio sucral (RR)= 0,44 Rischio sucral: Rischio ranit (RR)= 2,27 Odds Ratio Odds ranit = 10:586 = 0,017 Odds sucral = 23:581 = 0,040 Odds ranit: Odds sucral (OR)= 0,43 Odds sucral:Odds ranit(OR)= 2,32 137 The Third National Health and Nutrition Examination survey was conducted in the USA in the 1990s to examine the relationship between obesity and depression. The authors investigated the association between major depression and body mass index (BMI) for males and females. (American Journal of Epidemiology. 2003; 158:1139-1147) BMI Category, kg/m2 Unadjusted Odds Ratio 95% Confidence Interval What is the correct interpretation of the overweight values of 0.86? Normal weight (BMI 18.5-24.9) 1.00 Underweight (BMI <18.5) 1.17 0.49-2.80 Overweight (BMI 25.0-29.9) 0.86 0.53-1.41 Obese (BMI > 30) 1.88 1.02-3.46 Class 1 (BMI 30-34.9) 1.28 0.64-2.56 c. An overweight individual has a 0.86 probability of having major depression. Class 2 (BMI 35-39.9) 1.76 0.78-3.95 d. An overweight individual has a 0.86 odds of having major depression. Class 3 (BMI > 40) 4.98 2.07-11.99 a. Overweight individuals’ odds of having major depression are 14% lower than the odds of having major depression for individuals with normal weight. b. Overweight individuals’ odds of having major depression are 14% higher than the odds of having major depression for individuals with normal weight TABLE. Unadjusted Odds Ratios of Major Depression During the Past Month 138 EBM NNT, Number needed to treat E’ il numero di pazienti che deve essere trattato per ottenere un evento. Viene calcolato come il reciproco della riduzione del rischio assoluto. Sanguinamento GI Yes No ranit 10 586 596 sucral 23 581 604 33 1167 1200 Rischio sucral = 0,038 Rischio ranit = 0,017 Riduzione del rischio assoluto = 0,038-0,017 = 0,021 NNT = 1/0,021 NNT = 47 Occorre trattare 47 pazienti con la ranitidina per evitare un sanguinamento gastro-intestinale (evento) 139 EBM NNH, number needed to harm “Il rischio di tromboembolia nelle donne che usano contraccettivi orali che contengono desogestrel e gestodene é doppio rispetto a quello nelle donne che usano contraccettivi orali senza desogestrel e gestodene .” RR= 2 (95% C.I. 1.1 to 3.7) Tromboembolia Pillola Si No Rischio A = 0,03% Si 39 132000 132039 No 20 136000 136020 Rischio B = 0,01% 59 268000 268059 RR=2 Aumento del rischio assoluto = 0,03% - 0,01% = 0,02% NNH = 1/0,01 NNH = 6700 (95% C.I. 3600 -54000) 140 EBM NNH, Number needed to harm Dire ad una donna che ha un rischio tromboembolico raddoppiato perché prende un certo tipo di pillola non é lo stesso che dire: “Sì, c’é un rischio, ma è compreso tra 1 a 3.600 e 1 a 54.000.” Per confronto, la probabilità di essere uccisi in automobile in Gran Bretagna é di 1 a 16.000. McQuay H, et al. Ann Int Med 1998; 128:72 141 EBM Ignaz Philipp Semmelweis (1818-1865) n ipotetico trial clinico randomizzato Morte per sepsi puerperale Si No Handwashing Sì 42 3458 3500 Rischio HW-sì = 0,012 Handwashing No 620 2880 3500 Rischio HW-no = 0,177 662 6338 7000 Rischio relativo (RR)= 0,177:0,012 = 14,76 (95% C.I. 10,84-20,11) Riduzione del rischio assoluto = 0,177-0,012 = 0,165 NNT = 1/0,165 NNT = 6 142 http://www.pensiero.it/catalogo/scheda.asp?IDPubblicazione=543 143