Caratteristiche degli RCT Randomizzazione: finalità e limiti Scelta del gruppo di controllo Studi “in cieco” vs. studi “in aperto” scelta degli indicatori di esito Oreste Capelli Perché adottare un nuovo intervento (terapeutico, diagnostico, etc.)? Rischio + Beneficio Cosa mi aspetto dal nuovo intervento? • Funziona? • Funziona in pratica?” • Ne vale la pena?” • EFFICACY • EFFECTIVENESS • EFFICIENCY Hanes B. BMJ 1999;319:652-3 • “Funziona?” [efficacy] in circostanze ideali l’intervento produce più effetti positivi che negativi validità interna (riproducibilità dello studio) •“Funziona in pratica?” [effectiveness] gli effetti che l’intervento produce in circostanze di pratica clinica abituale validità esterna (trasferibilità dei risultati) •“Ne vale la pena?” [efficiency] effetti che l’intervento produce in relazione alle risorse che utilizza Rapporto costo/beneficio L’ESPERIMENTO DEL LATTE NEL LANARKSHIRE (RIFERITO DA “STUDENT”, 1931) • Nel 1930 si realizzò un esperimento consistente nella somministrazione nelle scuole di 3/4 di pinta di latte al giorno a 10.000 ragazzi; altri 10.000 ragazzi nelle stesse scuole non ricevevano questa somministrazione. • L’obiettivo dell’esperimento era di verificare se il supplemento di latte portava a un maggior accrescimento ponderale e nella statura. • Inizialmente fu deciso di effettuare l’assegnazione dei bambini all’uno o all’altro gruppo in modo casuale in alcune scuole, e in ordine alfabetico in altre. • Si decise poi, per evitare una sproporzione numerica tra i due gruppi, di affidare agli insegnanti il compito di integrare l’uno o l’altro gruppo con altri bambini. • Verosimilmente a causa del senso di umanità degli insegnanti, che li portava ad assegnare al gruppo cui era destinato il latte i bambini più malnutriti, il risultato finale fu che il gruppo di controllo risultò superiore in una misura corrispondente a circa 3 mesi di crescita ponderale e 4 mesi di crescita in statura. Il primo RCT Ê 1948: Primo studio clinico randomizzato valuta l’efficacia della streptomicina nel trattamento della tubercolosi versus “bed rest” Medical Research Council Streptomycin in Tuberculosis Trials Committee. Streptomycin treatment for pulmonary tuberculosis. BMJ 1948;ii:769.82. Controlled trial of streptomycin in the treatment of pulmonary tubercolosis Values are numbers (%) of patients followed for 6 months Condition on radiological examination Treatment Dead Deteriorated Unchanged Slightly improved Considerably improved Bed rest (n=52) 14 (27) 18 (34) 3 (6) 13 (25) 4 (8) 4 (7) 10 (18) 3 (6) 10 (18) 28 (51) Bed rest plus 2 g streptomycin-4 hourly (n=55) BMJ 1948; ii:769-82 Come leggere (criticamente) un RCT le domande principali 1. La domanda/ipotesi dello studio • • Sample size e differenze attese PICO 2. La validità interna – come è stato fatto e sua affidabilità • • • Randomizzazione Scelta dei partecipanti Risultati (benefici e rischi) e loro presentazione (differenze relative e assolute) Come leggere (criticamente) un RCT le domande principali 3. La trasferibilità • Domanda: i miei pazienti sono simili a quelli dello studio? 4. Gli altri studi disponibili (coerenza tra gli studi disponibili) 5. Interpretazione … e quindi … cosa cambia RCT disegno e validità interna Cosa caratterizza uno studio clinico (RCT Popolazione di riferimento Popolazione studiata tempo RANDOMIZZAZIONE Farmaco da studiare VALIDITÀ ESTERNA è condizionata da: trasferibilità • setting dello studio generalizzabilità • selezione dei pazienti applicabilità • differenza tra ciò che (effectiveness ) prevede il protocollo e la pratica clinica • rilevanza degli esiti “end- point” scelti VALIDITÁ INTERNA Controllo Placebo, nessun trattamento migliore terapia disponibile altra terapia disponibile (efficacy) Esempio di una flow chart di un RCT Randomizzazione e aderenza al protocollo • i partecipanti allo studio potrebbero completare lo studio senza aver aderito strettamente allo schema iniziale di randomizzazione • motivi: effetti collaterali, mancati benefici, preferenza del paziente (in caso di non cecità), ecc Chi ha maggiore probabilità di seguire il protocollo di studio? • chi trae benefici dal trattamento ricevuto • chi non riceve danni dal trattamento ricevuto • chi riesce ad avere una migliore compliance Randomizzazione: finalità e limiti Randomizzazione Lo scopo della randomizzazione (assegnazione casuale) è: 1. ottenere due gruppi di pazienti simili per tutti i fattori prognostici noti e non noti 2. eliminare i bias di selezione nella assegnazione dei trattamenti È la componente più importante degli RCT! Altman DG et al. The revised CONSORT statement Ann Intern Med 2001;134:663-94 Back to basics: Cochrane “L’idea di base, come tutte le cose buone, è semplice. Gli studi randomizzati affrontano il problema della confrontabilità di due gruppi a rovescio: l’idea non è di preoccuparsi delle caratteristiche dei pazienti, ma di essere sicuri che la divisione dei pazienti nei 2 gruppi sia fatta in modo indipendente dalla volontà dello sperimentatore.” L’uso di popolazioni non selezionate riduce i problemi di generalizzabilità. Come effettuare una randomizzazione corretta La generazione delle liste di randomizzazione deve avvenire attraverso un processo realmente random (ed essere trasparente e dichiarata) miglior metodo = liste generate tramite computer o tavole di numeri casuali (centralizzata) metodi meno validi = utilizzare numeri alternati, numeri di cartella clinica, data di nascita, buste opache e sigillate ecc. Randomizzazione: 2 fasi 1a fase: produzione di una sequenza di assegnazione dei trattamenti non prevedibile 2a fase: occultamento di questa sequenza agli sperimentatori che reclutano i partecipanti allo studio Altman DG et al. The revised CONSORT statement Ann Intern Med 2001;134:663-94 Tipi di randomizzazione 1. Semplice sequenza singola di assegnazioni casuali 2. Ristretta definisce diverse procedure controllate per raggiungere un bilanciamento tra gruppi, in termini di dimensioni o altre caratteristiche • a blocchi (bilanciati di 4 -10 pz) • stratificata (per età, gravità, ecc.) Ha funzionato la randomizzazione? Generalmente la tabella 1 degli studi riporta le caratteristiche dei due gruppi alla partenza (baseline) che dovrebbero risultare simili per i principali fattori prognostici (caratteristiche dei pazienti) Ha funzionato la randomizzazione? Tab 1. Altman DG et al. The revised CONSORT statement Ann Intern Med 2001;134:663-94 Ha funzionato la randomizzazione? Tabella 1 (Studio SHEP) Aspetti da considerare nella lettura/valutazione di uno studio 1 PICO 2 sample size, ipotesi, disegno dello studio 3 randomizzazione, baseline (Tab. 1) 4 dal reclutamento al follow-up (ev. protocollo) 5 risultati (esiti principali), eventi avversi 6 interpretazione dei risultati, trasferibilità La randomizzazione: è etica? quando? Cos’è il principio di incertezza negli Studi Randomizzati Controllati? il non sapere, a priori, quale trattamento sia il migliore fra: ⇒ quello standard (in uso) ⇒ il placebo (in assenza di un trattamento standard) ⇒ il nuovo trattamento da studiare La base etica di questi studi è rappresentata dall’incertezza su quale trattamento possa essere preferibile o appropriato in ogni singolo paziente reclutato nello studio. Se il medico (o il paziente) ha una marcata preferenza o timore nei confronti di uno dei trattamenti previsti nello studio il principio di incertezza non è rispettato e il paziente non dovrebbe partecipare allo studio RCT e principio di incertezza BMJ 2000 L’incertezza è il prerequisito morale di uno studio randomizzato. Se si è convinti di quello che si deve fare lo si deve fare e non studiare (randomizzare). la randomizzazione è accettabile /etica se il medico è sostanzialmente incerto su quale dei trattamenti in esame sia il più efficace rispetto al quadro clinico presente la randomizzazione NON è accettabile/etica e nessun paziente dovrebbe essere coinvolto in RCT se il medico e/o il paziente pensano che uno dei trattamenti in esame sia inappropriato (meno efficace e/o più rischioso) rispetto ad altri trattamenti disponibili (nello trial stesso o nella pratica corrente) o rispetto al NON trattare Scelta del gruppo di controllo Cosa caratterizza uno studio clinico (RCT) Popolazione studiata tempo RANDOMIZZAZIONE Farmaco Controllo da studiare Placebo, nessun trattamento migliore terapia disponibile altra terapia disponibile domande fondamentali Ê Il trattamento del gruppo di controllo è il migliore disponibile? Ê I trattamenti previsti e la lunghezza del follow-up sono adeguati per rispondere al quesito clinico? SCELTA DEI TRATTAMENTI FDA - Guidance for Industry E 10 Choice of Control Group and Related Issues in Clinical Trials May 2001 Ê Placebo Ê Nessun trattamento Ê Differente farmaco attivo Ê Differenti dosi o schemi terapeutici dello stesso farmaco http://www.fda.gov/cder/guidance/index.htm Gruppo di controllo: i ‘pro’ del placebo Ê “gli ortodossi del placebo” Ê Ê Ê considerano metodologicamente importanti e necessari gli studi con placebo Permettono numeri più piccoli di pazienti, esponendo minor numero di pazienti a potenziali rischi Permettono una più chiara distinzione tra l’effetto placebo e gli effetti avversi J. EMANUEL, N Engl J Med, Vol. 345,N .12 ·September 20, 2001 Gruppo di controllo: i ‘contro’ del placebo “gli ortodossi del controllo attivo” accusano gli ortodossi del placebo di sacrificare l’etica, i diritti e la salute dei pazienti a fronte di un presunto rigore scientifico Ê Se esiste un intervento efficace per una certa condizione, questo deve essere utilizzato nel gruppo di controllo. → Il nuovo farmaco è meglio del trattamento standard? Dichiarazione di Helsinki (ott. 2000) Ê I benefici, i rischi, gli aggravi e l’efficacia di un nuovo metodo devono essere valutati in confronto con quelli dei migliori metodi preventivi, diagnostici e terapeutici attualmente in uso. Ê Ciò non esclude l’impiego di placebo, o l’assenza di trattamento, negli studi dove non esistono metodi comprovati di prevenzione, diagnosi o terapia. È corretto l’uso del placebo? Original Contributions Prevention of stroke by antihypertensive drug treatment in older persons with isolated systolic hypertension Final results of the Systolic Hypertension in the Elderly Program (SHEP) SHEP Cooperative Research Group JAMA, 1991;265:3255-64 Conclusioni In persone di età > 60 anni con ipertensione sistolica isolata, una terapia anti-ipertensiva per gradi, iniziata con clortalidone a basse dosi, ha ridotto l’incidenza globale di ictus del 36%, con un beneficio assoluto a 5 anni di 30 eventi per 1.000. Il beneficio assoluto a 5 anni per eventi cardiovascolari maggiori, è stato di 55 eventi per 1.000. È corretto l’uso del placebo? Articles Randomized, double-blind, comparison of placebo and active treatment for older patients with isolated systolic hypertension Staessen JA, et al. for the Systolic Hypertension in Europe (Syst-Eur) Trial Investigators Lancet 1997;350:757-64 Conclusioni Nei pazienti anziani con ipertensione sistolica isolata, un trattamento anti-ipertensivo iniziato con nitrendipina riduce il rischio di complicanze cardiovascolari. Trattando 1.000 pazienti con questo farmaco, in 5 anni si possono prevenire 29 ictus o 53 eventi cardiovascolari maggiori. NON è etico randomizzare contro placebo 9 quando esiste un trattamento di riconosciuta efficacia per il quadro clinico di interesse 9 è documentato un uso eccessivo del placebo per “scopi registrativi” Rothman KJ, Michels KB. The continuing unethical use of placebo controls. NEJM 1994;331:394-8 “Nessun trattamento” come controllo: l’esempio del GISSI 1 Ê Obiettivo dello studio: valutazione di efficacia del trattamento trombolitico con streptochinasi (SK) sulla mortalità intraospedaliera di pazienti con infarto miocardico acuto (AMI) Ê per il tipo di esito considerato (mortalità) la presenza di un gruppo di controllo (placebo) venne ritenuta superflua Il farmaco di confronto riflette le dosi usualmente utilizzate nella pratica? Original Contributions Randomized, double-blind, comparative study of grepafloxacin and amoxycillin in the treatment of patients with community-acquired pneumonia O’Doherty B, et al. J Antimicrob Chemother, 1997;40 Suppl.A:73-81 Conclusioni Grepafloxacina (600mg/die per 7-10 gg.) e amoxicillina (500 mg x 3/die per 7-10 gg.) si sono dimostrate di pari efficacia nel raggiungimento di una risposta clinica e microbiologica in pazienti con polmonite extra-ospedaliera. Il farmaco di confronto riflette le dosi usualmente utilizzate nella pratica? 1 Studio CLASS pubblicato su JAMA 7968 pazienti randomizzati in tre gruppi PAZIENTI: età media 60 anni; 69% donne; 73% con Osteoartrosi durata media trattamento: 4,2 mesi (massimo 6 mesi) 20% in terapia con ASA a bassa dose (< 325 mg/die) CELECOXIB 400 mg x 2 IBUPROFENE 800 mg x 3 DICLOFENAC 75 mg x 2 N=3987 N=1985 N=1996 Studi “in cieco” vs. studi “in aperto” “Cecità”: di chi? Molti studi sono descritti come “doppio-cieco”. Anche se questo termine significa che né il medico né il paziente conoscono il trattamento assegnato è ambiguo per quanto riguarda la cecità di altre persone in particolare coloro che valutano gli esiti. “Cecità”: di chi ? • Gli Autori dovrebbero dichiarare chi era cieco (pazienti, sperimentatori, valutatori, monitor, statistici) e i meccanismi della cecità. • E’ importante per valutare correttamente esiti soggettivi (dolore, sonno) • E’ meno importante per esiti oggettivi come la mortalità o un dato di laboratorio indipendente Esistono davvero gli studi “in cieco”? Esempi: • calcio-antagonista versus beta-bloccante • SSRI versus antidepressivi triciclici È più importante la randomizzazione o la cecità? A questo punto dovrebbe essere chiaro ... che la randomizzazione è più importante della cecità! scelta degli indicatori di esito Scelta degli indicatori appropriati di esito “end point” Ogni studio presenta: - 1 (o più) esiti principali - una serie di esiti secondari Gli indicatori di esiti possono essere: surrogati semplici clinicamente rilevanti compositi Indicatori di esito • esiti clinicamente rilevanti: (mortalità totale o causa-specifica, eventi non fatali, quali infarto, ictus, etc, morbidità) • esiti surrogati: ↓ pressione arteriosa, ↓ colesterolemia, etc. • qualità della vita (problema della validazione degli strumenti/questionari) Esiti Surrogati surrogate o secondary outcomes DEFINIZIONE Un esito surrogato può essere definito come “una misura di laboratorio o un segno obiettivo o strumentale usato come sostituto di un esito clinicamente significativo, che misura direttamente le sensazioni soggettive o le funzioni di un paziente.” L’uso di esiti surrogati è indispensabile per la valutazione dei farmaci in studi di fase 2 e all’inizio della fase 3, per stabilire i benefici annunciati del farmaco Esiti Surrogati Vantaggi e svantaggi L’uso di un esito surrogato, in determinate condizioni cliniche, ha il vantaggio di poter condurre alla rapida e appropriata diffusione di nuovi trattamenti Per esempio, la decisione della FDA di approvare nuovi farmaci anti-retrovirali, basata sulle informazioni ricavate da trial che usano esiti surrogati, ha tenuto presente l’enorme esigenza di terapie efficaci per i pazienti con l’infezione da HIV. Indicatori di esito • Hard: determinati in modo inequivocabile ed oggettivo (mortalità, diagnosi di malattia, n° giorni di ricovero, etc) • Soft: determinazione meno sicura (es. miglioramento-peggioramento della qualità di vita, dolore, sintomi vari, etc) • “indiretti” es. utilizzo dei servizi sanitari Indicatori di esito efficacia clinica vs efficacia farmacologica • es. cardiovascolare: per concludere che un farmaco antiipertensivo è efficace, è sufficiente che abbassi la pressione arteriosa? • es. AIDS: per valutare l’efficacia di una terapia, è sufficiente che aumenti il livello di linfociti CD4? Esiti Surrogati vs clinic. rilevanti esempi ESITI SURROGATI ESITI clinic. rilevanti • Densità minerale ossea Fratture osteoporotiche • Pressione arteriosa Ictus cerebrale • Grado di stenosi carotidea Ictus cerebrale • Livelli ematici LDL-colesterolo Infarto miocardico • Grado di stenosi all’angiografia coronarica Infarto miocardico • Conta delle cellule CD4 Mortalità da AIDS Indicatori di esito • semplici: costituiti da un solo esito (hard o soft) es. morte cardiovascolare, infarto miocardico, ↓ pressione arteriosa • composti: somma di più esiti (hard e/o soft) es. morte cardiovascolare + IMA + ictus oppure morte cardiovascolare + IMA + ictus + ischemia ricorrente Background. Studi precedenti hanno dimostrato che, in pazienti con scompenso cardiaco, l’ibopamina (dopamino-agonista) riduce la concentrazione plasmatica di noradrenalina, di attività reninica e di aldosterone [surrogati] [van Velduisen DJ, et al. Effects of ibopamine on the increase in plasma norepinephrine levels during exercise in congestive heart failure. Am J Cardiol 1993; 71:992-4] Studi clinici hanno riportato che l’ibopamina migliora i sintomi ed ha effetti simili al captopril sulla tolleranza all’esercizio [surrogato] in pazienti con scompenso lieve-moderato. [Barabino A, et al. Comparative effects of long-term therapy with captopril and ibopamine in chronic congestive heart failure in old patients. Cardiology 1991; 78:243–56] BRIEF REPORTS Effects of Ibopamine on the Increase in Plasma Norepinephrine Levels During Exercise in Congestive Heart Failure Dirk J. van Veldhuisen, MD, Armand R. J. Girbes, MD, Stan A. J. van den Broek, MD, Pieter A. de Graeff, MD, Wiek H. van Gilst, PhD, and K. I. Lie, MD Am J Cardiol 1993; 71:992-4 FIGURE 2. Plasma norepinepluine at rest and during peak exercise, at baseline and after 6 weeks of treatment with ibopamine. Both resting and exercise values are significanfly reduced. Note that scale for norepinephrine levels are different. Intervento. 2200 pazienti con scompenso cardiaco severo (NYHA III-IV) e severa disfunzione del ventricolo sinistro, già in trattamento ottimale per lo scompenso, sono stati randomizzati a: ibopamina (100 mg t.i.d.) o placebo Misura di esito: mortalità per tutte le cause Risultati. Al reclutamento di 1906 pazienti lo studio è stato interrotto precocemente per un eccesso di morti nei pazienti trattati con ibopamina. 25% ibopamina vs 20% placebo RR = 1,26 (1.04-1.53) NNH = 24 (13-278) Migliora la densità ossea, ma.. peggiorano le fratture non vertebrali Effect of fluoride treatment on the fracture rate in postmenopausal women with osteoporosis BL Riggs, SF Hodgson, WM O'Fallon, EY Chao, HW Wahner, JM Muhs, SL Cedel, and LJ Melton Volume 322:802-809 March 22,1990 Number 12 Misure di esito • densità minerale ossea • incidenza di fratture vertebrali e non vertebrali Intervento • • • fluoruro di sodio (75 mg/d) placebo supplemento di calcio (1,5 g/d) in tutte le donne per 4 anni in 202 donne in post-menopausa con fratture vertebrali Esiti Confronto Fluoruro vs Placebo P-value Vertebra lombare +35% <0.001 Collo femorale +12% <0.001 Trocantere +10% <0.001 -4% <0.02 163 vs 136 NS 72 vs 24 <0.01 54 vs 24 <0.01 Densità ossea: Radio Fratture: Vertebrali Non Vertebrali Effetti avversi Densità ossea (surrogato) e fratture osteoporotiche (principale) Non cambia la densità ossea, ma.. Migliorano le fratture non vertebrali Misure di esito: densità minerale ossea, markers biochimici del metabolismo osseo e incidenza di fratture non vertebrali Intervento: supplementazione orale di 500 mg calcio plus 700 IU vit. D3 (colecalciferolo) pro die Vs placebo x 3 anni in 176 uomini e 213 donne di età >65 anni Risultati sulla densità minerale ossea Risultati sulle fratture non vertebrali Numero di fratture nei due gruppi: •Ca + vit D 11/187 = 6% •Placebo 26/202 = 13% RR = 0,4 (0,2-0,9) NNT = 14 (8-79) Densità ossea (surrogato) e fratture osteoporotiche (principale) Migliora la densità ossea, e Migliorano le fratture vertebrali Volume 333 November 30, 1995 Misure di esito: densità minerale ossea e incidenza di fratture vertebrali Intervento: alendronato (5-10 mg/d x 3aa o 20 mg/d x 2aa + 5 mg x 1aa) Vs placebo in 994 donne post-menopausali con osteoporosi Number 22 Volume 333 Risultati sulla densità minerale ossea November 30, 1995 Number 22 Volume 333 Risultati sulle fratture vertebrali NNT = 34 (17-2704) November 30, 1995 Number 22 Conclusioni • La misura di esito surrogato non sempre predice l’esito principale • L’uso terapeutico di un farmaco a partire da dimostrazioni di efficacia sull’esito surrogato può avere effetti benefici, nulli o addirittura dannosi • Nella pratica clinica, l’uso terapeutico di un farmaco dovrebbe basarsi su dimostrazioni di efficacia sull’esito principale o clinicamente importante per il paziente Validità interna: i 3 principi fondamentamentali 9Random division of the patients 9selection of an appropriate primary outcome measure Sir Austin Bradford Hill 9sample size calculation 1. Randomizzazione 2. Scelta di un indicatore appropriato di esito 3. Dimensione del campione e disegno