STUDI DI FASE III Sperimentazioni Cliniche Controllate (Controlled Clinical Trials, Randomized C.T.s’) SCOPO: Valutazione dell’efficacia del trattamento sperimentale EFFICACIA: Miglioramento della prognosi e/o della qualita’ di vita IST-GENOVA LO STUDIO CLINICO CONTROLLATO POPOLAZIONE 'TARGET' RANDOM TRATT. A TRATT.B ESITO ESITO CONFRONTO STATISTICO Sperimentazione Clinica Controllata • • • • • • • Identificazione dello/gli scopo/i dello studio Reclutamento prospettico dei pazienti Assegnazione casuale dei trattamenti Criteri di selezione espliciti Rilevazione oggettiva/unbiased dell’endpoint Piano statistico appropriato Comportamenti adeguati? L’aspetto piu’ importante di uno studio e’ il suo scopo primario Disegno Endpoint -Mascheramento Criteri di selezione dei pazienti SCOPO Protoc. terapeutico Follow-up Analisi Statistica Disegno di studio Disegni corretti • Exp vs Stand • Exp.+ Stand vs Standard • Exp vs niente • Exp1 +Exp2 vs standard ? Disegni non corretti • Exp vs Exp.+Standard • Exp+Standard vs niente • Exp1 vs Exp2 Studi a >2 braccia: E1 vs E2 vs Standard ? Studi fattoriali Studi cross-over Confronto di sequenze terapeutiche POPOLAZIONE 'TARGET' RANDOM Terapia medica Chirurgia Chirurgia Terapia M edica Esito Esito Confronto statistico Disegni particolari POPOLAZIONE 'T ARGET ' RANDOM Intervento Preventivo A Intervento Preventivo B Esito A Esito B Confronto A Contronto B Due studi !! Esempio: screening per c. prostatico e colorettale POPOLAZIONE 'TARGET' RANDO M PSA (screening c. prost.) Colonscopia Inc. c. prostatico Inc. C.Colorettale Confronto Confronto Vantaggi: Nessun gruppo e’ senza trattamento RANDOMIZZAZIONE Assegnazione dei trattamenti con una sequenza: • Casuale • Ignota sia al medico che al paziente • Imprevedibile • Non sistematica • Riproducibile Deve essere descritta in dettaglio nell’articolo di presentazione dei risultati RANDOMIZZAZIONE Metodi accettati: • Centralizzata telefonica • Centralizzata via fax/internet/Email • Locale su computer? Tecniche: • Semplice • Stratificata con bilanciamenti a blocchi • Minimizzazione • Altre Rapporto di randomizzazione: Qualsiasi Bilanciamento per fattori prognostici • Non necessario: possibile aggiustare in sede di analisi • Negli studi di dimensioni adeguate il bilanciamento si ottiene naturalmente • Negli studi piccoli e’ difficile da ottenere • Bilanciare solo per pochi fattori (4 fattori con 2 livelli + 1 con 3 livelli= 48 strati • 500 pz diviso 48 strati = 10 pz per strato in media • Consigliabile stratificare sempre x centro Endpoint Variabile misurata in ogni paziente, utilizzata per valutare l’efficacia del trattamento sperimentale • Identificazione -Definizione • Protocollo di rilevazione • Classificazione • Mascheramento Scelta dell’endpoint (Variabile di risposta, Outcome variable, etc) Criteri: Scopo dello studio Validita’ scientifica dei risultati Rilevanza sanitaria dei risultati Potenza statistica Fattibilita’ Esempio: Trial con un ace-inibitore nello scompenso cardiaco • Frazione di eiezione a 6 mesi • Capacita’ di esercizio (test specifico) a 1 anno • Incidenza di eventi avversi (specificati) a 3 anni • Mortalita’ CVD a 3 anni •Mortalita’ globale a 5 anni Endpoint: Protocollo di rilevazione e classificazione • Fonti/metodi accettati/gerarchie • Protocollo di rilevazione • Ricerca attiva/Controlli di qualita’ • Codifica delle informazioni • Persi al follow-up/classificazione • Comitato di revisione degli endpoints • Mascheramenti Mascheramento (Doppio o Triplo Cieco): Metodi per nascondere il braccio di assegnazione al paziente, al terapeuta e ai ‘valutatori’ Scopo : Prevenire… - bias nella rilevazione dell’endpoint - bias nella classificazione dell’endpoint - non compliance - contaminazione -bias nella decisione di interrompere lo studio Mascheramento Fattori da considerare • • • • • • Tipo di endpoint Gravita’ della malattia Via di somministrazione Tossicita’ dei due trattamenti Consenso informato Costi e problemi organizzativi • Scopo dello studio Mascheramenti differenziati per pz, medico, classificatori e valutatori Criteri di selezione dei pazienti Informazioni disponibili alla randomizzazione • Caratteristiche anagrafiche • Caratteristiche della malattia (stadio, biologia, sede, etc.) • Storia clinica specifica (es. terapie precedenti) • Storia clinica generica (es. malattie precedenti) • Stato del paziente (es.esami ematologici) • Disponibilita’ di test • Valutabilita’? Criteri di selezione dei pazienti • Selettivi: - Scarsa generalizzabilita’ dello studio - Difficolta’ di reclutamento • Generici - Sottostima dell’efficacia? - Minore validita’ scientifica dei risultati SCOPO DELLO STUDIO! Criteri di selezione dei pazienti: esempio Studio per valutare l’efficacia di una chemioterapia aggressiva Selettivi: - Pazienti con c. mammario operato radicalmente Eta’ <65 e >40 Infiltrazione linfonodale e Biologia aggressiva Ecocardiogramma FE >50% Generici - Pazienti con c. mammario operato radicalmente 100 Pazienti con c. mammario operabile 10 pz < 45 anni 50 pz 45-65 anni 25 pz N - 40 pz >65 anni 25 pz N+ 10 T. non aggress. 15 T. aggressivi 5 pz cardiop. 10 pz ELEGGIBILI Aspetti Statistici • • • • • • • Significativita’ Statistica Errore di I e II tipo Potenza dello studio Significativita’ vs stima di effetto Dimensioni dello studio Piano di analisi Conduzione dell’analisi ‘Significativita’, • Anche se i due trattamenti sono equiefficaci (ipotesi nulla), in ogni singolo studio, per puro caso, si osserveranno differenze (di solito piccole) • Se queste differenze sono troppo grosse per essere attribuite al caso si rifiuta l’ipotesi nulla • Troppo grosse? = probabilita’ di verificarsi per puro caso <5% Interpretazioni del test di significativita’ • P <0.05 = I due trattamenti sono differenti • P >0.05 I due trattamenti sono uguali Interpretazioni del test di significativita’ • P <0.05 = I due trattamenti sono differenti • P<0.05 : se fosse vera l’ipotesi nulla, difficilmente si sarebbero ottenuto risultati di questo tipo per puro caso • P >0.05 I due trattamenti sono uguali • P>0.05. Se fosse vera l’ipotesi nulla, risultati come quelli osservati non sarebbero troppo improbabili Test di Significativita’ vs Stime di effetto Confronto Mortalita’. A vs B 15% vs 10% N= 600 P=0.06 A vs C N=12000 15% vs 12.5% P = 0.0007 Test di Significativita’ vs Stime di effetto • • • • Coerenza degli effetti in studi diversi Valutazioni costi-benefici Scelte cliniche Linee guida • Le Riviste scientifiche chiedono stime di effetto + Limiti di confidenza (+/- 2 E.S.) Esempio: Efficacia = Mortalita’ Riduzione della mortalità: p=0.01 ? • Mortalita’ controllo 20% • Mortalita’ Sperimentale 15% • Efficacia relativa = Relative Risk (≈Hazard ratio) 15/20=75% • Riduzione del 25% • Odds Ratio:(15/85)/(20/80) = 0.7 • Efficacia assoluta (Rislk Difference) 15-20=5% = ogni 100 pz trattati col nuovo tratt. se ne salvano 5. • Number needed to treat (NTT) = 1/5% = 20 • Estrapolazioni ? Lo studio perfetto: checklist • • • • • • • • Razionale Scopo primario Disegno Endpoint-Mascheramento Registr./Randomizzazione Criteri di selezione Protocollo di trattamento Piano Statistico VALIDITA’ DI UNO STUDIO= Protocollo di studio + qualita’ dei comportamenti • • • • • • • • Razionale: Plausibilita' dell'ipotesi in studio Scopo primario: Definito in maniera univoca Disegno: Semplice e chiaro Endpoint: Sensibile, specifico e validato Mascheramento: Adeguato all’endpoint Registrazione: Prospettica, senza eccezioni Randomizzazione: Imprevedibile, ignota e non sistematica Criteri di selezione: Univoci, adeguati allo scopo dello studio • Protocollo di trattamento: Come sopra • Piano statistico: Se possibile, semplice - Deve essere previsto tutto Come interpretare i risultati di uno studio clinico • Coordinate interpretative • Coordinate statistiche • Quadro complessivo di riferimento LO STUDIO CLINICO CONTROLLATO POPOLAZIONE 'TARGET' RANDOM TRATT. A TRATT.B ESITO ESITO CONFRONTO STATISTICO Criteri tradizionali per valutare/ interpretare i risultati di un trial • Validita’ interna: – Validita’ statistica, assenza di bias/errore sistematico – Risultati = Verita’ +/- caso • Validita’ esterna: – Possibilita’ di estrapolare/generalizzare i risultati – Applicabilita’ Validita’ interna • Protocollo di ricerca • Disegno di studio • Identificazione dello scopo(i) primario(i) • Procedure di randomizzazione • Scelta/Rilevazione dell’endpoint/mascheramento • Piano statistico • Persi al follow-up/non valutati • Analisi ‘intention to treat’ Progetto -Comportamenti Validita’ Esterna • • • • • • • • • VALIDITA’ INTERNA ! Criteri di selezione dei pazienti Caratteristiche dei pazienti Tipologia dei centri partecipanti Protocollo terapeutico Endpoint Protocollo di follow-up Precisione delle stime Analisi ‘intention to treat’ Coordinate di riferimento nell’analisi di una S.C.C. • Statistica: Tutte le analisi statistiche devono essere esplicitamente predeterminate (endpoint, trasformazione, test, tempi, sottogruppi) • Metodologica: Tutti i pazienti randomizzati devono essere inseriti nell’analisi statistica in base al trattamento assegnato (intention to treat) MOLTEPLICITA’ - ENDPOINT:… .Non si sono osservate differenze statisticamente significative trai i due trattamenti per quanto riguarda O.S., P.F.S., Q.o.L., e tossicita’. Il trattamento X si e’ pero’ dimostrato SIGNIFICATIVAMENTE piu’ efficace di Y nel ridurre la mortalita’ per emorragie gastriche - SOTTOGRUPPI:.…si e’ pero’ osservato che nei pazienti maschi di eta’ inferiore ai 55 anni con neoplasia epidermoide il tr. Sperimentale induceva un miglioramento prognostico SIGNIFICATIVO (P<0.05). Questo f a ritenere… - ANALISI RIPETUTE:Nel corso del secondo anno dello studio ha pero’ iniziato a manifestarsi, nel confronto tra le proporzioni di pazienti rispondenti nei due gruppi, un trend a favore del trattamento sperimentale che al 34° mese ha raggiunto la SIGNIFICATIVITA’ STATISTICA (P<0.05), inducendoci all’interruzione dello studio. Il problema della molteplicità • P statistica : Probabilità di osservare un fenomeno raro quanto quello osservato (o più raro) se è vera l’ipotesi nulla (Eguale efficacia dei due trattamenti). • Es. BRACCIO A Risposte 30/40 ( 75 % ) • BRACCIO B Risposte 20/40 ( 50 % ) P = 0.02 • La probabilità di osservare un risultato come questo per puro caso è del 2 %. • Livello di significatività convenzionale per rifiutare l’ipotesi nulla : 5 % segue • Si considerano non casuali le differenze che si verificherebbero, per caso, meno del 5 % delle volte. • Livello di significatività = Frequenza di analisi falsamente positive • 5 % ogni 100 studi (analisi) che confrontano trattamenti di eguale efficacia, mediamente, in 5 un trattamento sarà dichiarato superiore all’altro per un errore dovuto al caso. Conseguenze • La probabilità che almeno 1 di più studi/analisi fornisca, per caso, risultati statisticamente significativi è > 5 % • Quindi, se in uno studio vengono eseguiti più test di significatività la probabilità di un risultato falsamente positivo è > 5 % • La probabilità di un risultato falsamente positivo aumenta all’aumentare del numero di test di significatività Esempio: Acqua S. Bernardo vs Acqua Fiuggi nel trattamento del c. polmonare inoperabile • • • • Probabilita’ di trovare un risultato SIGNIFICATIVO Confronto principale: 5% SB vs F nei giovani - SB vs F nei vecchi: 9.75 Nei giovani PS<2 - giovani PS>2 -vecchi <2 - vecchi >2 : 18.5 • G,<2, Epidermoide, ….V,>2, Epidermoide, G,<2,ADK…..V,>2,ADK, G<2 Altri…V>2,Altri = 12 strati 46% • Tutte le 20 analisi possibili : 64% (probabilita’ di trovare almeno una differenza significativa) Fattori prognostici nel c. mammario (operabile) • Eta’ - Stato menopausale - Obesita’ - Altezza - Terapie ormonali precedenti • T, N, Angiogenesi • G, MI, TLI, • ER, PgR • Neu-erb, p53 15 fattori: > 100 combinazioni di 2 fattori: praticamente e’ certo che in qualche sottogruppo vi sara’ una differenza significativa tra i due trattamenti Possibili fonti di molteplicita’ in un clinical trial • Endpoints multipli • Trasformazione degli endpoints (es. curva di sopravvivenza vs % di pz vivi a 3 anni) • Test statistico • Misura di effetto • Dati mancanti • Analisi per sottogruppi • Analisi nel corso dello studio Test multipli vs Analisi derivate dai dati • Test multipli : • Predeterminati (Protocollo di studio) • Numero finito • Possibile correzione statistica • Analisi derivate dai dati • L’osservazione di un particolare fenomeno induce all’esecuzione di un test di significatività • Numero potenzialmente illimitato • Prive di alcuna validità statistica MOLTEPLICITA’ : Regole generali • Viene stabilito, prima dell’inizio dello studio, il numero e tipo (tempo) delle analisi (ES. 2 analisi per soggetti < 50 e >50 anni, oppure 3 analisi, dopo 100, 200 e 300 eventi (finale) • Viene stabilito un insieme di regole per decidere che lo studio ha dato un risultato significativo (o per interrompere lo studio) • Queste regole sono dei livelli di significativita’ (tutti < α) calcolati in modo che la probabilita’ di errore α complessiva sia quella desiderata (ES. 5%) Analisi Per Sottogruppi: Metodo piu’ utilizzato (sbagliato) IL TEST DI SIGNIFICATIVITA’ VIENE RIPETUTO IN OGNI SOTTOGRUPPO AL LIVELLO DI SIGNIFICATIVITA’ CONVENZIONALE Esempio: trial ipotetico con 120 pz a braccio Osserviamo 72 risposte (60%) (tratt.sper.) contro 48 (cont.) (40%), p<0.002 (molto signif.) Tre sottogruppi: < 30anni: p=0.01 30-50 anni: p=0.2 n.s. > 50anni: p=0.2 n.s. Conclusioni? Esempio: trial ipotetico con 120 pz a braccio Osserviamo 72 risposte (60%) (tratt.sper.) contro 48 (cont.) (40%), p<0.002 (molto signif.) Tre sottogruppi: < 30anni: 48/80 (60%) vs 32/80 (40%), p=0.01 30-50 anni: 12/20 (60%) vs 8/20 (40%), p=0.2 n.s. > 50anni: 12/40 (60%) vs 8/20 (40%), p=0.2 n.s. Esempio: trial ipotetico con 120 pz a braccio Osserviamo 72 risposte (60%) (tratt.sper.) contro 48 (cont.) (40%), p<0.002 (molto signif.) Tre sottogruppi: < 30anni: p=0.07 n.s. 30-50 anni: p=0.07 n.s. > 50anni: p=0.07 n.s. Conclusioni? Esempio: trial ipotetico con 120 pz a braccio Osserviamo 72 risposte (60%) (tratt.sper.) contro 48 (cont.) (40%), p<0.002 (molto signif.) Tre sottogruppi: < 30anni: p=0.07 n.s. 24/40 (60%) vs 16/40 (40%), 30-50 anni: p=0.07 n.s. 24/40 (60%) vs 16/40 (40%), > 50anni: p=0.07 n.s. 24/40 (60%) vs 16/40 (40%), Soluzioni tipiche (Sottogruppi) • Viene definita come analisi primaria l’analisi sull’intero gruppo • Viene introdotta come analisi secondaria l’analisi per alcuni sottogruppi predefiniti se significativita’ nell’analisi primaria. Questa si basa su un test di interazione • Il test di significativita’ nei vari sottogruppi e’ privo di senso e produce risultati assurdi Analisi per sottogruppi: test di interazione Nuova ipotesi nulla: Omogeneita’ dell’effetto (o del non effetto) in tutti i sottogruppi (l’effetto e’ lo stesso?) In qualche sottogruppo esiste evidenza ‘significativa’ di un effetto diverso? Analisi stratificata o multivariata Scarsa potenza statistica Suggerimento per nuovi studi o meta-analisi Esempio: trial ipotetico con 120 pz a braccio Osserviamo 72 risposte (60%) (tratt.sper.) contro 48 (cont.) (40%), p<0.002 (molto signif.) Tre sottogruppi: < 30anni: 48/80 (60%) vs 32/80 (40%), O.R.= 2.25 30-50 anni: 12/20 (60%) vs 8/20 (40%), O.R.= 2.25 > 50anni: 12/40 (60%) vs 8/20 (40%), O.R.= 2.25 Analisi dei Risultati: Strategia • Analisi Primaria (t. di significativita’ e/o stima di effetto) • Analisi Intermedie • Analisi secondarie previste – – – – Altri endpoints Sottopopolazioni Per sottogruppi (Interazioni) Analisi multivariate • Analisi non previste : scopo puramente esplorativo • -> per pianificare altri studi P R O T O C O L L O Problemi in una S.C.C (metodologici) Sperim.Clinica Problemi Reclutamento Pazienti Criteri di selezione Randomizzazione Pz. Randomizzati ma ineleggibili Trattamento Follow-up e Rilevazione esito Rifiuti-Errori-Modif. x Tossicita’ o non risposta Persi al follow-up Non valutabili Trial nello scompenso cardiaco Endpoint: Durata dell’esercizio decessi Braccio A: 100 pz 5 Braccio B: 100 pz 10 test non eseg. per motivi clinici 10 20 Drop Outs 5 10 Durata media esecizio 8’ (+/-1’) 10’ (+/-1’) Principio ‘Intention to treat’ Tutti i pazienti randomizzati, indipendentemente dall’eleggibilita’, dal trattamento ricevuto,e dalla compliance al follow-up devono essere inseriti nell’analisi dei risultati Motivazioni: • Validita’ statistica • Applicabilita’ alla pratica clinica Intention to treat (validita’ interna) • Pazienti ineleggibili erroneamente randomizzati (bias?) • Pazienti che non seguono il protocollo assegnato (rifiuto, tossicita’, non risposta :bias ?) • Pazienti ‘non valutati’ (persi al follow-up, rifiuti: bias?) Trial nello scompenso cardiaco Endpoint: Durata dell’esercizio decessi Braccio A: 100 pz 5 Braccio B: 100 pz 10 test non eseg. per motivi clinici 10 20 Drop Outs 5 10 Durata media esecizio 8’ (+/-1’) 10’ (+/-1’) Intention to treat e validita’ statistica T. standard (non tossica) Popol. target 100 pz 40 decessi (40%) Random 60 compliers 12 decessi (20%) T. speriment. 100 pz (tossica) 40 interruzioni (x tossicita’) 28 decessi (70%) Morti totali: 40/100 Example: RCT of surgery vs wait-andsee in prostate cancer Surgery: 100 patients 1 surgical death 30 ineligible (surgical stage) Wait and See 100 patients 20 relapses 40 relapses- surgery 10 deaths 10 deaths 30 pts with incontinence 15 pts with incontinence 10 want surgery Intention to treat e dati mancanti Per rispettare il principio dell’ITT e’ necessario includere nell’analisi anche i pazienti con dati mancanti sull’endpoint primario (Dati mancanti sui fattori prognostici - problema secondario) Intention to treat e dati mancanti • • • • • • • Proporzione di dati mancanti ‘accettabile’ ? Analisi di sensibilita’ (es. tutti morti/tutti vivi) Motivi ‘presumibili’ per la mancanza del dato Missing at random? Proporzione di ‘missing nei due gruppi ‘IMPUTAZIONE FORZATA’ Tipo di endpoint L’Intention to Treat e’ una filosofia di analisi di uno studio Nella presentazione dei risultati e’ necessario descrivere in dettaglio tutti i pz randomizzati ma: – Ineleggibili – Con compliance indadeguata o nulla – Persi al follow-up, non valutati, etc. e spiegare come sono stati trattati nell’analisi. Intention to treat e pratica clinica Attivita' clinica Diagnosi e stadiazione Scelta terap. Trattamento Problemi Errori diagnostici Rifiuti-Errori Tossicita’ Effetti sui pazienti Applicabilita’ dei risultati di una sperimentazione clinica Nuovo trattamento Efficacia??? TRIAL Centri specializz. Pz ideali Protocolli rigidi USO LARGA SCALA Centri? Pazienti? Procedure? Dimostrazione Efficacia Registrazione Efficacia? • Efficacy: Efficacia del trattamento in condizioni ottimali, su pazienti ideali e in centri specializzati • Effectiveness: • Efficacia nella pratica clinica su larga scala Efficacy vs Effectiveness • • • • Tecnologie disponibili (Es. Appendicectomia) Risorse ( MRI mammaria) Capacita’ (Chirurgia laparoscopica) Selezione dei pazienti (Eta’, Stadio, Biologia, Condizioni del paziente) • ‘Attenzione’ Prospettiva del paziente verso prospettiva di sanita’ pubblica STUDI ESPLICATIVI STUDI PRAGMATICI EFFICACY STUDI ESPLICATIVI EFFECTIVENESS STUDI PRAGMATICI- LARGE AND SIMPLE CLINICAL TRIALS - META-ANALISI IST-GENOVA Efficacy vs effectiveness Trial Scopo • Pazienti • Protocolli • Follow-up • Endpoint • Centri • Size Explanatory Pragmatic Efficacy Selezionati Approfonditi Ad hoc Strum/Clinico Specializzati Media Effectiveness Pratica clinica Generici Pratica clinica Clinico Generici Grande Large and Simple Clinical Trials • Studi-intervento per la valutazione e l’introduzione nella routine clinica di nuove pratiche cliniche • Dimensioni enormi • Centri e pazienti non selezionati • Riproducono la pratica clinica + randomizzazione tra due terapie • ITT rigida • Studi epidemiologici-Sanita’ pubblica LARGE AND SIMPLE CLINICAL TRIALS 10.000 STUDI PRAGMATICI 1000 FASE III 100 FASE II Attività Efficacy Effectiveness IST-GENOVA Interpretazione dei risultati di uno studio L’interpretazione dei risultati di uno studio e’ un’operazione complessa, che deve soppesare: • Limiti dello studio (Validita’ interna, bias) • Le dimensioni degli effetti, primari e secondari, osservati per il gruppo sperimentale rispetto a quello di controllo • Le probabilita’ che questi siano dovuti al caso • Tutte le evidenze esterne, dirette e indirette che abbiano qualche rilevanza rispetto allo studio Problemi residui • Molteplici studi con risultati contrastanti • Studi di qualita’ non omogenea (falsi positivi e falsi negativi) • Studi di dimensioni insufficienti (falsi negativi) • Pubblication bias Evidence-based Medicine Sforzo collettivo della comunita’ medica per rifondare la pratica della medicina su principi scientifici. Il suo aspetto qualificante e’ la valutazione critica di tutte le informazioni disponibili utilizzando criteri, sia qualitativi che quantitativi, espliciti e riproducibili EvidenceBasedMedicine PROBLEMA CLINICO RICERCA DELLA LETTERATURA REVISIONE NARRATIVA SISTEMATICA REVISIONE NARRATIVA PRO’s 1. Evidenze a priori 2. Collegamenti trasversali 3. Coerenza 4. Validita’ clinica 5. Costruzione di una teoria terapeutica (falsificabile) REVISIONE NARRATIVA CON’s CRITERI NON ESPLICITI E ARBITRARI PER 1. Ricerca delle evidenze 2. Selezione/citazione studi 3.Arbitrarieta’ giudizi 4. Metodi statistici 5. Stime quantitative di effetto? REVISIONE SISTEMATICA: Studio ‘epidemiologico’ degli studi rilevanti rispetto a un quesito clinico Ricerca esaustiva, Classificazione sistematica, Valutazione oggettiva e Analisi ‘pooled’ di tutta l’evidenza disponibile REVISIONE SISTEMATICA Coordinate Metodologiche: • Esaustivita’ • Criteri espliciti • Oggettivita’ • Approccio ‘quantitativo’ = RIPRODUCIBILITA’ (e la qualita’ dei comportamenti clinici?) Criteri di selezione degli studi • Patologia (Tipo, Conferma diagnostica, Stadio) • Disegno (Randomizzati -Non controllati) • Caratteristiche dei pazienti (eta’ sesso, terapie precedenti, etc) • Terapia di controllo • Terapia sperimentale • PUBBLICATI VS TUTTI (Bias di pubblicazione) Strategia di ricerca degli studi • • • • • Banche dati (Med-line, etc.) Full papers vs Abstracts Lingua inglese vs tutte Passa-parola REGISTRI PROSPETTICI Nota bene: Studi interrotti precocemente: BIAS ? Criteri di valutazione degli studi • • • • Espliciti Obiettivi - Riproducibili Predefiniti Validati? a) Procedure di randomizzazione b) Mascheramento - Rilevazione dell’endpoint c) Persi al follow-up-esclusioni d) Analisi statistica Analisi=Meta-analisi Analisi congiunta dei risultati di tutti gli studi ‘eleggibili’ trovati nella ricerca 1. Possibilita’ di eseguire la meta-analisi 2. Tecniche Statistiche 3. Analisi per sottogruppi 4. Eteterogeneita’ tra i risultati degli studi 5 .Interpretazione e problemi Fig 1. Overall survival with adjuvant chemotherapy compared with surgery alone Hotta, K. et al. J Clin Oncol; 22:3860-3867 2004 Copyright © A m erican Society of Clinical Oncology Interpretazione di MetaAnalisi/LSCT’s • • • • • • • Eterogeneità dei pazienti Eterogeneità dei centri Eterogeneità dei comportamenti Complessita’ del trattamento sperimentale Qualita’ dei dati Efficacia ‘Media’? Efficacia relativa a un determinato contesto? Interpretazione e problemi • La revisione sistematica (con l’eventuale metaanalisi) e’ uno studio epidemiologico con tutti i limiti e i possibili difetti • Meta-analisi diverse sullo stesso argomento possono dare risultati diversi • Il principale risultato e’ la stima quantitativa dell’effetto medio e del range di effetti ottenuti dal trattamento in tutti gli studi • Il valore di una meta-analisi dipende dalla qualita’ degli studi che la compongono Qualita’ degli studi? • Qualita’ metodologica: verificabile • Qualita’ dei dati ? • Qualita’ dei comportamenti ? – diagnosi e stadiazione – trattamenti – valutazioni La meta-analisi e’ uno studio osservazionale che fornisce una stima riassuntiva dei risultati degli studi, senza entrare nel merito della qualita’ dei dati o dei comportamenti Conclusioni • Studio clinico randomizzato: fondamento della Medicina Moderna • Nella sua rappresentazione ideale: risposte statisticamente valide e generalizzabili (disegno di studio) • Realta’: nessuno studio e’ esente da difetti (pianificazione, conduzione, analisi) • Generalizzabilita’: sempre discutibile • Meta-analisi:analisi di uno studio epidemiologico degli studi condotti su un quesito Conclusioni (segue) • Nessuno studio o meta-analisi e’ in grado di consegnarci ‘la verita assoluta’’ • Sono strumenti difettosi che forniscono una visione piu’ o meno distorta di una verita’ relativa al periodo e alle condizioni di esecuzione dei vari studi • Linee guida? • Pratica clinica ? E’ necessario che il medico continui a esercitare giudizio e spirito critico MODERNA Decisione Clinica: ‘SCIENZA e COSCIENZA’ • SCIENZA: Opinione COLLETTIVA della comunita’ medica BASATA SU PROVE SCIENTIFICAMENTE VALIDE • COSCIENZA: Esclusivo interesse del paziente (stabilito dal PAZIENTE, CON L’AIUTO del medico) NUOVO CONTRATTO TERAPEUTICO