Corso di Laurea Specialistica in Scienze delle Professioni Sanitarie della Prevenzione Letteratura secondaria: revisioni sistematiche e meta-analisi Ludovica Tamburini 14 e 15 gennaio 2010 Evidence-based Medicine Movimento culturale che si è progressivamente diffuso a livello internazionale, favorito da alcuni fenomeni che hanno contribuito ad una crisi dei modelli tradizionali della medicina: crescita esponenziale dell’informazione biomedica (volume e complessità) limitato trasferimento dei risultati della ricerca alla pratica sanitaria crisi economica dei sistemi sanitari maggior livello di consapevolezza degli utenti sviluppo delle tecnologie informatiche L’Evidence-based Prevention Movimento che: → coopera per cambiare la pratica della prevenzione, al fine di renderla sempre più utile per la salute della popolazione; → intende arricchire la prevenzione di tutti quegli interventi per i quali, attraverso adeguati studi scientifici , ne è stata dimostrata utilità ed efficacia; → intende eliminare progressivamente tutte quelle pratiche di prevenzione inutili ed inefficaci. Poiché alcune delle pratiche inefficaci sono ancora obbligatorie per legge, l'iniziativa Evidence Based Prevention tenta anche di adeguare la normativa alle attuali conoscenze scientifiche. Dall’EBM all’EBP Il fascino dell'EBM ha presto "contagiato" tutte le specialità mediche e le altre professioni sanitarie con relativa moltiplicazione degli acronimi. Superata la fase campanilistica si è diffuso il termine Evidence-based Practice (EBP), a sottolineare in maniera univoca la "pratica professionale basata sulle evidenze scientifiche".* * www.gimbe .it Core-curriculum La pratica dell'EBP si articola in 4 step: Formulating → Convertire il bisogno di informazione in quesiti question definiti Getting evidence → Ricercare con la massima efficienza, le migliori evidenze disponibili Appraising evidence → Valutare criticamente le evidenze Applying evidence → Integrare le evidenze nelle decisioni cliniche Quesiti e approcci di ricerca bibliografica QUESITO APPROCCIO BACKGROUND QUESTIONS quesiti di carattere generale SCANNING STRATEGIA PRO-ATTIVA (consultazione periodica per individuare novità sui temi di abituale interesse) FOREGROUND QUESTIONS quesiti specifici che si riferiscono ad un aspetto particolare (di trattamento, di prognosi, eziologici, diagnostici). SEARCHING STRATEGIA REATTIVA (ricerca attiva rispetto ad un quesito formulato ) Foreground questions • quesito in forma narrativa • PICO P – (patient) paziente o problema I – (intervetion) intervento o esposizione C – (comparison) confronto o intervento di controllo O – (outcame) risultato o esito • parole chiave • traduzione • ricerca nelle banche dati biomediche Esempio: Nelle persone al di sopra dei 65 anni, la vaccinazione antinfluenzale può ridurre la morbilità rispetto alle persone che non la effettuano? Popolazione Intervento Anziani > a 65 anni Vaccinazione antinfluenzale PAROLE CHIAVE Comparazione Outcome Riduce la morbilità? TRADUZIONE ANZIANI AGED VACCINAZIONE ANTINFLUENZALE INFLUENZA VACCINES MORBILITÀ MORBIDITY Come si collocano i professionisti? LIMITATA PRATICABILITA’ EBP-practitioners, capaci di praticare l’EBP step-by-step e di diffonderla nel loro setting professionale. EBP-users, professionisti che condividono principi e metodi dell’EBP, ma sostituiscono lo step relativo alla valutazione critica utilizzando prevalentemente fonti secondarie. LA LETTERATURA SCIENTIFICA PRIMARIA SECONDARIA TERZIARIA Oggetto: Pazienti Oggetto: Studi primari Oggetto: - Studi primari di: Trattamento (RCT) Eziologia (coorte o casocontrollo) Prognosi (coorte) Diagnosi (di validazione) Revisioni sistematiche Metanalisi Linee guida evidence based Trattati Libri Revisioni tradizionali Editoriali Lettere La piramide delle evidenze SRs e MAs di RCTs RCTs SRs e MAs di CSs Cohorte Studies SRs e MAs di CCSs Case Control Studies Case Series – Case Report Opinions Non è evidenza ciò che è esplicito ma ciò che è dimostrato REVIEWS Rendono più “maneggevole” un enorme quantità di informazioni. Si distinguono in: TRADIZIONALI – narrative (letteratura terziaria) SISTEMATICHE - qualitative o quantitative (letteratura secondaria) Revisione tradizionale Paragonabile al capitolo di un libro Non esplicitato il metodo di selezione, sintesi e interpretazione delle evidenze Impossibilità di fare una valutazione critica Obiettivi molto ampi Spesso fatte su commissione * Centro Studi EBN S.Orsola – Malpighi Bologna Revisione sistematica Ricerca scientifica vera e propria Esplicitato il protocollo metodologico Possibilità di fare una valutazione critica Sintesi dei risultati spesso fatta con metodo meta analitico Systematic Review Individua, valuta e sintetizza studi scientifici, allo scopo di offrire risposte esaurienti, basate su dati empirici, a quesiti della ricerca scientifica E’ uno strumento capace di risolvere problemi legati alla ricerca e all’interpretazione delle migliori evidenze Ha un ruolo sempre crescente per la pratica clinica, per la formazione permanente, per le decisioni di politica sanitaria Systematic Review Le revisioni sistematiche consentono di riassumere tutte le prove di efficacia circa un particolare intervento/prestazione e di aggiornarle quando nuove informazioni sono disponibili. L’analisi combinata di diversi studi sulla stessa tipologia di pazienti, di intervento/prestazione ed outcome consente di aumentare la precisione delle stime. La possibilità offerta dalle revisioni sistematiche di comparare i risultati di studi diversi condotti in contesti differenti consente di migliorare la generalizzabilità dei risultati. Systematic Review FASI 1. 2. 3. 4. 5. 6. 7. 8. Identificazione del problema e dello scopo Sviluppo di un protocollo di revisione Localizzazione degli studi Selezione degli studi rilevanti Valutazione della qualità delle ricerche Raccolta dei dati dagli studi individuali Sintesi quantitativa o qualitativa e riassunto dei risultati degli studi Documentazione del metodo nel report della revisione Systematic Review ELEMENTI ESSENZIALI DEL PROTOCOLLO DI REVISIONE → DEFINIZIONE QUESITO DI RICERCA (GENERALMENTE DI FOREGROUND) → DEFINIZIONE STRATEGIA DI RICERCA DEGLI STUDI → DEFINIZIONE CRITERI DI INCLUSIONE/ESCLUSIONE DEGLI STUDI → CRITERI PER LA VALUTAZIONE DELLA QUALITA’ → ESTRAPOLAZIONE ED ANALISI DEI DATI 1. Quesito Deve essere essenziale, specifico e chiaro. Deve definire i partecipanti, gli interventi da valutare, gli esiti da misurare (PICO). Quesiti non chiari e generici danno luogo a revisioni scadenti. 2.Criteri di inclusione e di esclusione Devono essere sempre definiti prima di iniziare la ricerca degli studi in letteratura Devono riflettere direttamente il quesito della ricerca (partecipanti, interventi, risultati) Devono indicare i tipi che di studio verranno selezionati 3. Strategia di ricerca Serve ad interrogare le banche dati e descrive le modalità di consultazione di ogni altra fonte informativa, ricerca bibliografica, ricerca manuale, contatti con ricercatori, atti di congressi, registri di studi non ancora pubblicati (es. Cochrane Central Register*) *http://uscc.cochrane.org/en/newPage3.html The Cochrane Central Register of Controlled Trials (CENTRAL) is a database of controlled trials and other healthcare interventions that serves as the best available resource for those preparing and maintaining systematic reviews or searching for trials. CENTRAL includes citations that may not be indexed in MEDLINE, EMBASE, or other bibliographic databases, citations published internationally in many languages, and citations that are available in conference proceedings or other hard to access sources. (Dickersin K, Manheimer E, Wieland S, Robinson KA, Lefebvre C, McDonald S, and the Central Development Group. Development of the Cochrane Collaboration's Central Register of Controlled Clinical Trials. Evaluation and the Health Professions, 2002; 25:38-64.) 3. Strategia di ricerca Deve avere come obiettivo l’identificazione di tutti gli studi pubblicati, non pubblicati o in corso di pubblicazione che rientrino nei criteri di inclusione. L’obiettivo di una strategia di ricerca completa è quello di ridurre al minimo il rischio di bias: publication bias (di pubblicazione) time lag bias (temporale) language bias (linguistico) Funnel Plot Tecnica grafica utilizzata per valutare la possibilità di publication bias in una RS. Si tratta di uno strumento grafico che si basa sulla distribuzione dei punti sul grafico: - se questi sono equamente distribuiti nelle due parti si ipotizza che non siano presenti pubblication bias - se invece sono concentrati in una sola parte il rischio è che siano presenti bias Funnel Plot Recentemente questo strumento è stato messo in discussione, per la grande sensibilità e la scarsa specificità. Ossia se il funnel plot non rileva bias è probabile che non ci sia, ma se lo rileva non è detto che questo ci sia realmente. 4. Valutazione critica Serve per valutare il rigore metodologico degli studi raccolti, verificando il disegno di studio e la sua conduzione. La qualità del prodotto conclusivo di una RS dipende dalla qualità degli studi considerati. Pertanto è necessaria una valutazione critica relativa alla pertinenza al tema e alla metodologia di ricerca. Esistono strumenti specifici per la valutazione critica (es: Quality Assessment Scale, Scala di Newcastle-Ottawa ). 5. Raccolta e sintesi dei dati Estrapolare i dati nel modo più accurato possibile e creare uno strumento (es. una griglia) dove registrare le informazioni che servono, relative ad ogni studio incluso nella RS. Per un buon livello qualitativo, l’analisi dei dati va definita nel protocollo della RS I dati di una revisione si possono analizzare in modi differenti: se quantitativi si prestano al metodo statistico della meta-analisi, se qualitativi possono essere presentati in forma narrativa. In entrambi i casi è opportuno definire a priori la metodologia che si intende seguire. Meta-analisi La metanalisi è una tecnica clinico-statistica che permette di analizzare una serie di studi condotti sullo stesso argomento, consentendo una sintesi quantitativa dei risultati. Meta-analisi E’ utilizzata nei casi di incertezza nella valutazione di efficacia di un trattamento quando i risultati dei singoli studi non sono univoci quando i singoli studi sono effettuati su un campione di pazienti numericamente scarso (poco affidabili) LA COMBINAZIONE DEI DATI DIMINUISCE L’IMPRECISIONE DEI RISULTATI DEI SINGOLI STUDI Meta-analisi In una meta-analisi non si sommano semplicemente i pazienti dei vari studi. Si conserva l'effetto individuale di ciascuno studio e si usano metodi statistici che, preservando l'identità del singolo studio, forniscono una stima combinata dell'effetto dell'intervento dando maggior peso agli studi più grandi. Più è grande uno studio e più esso influenzerà il risultato globale della meta-analisi. Meta-analisi: quale valore aggiunto? Combinazione statistica di più studi che permette: di aumentare la potenza del risultato in caso di studi con campioni piccoli di aumentare la generalizzabilità aumentando il campione (purchè omogeneo) di rispondere a domande non poste dai singoli studi di chiarire controversie che derivano da studi confliggenti di formulare nuove ipotesi Meta-analisi: quando non è opportuna? 1. Se gli studi sono clinicamente molto diversi (interventi o outcome diversi) 2. Se gli studi sono di scarsa qualità metodologica 3. Se la revisione della letteratura non ha eliminato il pubblication bias. Come leggere una meta-analisi: il forest plot o blobbogramma Nel tipico grafico di sintesi di una meta-analisi si hanno linee orizzontali, ciascuna delle quali mostra il risultato di un singolo studio, mentre la linea perpendicolare corrisponde a "nessun effetto". Per convenzione nel lato sinistro del grafico cadono le stime di effetto che favoriscono il trattamento sperimentale mentre in quello destro quelle a favore del trattamento standard. Conviene però guardare sempre la figura con attenzione perché a volte la situazione è capovolta. Il quadratino in mezzo alla linea indica la stima di effetto che può essere riassunta con diversi tipi di misure: rischio relativo, odds ratio, differenza di rischio (la misura più spesso usata è l'odds ratio). La lunghezza della linea attorno alla stima puntuale è proporzionale all'incertezza che ha la stima puntuale di quello studio. Essa rappresenta l'intervallo di confidenza del risultato. Quando uno studio ha un campione piccolo il risultato è molto incerto e ciò si può vedere dalla lunghezza della linea (che sarà lunga) e dalla dimensione della stima puntuale nel centro (che sarà piccola). Quando la linea dello studio tocca o attraversa la linea perpendicolare del "nessun effetto" il risultato non è convenzionalmente "statisticamente significativo". Se confrontiamo i due studi inseriti nel forest plot, si nota che lo studio a sx produce una stima molto meno incerta. Il grado di certezza/incertezza derivante da ogni singolo studio non è comunque una misura di "validità dei risultati". Infatti, entrambi gli studi possono essere completamente sbagliati. Una piccola dose di incertezza (come nello studio più grande) non significa assolutamente che il risultato sia "vero". Essa mostra semplicemente l'incertezza attorno alla stima puntuale per ogni studio. E' difficile pensare che entrambi gli studi mostrino la verità su questo trattamento, perché essi puntano in direzioni opposte. Il primo studio che abbiamo inserito sulla destra indica, in modo statisticamente significativo, che il trattamento non è utile poiché i soggetti nel gruppo di controllo hanno un esito migliore. E lo studio sulla sinistra dice l'opposto. Inserendo nel grafico un terzo studio, anche questo ci dice che probabilmente il trattamento sperimentale non funziona. Ma il risultato è compatibile sia con un piccolo effetto positivo, sia con un piccolo effetto negativo. Prima di procedere alla combinazione quantitativa dei risultati, si aggiungono nel forest plot uno studio dopo l'altro. Se si sceglie di fare una meta-analisi occorre procedere con una stima puntuale globale degli studi. Il risultato cumulativo derivante dall’elaborazione statistica di tutti gli studi è rappresentato dal diamante ai piedi del grafico, il cui punto centrale indica la stima complessiva dell’efficacia dell’intervento indagato, mentre la larghezza si riferisce all’intervallo di confidenza complessivamente calcolato. In questo caso particolare, la combinazione è più o meno simile come ci si poteva attendere - allo studio più grande poiché quando si hanno pochi studi a disposizione lo studio più ampio domina la metaanalisi. Può darsi che l'unico studio che mostra un effetto positivo del trattamento abbia ragione, ma può anche essere in realtà che quello studio ci stia dando una risposta sbagliata. Quindi, la decisione di combinare o meno quantitativamente i risultati quando gli studi sono pochi e i risultati variabili andrebbe presa con molta cautela. Critical Appraisal: come valutare la qualità di una RS qualitativa e quantitativa? Poche e semplici domande su: OBIETTIVO STRATEGIA DI RICERCA CRITERI DI INCLUSIONE VALUTAZIONE CRITICA SINTESI DEI DATI OMOGENEITA’ DOCUMENTAZIONE DEI RISULTATI CONCLUSIONI E RACCOMANDAZIONI Obiettivo L’obbiettivo specifico è dichiarato in modo chiaro ed esplicito (PICO)? Strategia di ricerca È stata utilizzata una strategia della ricerca corretta per individuare gli studi? È stata fatta una ricerca completa dei database appropriati e sono state esplorate le altre fonti potenzialmente importanti? (controllare che siano state utilizzate come banche dati almeno Medline, Embase, Chinal, Cochrane) Criteri di inclusione Come sono stati selezionati gli studi? I criteri di inclusione sono dichiarati? Valutazione critica È stata valutata in modo appropriato la validità degli studi inclusi? (bias? violazione del protocollo?) Sintesi dei dati Come sono stati aggregati gli studi? I risultati sono stati aggregati in modo appropriato (meta-analisi per gli studi quantitativi e forma narrativa per quelli qualitativi)? Omogeneità Gli studi sono omogenei? La popolazione degli studi inclusi è simile? È stato valutato lo stesso intervento? Sono stati usati gli stessi outcome? Documentazione dei risultati I metodi di revisione sono documentati? È fornito un riassunto dei risultati? Conclusioni e raccomandazioni È fornito un riassunto dei risultati? Sono proposte specifiche direttive per nuove ricerche? Le conclusioni sono supportate dai dati? Valutazione della qualità delle RS Devono essere valutati i successivi sei punti: 1. il quesito clinico di partenza non deve essere una semplice speculazione teorica, ma deve avere un impatto sui pazienti ed essere clinicamente rilevante; 2. i criteri di inclusione degli studi in termini di tipologia di pazienti, condizioni di salute, interventi da valutare, misure di esito e disegno di studio devono essere chiaramente esplicitati; 3. la strategia attraverso la quale sono stati ricercati gli studi da includere deve essere dichiarata, deve essere specificato che non sono stati applicati limiti temporali o linguistici alla ricerca e come è stata verificata l’esistenza di studi in corso e/o non pubblicati; 4. come è stata effettuata l’estrazione dei dati dagli studi. L’adozione di una scheda predefinita ed il lavoro svolto da almeno due revisori indipendenti è il metodo accreditato per ridurre gli errori; 5. il modo in cui si è proceduto alla valutazione della qualità degli studi e come questa valutazione è stata presa in considerazione in fase di analisi. 6. in che modo gli autori della revisione hanno interpretato i risultati. In particolare è importante che i risultati derivino dai dati presentati e non si confondano le considerazioni degli autori con i risultati delle analisi. È necessario, per esempio, che la mancanza di prove di efficacia non sia confusa con le prove di inefficacia, ovvero che la carenza di studi non sia discussa come se esistessero studi con risultati negativi. ETEROGENEITA’ Occorre definire se gli studi sono sufficientemente omogenei da legittimare la meta-analisi. Si distinguono 3 tipi: 1. CLINICA (PICO), 2. METODOLOGICA (M), 3. STATISTICA (dipende dalle prime due) La decisione rispetto all’eterogeneità si prende sulla base dei seguenti aspetti: •Scostamenti tra le stime puntuali degli effetti dei diversi studi. •Sovrapposizione degli intervalli di confidenza. •Valore del test statistico di eterogeneità. TEST STATISTICI DI ETEROGENEITA’ chi quadro p value (<0,10) la differenza tra le popolazioni di riferimento è reale o casuale? Se p > 0,05 non c’è eterogeneità (differenza casuale), se < 0,05 c’è eterogeneità (differenza reale) inconsistenza I² descrive la percentuale della variabilità dell’effetto della stima che è riferibile alla eterogeneità piuttosto che al caso (variabilità campionaria). Se I² > 50%, siamo in presenza di una eterogeneità sostanziale. ETEROGENEITA’ NON PRESENTE ETEROGENEITA’ PRESENTE CASA FARE IN CASO DI ETEROGENEITA’ Se le stime puntuali sono lontane, gli overlaps sono scarsi, p < 0,10, I₂ > 50% significa che la variabilità che si osserva tra gli studi non è spiegabile solo attraverso il caso, ma è imputabile a differenze reali (la meta-analisi non è “appropriata”). Non è opportuno utilizzare i risultati di una meta-analisi che dimostra eterogeneità.