STUDI DI FASE III
Sperimentazioni Cliniche Controllate
(Controlled Clinical Trials, Randomized
C.T.s’)
SCOPO: Valutazione dell’efficacia del
trattamento sperimentale
EFFICACIA: Miglioramento della prognosi
e/o della qualita’ di vita
IST-GENOVA
LO STUDIO CLINICO
CONTROLLATO
POPOLAZIONE 'TARGET'
RANDOM
TRATT. A
TRATT.B
ESITO
ESITO
CONFRONTO
STATISTICO
Sperimentazione Clinica Controllata
•
•
•
•
•
•
•
Identificazione dello/gli scopo/i dello studio
Reclutamento prospettico dei pazienti
Assegnazione casuale dei trattamenti
Criteri di selezione espliciti
Rilevazione oggettiva/unbiased dell’endpoint
Piano statistico appropriato
Comportamenti adeguati?
L’aspetto piu’ importante di uno
studio e’ il suo scopo primario
Disegno
Endpoint -Mascheramento
Criteri di selezione dei
pazienti
SCOPO
Protoc. terapeutico
Follow-up
Analisi Statistica
Disegno di studio
Disegni corretti
• Exp vs Stand
• Exp.+ Stand vs Standard
• Exp vs niente
• Exp1 +Exp2 vs standard ?
Disegni non corretti
• Exp vs Exp.+Standard
• Exp+Standard vs niente
• Exp1 vs Exp2
Studi a >2 braccia: E1 vs E2 vs Standard ?
Studi fattoriali
Studi cross-over
Confronto di sequenze terapeutiche
POPOLAZIONE 'TARGET'
RANDOM
Terapia medica
Chirurgia
Chirurgia
Terapia M edica
Esito
Esito
Confronto statistico
Disegni particolari
POPOLAZIONE 'T ARGET '
RANDOM
Intervento
Preventivo A
Intervento
Preventivo B
Esito A
Esito B
Confronto A
Contronto B
Due studi !!
Esempio: screening per c. prostatico e
colorettale
POPOLAZIONE 'TARGET'
RANDO M
PSA
(screening c. prost.)
Colonscopia
Inc. c. prostatico
Inc. C.Colorettale
Confronto
Confronto
Vantaggi: Nessun gruppo e’ senza trattamento
RANDOMIZZAZIONE
Assegnazione dei trattamenti con una sequenza:
• Casuale
• Ignota sia al medico che al paziente
• Imprevedibile
• Non sistematica
• Riproducibile
Deve essere descritta in dettaglio nell’articolo di
presentazione dei risultati
RANDOMIZZAZIONE
Metodi accettati:
• Centralizzata telefonica
• Centralizzata via fax/internet/Email
• Locale su computer?
Tecniche:
• Semplice
• Stratificata con bilanciamenti a blocchi
• Minimizzazione
• Altre
Rapporto di randomizzazione: Qualsiasi
Bilanciamento per fattori prognostici
• Non necessario: possibile aggiustare in sede di analisi
• Negli studi di dimensioni adeguate il bilanciamento si
ottiene naturalmente
• Negli studi piccoli e’ difficile da ottenere
• Bilanciare solo per pochi fattori (4 fattori con 2 livelli
+ 1 con 3 livelli= 48 strati
• 500 pz diviso 48 strati = 10 pz per strato in media
• Consigliabile stratificare sempre x centro
Endpoint
Variabile misurata in ogni paziente,
utilizzata per valutare l’efficacia del
trattamento sperimentale
• Identificazione -Definizione
• Protocollo di rilevazione
• Classificazione
• Mascheramento
Scelta dell’endpoint
(Variabile di risposta, Outcome variable,
etc)
Criteri:
Scopo dello studio
Validita’ scientifica dei risultati
Rilevanza sanitaria dei risultati
Potenza statistica
Fattibilita’
Esempio: Trial con un ace-inibitore
nello scompenso cardiaco
• Frazione di eiezione a 6 mesi
• Capacita’ di esercizio (test specifico) a 1 anno
• Incidenza di eventi avversi (specificati) a 3 anni
• Mortalita’ CVD a 3 anni
•Mortalita’ globale a 5 anni
Endpoint: Protocollo di rilevazione e
classificazione
• Fonti/metodi accettati/gerarchie
• Protocollo di rilevazione
• Ricerca attiva/Controlli di qualita’
• Codifica delle informazioni
• Persi al follow-up/classificazione
• Comitato di revisione degli endpoints
• Mascheramenti
Mascheramento (Doppio o Triplo Cieco):
Metodi per nascondere il braccio di
assegnazione al paziente, al terapeuta e ai
‘valutatori’
Scopo : Prevenire…
- bias nella rilevazione dell’endpoint
- bias nella classificazione dell’endpoint
- non compliance
- contaminazione
-bias nella decisione di interrompere lo studio
Mascheramento
Fattori da considerare
•
•
•
•
•
•
Tipo di endpoint
Gravita’ della malattia
Via di somministrazione
Tossicita’ dei due trattamenti
Consenso informato
Costi e problemi organizzativi
• Scopo dello studio
Mascheramenti differenziati per pz,
medico, classificatori e valutatori
Criteri di selezione dei pazienti
Informazioni disponibili alla randomizzazione
• Caratteristiche anagrafiche
• Caratteristiche della malattia (stadio, biologia, sede,
etc.)
• Storia clinica specifica (es. terapie precedenti)
• Storia clinica generica (es. malattie precedenti)
• Stato del paziente (es.esami ematologici)
• Disponibilita’ di test
• Valutabilita’?
Criteri di selezione dei pazienti
• Selettivi:
- Scarsa generalizzabilita’ dello studio
- Difficolta’ di reclutamento
• Generici
- Sottostima dell’efficacia?
- Minore validita’ scientifica dei risultati
SCOPO DELLO STUDIO!
Criteri di selezione dei pazienti: esempio
Studio per valutare l’efficacia di una
chemioterapia aggressiva
Selettivi:
-
Pazienti con c. mammario operato radicalmente
Eta’ <65 e >40
Infiltrazione linfonodale e Biologia aggressiva
Ecocardiogramma FE >50%
Generici
- Pazienti con c. mammario operato radicalmente
100 Pazienti con c. mammario operabile
10 pz < 45 anni
50 pz 45-65 anni
25 pz N -
40 pz >65 anni
25 pz N+
10 T. non aggress.
15 T. aggressivi
5 pz cardiop.
10 pz ELEGGIBILI
Aspetti Statistici
•
•
•
•
•
•
•
Significativita’ Statistica
Errore di I e II tipo
Potenza dello studio
Significativita’ vs stima di effetto
Dimensioni dello studio
Piano di analisi
Conduzione dell’analisi
‘Significativita’,
• Anche se i due trattamenti sono equiefficaci
(ipotesi nulla), in ogni singolo studio, per puro
caso, si osserveranno differenze (di solito
piccole)
• Se queste differenze sono troppo grosse per
essere attribuite al caso si rifiuta l’ipotesi nulla
• Troppo grosse? = probabilita’ di verificarsi per
puro caso <5%
Interpretazioni del test di
significativita’
• P <0.05 = I due
trattamenti sono
differenti
• P >0.05 I due
trattamenti sono
uguali
Interpretazioni del test di
significativita’
• P <0.05 = I due
trattamenti sono
differenti
• P<0.05 : se fosse vera
l’ipotesi nulla, difficilmente
si sarebbero ottenuto risultati
di questo tipo per puro caso
• P >0.05 I due
trattamenti sono
uguali
• P>0.05. Se fosse vera
l’ipotesi nulla, risultati come
quelli osservati non
sarebbero troppo improbabili
Test di Significativita’ vs
Stime di effetto
Confronto
Mortalita’.
A vs B
15% vs 10%
N= 600
P=0.06
A vs C
N=12000
15% vs 12.5%
P = 0.0007
Test di Significativita’ vs
Stime di effetto
•
•
•
•
Coerenza degli effetti in studi diversi
Valutazioni costi-benefici
Scelte cliniche
Linee guida
• Le Riviste scientifiche chiedono stime di effetto
+ Limiti di confidenza (+/- 2 E.S.)
Esempio: Efficacia = Mortalita’
Riduzione della mortalità: p=0.01 ?
• Mortalita’ controllo 20%
• Mortalita’ Sperimentale 15%
• Efficacia relativa = Relative Risk (≈Hazard ratio)
15/20=75%
• Riduzione del 25%
• Odds Ratio:(15/85)/(20/80) = 0.7
• Efficacia assoluta (Rislk Difference) 15-20=5% = ogni
100 pz trattati col nuovo tratt. se ne salvano 5.
• Number needed to treat (NTT) = 1/5% = 20
• Estrapolazioni ?
Lo studio perfetto: checklist
•
•
•
•
•
•
•
•
Razionale
Scopo primario
Disegno
Endpoint-Mascheramento
Registr./Randomizzazione
Criteri di selezione
Protocollo di trattamento
Piano Statistico
VALIDITA’ DI UNO STUDIO= Protocollo di
studio + qualita’ dei comportamenti
•
•
•
•
•
•
•
•
Razionale: Plausibilita' dell'ipotesi in studio
Scopo primario: Definito in maniera univoca
Disegno: Semplice e chiaro
Endpoint: Sensibile, specifico e validato
Mascheramento: Adeguato all’endpoint
Registrazione: Prospettica, senza eccezioni
Randomizzazione: Imprevedibile, ignota e non sistematica
Criteri di selezione: Univoci, adeguati allo scopo dello
studio
• Protocollo di trattamento: Come sopra
• Piano statistico: Se possibile, semplice - Deve essere
previsto tutto
Come interpretare i risultati di uno
studio clinico
• Coordinate interpretative
• Coordinate statistiche
• Quadro complessivo di riferimento
LO STUDIO CLINICO
CONTROLLATO
POPOLAZIONE 'TARGET'
RANDOM
TRATT. A
TRATT.B
ESITO
ESITO
CONFRONTO
STATISTICO
Criteri tradizionali per valutare/
interpretare i risultati di un trial
• Validita’ interna:
– Validita’ statistica, assenza di bias/errore sistematico
– Risultati = Verita’ +/- caso
• Validita’ esterna:
– Possibilita’ di estrapolare/generalizzare i risultati
– Applicabilita’
Validita’ interna
• Protocollo di ricerca
• Disegno di studio
• Identificazione dello scopo(i) primario(i)
• Procedure di randomizzazione
• Scelta/Rilevazione dell’endpoint/mascheramento
• Piano statistico
• Persi al follow-up/non valutati
• Analisi ‘intention to treat’
Progetto -Comportamenti
Validita’ Esterna
•
•
•
•
•
•
•
•
•
VALIDITA’ INTERNA !
Criteri di selezione dei pazienti
Caratteristiche dei pazienti
Tipologia dei centri partecipanti
Protocollo terapeutico
Endpoint
Protocollo di follow-up
Precisione delle stime
Analisi ‘intention to treat’
Coordinate di riferimento
nell’analisi di una S.C.C.
• Statistica: Tutte le analisi statistiche devono
essere esplicitamente predeterminate (endpoint,
trasformazione, test, tempi, sottogruppi)
• Metodologica: Tutti i pazienti randomizzati
devono essere inseriti nell’analisi statistica in
base al trattamento assegnato (intention to
treat)
MOLTEPLICITA’
- ENDPOINT:… .Non si sono osservate differenze
statisticamente significative trai i due trattamenti per quanto
riguarda O.S., P.F.S., Q.o.L., e tossicita’. Il trattamento X si e’
pero’ dimostrato SIGNIFICATIVAMENTE piu’ efficace di Y nel
ridurre la mortalita’ per emorragie gastriche
- SOTTOGRUPPI:.…si e’ pero’ osservato che nei pazienti
maschi di eta’ inferiore ai 55 anni con neoplasia epidermoide il
tr. Sperimentale induceva un miglioramento prognostico
SIGNIFICATIVO (P<0.05). Questo f a ritenere…
- ANALISI RIPETUTE:Nel corso del secondo anno dello studio
ha pero’ iniziato a manifestarsi, nel confronto tra le proporzioni
di pazienti rispondenti nei due gruppi, un trend a favore del
trattamento sperimentale che al 34° mese ha raggiunto la
SIGNIFICATIVITA’ STATISTICA (P<0.05), inducendoci
all’interruzione dello studio.
Il problema della molteplicità
• P statistica : Probabilità di osservare un fenomeno raro quanto
quello osservato (o più raro) se è vera l’ipotesi nulla (Eguale
efficacia dei due trattamenti).
• Es.
BRACCIO A
Risposte 30/40 ( 75 % )
•
BRACCIO B
Risposte 20/40 ( 50 % )
P = 0.02
• La probabilità di osservare un risultato come questo per puro caso
è del 2 %.
• Livello di significatività convenzionale per rifiutare l’ipotesi
nulla : 5 %
segue
• Si considerano non casuali le differenze che si
verificherebbero, per caso, meno del 5 % delle volte.
• Livello di significatività = Frequenza di analisi
falsamente positive
• 5 % ogni 100 studi (analisi) che confrontano
trattamenti di eguale efficacia, mediamente, in 5 un
trattamento sarà dichiarato superiore all’altro per un
errore dovuto al caso.
Conseguenze
• La probabilità che almeno 1 di più studi/analisi
fornisca, per caso, risultati statisticamente
significativi è > 5 %
• Quindi, se in uno studio vengono eseguiti più test di
significatività la probabilità di un risultato falsamente
positivo è > 5 %
• La probabilità di un risultato falsamente positivo
aumenta all’aumentare del numero di test di
significatività
Esempio: Acqua S. Bernardo vs Acqua Fiuggi
nel trattamento del c. polmonare inoperabile
•
•
•
•
Probabilita’ di trovare un risultato SIGNIFICATIVO
Confronto principale: 5%
SB vs F nei giovani - SB vs F nei vecchi: 9.75
Nei giovani PS<2 - giovani PS>2 -vecchi <2 - vecchi >2 :
18.5
• G,<2, Epidermoide, ….V,>2, Epidermoide,
G,<2,ADK…..V,>2,ADK, G<2 Altri…V>2,Altri = 12
strati 46%
• Tutte le 20 analisi possibili : 64% (probabilita’ di trovare
almeno una differenza significativa)
Fattori prognostici nel c. mammario
(operabile)
• Eta’ - Stato menopausale - Obesita’ - Altezza - Terapie
ormonali precedenti
• T, N, Angiogenesi
• G, MI, TLI,
• ER, PgR
• Neu-erb, p53
15 fattori: > 100 combinazioni di 2 fattori: praticamente e’
certo che in qualche sottogruppo vi sara’ una differenza
significativa tra i due trattamenti
Possibili fonti di molteplicita’
in un clinical trial
• Endpoints multipli
• Trasformazione degli endpoints (es. curva di
sopravvivenza vs % di pz vivi a 3 anni)
• Test statistico
• Misura di effetto
• Dati mancanti
• Analisi per sottogruppi
• Analisi nel corso dello studio
Test multipli vs Analisi derivate
dai dati
• Test multipli :
• Predeterminati (Protocollo di studio)
• Numero finito
• Possibile correzione statistica
• Analisi derivate dai dati
• L’osservazione di un particolare fenomeno
induce all’esecuzione di un test di significatività
• Numero potenzialmente illimitato
• Prive di alcuna validità statistica
MOLTEPLICITA’ : Regole generali
• Viene stabilito, prima dell’inizio dello studio, il
numero e tipo (tempo) delle analisi (ES. 2 analisi per
soggetti < 50 e >50 anni, oppure 3 analisi, dopo 100,
200 e 300 eventi (finale)
• Viene stabilito un insieme di regole per decidere che lo
studio ha dato un risultato significativo (o per
interrompere lo studio)
• Queste regole sono dei livelli di significativita’ (tutti <
α) calcolati in modo che la probabilita’ di errore α
complessiva sia quella desiderata (ES. 5%)
Analisi Per Sottogruppi:
Metodo piu’ utilizzato (sbagliato)
IL TEST DI SIGNIFICATIVITA’ VIENE
RIPETUTO IN OGNI SOTTOGRUPPO AL
LIVELLO DI SIGNIFICATIVITA’
CONVENZIONALE
Esempio: trial ipotetico con 120 pz a braccio
Osserviamo 72 risposte (60%) (tratt.sper.) contro
48 (cont.) (40%), p<0.002 (molto signif.)
Tre sottogruppi:
< 30anni:
p=0.01
30-50 anni:
p=0.2 n.s.
> 50anni:
p=0.2 n.s.
Conclusioni?
Esempio: trial ipotetico con 120 pz a braccio
Osserviamo 72 risposte (60%) (tratt.sper.) contro
48 (cont.) (40%), p<0.002 (molto signif.)
Tre sottogruppi:
< 30anni:
48/80 (60%) vs 32/80 (40%),
p=0.01
30-50 anni:
12/20 (60%) vs 8/20 (40%),
p=0.2 n.s.
> 50anni:
12/40 (60%) vs 8/20 (40%),
p=0.2 n.s.
Esempio: trial ipotetico con 120 pz a braccio
Osserviamo 72 risposte (60%) (tratt.sper.) contro
48 (cont.) (40%), p<0.002 (molto signif.)
Tre sottogruppi:
< 30anni:
p=0.07 n.s.
30-50 anni:
p=0.07 n.s.
> 50anni:
p=0.07 n.s.
Conclusioni?
Esempio: trial ipotetico con 120 pz a braccio
Osserviamo 72 risposte (60%) (tratt.sper.) contro
48 (cont.) (40%), p<0.002 (molto signif.)
Tre sottogruppi:
< 30anni:
p=0.07 n.s.
24/40 (60%) vs 16/40 (40%),
30-50 anni:
p=0.07 n.s.
24/40 (60%) vs 16/40 (40%),
> 50anni:
p=0.07 n.s.
24/40 (60%) vs 16/40 (40%),
Soluzioni tipiche
(Sottogruppi)
• Viene definita come analisi primaria l’analisi
sull’intero gruppo
• Viene introdotta come analisi secondaria
l’analisi per alcuni sottogruppi predefiniti se
significativita’ nell’analisi primaria. Questa si
basa su un test di interazione
• Il test di significativita’ nei vari sottogruppi e’
privo di senso e produce risultati assurdi
Analisi per sottogruppi:
test di interazione
Nuova ipotesi nulla: Omogeneita’ dell’effetto (o del
non effetto) in tutti i sottogruppi (l’effetto e’ lo
stesso?)
In qualche sottogruppo esiste evidenza
‘significativa’ di un effetto diverso?
Analisi stratificata o multivariata
Scarsa potenza statistica
Suggerimento per nuovi studi o meta-analisi
Esempio: trial ipotetico con 120 pz a braccio
Osserviamo 72 risposte (60%) (tratt.sper.) contro
48 (cont.) (40%), p<0.002 (molto signif.)
Tre sottogruppi:
< 30anni:
48/80 (60%) vs 32/80 (40%),
O.R.= 2.25
30-50 anni:
12/20 (60%) vs 8/20 (40%),
O.R.= 2.25
> 50anni:
12/40 (60%) vs 8/20 (40%),
O.R.= 2.25
Analisi dei Risultati: Strategia
• Analisi Primaria
(t. di significativita’ e/o stima di effetto)
• Analisi Intermedie
• Analisi secondarie previste
–
–
–
–
Altri endpoints
Sottopopolazioni
Per sottogruppi
(Interazioni)
Analisi multivariate
• Analisi non previste : scopo puramente esplorativo
• -> per pianificare altri studi
P
R
O
T
O
C
O
L
L
O
Problemi in una S.C.C
(metodologici)
Sperim.Clinica
Problemi
Reclutamento
Pazienti
Criteri di selezione
Randomizzazione
Pz. Randomizzati ma ineleggibili
Trattamento
Follow-up e
Rilevazione esito
Rifiuti-Errori-Modif. x Tossicita’ o
non risposta
Persi al follow-up Non valutabili
Trial nello scompenso cardiaco
Endpoint: Durata dell’esercizio
decessi
Braccio A: 100 pz
5
Braccio B: 100 pz
10
test non eseg. per
motivi clinici
10
20
Drop Outs
5
10
Durata media
esecizio
8’ (+/-1’)
10’ (+/-1’)
Principio
‘Intention to treat’
Tutti i pazienti randomizzati, indipendentemente
dall’eleggibilita’, dal trattamento ricevuto,e
dalla compliance al follow-up devono essere
inseriti nell’analisi dei risultati
Motivazioni:
• Validita’ statistica
• Applicabilita’ alla pratica clinica
Intention to treat
(validita’ interna)
• Pazienti ineleggibili erroneamente randomizzati
(bias?)
• Pazienti che non seguono il protocollo assegnato
(rifiuto, tossicita’, non risposta :bias ?)
• Pazienti ‘non valutati’ (persi al follow-up, rifiuti:
bias?)
Trial nello scompenso cardiaco
Endpoint: Durata dell’esercizio
decessi
Braccio A: 100 pz
5
Braccio B: 100 pz
10
test non eseg. per
motivi clinici
10
20
Drop Outs
5
10
Durata media
esecizio
8’ (+/-1’)
10’ (+/-1’)
Intention to treat e validita’ statistica
T. standard
(non tossica)
Popol.
target
100 pz
40 decessi
(40%)
Random
60 compliers
12 decessi
(20%)
T. speriment. 100 pz
(tossica)
40 interruzioni
(x tossicita’)
28 decessi
(70%)
Morti totali: 40/100
Example: RCT of surgery vs wait-andsee in prostate cancer
Surgery:
100 patients
1 surgical death
30 ineligible (surgical stage)
Wait and See
100 patients
20 relapses
40 relapses- surgery
10 deaths
10 deaths
30 pts with incontinence
15 pts with incontinence
10 want surgery
Intention to treat e dati mancanti
Per rispettare il principio dell’ITT e’ necessario
includere nell’analisi anche i pazienti con dati
mancanti sull’endpoint primario
(Dati mancanti sui fattori prognostici - problema
secondario)
Intention to treat e dati mancanti
•
•
•
•
•
•
•
Proporzione di dati mancanti ‘accettabile’ ?
Analisi di sensibilita’ (es. tutti morti/tutti vivi)
Motivi ‘presumibili’ per la mancanza del dato
Missing at random?
Proporzione di ‘missing nei due gruppi
‘IMPUTAZIONE FORZATA’
Tipo di endpoint
L’Intention to Treat e’ una filosofia
di analisi di uno studio
Nella presentazione dei risultati e’ necessario
descrivere in dettaglio tutti i pz randomizzati ma:
– Ineleggibili
– Con compliance indadeguata o nulla
– Persi al follow-up, non valutati, etc.
e spiegare come sono stati trattati nell’analisi.
Intention to treat e pratica clinica
Attivita' clinica
Diagnosi e stadiazione
Scelta terap.
Trattamento
Problemi
Errori diagnostici
Rifiuti-Errori
Tossicita’
Effetti sui pazienti
Applicabilita’ dei risultati di una
sperimentazione clinica
Nuovo trattamento
Efficacia???
TRIAL
Centri specializz.
Pz ideali
Protocolli rigidi
USO LARGA SCALA
Centri?
Pazienti?
Procedure?
Dimostrazione
Efficacia
Registrazione
Efficacia?
• Efficacy:
Efficacia del trattamento in condizioni ottimali, su
pazienti ideali e in centri specializzati
• Effectiveness:
• Efficacia nella pratica clinica su larga scala
Efficacy vs Effectiveness
•
•
•
•
Tecnologie disponibili (Es. Appendicectomia)
Risorse ( MRI mammaria)
Capacita’ (Chirurgia laparoscopica)
Selezione dei pazienti (Eta’, Stadio, Biologia,
Condizioni del paziente)
• ‘Attenzione’
Prospettiva del paziente verso prospettiva di sanita’
pubblica
STUDI ESPLICATIVI
STUDI PRAGMATICI
EFFICACY
STUDI ESPLICATIVI
EFFECTIVENESS STUDI
PRAGMATICI- LARGE AND SIMPLE
CLINICAL TRIALS - META-ANALISI
IST-GENOVA
Efficacy vs effectiveness
Trial
Scopo
• Pazienti
• Protocolli
• Follow-up
• Endpoint
• Centri
• Size
Explanatory
Pragmatic
Efficacy
Selezionati
Approfonditi
Ad hoc
Strum/Clinico
Specializzati
Media
Effectiveness
Pratica clinica
Generici
Pratica clinica
Clinico
Generici
Grande
Large and Simple Clinical Trials
• Studi-intervento per la valutazione e l’introduzione
nella routine clinica di nuove pratiche cliniche
• Dimensioni enormi
• Centri e pazienti non selezionati
• Riproducono la pratica clinica + randomizzazione tra
due terapie
• ITT rigida
• Studi epidemiologici-Sanita’ pubblica
LARGE AND SIMPLE
CLINICAL TRIALS
10.000
STUDI PRAGMATICI
1000
FASE III
100
FASE II
Attività
Efficacy
Effectiveness
IST-GENOVA
Interpretazione dei risultati di uno studio
L’interpretazione dei risultati di uno studio e’
un’operazione complessa, che deve soppesare:
• Limiti dello studio (Validita’ interna, bias)
• Le dimensioni degli effetti, primari e secondari,
osservati per il gruppo sperimentale rispetto a quello di
controllo
• Le probabilita’ che questi siano dovuti al caso
• Tutte le evidenze esterne, dirette e indirette che abbiano
qualche rilevanza rispetto allo studio
Problemi residui
• Molteplici studi con risultati contrastanti
• Studi di qualita’ non omogenea (falsi positivi e
falsi negativi)
• Studi di dimensioni insufficienti (falsi negativi)
• Pubblication bias
Evidence-based Medicine
Sforzo collettivo della comunita’ medica
per rifondare la pratica della medicina su
principi scientifici.
Il suo aspetto qualificante e’ la
valutazione critica di tutte le
informazioni disponibili utilizzando
criteri, sia qualitativi che quantitativi,
espliciti e riproducibili
EvidenceBasedMedicine
PROBLEMA CLINICO
RICERCA DELLA
LETTERATURA
REVISIONE
NARRATIVA
SISTEMATICA
REVISIONE NARRATIVA
PRO’s
1. Evidenze a priori
2. Collegamenti trasversali
3. Coerenza
4. Validita’ clinica
5. Costruzione di una teoria terapeutica (falsificabile)
REVISIONE NARRATIVA
CON’s
CRITERI NON ESPLICITI E ARBITRARI PER
1. Ricerca delle evidenze
2. Selezione/citazione studi
3.Arbitrarieta’ giudizi
4. Metodi statistici
5. Stime quantitative di effetto?
REVISIONE SISTEMATICA:
Studio ‘epidemiologico’ degli studi
rilevanti rispetto a un quesito clinico
Ricerca esaustiva, Classificazione sistematica,
Valutazione oggettiva e Analisi ‘pooled’ di tutta
l’evidenza disponibile
REVISIONE SISTEMATICA
Coordinate Metodologiche:
• Esaustivita’
• Criteri espliciti
• Oggettivita’
• Approccio ‘quantitativo’
= RIPRODUCIBILITA’
(e la qualita’ dei comportamenti clinici?)
Criteri di selezione degli studi
• Patologia (Tipo, Conferma diagnostica, Stadio)
• Disegno (Randomizzati -Non controllati)
• Caratteristiche dei pazienti (eta’ sesso, terapie
precedenti, etc)
• Terapia di controllo
• Terapia sperimentale
• PUBBLICATI VS TUTTI (Bias di
pubblicazione)
Strategia di ricerca degli studi
•
•
•
•
•
Banche dati (Med-line, etc.)
Full papers vs Abstracts
Lingua inglese vs tutte
Passa-parola
REGISTRI PROSPETTICI
Nota bene: Studi interrotti precocemente: BIAS ?
Criteri di valutazione degli studi
•
•
•
•
Espliciti
Obiettivi - Riproducibili
Predefiniti
Validati?
a) Procedure di randomizzazione
b) Mascheramento - Rilevazione dell’endpoint
c) Persi al follow-up-esclusioni
d) Analisi statistica
Analisi=Meta-analisi
Analisi congiunta dei risultati di tutti gli
studi ‘eleggibili’ trovati nella ricerca
1. Possibilita’ di eseguire la meta-analisi
2. Tecniche Statistiche
3. Analisi per sottogruppi
4. Eteterogeneita’ tra i risultati degli studi
5 .Interpretazione e problemi
Fig 1. Overall survival with adjuvant chemotherapy compared with surgery
alone
Hotta, K. et al. J Clin Oncol; 22:3860-3867 2004
Copyright © A m erican Society of Clinical Oncology
Interpretazione di MetaAnalisi/LSCT’s
•
•
•
•
•
•
•
Eterogeneità dei pazienti
Eterogeneità dei centri
Eterogeneità dei comportamenti
Complessita’ del trattamento sperimentale
Qualita’ dei dati
Efficacia ‘Media’?
Efficacia relativa a un determinato contesto?
Interpretazione e problemi
• La revisione sistematica (con l’eventuale metaanalisi) e’ uno studio epidemiologico con tutti i
limiti e i possibili difetti
• Meta-analisi diverse sullo stesso argomento
possono dare risultati diversi
• Il principale risultato e’ la stima quantitativa
dell’effetto medio e del range di effetti ottenuti
dal trattamento in tutti gli studi
• Il valore di una meta-analisi dipende dalla
qualita’ degli studi che la compongono
Qualita’ degli studi?
• Qualita’ metodologica: verificabile
• Qualita’ dei dati ?
• Qualita’ dei comportamenti ?
– diagnosi e stadiazione
– trattamenti
– valutazioni
La meta-analisi e’ uno studio osservazionale che
fornisce una stima riassuntiva dei risultati degli
studi, senza entrare nel merito della qualita’ dei
dati o dei comportamenti
Conclusioni
• Studio clinico randomizzato: fondamento della
Medicina Moderna
• Nella sua rappresentazione ideale: risposte
statisticamente valide e generalizzabili (disegno
di studio)
• Realta’: nessuno studio e’ esente da difetti
(pianificazione, conduzione, analisi)
• Generalizzabilita’: sempre discutibile
• Meta-analisi:analisi di uno studio
epidemiologico degli studi condotti su un
quesito
Conclusioni (segue)
• Nessuno studio o meta-analisi e’ in grado di
consegnarci ‘la verita assoluta’’
• Sono strumenti difettosi che forniscono una visione
piu’ o meno distorta di una verita’ relativa al periodo e
alle condizioni di esecuzione dei vari studi
• Linee guida?
• Pratica clinica ?
E’ necessario che il medico continui a esercitare
giudizio e spirito critico
MODERNA Decisione Clinica:
‘SCIENZA e COSCIENZA’
• SCIENZA: Opinione COLLETTIVA della comunita’
medica BASATA SU PROVE SCIENTIFICAMENTE
VALIDE
• COSCIENZA: Esclusivo interesse del paziente
(stabilito dal PAZIENTE, CON L’AIUTO del medico)
NUOVO CONTRATTO TERAPEUTICO
Scarica

Clinical trials 2 - Scienze Biomediche ed Oncologia Umana