Disegni quasi-sperimentali e sperimentali Introduzione Il disegno quasi-sperimentale e sperimentale elimina alcune minacce contro la validità interna (threats) che limitano la “forza” del disegno beforeand-after, il più semplice disegno di valutazione di efficacia di un intervento. In questa lezione si parlerà prima di come un disegno before-and-after può evolvere a un disegno quasi-sperimentale con l’aggiunta di uno o più elementi e poi di disegni sperimentali. Negli ambienti di lavoro i disegni quasi-sperimentali sono maggiormente fattibili dei disegni sperimentali. Ci sono cinque strategie per migliorare il disegno prima-e-dopo • Strategia 1: Aggiungere un gruppo di controllo • Strategia 2: Prendere più misure prima e dopo l’implementazione dell’intervento • Strategia 3: Sfasare l’introduzione dell’intervento tra i gruppi • Strategia : Aggiungere una fase di rimozione dell’intervento • Strategia 5: Usare misure di outcome addizionali Strategia 1 Aggiungere un gruppo di controllo Pre-post con controlli non-randomizzati OXO O O Pre-post con controlli nonrandomizzati Come nel disegno sperimentale, vi è almeno un gruppo che riceve l'intervento (gruppo di intervento) ed un gruppo che non lo riceve (gruppo di controllo). La differenza sta nel modo in cui i partecipanti sono assegnati ai gruppi per l’intervento e la valutazione. In un esperimento i partecipanti sono assegnati a caso; nei disegni quasi-sperimentali l'assegnazione è determinata spesso dall'organizzazione del lavoro. Costituire i gruppi (intervento e controllo) negli studi quasi-sperimentali Il principio fondamentale nella scelta nonrandomizzata dei gruppi per un disegno quasisperimentale è quello di renderli confrontabili. Dovrebbero essere simili sotto tutti gli aspetti eccetto che per l'intervento. Nel confrontare due reparti, è necessario trovarne due che siano simili rispetto al tipo di attività lavorativa. Per selezionare gruppi che si assomiglino, si potrebbero cercare reparti simili in ambienti di lavoro differenti, preferibilmente nello stesso tipo di industria. Costituire i gruppi (intervento e controllo) negli studi quasi-sperimentali La scelta dipende dalla situazione locale. Non possiamo dire specificamente quale gruppo sarebbe meglio, ma possono essere prese in considerazione alcune caratteristiche • caratteristiche del lavoratore (per esempio, età, sesso, esperienza) • natura delle mansioni di lavoro • ambiente del lavoro (cioè, esposizione ai rischi, controlli per la sicurezza) • fattori contestuali (per esempio, cultura sulla sicurezza e la salute; sostegno dell'amministrazione per la sicurezza) • registro di informazioni sulla sicurezza Vantaggi del disegno “pre-post con controlli non-randomizzati Aggiungere un gruppo di controllo nonrandomizzato al semplice disegno beforeand-after riduce automaticamente alcune delle minacce alla validità interna. In particolare si riduce l'interferenza da circostanze esterne (history threats), perché quest’ultimo effetto si verificherà sia nel gruppo di controllo che nel gruppo di intervento. Quindi questo disegno permette di separare l'effetto dell'intervento da quello di altre circostanze. Strategia 2 Prendere più misure prima e dopo l’implementazione dell’intervento Time series designs OOOXOOO Strategia 2: due approcci Disegni time series 2a: semplice OOOXOOO 2b: multiplo OOOXOOO OOO OOO Strategia 2a: “time series” semplice OOOXOOO Un disegno time series semplice differisce dal disegno before-and-after perché si effettuano misurazioni multiple prima e dopo l'intervento. Si stabilisce un baseline time trend ottenendo svariate misure dei risultati prima di effettuare l'intervento. Dopo l'intervento si rifanno misurazioni multiple per stabilire un second time trend. Se l'intervento è efficace, troveremo una differenza tra le misure dei risultati nei due trend temporali. Disegno “time series” semplice Vantaggi Nel primo riquadro si vede che vi è stato un decremento nella misura tra prima e dopo l’intervento. Tuttavia, questa differenza può essere dovuta a “history”, “maturation”, “instrumentation”, “regression-to-themean” o “Hawthorne threats”. Aggiungendo le misure, come indicate nel secondo riquadro, possiamo ridurre la probabilità di: • maturation threat perchè i cambiamenti dovuti ad aumento di età o di esperienza sono più graduali. • regression-to-the-mean o testing threats perché i risultati sono ripetutamente elevati prima e ripetutamente bassi in seguito. • Hawthorne e placebo threats perché la gente si adatta al cambiamento delle condizioni. • history effect threat perché le misure più numerose rendono un evento coincidente improbabile. • Restano possibili dropout e instrumentation threats, se non vi sono informazioni supplementari. Quante misure sono necessarie per un disegno time series semplice? Il numero di misure necessarie per un time series design dipende dalla quantità di fluttuazione casuale della misura (rumore) e da quanto ci si aspetta possa essere l’impatto l’intervento (segnale). Generalmente sono necessarie 6-15 misurazioni per inquadrare il baseline time trend e altrettante per il second time trend. Quante misure sono necessarie per un disegno time series semplice? Poiché sono necessarie molte misure, usando il tasso di infortunio come outcome, un time series design probabilmente non sarebbe adatto per studiare una piccola azienda, dove ci vorrebbe troppo tempo – un anno o più – per ottenere un trend di infortuni. Invece, il disegno potrebbe essere adatto per un gruppo di piccole aziende, un’azienda più grande, o nel caso si misurassero le condizioni del posto di lavoro anziché il tasso di infortunio. Queste situazioni consentono misurazioni più frequenti e più sicure. Quante misure sono necessarie per un disegno time series semplice? Anche quando non è possibile prendere tante misure quante sono necessarie per un’analisi di serie cronologiche, effettuare misure supplementari nel tempo permette una migliore stima dell’effetto dell’intervento. Fornisce una migliore percezione del tipo di variabilità nel tempo e se l'ultima misura “before” è dello stesso ordine di grandezza di quelle che la precedono, e se la prima misura “after” è dello stesso ordine di quelle che seguono. Strategia 2b: “time series” multiplo OOOXOOO OOO OOO Ancora meglio di utilizzare separatamente la Strategia #1 o #2, si può rafforzare il disegno before-and-after, combinando entrambe le strategie (gruppo di controllo + molteplici misurazioni). Strategia 3 Sfasare l’introduzione dell’intervento nei due gruppi Multiple baseline design across groups OOOXOOO OOO OOO OOOXOOO Multiple baseline design across groups L’introduzione sfasata di un intervento consente di ridurre marcatamente l’effetto “history threats”. Quando si effettua un intervento soltanto in un gruppo, non si può mai essere realmente sicuri che non sia accaduto qualcos'altro simultaneamente causando l'effetto misurato. Anche usando un gruppo di controllo, qualcosa potrebbe essere accaduto al gruppo di intervento (oltre all'intervento in se) tale da influenzare il risultato. Quando l’introduzione dell’intervento è sfasato, e l’effetto apparente è corrispondentemente sfasato, un “history effect” diventa una spiegazione improbabile dei risultati. Multiple baseline across groups design Ogni volta che un ambiente di lavoro è composto da più divisioni o gruppi, l’introduzione sfasata di un intervento dovrebbe essere considerata come una alternativa prima di implementare l’intervento in tutta l’azienda. Questo approccio “sfasato” può permettere una valutazione provvisoria e, se necessario, una modifica dell’intervento o della sua implementazione, prima di applicarlo a tutta l’azienda (Tuttavia tali modifiche dovrebbero essere considerate nell’interpretazione dei risultati). Esempio: In un’azienda fu introdotto un intervento prima in un reparto e poi in un altro. L'intervento iniziò con una sessione educativa su buone pratiche per la sicurezza. Successivamente i comportamenti di sicurezza sono stati misurati da un osservatore addestrato (3-4 volte alla settimana) che, usando una lista di controllo, forniva la percentuale di operazioni eseguite senza pericoli. Poiché la sequenza di eventi si era presentata non una ma due volte, questo fatto supportava il nesso causale tra l’intervento e il cambio di comportamento. Strategia 4 Aggiungere una fase di rimozione dell’intervento OOOXOOO-XOOO Un modo per rinforzare un disegno di tipo before-andafter o anche time series è far seguire all'introduzione di un intervento un'altra fase in cui l'intervento viene rimosso. Nel caso più semplice, ci sono tre fasi: una fase baseline, una fase di intervento e una fase di inversione. Se si rimuove l’intervento, si dovrebbe vedere un corrispondente cambiamento del risultato verso lo stato baseline. Naturalmente, questo disegno non è adatto a tutte le situazioni, perché si spera che l'effetto di un intervento duri e quindi non si inverta facilmente. Tuttavia, questo approccio è utile quando il risultato misurato è il comportamento. In questo caso, l'intervento "è stato invertito" sospendendo l’invio delle risposte di feedback. Vantaggi di un disegno con una fase di inversione dell’intervento La dimostrazione dell’inversione dell’effetto comporta una marcata riduzione delle minacce interne alla validità (in particolare history, maturation, testing, dropout and Hawthorne, assumendo che i ricercatori esterni siano ancora presenti durante la fase di inversione). Gli effetti placebo e di strumentazione possono ancora rimanere elementi importanti e dovrebbero essere considerati. Dopo la dimostrazione dell'effetto d'inversione dell’intervento, si può riprendere l'intervento. Svantaggi di un disegno con una fase di inversione dell’intervento L’altra faccia della medaglia è che cambiamenti ripetuti nella programmazione della sicurezza potrebbero generare confusione, stress ed risentimento fra i lavoratori interessati. Inoltre se un intervento è sembrato promettente, la sua rimozione potrebbe essere considerata non etica. Quindi, è una strategia da usare con attenzione. Strategia 5 Misurare molteplici outcome O1/O2 X O1/O2 Usare misure di outcome addizionali: due approcci Measure multiple outcomes Aggiungere misure di risultati interposti Aggiungere misure di outcome correlate ma diverse dagli obiettivi dello studio Aggiungere misure di risultati interposti Indicatori di risultati intermedi o interposti: • effetti a breve e medio termine dell'intervento • misure di esecuzione dell’intervento Esempi di indicatori interposti Component 1 Objectives Short-term outcomes Intermediateterm outcomes Long-term outcomes Component 2 Per quanto è fattibile dovremmo provare a misurare questi risultati interposti. Le misure di esecuzione dell’ intervento (documentazione degli acquisti di apparecchiatura e della modifica di compiti lavorativi) sono particolarmente importanti. Nel caso in cui un programma non abbia funzionato, si può distinguere un programma inefficace da un'esecuzione non corretta. Se un intervento non è stato effettuato come previsto, si potrebbe provare a migliorare questa parte dell'intervento, invece di scartare l'intervento complessivo. Un esempio Un'azienda progetta di effettuare un programma ergonomico “partecipativo” e cioè: • costituire un comitato lavoratori-dirigenti • valutare i bisogni dei lavoratori • comprare nuove attrezzature • modificare i compiti lavorativi • formare i lavoratori. L’effetto finale del programma consiste nella misura di sintomi auto-segnalati e di infortuni prima e dopo l'intervento. Continua l’esempio Il coordinatore del programma progetta alcune misure supplementari: • annotazioni degli acquisti dell'apparecchiatura • rapporti auto-compilati dei compiti lavorativi • buone pratiche • fattori di stress. Questi sono i risultati di misure interposte fra disegno dell'intervento ed il risultato finale (cambiamenti dei sintomi e degli infortuni). Aggiungere una misura di outcome correlata ma diversa dagli obiettivi dello studio Una seconda strategia per aumentare la forza di un disegno di intervento è di misurare un risultato che sia simile alla misura principale di risultato, ma che non sia tra gli obiettivi dell'intervento. La misura supplementare di risultato dovrebbe essere abbastanza simile alla misura principale di risultato in modo che sia suscettibile ai principali threats alla validità interna. Deve tuttavia essere abbastanza differente da non risentire dell’intervento. I seguenti esempi mostrano come funziona questo metodo. CODOLO = La parte di un cucchiaio o di una forchetta (che rassomiglia ad una coda) con cui si tengono in mano per adoperarli Misura di outcome correlata ma diversa dagli obiettivi dello studio L'effetto di nuova apparecchiatura sulle piattaforme petrolifere è stato valutato in base ai cambiamenti nel tasso di infortuni da codolo, un tipo di infortunio che dovrebbe essere ridotto usando la nuova apparecchiatura. E’ stato preso in considerazione anche il tasso delle lesioni non-codolo, una misura di risultato correlato ma non considerato tra gli obiettivi. Anche se questo secondo tipo di infortunio non dovrebbe risentire dell'intervento, probabilmente sarebbe in maniera simile suscettibile a effetti di tipo “ history or reporting threats”. Misura di outcome correlata ma diversa dagli obiettivi dello studio Un intervento ergonomico fra i lavoratori addetti al controllo della merce in un supermercato, è stato valutato misurando i disturbi del sistema muscoloscheletrico auto-segnalati prima e dopo l’intervento. L'intervento sembrava riuscito per il fatto che i cambiamenti riguardavano i sintomi a livello cervicale/spalla e a livello lombare/arti inferiori (dove l’intervento ergonomico intendeva portare benefici) ma non i sintomi di braccia/avanbracci/polso (che non erano oggetto dell’intervento). Ciò ha reso gli effetti history, maturation, instrumentation, placebo, Hawthorne and instrumentation spiegazioni improbabili. Studi sperimentali Anche se spesso non è fattibile, un disegno sperimentale è stato usato in parecchie situazioni professionali Due caratteristiche fondamentali : • uso di un gruppo di controllo • assegnazione randomizzata dei partecipanti Precedentemente, sono stati descritti tre tipi di disegni quasi-sperimentali con utilizzo di gruppi di controllo non randomizzati: • pre-post con gruppo di controllo (Strategia 1) • multiple time series (Strategia 2b) • multiple baseline across groups (Strategia 3). Questi stessi tipi di disegno possono diventare disegni sperimentali usando la randomizzazione per generare i gruppi. Studi non sperimentali Disegno 1 Disegno 2 Disegno 3 OXO O O OOOXOOO OOO OOO OOOXOOO OOO OOO OOOXOOO Precedentemente, sono stati descritti tre tipi di disegni quasi-sperimentali con utilizzo di gruppi di controllo non randomizzati: • pre-post con gruppo di controllo non-randomizzato • multiple time series • multiple baseline across groups Questi stessi tipi di disegno possono diventare disegni sperimentali usando la randomizzazione per generare i gruppi. Studi sperimentali Disegno 1 Disegno 2 Disegno 3 (R) OXO (R) O O (R) OOOXOOO (R) OOO OOO (R) OOOXOOO OOO (R) OOO OOOXOOO Il disegno 1 (pre-post controllato e randomizzato) è stato usato nei due esempi successivi. Sono stati assegnati per randomizzazione ai due gruppi (gruppo di intervento, gruppo di controllo): ► i posti di lavoro (primo esempio) ► i lavoratori (secondo esempio) Primo esempio • Target: gli operatori principali di aziende agricole • Intervento: un seminario educativo di un giorno • Popolazione: campione casuale di aziende incluse in una lista dell'associazione di agricoltori. Il 60% di questa aziende acconsentì a partecipare allo studio • Randomizzazione: Gli operatori principali (uno per azienda) sono stati assegnati al gruppo di intervento o al gruppo di controllo, seguendo una procedura random • Per valutare l'intervento, questi gruppi sono stati confrontati in base alle misure prese prima e dopo l'intervento: infortuni e quasi-infortuni auto-riportati, (risultato finale) e percezioni della sicurezza, buone pratiche ed atteggiamenti (risultati intermedi). Primo esempio Misure preintervento Intervento (questionario) Gr up pi A B Infortuni e quasi-infortuni riportati + percezione di sicurezza buona pratica attitudini Controlli della sicurezza in azienda + Formazione di un giorno O O A = gruppo di intervento; Misure post-intervento (questionario) Percezione di sicurezza buona pratica attitudini (outcome intermedio) X B=gruppo di controllo Infortuni e quasi-infortuni riportati (outcome finale) O O Secondo esempio Misure preMisure preComponenti dell’intervento intervento intervento Gr Forza muscoli up addominali + pi Questionario back school + Infortuni + Assenze per malattia training A O X B O X C O A =Intervento_ 1; fasce/cinture lombari Forza muscoli addominali + Questionario + Infortuni + Assenze per malattia O X O O B = Intervento_ 2; C= controlli Minacce per la validità interna nei Disegni con gruppo di controllo I gruppi di controllo introducono alcune nuove minacce alla validità interna. Nonostante ciò, l’utilizzo di gruppi di controllo è fortemente raccomandato. Essi rafforzano lo studio molto di più di quanto non la indeboliscano. Selection threats • Quando i gruppi di intervento e di controllo non sono simili riguardo a tutte le variabili che possono influenzare i risultati, l'effetto dell'intervento potrebbe essere dovuto a differenze nelle caratteristiche dei partecipanti nei gruppi confrontati, piuttosto che all'intervento in se. • Per questo motivo, nei disegni quasi-sperimentali e sperimentali (in cui è stata usata una procedura di randomizzazione per generare i gruppi), è necessario considerare se le persone nei due gruppi differiscono, per esempio, per età livello di esperienza livello di formazione, e altre caratteristiche. • In caso affermativo, bisogna raccogliere informazioni su queste caratteristiche e tenere conto di queste differenze nell’analisi statistica. Diffusion or contamination threat Una minaccia di diffusion alla validità interna (anche conosciuta come una minaccia di contaminazione) si presenta quando l'intervento introdotto ad un gruppo "si diffonde" all'altro. Ciò può accadere facilmente quando l'intervento è educativo, poiché gli operai condividono naturalmente le informazioni tra loro. È persino possibile che una nuova apparecchiatura data al gruppo di venga ripartita con il gruppo di controllo. La diffusione è più probabile quando l'intervento è percepito come favorevole. È un evento non desiderato perché riduce le differenze osservate fra i gruppi nei loro i cambiamenti “before” to “after”. Si potrebbe concludere che un intervento era inefficace quando realmente non lo era. Il modo migliore per ridurre la minaccia di diffusione è mantenere i gruppi di controllo e di intervento separati quanto più possibile. Rivalry or resentment threat … quando la gente del gruppo di controllo reagisce per non aver ricevuto l'intervento. Per esempio, in un programma in cui sia stato introdotto un incentivo per incoraggiare buone pratiche di sicurezza, il gruppo di controllo potrebbe reagire non segnalando gli infortuni così che le relative prestazioni a riguardo della sicurezza finirebbero per apparire buone se confrontate al gruppo di intervento. O potrebbe “sovrariportare" gli infortuni per dimostrare che il gruppo ha bisogno di un intervento. In entrambi i casi il gruppo di controllo ha cambiato il comportamento per rivalità. Sono inoltre possibili effetti di risentimento. Il gruppo di controllo, per esempio, potrebbe risentirsi per non aver avuto la possibilità di partecipare ad un programma di miglioramento. Questo inacidimento dei rapporti di lavoro può causare un aumento nei tassi di infortunio. Rivalry or resentment threat Gli effetti appena descritti possono a volte essere evitati comunicando bene con i gruppi o promettendo che se l'intervento risulta essere efficace, il gruppo di controllo riceverà in seguito lo stesso intervento. Se gli interventi sono concepiti ed introdotti con un processo di partecipazione, le reazioni inattese sono meno probabili. Tuttavia, è impossible prevedere tutte le possibili reazioni ad un programma. E’ un’area dove la ricerca qualitativa può essere molto utile. Le interviste con alcuna persone informate nel gruppo di controllo dovrebbero far comprendere se rancore o di rivalità siano minacce da prendere in considerazione. Come con la minaccia di diffusione, la rivalità o le minacce di rancore potrebbero essere evitate se i gruppi non comunicano tra loro.