CONTROLLO DEI DATI
I dati raccolti, indipendentemente dalla forma di presentazione (tabelle cartacee o archivio di computer),
costituiscono nel loro insieme i dati grezzi, il cui unico ordine precostituito è in genere rappresentato dalla
cronologia del rilevamento. Un controllo dei dati grezzi è necessario per limitare o eliminare errori ripetuti, i
quali, anche se di lieve entità, possono incidere sulla stima del fenomeno; questa regola deve essere
considerata durante tutte le fasi della ricerca, in quanto la ripetitività di un errore (seppur minimo) può
generare grossolane distorsioni in sede di valutazione finale. La sperimentazione ha evidenziato che
l’errore sistematico inficia la validità delle osservazioni sul fenomeno in maniera inversamente
proporzionale al momento di introduzione. L’errore commesso nelle prime fasi della ricerca influisce sulla
differenza tra modello proposto e realtà più di quanto non influiscano gli errori in fase di elaborazione.
Il controllo dei dati grezzi, evidentemente, non può entrare nel merito della loro correttezza, la cui verifica
deve essere già stata effettuata all’atto del rilevamento, ma può evidenziare misure poco plausibili sfuggite
al rilevatore o introdotte con la trascrizione dei dati, nonché incongruenze, dati mancanti e valori fuori
norma. I dati mancanti possono essere recuperati, se disponibili, mentre negli altri casi viene effettuato un
confronto con i dati originali.
Taluni ritengono lecito eliminare i dati anomali considerandoli aprioristicamente errati. La tendenza a
operare in questo modo viene giustificata dal fatto che tali dati possono influenzare notevolmente i risultati
delle elaborazioni statistiche. Questa prassi non è corretta; se non è stato accertato un errore, non è
ammesso eliminare dati solo perché colpevoli di non essere in sintonia con gli altri: potrebbero essere
segnali di particolari variabilità che verrebbero perdute con la loro eliminazione. Sarà compito dello
statistico orientarsi su opportune tecniche per evitare ripercussioni su calcoli e risultati. La possibilità di
essere in presenza di dati mancanti e dati non misurabili in modo quantitativo, perché al di sotto o al di
sopra della sensibilità dello strumento o della logica dell’indagine, va prevista nella programmazione e deve
indirizzare a tecniche statistiche specifiche.
Una semplice osservazione dei dati può anche far emergere l’eventuale esigenza di una loro
trasformazione per una migliore elaborazione statistica.
Elementi di Statistica medica
Pasquale Bruno Lantieri, Domenico Risso, Giambattista Ravera
Copyright © 2007 – The McGraw-Hill Companies s.r.l.
Scarica

controllo dei dati