ALTRE MEDIE ANALITICHE Media troncata (trimmed mean) Uno dei limiti della media aritmetica è di essere sensibile a dati particolarmente scostati rispetto all’insieme degli altri. Il problema è superabile utilizzando indici di posizione, oppure facendo riferimento a questa particolare media aritmetica calcolata dopo aver eliminato i valori più estremi della casistica in esame. La quantità di dati da scartare viene decisa in percentuale (5, 10, 20% ecc.) in relazione alla quantità di valori che potrebbero compromettere il significato della media e deve riguardare simmetricamente i valori più alti e quelli più bassi. Media mobile Quando un fenomeno viene seguito nel tempo, un modo di presentarlo è costruire una serie temporale considerando i valori riscontrati in singoli periodi di osservazione (giorni, mesi, anni ecc.); in questo modo si è in grado di evidenziare variazioni caratteristiche. Se i valori sono soggetti a fluttuazioni, questa variabilità unita a quella casuale potrebbe mascherare qualche particolare andamento generale (trend). Un metodo semplice per ridurre le variabilità che possono mascherare il trend di una serie temporale consiste nell’uso della media mobile. Si tratta di calcolare una serie di nuovi valori ottenuti ciascuno come media aritmetica di N dati originali consecutivi (in genere 3), a partire dal primo e scalando di una osservazione di volta in volta: il primo si ottiene come media delle prime tre osservazioni, il secondo deriva dalla seconda, terza e quarta osservazione e così a seguire. Si ottiene una serie di valori medi nei quali è attenuata la variabilità non dovuta all’andamento generale (Figura 1). Non è ovviamente possibile attribuire valori di media mobile al primo e all’ultimo dato originale Elementi di Statistica medica Pasquale Bruno Lantieri, Domenico Risso, Giambattista Ravera Copyright © 2007 – The McGraw-Hill Companies s.r.l. Media geometrica In certe circostanze, la media aritmetica non rappresenta in modo adeguato la tendenza centrale dei dati; per esempio, non è conveniente utilizzarla nel caso di dati distribuiti su diversi ordini di grandezza. La media aritmetica di 10, 100 e 1000 è , troppo spostata verso il valore alto e quindi poco plausibile per segnalare la centralità: si evidenzia così un limite di utilizzazione della media aritmetica. Quando i dati appaiono legati tra loro da un fattore moltiplicativo (in linguaggio matematico, si dovrebbe parlare di dati in successione geometrica), i valori elevati acquistano un peso preponderante rispetto ai valori bassi e alzano drasticamente il valore della media aritmetica. All’inconveniente prospettato si ovvia utilizzando la media geometrica definita da: N MG N x1 x2 xN N xi i 1 cioè la radice ennesima del prodotto (o produttoria, in analogia alla sommatoria) delle N osservazioni. Nel caso di osservazioni ripetute, o di distribuzioni in classi, la formula viene adattata come media geometrica ponderata: MG fi x1f1 x2f2 xNfN fi x fi i Se ricalcoliamo la tendenza centrale di 10, 100 e 1000 come media geometrica, si ottiene MG 3 10 102 103 3 106 102 100 che meglio rappresenta la centralità dei dati. Elementi di Statistica medica Pasquale Bruno Lantieri, Domenico Risso, Giambattista Ravera Copyright © 2007 – The McGraw-Hill Companies s.r.l. La media geometrica viene largamente usata nelle ricerche di microbiologia e sierologia che prevedono titolazioni di soluzioni ottenute mediante diluizioni costanti. Di conseguenza, le concentrazioni si riducono in base al fattore di diluizione determinando valori in successione geometrica. Analogamente, la media geometrica viene preferita per serie temporali riferite allo sviluppo di microrganismi e, per assimilazione, nel caso di variazioni di una popolazione in accrescimento o in diminuzione, se espresse da una successione geometrica. Ci si ricollega alle variazioni percentuali precedentemente viste. Quando un fenomeno varia nel tempo sia in più sia in meno rispetto a un valore di riferimento (e interessano non tanto le variazioni intese come differenze, quanto le variazioni relative), le misure sono costituite da rapporti, di cui sono un esempio i già considerati numeri indice. In questo caso, la media geometrica permette di attribuire uno stesso peso a variazioni relative uguali per intensità, ma opposte per verso, diversamente da come si comporta la media aritmetica che attribuisce peso maggiore agli aumenti piuttosto che alle diminuzioni. Dato un valore di partenza pari a 10 con la possibilità di variazioni relative di ordine 2, il nuovo valore diventerà rispettivamente 20 in accrescimento e 5 in diminuzione; la media aritmetica tra questi due valori è 12.5 mentre la media geometrica risulta 10, che si pone effettivamente come valore centrale tra i due. Le variazioni percentuali sono una particolare espressione di variazioni relative e, in quanto tali, per ottenerne la tendenza centrale devono essere elaborate come media geometrica delle variazioni relative. È evidente che la media geometrica non ha significato in presenza di valori nulli o negativi e, di conseguenza, è utilizzabile solo con scale quantitative di rapporto. Elementi di Statistica medica Pasquale Bruno Lantieri, Domenico Risso, Giambattista Ravera Copyright © 2007 – The McGraw-Hill Companies s.r.l. Elementi di Statistica medica Pasquale Bruno Lantieri, Domenico Risso, Giambattista Ravera Copyright © 2007 – The McGraw-Hill Companies s.r.l. Media armonica Una media analitica di uso meno frequente è la media armonica, definita come il reciproco della media aritmetica del reciproco delle misure: MA 1 N 1 1 xi xi N oppure, per dati ripetuti o distribuzioni in classi, MA fi f i xi Tale media trova applicazione nella valutazione di tempi di reazione o risposta, in prove di tossicità, sopravvivenza postoperatoria ecc. e, in genere, quando un fenomeno si dovrebbe prevedibilmente esaurire in un arco di tempo definito. In tali situazioni, poiché la rilevazione viene limitata a tale periodo, sorge il problema di come considerare, agli effetti di una tendenza centrale, i tempi che vanno oltre il periodo ragionevole di controllo, per un tempo quindi ipoteticamente “infinito”. La media armonica permette di tener conto nell’elaborazione anche dei valori “infiniti” (il reciproco di è 0) che, come tali, impedirebbero il calcolo di altre medie analitiche (per contro, è evidente che la media armonica non è utilizzabile nel caso di valori nulli). Per analogia, si possono considerare valori infiniti i dati di laboratorio indeterminati del tipo > 100 mg dovuti a una limitata sensibilità dello strumento di misura. Elementi di Statistica medica Pasquale Bruno Lantieri, Domenico Risso, Giambattista Ravera Copyright © 2007 – The McGraw-Hill Companies s.r.l. La media armonica gode delle stesse proprietà della media aritmetica rispetto ai reciproci delle misure. Di conseguenza, trova applicazione anche quando occorre calcolare la media di una variabile rilevata come reciproco dell’informazione che interessa. Volendo stabilire il consumo medio in un dato arco di tempo (giorno, settimana, mese ecc.) di un prodotto, per esempio un farmaco di uso non continuativo, può essere più agevole raccogliere l’informazione riguardante la durata di una confezione (la durata è il reciproco del consumo, oggetto di indagine). La media armonica dei tempi di durata fornisce un’informazione utile per valutare la tendenza centrale del consumo (che è il reciproco della media armonica ottenuta). Per contro, la tendenza centrale ottenuta come reciproco della media aritmetica dei tempi di durata porterebbe a risultati che non rispecchiano la realtà. Relazioni tra medie analitiche Tra le medie aritmetica, geometrica e armonica, calcolate su una stessa serie di misure, esiste la relazione: MA MG x (principio di Cauchy) dove il segno di uguaglianza vale solo nel caso in cui le osservazioni siano tutte uguali. Elementi di Statistica medica Pasquale Bruno Lantieri, Domenico Risso, Giambattista Ravera Copyright © 2007 – The McGraw-Hill Companies s.r.l.