Università degli Studi di Pisa Facoltà di Scienze matematiche fisiche e naturali Anno Accademico 2011-12 Biostatistica (SECS-S/02 ) STATISTICA PER LA RICERCA SPERIMENTALE E TECNOLOGICA Incontro 14 24 Novembre 2011 Confronti multipli non prestabiliti • La definizione a priori dei contrasti ortogonali consente grandi vantaggi di semplicità e correttezza nei test statistici relativi , ma nella pratica sperimentale non è sempre possibile pianificare a priori i confronti ,soprattutto se questi sono equivalenti o suggeriti dai risultati dell’esperimento. • Esempio:In agronomia un esperimento di confronto tra varietà non permette di pianificare in anticipo dei contrasti tra le medie campionarie:è più conveniente basarsi su quanto suggeriscono i dati sperimentali e verificare se la varietà che risulta più produttiva è significativamente migliore di quella che la segue nella scala di produttività. In altri casi può essere opportuno effettuare tutti i confronti possibili tra i livelli del fattore sperimentale . Test di Tukey (Metodo T) Confronti a coppie • I contrasti vengono scelti sulla base dei risultati dell’esperimento(non sono quindi prestabiliti). • Si escludono i contrasti complessi. • Si utilizzano i valori critici della distribuzione q (‘Intervallo di variazione studentizzato’ o ‘studentized range’): in realtà la distribuzione q è una famiglia di distribuzioni identificate dal numero dei trattamenti(p) e dai gradi di libertà(nT-p) della devianza dell’errore. Test di Tukey (Metodo T) Confronti a coppie Intervallo di Confidenza • Sia p il numero di trattamenti ,l’intervallo di confidenza tra 2 medie sulla base della distribuzione q è definito come : 1 k lk q ; p ,( nT p ) s n dove s QM (e) con GL(QM (e)) nT p Test di Tukey (Metodo T)-Confronti a coppie Test d’ipotesi • Si definisce una DMS(Differenza Minima Significativa) protetta (se il test ANOVA è risultato significativo)T che dipende dal livello di significatività prescelto α e si dichiarano significative le differenze tra medie che superano tale soglia in valore assoluto: 1 T q ; p ,( nT p ) s n Se p 2 q ; 2,( nT 2 ) t / 2;( nT 2 ) T DMS Esperimento non bilanciato ni ni ' T q ; p ,( nT p ) s 2ni ni ' : Approssima zione Esempio:Test di Tukey • Un’esperimento bilanciato di confronto tra 5 diete ha fornito i seguenti risultati espressi come incrementi del peso dei conigli(n=5 ripetizioni per dieta vengono omesse per brevità): Medie:6.49 ,6.07 , 6.02 , 6.17 , 5.62 QM(a)=0.5806 con GL(QM(a))=4 QM(e)=0.1468 con GL(QM(e))=20. • L’ipotesi complessiva H0:μ1=μ2=μ3=μ4=μ5 viene respinta sulla base dei test F4,20=0.5806/0.1468=3.96 che risulta significativo al livello di α=0.05. • Naturalmente è lecito chiedersi quale differenza tra i valori medi delle singole varietà sia responsabile del rifiuto dell’ipotesi complessiva. Esempio:Test di Tukey • Le differenze tra le medie campionarie possono essere riportate nella seguente tabella: Dieta 1 Dieta 2 Dieta 3 Dieta 4 Dieta 5 Media: 6.49 6.07 6.02 6.17 5.62 Dieta 2 0.42 ……. Dieta 3 0.47 0.05 …….. Dieta 4 0.32 -0.10 -0.15 ………. Dieta 5 0.87 0.45 0.40 0.55 5 5! 5 * 4 10 2 2 2!3! ………. Numero dei contrasti a coppia possibili Esempio:Test di Tukey È opportuno formulare delle ipotesi nulle per il confronto tra le medie dei trattamenti ,indicate generalmente come: H0:λ(k)=0 , corrispondenti , alla formulazione: H0:μi- μi’=0 con i,i’=1,2,….5. Per α=0.05 la variabile q assume il valore: q0.05;5,20 =4.24 da cui: T q0.05;5, 20 s2 n 4.24 0.1468 / 5 0.723 Dalla tabella si può verificare che solo il confronto tra μ1 e μ5 risulta significativo. Verifica delle assunzioni dell’ANOVA 1) Normalità degli Errori 2) Uguaglianza della varianza degli errori (entro trattamento) o omogeneità delle varianze. 3) Indipendenza statistica degli errori Nella pratica sperimentale non sempre tutte le assunzioni sono rispettate! Non Normalità degli Errori • La non normalità degli errori rende approssimate le stime delle componenti della varianza : se la curtosi è diversa da zero le varianze degli effetti che nel modello ad effetti random seguono una distribuzione χ 2 sono una cattiva approssimazione. Se l’esperimento è bilanciato le conseguenze della non normalità degli errori sono meno gravi. Non omogeneità delle varianze • Le varianze campionarie stimano tutte la stessa varianza,comune a tutte le popolazioni • La non uguaglianza delle varianze entro gruppi fa in modo che il vero valore di α superi il suo valore nominale(anche per 2 soli trattamenti):tale effetto sul livello di significatività si accentua quando l’esperimento è sbilanciato . Test di Cochran • Se l’esperimento è bilanciato ,l’ipotesi di omogeneità tra le varianze entro-trattamento H0:σ1=σ2=σ3=….=σp viene saggiata tramite la statistica-test : 2 max 2 3 s Rn, p 2 2 2 s1 s2 s ....... s p Si utilizzano apposite tavole per confrontare il valore della statistica-test con i valori critici,fissato il livello di significatività. Se il valore è significativo(maggiore del valore della tabella) rifiuto l’ipotesi di omogeneità tra le varianze. Analisi della varianza non parametrica • Se le assunzioni dell’analisi della varianza vengono seriamente violate ,cioè quando i campioni sono estratti da popolazioni non normalmente distribuiti e con varianze disuguali si può ricorrere a procedure alternative non parametriche : – Test sulla mediana per p campioni – Test H di Kraskal-Wallis Test sulla mediana per p campioni • È un estensione del test sulla mediana e richiede la determinazione della mediana di tutte le osservazioni dei p campioni considerati congiuntamente . • Si costruisce una tabella in cui per ogni campione sono riportati il numero di osservazioni al di sopra della mediana e il numero di quelle non al di sopra. • L’ipotesi nulla che le popolazioni hanno la stessa mediana ,può essere verificata con test χ2 ,applicato alla tabella 2xp. • Il test può essere applicato quando il valore atteso per ogni gruppo è di almeno 5 . Test H di Kruskal-Wallis • Il test H richiede che le osservazioni siano trasformate in ranghi , come indicato per il test U su due campioni ,e può essere applicato nel caso di un esperimento completamente randomizzato . • L’ipotesi nulla non comprende relazioni riguardanti i parametri delle popolazioni e non vengono utilizzate statistiche campionarie per la verifica delle ipotesi stesse. • L’ipotesi nulla infatti comprende solo l’appartenenza dei p campioni alla stessa popolazione ,mentre l’ipotesi alternativa dice che almeno uno dei campioni non appartiene a tale popolazione . Test H di Kruskal-Wallis • Una volta trasformati ,i dati in ranghi ,indipendentemente dall’appartenenza ai singoli trattamenti , si calcola per ogni trattamento la somma dei ranghi relativi : ni Ri Rij j 1 n(n 1) Ri 2 i 1 Statistica Test p Il rapporto SS(a)/QM(y) corrisponde ad H: ciò può essere utile in esperimenti più complessi (ANOVA a più criteri di classificazione),per i quali sia opportuno l’approccio non paramentrico. p Ri2 12 H 3(nT 1) nT (nT 1) i 1 ni La statistica H segue la distribuzione di un χ2 con p-1 gradi di libertà ,a patto che il numero di ripetizioni per gruppo sia almeno 5 . Se l’adattamento alla distribuzione del χ2 non è valido,è possibile ricorrere ad apposite tavole di valori critici di H . Esempio (ANOVA non parametrica) • L’efficacia di 3 acaricidi viene saggiata contando il numero di acari presenti su una foglia di 5 piante diverse scelte a caso e trattate con ciascun acaricida . Acaricida A Acaricida B Acaricida C 25(4) 110(15) 39(8) 21(2) 66(12) 43(9) 33(6) 91(14) 28(5) 36(7) 52(10) 11(1) 54(11) 72(13) 24(3) R1=30 R2=64 R3=26 n1=5 n2=5 n3=5 nT=15 Esempio (ANOVA non parametrica) • L’ipotesi nulla può essere formulata come segue : H0:il numero di acari per foglia è uguale nelle piante trattate con i 3 acaricidi. L’ipotesi è verificata con la statistica-test: p Ri2 12 H 3(nT 1) nT (nT 1) i 1 ni 12 30 64 26 3(16) 8.72 15(16) 5 Il valore critico di χ2 con 2 gradi di libertà per α=0.05 è 5.99 : l’ipotesi nulla può quindi essere rifiutata. Esercizio(Anova) • E' stato condotto un esperimento per confrontare il raccolto di 4 varietà di riso. Ognuno dei 16 appezzamenti della fattoria sottoposta al test è stato trattato in modo simile per quanto concerne l'acqua e il fertilizzante. Quattro appezzamenti sono stati assegnati casualmente ad ognuna delle 4 varietà di riso. Il raccolto di ogni appezzamento è stato annotato in libbre per acro nella seguente tabella: Varietà Raccolti 1 934 1041 1028 935 2 880 963 924 946 3 987 951 976 840 4 992 1143 1140 1191 I dati della tabella indicano una differenza nel raccolto medio delle 4 varietà? Usare un'analisi della varianza con α = 0.05. Esercizio 2 • L'assorbimento da parte del suolo dei metalli che fuoriescono nell'aria durante alcuni processi industriali produce gravi danni ambientali. Per accertarsi se le percentuali di assorbimento variano tra i tipi di terreno,sono stati casualmente scelti 6 campioni di terre coltivate, aventi 5 tipi di suolo differenti (1, 2, 3, 4, 5) in un'area nota per avere un'esposizione relativamente uniforme ai metalli osservati. I 30 campioni di terreno sono stati analizzati per contenuto di cadmio (Cd). I risultati sono presentati nella seguente tabella. Eseguire un'analisi della varianza per determinare se vi siano differenze nel contenuto di cadmio tra i terreni. Esercizio 2 Esercizio 3 Grazie per l’attenzione