ANALISI della VARIANZA FATTORIALE Impostazione: E’ conosciuto: L’analisi della varianza con un solo fattore. il significato di fattori fissi e casuali. lo schema a blocchi randomizzati. L’argomento non è mai stato trattato in precedenti corsi ARGOMENTI TRATTATI Vantaggi e svantaggi dell’impostazione fattoriale. Concetto di interazione tra fattori. Impianto in campo dell’esperimento. Randomizzazione completa. Blocchi randomizzati. Esecuzione dei calcoli. Interpretazione dei risultati. Analisi grafica dell’interazione Modelli: a effetti fissi, casuali e misto. Contrasti in un esperimento fattoriale. Confronti multipli in un esperimento fattoriale. Esperimenti fattoriali sbilanciati (cenni). Software disponibile. ANALISI della VARIANZA FATTORIALE VANTAGGI SVANTAGGI Si può studiare contemporaneamente l’effetto di 2 (o più) fattori. difficoltà con esperimenti sbilanciati Si può identificare l’interazione tra fattori maggiore potenza difficile interpretazione (se i fattori sono più di 2) > complessità calcoli (trascurabile) Da preferire per esperimenti idonei all’identificazione dell’effetto di specifici trattamenti, meno idonea all’analisi di sistemi reali L’INTERAZIONE Tra 2 (o più) fattori applicati contemporaneamente può esservi: indifferenza I fattori esercitano il loro effetto senza variazioni dovute al livello degli altri fattori (comportamento additivo) sinergismo La presenza contemporanea di determinati livelli dei fattori migliora il risultato rispetto alla semplice additività antagonismo La presenza contemporanea di determinati livelli dei fattori peggiora il risultato rispetto alla semplice additività Comportamenti sinergici o antagonistici indicano INTERAZIONE tra i fattori L’interazione Produzioni frumento 8 Effetto dell'N interazione effetto del P t ha -1 s.s. 6 4 2 0 N0-P0 N1-P0 N0-P1 N1P1 concimazioni concimazione frumento 7 6 t ha-1 s.s. 5 4 P0 3 P1 2 1 Assenza di interazione: i segmenti sono paralleli 0 N0 N1 livelli di N t ha-1 s.s. concimazione frumento 8 7 6 5 P0 4 3 2 1 0 P1 int P1 int N0 N1 livelli di N Presenza di interazione: i segmenti NON sono paralleli, l’effetto di un fattore dipende dal livello dell’altro Principali applicazioni E’ uno degli strumenti statistici più usati Analisi dei rapporti genotipo-ambiente cultivar x tecnica colturale interazioni tra fertilizzanti COMLETA!!! Il MODELLO dell’ANOVA a 2 VIE Yijk= + i + j + ( )ij + ijk ijk ( )1,2 1 1 2 1 ( )2,1 ijk Il valore di un dato (Yijk) è la somma dell’effetto di uno specifico livello del 1° fattore (i) , dello specifico livello del 2° fattore (j ), della loro interazione (( )ij ) e di una componente accidentale (ijk) Assunzioni Le stesse dell’ANOVA a 1 via: omogeneità delle varianze normalità delle popolazioni indipendenza dei dati Proprie dell’ANOVA a 2 vie i=0 j=0 ()ij=0 L’impianto in campo della prova Occorre innanzitutto determinare tutte le combinazioni possibili tra i livelli dei fattori. Esempio (didattico) con 2 fattori a 2 livelli: Livello 1 Livello 2 N (kg ha-1) 0 100 P2O5 (kg ha-1) 0 60 Le combinazioni sono: N1-P1; N1-P2; N2-P1; N2-P2 Vanno considerate come se fossero singoli trattamenti nell’ANOVA a 1 via Si ipotizzano 3 ripetizioni 12 parcelle, con i trattamenti da attribuirsi, secondo lo schema sperimentale adottato, casualmente La disposizione in campo Schema a randomizzazione completa N1-P2 N1-P1 N2-P1 N2-P1 N2-P2 N1-P2 N2-P2 N1-P2 N2-P1 N1-P1 N2-P2 N1-P1 Schema a blocchi randomizzati N1-P2 N1-P1 N2-P2 N2-P1 N2-P1 N1-P2 N2-P2 N1-P2 N2-P1 N1-P1 N2-P2 N1-P1 Blocco 1 Blocco 2 Blocco 3 Esecuzione dei calcoli Passo 1: stimare la varianza errore eseguire gli stessi calcoli necessari per l’ANOVA a 1 via, considerando le combinazioni come fossero singoli trattamenti Si ottiene: devianza e varianza dei trattamenti nel loro complesso (utile successivamente) e devianza e varianza errore Passo 2: stimare le varianze degli effetti semplici sia: p il numero di livelli del fattore A q il numero di livelli del fattore B nrip il numero di ripetizioni consideriamo l’esperimento come se vi fosse presente un solo fattore. Quindi si hanno nrip*q unità sperimentali che hanno ricevuto un determinato livello del fattore in esame. Per calcolare la devianza del fattore A è allora sufficiente sostituire ogni dato con la media del livello di A a cui appartiene e calcolare la devianza di tutti i dati così ottenuti: Dev A nrip * q Yi Y p i 1 2 Del tutto analogamente si procede per il fattore b I gradi di libertà sono p-1 e q-1 Esecuzione dei calcoli (segue) Passo 3: stimare la varianza dell’interazione La via più semplice è per sottrazione: Dev. Interazione = Dev. Trattamenti - Dev. A -Dev.B si può anche calcolare indipendentemente (utile per ANOVA a 3 o più vie): 1)Porre ogni dato uguale al valore medio della combinazione a cui appartiene 2) sottrarre a ogni dato i valori medi del livello del fattore al quale si riferisce 3) calcolare la devianza dei dati così ottenuti GL = GL trattamenti - GL A - GL B ovvero (p-1)(q-1); infatti (p-1)*(q-1) = pq - p - q + 1 pq = GL trattamenti +1 GL int = GL trattamenti +1 -p - q + 1 Esecuzione dei calcoli (segue) Passo 4: impostare la tabella dell’ANOVA fonti di variazione devianze totale trattamenti (tra caselle) fattore a fattore b interazione a x b errore dtot dtratt da db dint de GL varianze F calcolato P(F) p*q*nrip-1 p*q-1 dtratt/gl vtratt/verr p-1 da/gl va/verr q-1 db/gl vb/verr (p-1)(q-1) dint/gl vint/verr p*q*(nrip-1) de/gl N.B. Se i fattori a e b sono fissi, il test di tutti gli effetti si fa contro l’errore Passo 5: interpretazione osservare innanzitutto la significatività dell’interazione: se l’effetto interattivo è significativo va considerata solo l’interazione e NON E’ LECITA ALCUNA CONCLUSIONE SUGLI EFFETTI SEMPLICI. Infatti con interazione, l’effetto di un fattore è condizionato dal livello dell’altro. Esempi 6 5 Interazione e effetti semplici significativi. 4 3 2 1 0 1 2 6 5 Interazione e un effetto semplice significativi. 4 3 2 1 0 1 2 6 5 4 3 2 1 0 1 2 Interazione e effetti semplici significativi. L’interazione Puo’ avere valore pratico trascurabile Un esempio di calcolo I DATI: Tratt. rip 1 rip 2 rip 3 media N0-P0 N0-P1 N1-P0 N1-P1 4 4.2 5.2 6.6 4.9 5.5 5.2 7.2 4.3 5.9 5.8 7.8 4.4 5.2 5.4 7.2 devianza totale = 15.5 Calcolo devianza trattamenti (caselle) 4.4 5.2 5.4 7.2 dev. Tratt. = dev errore= 4.4 5.2 5.4 7.2 4.4 5.2 5.4 7.2 12.6 GL= 3 Dev tot - dev tratt dev errore = 2.96 GL= varianza errore = 0.37 2.96 8 Un esempio di calcolo (segue) La tabella delle medie N0 N1 Media P P0 4.4 5.4 4.9 P1 Media N 5.2 4.8 7.2 6.3 6.2 Calcolo devianza effetto N ogni dato è sostituito con la media del corrispondente livello di N N0 N1 4.8 6.3 Devianza N = GL = 1 4.8 6.3 4.8 6.3 4.8 6.3 4.8 6.3 4.8 6.3 6.75 Calcolo devianza P ogni dato è sostituito con la media del corrispondente livello di P P0 P1 4.9 6.2 Devianza P = GL = 1 4.9 6.2 5.07 4.9 6.2 4.9 6.2 4.9 6.2 4.9 6.2 Un esempio di calcolo (segue) Calcolo devianza interazione dev. Interazione =D.tratt - dev. A - dev. B dev interazione = 0.75 GL = GL tratt- GL N - GL P = 1 oppure, sostituendo a ogni dato la media del gruppo e sottraendo le medie N e P relative: Tratt. rip 1 rip 2 rip 3 N0-P0 N0-P1 N1-P0 N1-P1 4.4 5.2 5.4 7.2 4.4 5.2 5.4 7.2 4.4 5.2 5.4 7.2 4.8 4.8 6.3 6.3 4.8 4.8 6.3 6.3 4.8 4.8 6.3 6.3 4.9 6.2 4.9 6.2 4.9 6.2 4.9 6.2 4.9 6.2 4.9 6.2 -5.3 -5.8 -5.8 -5.3 -5.3 -5.8 -5.8 -5.3 -5.3 -5.8 -5.8 -5.3 medie N N0 N1 Medie P P0 P1 P0 P1 Risultato dev interazione = 0.75 Si constata che GL = 1 Un esempio di calcolo (segue) Tabella ANOVA F.var totale Tratt. eff N eff P int P x N errore Dev. 15.5 12.6 6.8 5.1 0.8 2.96 GL Var. F calc. P(F) 3 1 1 1 8 4.19 11.32 0.003 6.75 18.24 0.003 5.07 13.70 0.006 0.75 2.03 0.192 0.37 8 7 6 5 N0 4 N1 3 2 1 0 P0 P1 Interpretazione: nonostante una apparente divergenza, i due segmenti sono da considerarsi paralleli in senso statistico, P(Fint) = 0,2 non fornisce evidenze sulla presenza di interazione. L’effetto migliorativo del P e dell’N è significativo La presenza di fattori casuali Nell’analisi della varianza fattoriale uno più fattori possono essere random: (cioè i trattamenti sono un campione di infiniti possibili trattamenti e non interessa studiarli in quanto tali, ma per identificare se costituiscono una fonte di variabilità significativa) Casi tipici: gli anni per i quali è ripetuta una sperimentazione. Si è interessati non agli specifici anni, ma li si considera come un campione di possibili andamenti meteorologici. Le località, se intese solo come possibili campi in cui si ha una certa coltura e NON come rappresentative di areali. In genetica, variablità delle popolazioni di partenza per ottenere incroci.( risponde alla domanda: ha effetto la variabilità genetica del genitore maschile, di quello femminile o la loro interazione nel determinare il risultato dell’incrocio ?) In agronomia sono frequenti esperimenti con 1 fattore random e altri fattori fissi, poco frequenti quelli con più di 1 fattore random e altri fissi, rarissimi quelli con tutti i fattori random. Trattamento dei dati in presenza di fattori casuali La presenza di fattori casuali non modifica i calcoli di devianze, varianze e gradi di libertà. Sono diversi invece i test F nel caso di modelli MISTI (cioè con presenza di fattori fissi e casuali assieme) o completamente random. Qui viene data una spiegazione intuitiva della diversa struttura dei test F. Per un approccio matematico formale si rimanda a testi specifici (es. Snedecor e Cochran, 1989). Nel caso di schemi fattoriali a 2 vie non ci hanno difficoltà; nel caso di schemi a più vie non si hanno difficoltà se 1 solo fattore è random. I package di calcolo statistico hanno da non molti anni introdotto il trattamento completo dei fattori random, risolvendo il problema. Occorre però riconoscere un fattore random in quanto tale. In generale, in presenza di un fattore random nella stima della varianza di un effetto relativo a un fattore fisso è sempre compresa una quota di varianza attribuibile al fattore casuale: infatti la stima degli i è fatta in funzione di j soggetti a variazione campionaria. Nella stima della varianza di un fattore random non è invece compresa una quota di varianza legata al fattore fisso (gli i sono sempre gli stessi). L’interazione tra un fattore fisso e uno random, essendo attesi effetti diversi se l’esperimento viene ripetuto. Trattamento dei dati in presenza di fattori casuali (segue) Si può dimostrare che se il fattore a è fisso e b random: E[var(a)] = 2 + nrip 2 +nrip * q 2/(p-1) E[var(b)] = 2 + nrip*p 2 E[var(a x b)] = 2 + nrip 2 E[var(a x b)] = 2 Ne consegue che il test corretto per l’effetto fisso è contro l’interazione, per il fattore random e l’interazione contro l’errore. In presenza di 1 solo fattore random, ogni effetto fisso deve essere testato contro la sua interazione con il fattore random, i fattori random e le interazioni tra un fattore fisso e uno random contro l’errore. Intuitivamente, in presenza di fattori casuali, per dichiarare un effetto fisso significativo, non ci basta che il suo effetto sia superiore a quello della variabilità sperimentale, occorre che sia anche “maggiore” della variabilità indotta dal fattore casuale affinché il suo effetto sia “apprezzabile” anche in presenza di altri valori del fattore casuale. Da questo ne consegue che il test corretto è contro la sua interazione con il fattore casuale, che comprende, oltre a una quota dovuta alla variabilità accidentale (come ogni varianza stimata), anche una quota di interazione tra il fattore fisso e quello random. Altri tipi di analisi della varianza fattoriale Esperimenti senza ripetizioni in caso di esperimenti fattoriali un esperimento si può impostare senza repliche, assumendo a priori che NON VI SIA INTERAZIONE. Se l’interazione è nulla, allora la varianza dell’interazione stima la varianza errore e può essere usata per calcolare i rapporti F relativi agli effetti semplici. Questa impostazione è però in linea di massima sconsigliabile, essendo uno degli scopi primari dell’ANOVA fattoriale proprio l’analisi dell’interazione. Per il calcolo occorre calcolare le devianze degli effetti semplici e, per sottrazione dalla devianza totale, la devianza errore. Approccio gerarchico In alcuni casi non è possibile un approccio fattoriale pieno: i livelli di un fattore sono diversi a secondo dei livelli dell’altro: Farlo meglio se questa è la lezione