ANALISI della VARIANZA FATTORIALE
Impostazione:
E’ conosciuto:
L’analisi della varianza con un solo fattore.
il significato di fattori fissi e casuali.
lo schema a blocchi randomizzati.
L’argomento non è mai stato trattato in
precedenti corsi
ARGOMENTI TRATTATI
 Vantaggi e svantaggi dell’impostazione fattoriale.
 Concetto di interazione tra fattori.
 Impianto in campo dell’esperimento.
Randomizzazione completa.
Blocchi randomizzati.
 Esecuzione dei calcoli.
 Interpretazione dei risultati.
 Analisi grafica dell’interazione
 Modelli: a effetti fissi, casuali e misto.
 Contrasti in un esperimento fattoriale.
 Confronti multipli in un esperimento fattoriale.
 Esperimenti fattoriali sbilanciati (cenni).
 Software disponibile.
ANALISI della VARIANZA FATTORIALE
VANTAGGI
SVANTAGGI
 Si può studiare
contemporaneamente
l’effetto di 2 (o più)
fattori.
 difficoltà con
esperimenti sbilanciati
 Si può identificare
l’interazione tra fattori
 maggiore potenza
 difficile
interpretazione (se i
fattori sono più di 2)
 > complessità
calcoli (trascurabile)
Da preferire per esperimenti idonei
all’identificazione dell’effetto di specifici
trattamenti, meno idonea all’analisi di
sistemi reali
L’INTERAZIONE
Tra 2 (o più) fattori applicati contemporaneamente
può esservi:
indifferenza
I fattori esercitano il loro
effetto senza variazioni
dovute al livello degli altri
fattori (comportamento
additivo)
sinergismo
La presenza
contemporanea di
determinati livelli dei
fattori migliora il risultato
rispetto alla semplice
additività
antagonismo
La presenza
contemporanea di
determinati livelli dei
fattori peggiora il risultato
rispetto alla semplice
additività
Comportamenti sinergici o antagonistici indicano
INTERAZIONE tra i fattori
L’interazione
Produzioni frumento
8
Effetto dell'N
interazione
effetto del P
t ha -1 s.s.
6
4
2
0
N0-P0
N1-P0
N0-P1
N1P1
concimazioni
concimazione frumento
7
6
t ha-1 s.s.
5
4
P0
3
P1
2
1
Assenza di interazione:
i segmenti sono
paralleli
0
N0
N1
livelli di N
t ha-1 s.s.
concimazione frumento
8
7
6
5
P0
4
3
2
1
0
P1 int
P1 int
N0
N1
livelli di N
Presenza di
interazione: i segmenti
NON sono paralleli,
l’effetto di un fattore
dipende dal livello
dell’altro
Principali applicazioni
E’ uno degli strumenti statistici più usati
Analisi dei rapporti genotipo-ambiente
cultivar x tecnica colturale
interazioni tra fertilizzanti
COMLETA!!!
Il MODELLO dell’ANOVA a 2 VIE
Yijk=  + i + j + ( )ij + ijk
ijk
( )1,2
1
1
2
1
( )2,1
ijk
Il valore di un dato (Yijk) è la somma dell’effetto
di uno specifico livello del 1° fattore (i) , dello
specifico livello del 2° fattore (j ), della loro
interazione (( )ij ) e di una componente
accidentale (ijk)
Assunzioni
Le stesse dell’ANOVA a 1 via:
omogeneità delle varianze
normalità delle popolazioni
indipendenza dei dati
Proprie dell’ANOVA a 2 vie
i=0
j=0
()ij=0
L’impianto in campo della prova
Occorre innanzitutto determinare tutte
le combinazioni possibili tra i livelli dei
fattori.
Esempio (didattico) con 2 fattori a 2 livelli:
Livello 1
Livello 2
N (kg ha-1)
0
100
P2O5 (kg ha-1)
0
60
Le combinazioni sono: N1-P1; N1-P2; N2-P1; N2-P2
Vanno considerate come se fossero singoli trattamenti
nell’ANOVA a 1 via
Si ipotizzano 3 ripetizioni  12 parcelle, con i
trattamenti da attribuirsi, secondo lo schema
sperimentale adottato, casualmente
La disposizione in campo
Schema a randomizzazione completa
N1-P2
N1-P1
N2-P1
N2-P1
N2-P2
N1-P2
N2-P2
N1-P2
N2-P1
N1-P1
N2-P2
N1-P1
Schema a blocchi randomizzati
N1-P2
N1-P1
N2-P2
N2-P1
N2-P1
N1-P2
N2-P2
N1-P2
N2-P1
N1-P1
N2-P2
N1-P1
Blocco 1
Blocco 2
Blocco 3
Esecuzione dei calcoli
Passo 1: stimare la varianza errore
eseguire gli stessi calcoli necessari per l’ANOVA a 1
via, considerando le combinazioni come fossero
singoli trattamenti
Si ottiene: devianza e varianza dei trattamenti nel
loro complesso (utile successivamente) e devianza e
varianza errore
Passo 2: stimare le varianze degli effetti semplici
sia:
p il numero di livelli del fattore A
q il numero di livelli del fattore B
nrip il numero di ripetizioni
consideriamo l’esperimento come se vi fosse
presente un solo fattore. Quindi si hanno nrip*q
unità sperimentali che hanno ricevuto un determinato
livello del fattore in esame.
Per calcolare la devianza del fattore A è allora
sufficiente sostituire ogni dato con la media del livello
di A a cui appartiene e calcolare la devianza di tutti i
dati così ottenuti:
Dev A  nrip * q  Yi  Y 
p
i 1
2
Del tutto analogamente si procede per il fattore b
I gradi di libertà sono p-1 e q-1
Esecuzione dei calcoli (segue)
Passo 3: stimare la varianza dell’interazione
La via più semplice è per sottrazione:
Dev. Interazione = Dev. Trattamenti - Dev. A -Dev.B
si può anche calcolare indipendentemente (utile per
ANOVA a 3 o più vie):
1)Porre ogni dato uguale al valore medio della
combinazione a cui appartiene
2) sottrarre a ogni dato i valori medi del livello del
fattore al quale si riferisce
3) calcolare la devianza dei dati così ottenuti
GL = GL trattamenti - GL A - GL B
ovvero (p-1)(q-1); infatti
(p-1)*(q-1) = pq - p - q + 1
pq = GL trattamenti +1
GL int = GL trattamenti +1 -p - q + 1
Esecuzione dei calcoli (segue)
Passo 4: impostare la tabella dell’ANOVA
fonti di variazione
devianze
totale
trattamenti (tra caselle)
fattore a
fattore b
interazione a x b
errore
dtot
dtratt
da
db
dint
de
GL
varianze F calcolato P(F)
p*q*nrip-1
p*q-1
dtratt/gl vtratt/verr
p-1
da/gl
va/verr
q-1
db/gl
vb/verr
(p-1)(q-1) dint/gl
vint/verr
p*q*(nrip-1) de/gl
N.B.
Se i fattori a e b sono fissi, il test di tutti gli effetti si fa
contro l’errore
Passo 5: interpretazione
osservare innanzitutto la significatività dell’interazione:
se l’effetto interattivo è significativo va considerata solo
l’interazione e NON E’ LECITA ALCUNA
CONCLUSIONE SUGLI EFFETTI SEMPLICI. Infatti con
interazione, l’effetto di un fattore è condizionato dal
livello dell’altro.
Esempi
6
5
Interazione e
effetti semplici
significativi.
4
3
2
1
0
1
2
6
5
Interazione e
un effetto
semplice
significativi.
4
3
2
1
0
1
2
6
5
4
3
2
1
0
1
2
Interazione e
effetti semplici
significativi.
L’interazione
Puo’ avere
valore pratico
trascurabile
Un esempio di calcolo
I DATI:
Tratt.
rip 1
rip 2
rip 3 media
N0-P0
N0-P1
N1-P0
N1-P1
4
4.2
5.2
6.6
4.9
5.5
5.2
7.2
4.3
5.9
5.8
7.8
4.4
5.2
5.4
7.2
devianza totale = 15.5
Calcolo devianza trattamenti (caselle)
4.4
5.2
5.4
7.2
dev. Tratt. =
dev errore=
4.4
5.2
5.4
7.2
4.4
5.2
5.4
7.2
12.6 GL=
3
Dev tot - dev tratt
dev errore =
2.96 GL=
varianza errore = 0.37
2.96
8
Un esempio di calcolo (segue)
La tabella delle medie
N0
N1
Media P
P0
4.4
5.4
4.9
P1 Media N
5.2
4.8
7.2
6.3
6.2
Calcolo devianza effetto N
ogni dato è sostituito con la media del corrispondente livello di N
N0
N1
4.8
6.3
Devianza N =
GL =
1
4.8
6.3
4.8
6.3
4.8
6.3
4.8
6.3
4.8
6.3
6.75
Calcolo devianza P
ogni dato è sostituito con la media del corrispondente livello di P
P0
P1
4.9
6.2
Devianza P =
GL =
1
4.9
6.2
5.07
4.9
6.2
4.9
6.2
4.9
6.2
4.9
6.2
Un esempio di calcolo (segue)
Calcolo devianza interazione
dev. Interazione =D.tratt - dev. A - dev. B
dev interazione = 0.75
GL =
GL tratt- GL N - GL P =
1
oppure, sostituendo a ogni dato la media del gruppo e sottraendo
le medie N e P relative:
Tratt.
rip 1
rip 2
rip 3
N0-P0
N0-P1
N1-P0
N1-P1
4.4
5.2
5.4
7.2
4.4
5.2
5.4
7.2
4.4
5.2
5.4
7.2
4.8
4.8
6.3
6.3
4.8
4.8
6.3
6.3
4.8
4.8
6.3
6.3
4.9
6.2
4.9
6.2
4.9
6.2
4.9
6.2
4.9
6.2
4.9
6.2
-5.3
-5.8
-5.8
-5.3
-5.3
-5.8
-5.8
-5.3
-5.3
-5.8
-5.8
-5.3
medie N
N0
N1
Medie P
P0
P1
P0
P1
Risultato
dev interazione = 0.75
Si constata che GL = 1
Un esempio di calcolo (segue)
Tabella ANOVA
F.var
totale
Tratt.
eff N
eff P
int P x N
errore
Dev.
15.5
12.6
6.8
5.1
0.8
2.96
GL
Var. F calc. P(F)
3
1
1
1
8
4.19 11.32 0.003
6.75 18.24 0.003
5.07 13.70 0.006
0.75 2.03 0.192
0.37
8
7
6
5
N0
4
N1
3
2
1
0
P0
P1
Interpretazione: nonostante una apparente
divergenza, i due segmenti sono da considerarsi
paralleli in senso statistico, P(Fint) = 0,2 non fornisce
evidenze sulla presenza di interazione. L’effetto
migliorativo del P e dell’N è significativo
La presenza di fattori casuali
Nell’analisi della varianza fattoriale uno più fattori
possono essere random: (cioè i trattamenti sono un
campione di infiniti possibili trattamenti e non
interessa studiarli in quanto tali, ma per identificare
se costituiscono una fonte di variabilità significativa)
Casi tipici:
gli anni per i quali è ripetuta una sperimentazione. Si
è interessati non agli specifici anni, ma li si considera
come un campione di possibili andamenti
meteorologici.
Le località, se intese solo come possibili campi in cui
si ha una certa coltura e NON come rappresentative
di areali.
In genetica, variablità delle popolazioni di partenza
per ottenere incroci.( risponde alla domanda: ha
effetto la variabilità genetica del genitore maschile, di
quello femminile o la loro interazione nel determinare
il risultato dell’incrocio ?)
In agronomia sono frequenti esperimenti con 1
fattore random e altri fattori fissi, poco frequenti quelli
con più di 1 fattore random e altri fissi, rarissimi quelli
con tutti i fattori random.
Trattamento dei dati in presenza di
fattori casuali
La presenza di fattori casuali non modifica i calcoli di
devianze, varianze e gradi di libertà. Sono diversi invece
i test F nel caso di modelli MISTI (cioè con presenza di
fattori fissi e casuali assieme) o completamente random.
Qui viene data una spiegazione intuitiva della diversa
struttura dei test F. Per un approccio matematico
formale si rimanda a testi specifici (es. Snedecor e
Cochran, 1989).
Nel caso di schemi fattoriali a 2 vie non ci hanno
difficoltà; nel caso di schemi a più vie non si hanno
difficoltà se 1 solo fattore è random.
I package di calcolo statistico hanno da non molti anni
introdotto il trattamento completo dei fattori random,
risolvendo il problema. Occorre però riconoscere un
fattore random in quanto tale.
In generale, in presenza di un fattore random nella stima
della varianza di un effetto relativo a un fattore fisso è
sempre compresa una quota di varianza attribuibile al
fattore casuale: infatti la stima degli i è fatta in funzione
di j soggetti a variazione campionaria. Nella stima
della varianza di un fattore random non è invece
compresa una quota di varianza legata al fattore fisso
(gli i sono sempre gli stessi). L’interazione tra un fattore
fisso e uno random, essendo attesi effetti diversi se
l’esperimento viene ripetuto.
Trattamento dei dati in presenza di
fattori casuali (segue)
Si può dimostrare che se il fattore a è fisso e b random:
E[var(a)] = 2 + nrip 2 +nrip * q 2/(p-1)
E[var(b)] = 2 + nrip*p 2
E[var(a x b)] = 2 + nrip 2
E[var(a x b)] = 2
Ne consegue che il test corretto per l’effetto fisso è
contro l’interazione, per il fattore random e l’interazione
contro l’errore. In presenza di 1 solo fattore random,
ogni effetto fisso deve essere testato contro la sua
interazione con il fattore random, i fattori random e le
interazioni tra un fattore fisso e uno random contro
l’errore.
Intuitivamente, in presenza di fattori casuali, per
dichiarare un effetto fisso significativo, non ci basta che
il suo effetto sia superiore a quello della variabilità
sperimentale, occorre che sia anche “maggiore” della
variabilità indotta dal fattore casuale affinché il suo
effetto sia “apprezzabile” anche in presenza di altri
valori del fattore casuale. Da questo ne consegue che il
test corretto è contro la sua interazione con il fattore
casuale, che comprende, oltre a una quota dovuta alla
variabilità accidentale (come ogni varianza stimata),
anche una quota di interazione tra il fattore fisso e quello
random.
Altri tipi di analisi della varianza
fattoriale
Esperimenti senza ripetizioni
in caso di esperimenti fattoriali un esperimento si può
impostare senza repliche, assumendo a priori che
NON VI SIA INTERAZIONE. Se l’interazione è nulla,
allora la varianza dell’interazione stima la varianza
errore e può essere usata per calcolare i rapporti F
relativi agli effetti semplici. Questa impostazione è però
in linea di massima sconsigliabile, essendo uno degli
scopi primari dell’ANOVA fattoriale proprio l’analisi
dell’interazione. Per il calcolo occorre calcolare le
devianze degli effetti semplici e, per sottrazione dalla
devianza totale, la devianza errore.
Approccio gerarchico
In alcuni casi non è possibile un approccio fattoriale
pieno: i livelli di un fattore sono diversi a secondo dei
livelli dell’altro:
Farlo meglio se questa è la lezione
Scarica

Anova Fattoriale