Ringrazio Xavier Tomàs Morer, Emerito della Università Ramon LLull di Bercellona,
per la accurata revisione.
1
Jacques Hadamard e Roger Phan Tan Luu
5 – ELEMENTI DI DISEGNO SPERIMENTALE
5.1 - INTRODUZIONE AL DISEGNO SPERIMENTALE
5.1.2 - Generalità
La storia di questa disciplina (ED, per Experimental Design, DOE, per Design Of Experiments,
MDOE: Multivariate DOE) è relativamente recente. Nel 1935 R.A. Fisher pubblicò il The Design of
Experiments con i primi elementi fondamentali dell’attuale metodologia. Il suo esempio “The Lady
Tasting Tea” contiene importanti insegnamenti metodologici. L’obbiettivo è verificare l’ipotesi che
una certa signora non possa distinguere tra il tè preparato aggiungendo prima il latte e poi il tè, e
quello preparato aggiungendo il latte per secondo. La strategia consiste nel presentare alla signora
8 diverse tazze di tè al latte, quattro per ciascuna delle preparazioni, e contare quante vengono
classificate correttamente (otterremo una tavola delle contingenze, 4.14.6.1). Con una
randomizzazione rigorosa, sia dei due tè nelle otto diverse tazze sia dell’ordine di presentazione
alla signora, la probabilità che la signora non faccia errori è solo 1/70, si evita la confusione con
fattori non controllati, si ha la possibilità di applicare correttamente i test statistici.
Momenti importanti nello sviluppo delle metodologie del disegno sperimentale sono dovuti a R.L.
Plackett and J.P. Burman ("The Design of Optimum Multifactorial Experiments", Biometrika 33 (4),
pp. 305-25, June 1946 ) e a George Box (G.E. Box, N.R. Draper, “Empirical Model-Building and
Response Surfaces”, Wiley, 1987 e G.E. Box, W.G. Hunter, J.S. Hunter, “Statistics for
Experimenters”, Wiley).
In Europa, una importante scuola di Metodologia della Ricerca Scientifica è quella fondata da
Roger Phan-Tan-Luu alla Università Paul Cezanne di Marseille-Aix. Questo capitolo segue in gran
parte gli insegnamenti di Roger Phan-Tan-Luu.
2
La ricerca sperimentale (accademica, industriale, agricola) richiede azioni (esperimenti) dai quali
ottenere informazione rilevante per rispondere ad una serie di domande.
Vi son molti tipi di esperimenti, ma tutti sono caratterizzati dal fatto che lo sperimentatore sceglie
sia il numero degli esperimenti che per ciascuno le “condizioni sperimentali”, l’insieme di un
numero più o meno grande di caratteristiche variabili che si suppone abbiano effetto sul risultato
dell’esperimento. Ovviamente lo sperimentatore riflette con lo scopo di operare una scelta
adeguata. Gli strumenti del disegno sperimentale lo aiutano ad operare questa scelta nella
maniera migliore.
Lavorare senza impiegare abbastanza tempo e conoscenze per pianificare il lavoro sperimentale
significa:
1) usare esperimenti e/o condizioni sperimentali “sbagliate” (per esempio scegliere una
metodica di analisi non adatta, o fissare in modo errato i parametri che hanno effetto sui
risultati di una metodica adatta);
2) fare più esperimenti di quelli necessari per ottenere le informazioni richieste (perdita di
tempo e di economia), oppure ottenere meno informazioni di quelle richieste
(informazione insufficiente o di cattiva qualità).
Il Disegno sperimentale o Metodologia della ricerca scientifica é l’insieme dei procedimenti usati
per pianificare il lavoro sperimentale, cioè scegliere gli esperimenti in modo da ottenere:
A) la massima informazione rilevante;
B) informazione della migliore qualità;
C) con il numero minimo di esperimenti, salvando tempo e denaro.
Il risultato di un esperimento (RISPOSTA) dipende dalle condizioni sperimentali, descritte da un
certo numero di FATTORI, continui (come temperatura, concentrazione, tempo) o discreti (come
catalizzatore, recipiente, tipo di impianto, solvente, sostituente).
Lo sperimentatore può CONTROLLARE questi fattori, cioè fissare il loro valore in un certo
intervallo. L’intervallo possibile, o definito dallo sperimentatore, per i fattori definisce lo spazio
sperimentale o DOMINIO SPERIMENTALE.
Per elaborare una strategia, la pianificazione degli esperimenti per un determinato problema,
occorre, per prima cosa, definire gli obbiettivi, che possono essere:
a) Ottimizzazione, che consiste semplicemente nel ricercare la combinazione dei valori
(LIVELLI) dei fattori che fornisce il miglior risultato;
3
b) Studio quantitativo, che consiste nella esplorazione di tutto il dominio sperimentale e nel
trovare la relazione tra livelli dei fattori e risposta;
c) Screening dei fattori (cernita, esame preliminare), che consiste nell’individuare un numero
ridotto di fattori realmente importanti partendo da un numero elevato di fattori
potenzialmente importanti.
Lo schema in Figura 5-1 mostra i blocchi del progetto di ricerca sperimentale. Spesso i risultati
ottenuti in base ad un primo disegno sperimentale non sono sufficienti per la soluzione del
problema (anche perché per ragioni economiche si preferisce inizialmente un disegno economico),
ed è necessario fare passi indietro, qualche volta anche ritornare alla definizione del problema.
Il PROBLEMA riguarda una o più quantità misurabili (risposte o risultati dell’esperimento) che sono
funzione di uno o più fattori sperimentali, variabili che lo sperimentatore può più o meno bene
controllare, ponendoli come si è detto, a determinati valori, i livelli. Generalmente l’obbiettivo
finale del problema è la ottimizzazione delle risposte o di una loro funzione. Se si parte dallo
screening, in un secondo tempo si lavorerà sui fattori che lo screening ha evidenziato come
realmente importanti, studiando tutto il dominio sperimentale (per avere una visione
approfondita) o limitando la investigazione alla ricerca dell’ottimo.
Figura 5-1 – Blocchi del progetto di ricerca
4
Il dominio sperimentale é delimitato dall’intervallo permesso o imposto per ogni fattore e
contiene tutte le possibili combinazioni dei livelli dei fattori. Esso può essere rettangolare, o in
parallelepipedo, o un iper-parallelepipedo. Può avere una geometria diversa, per esempio
triangolare, come nel caso i fattori siano le frazioni molari di tre componenti una miscela, o una
geometria complessa, dovuta generalmente ad una serie di vincoli, sia chimico-fisici che
economici.
Vi sono molti tipi di progetto di ricerca (sintesi di una molecola, ottimizzazione di un impianto,
ottimizzazione di una procedura analitica, scelta di campioni per una calibrazione, simulazione,
ottimizzazione di un contenitore, ottimizzazione di un prodotto dolciario industriale, ).
Lo sperimentatore si pone una serie di domande.
Cosa vuole o cosa può misurare?
Con quali strumenti e con quali metodologie?
Quali sono i fattori che influenzano o che potrebbero influenzare il processo?
Quale è l’intervallo permesso o interessante per questi fattori?
Quali sono i vincoli di tempo, costo, personale.? Quali sono le difficoltà pratiche?
Dagli esperimenti lo sperimentatore desidera ottenere la corretta risposta a domande del tipo:
La resa della reazione é influenzata dalla temperatura?
Quale é il miglior catalizzatore tra A, B e C?
Quali sono le proporzioni di farmaco attivo e di eccipienti per ottenere compresse con determinate
caratteristiche?
Quali sono gli standard da scegliere per una calibrazione multivariata?
Quali sostituenti si devono studiare per esplorare i derivati di una molecola attiva base?
5.1.2 - Disegno “One-at-a-time” e “grid search”
Per rispondere a queste domande lo sperimentatore se ne deve porre una nuova: quali e quanti
esperimenti devono essere realizzati? La risposta a questa domanda costituisce il cuore della
metodologia della ricerca sperimentale, il disegno multivariato (molti fattori) degli esperimenti,
MDOE (Multivariate Design Of Experiments).
La risposta si trova abbastanza banalmente quando la risposa dipende da un unico fattore, ma
questo è un caso molto raro, e supporremo che i fattori siano sempre più di uno e che l’obbiettivo
sia scegliere la combinazione dei livelli dei vari fattori in modo che la risposta sia ottima, massima
o minima a seconda dei casi.
5
Storicamente il primo, classico, approccio al disegno sperimentale è stato lo studio di un fattore
per volta (one at a time)
Questa strategia é facile, ma non é efficiente.
Supponiamo did over studiare il rendimento di una reazione chimica
A+BC
e che siano due i fattori che possiamo controllare e che riteniamo abbiano effetto sul rendimento,
il pH e la temperatura:
RISPOSTA
RENDIMENTO
FATTORI
pH, Temperatura
Supponiamo che il dominio sperimentale sia rettangolare, con il pH tra 3 e 7 e la temperatura tra
40 e 80°C.
Iniziamo l’esplorazione del dominio sperimentale con il pH, fissando la temperatura a 40°C.
Effettuiamo 5 esperimenti, scegliendo 5 livelli (3, 4, 5, 6, 7) per il fattore pH.
Misuriamo per ogni esperimento il rendimento ed otteniamo il risultato in Figura 5-2.
Figura 5-2 – Strategia “one at a time”, risultati con l’esplorazione del primo fattore. Temperatura
40°C.
Il rendimento massimo è a pH 5. Abbiamo ottimizzato il pH.
Ora ottimizziamo la temperatura, effettuando 4 esperimenti a 50, 60, 70 e 80°C. Per ogni
esperimento misuriamo il rendimento e otteniamo il risultato in Figura 5-3.
6
Figura 5-3 – Strategia “one at a time”, risultati con l’esplorazione del secondo fattore. pH = 5.
Troviamo che il massimo rendimento è a 50°C, e concludiamo che la resa della reazione è massima
a pH5 e 50°C:
La strategia “one at a time” fornisce un risultato corretto (ottimo individuato entro le differenze
tra i livelli) solo in alcuni, rari, casi. La Figura 5-4 mostra uno di questi casi, quelli in cui gl effetti dei
fattori sono incorrelati, e il procedimento one at a time, con un opportuno numero di livelli, riesce
ad individuare l’ottimo (il minimo della risposta in questo caso.
Figura 5-4 – Curve di isorisposta per fattori con effetti non correlati
7
Quando l’effetto dei fattori è correlato (si ha interazione, e l’effetto di un fattore dipende dal
livello dell’altro fattore), come nel caso della Figura 5-5, il metodo one at a time può indicare una
combinazione dei fattori molto lontana dal vero ottimo.
Figura 5-5 –Curve di isorisposta per fattori con effetti correlati
Concludendo, il procedimento one at a time può richiedere un numero elevato di esperimenti,
esplora solo una piccola parte dello spazio sperimentale, non tiene conto delle interazioni tra
fattori, e conseguentemente può portare a risultati completamente errati.
Figura 5-6 – Strategia “one at a time” (A) e strategia “Grid search” (B)
8
Una strategia alternativa è la “grid search”, la esplorazione sistematica, a griglia, di tutto il dominio
sperimentale (Figura 5-6). La strategia a griglia esplora completamente il dominio sperimentale,
ma il costo della sperimentazione è eccessivamente elevato.
5.1.3 – La bilancia di Hotelling
Le tecniche attuali di disegno sperimentale selezionano un numero di esperimenti minimo per
esplorare lo spazio dei fattori e dare informazione della miglior qualità possibile.
Un esempio illuminante è quello della “Bilancia di Hotelling”.
Il problema è quello di pesare un certo numero di oggetti (tre nell’esempio).
Le domande che si pone lo sperimentatore sono:
1) Quale strategia dovrò usare per pesare gli oggetti?
2) Vi sono più strategie alternative?
3) Se ve ne sono, come possiamo caratterizzare le differenti strategie?
4) Se ve ne sono, vi è una strategia “ottima”?
5) Se ve ne sono, quale criterio si deve utilizzare per scegliere la strategia ottima?
Gli esperimenti richiedono tempo e costo. In questo caso supporremo che ogni esperimento costi
10 €. Per effettuare gli esperimenti lo sperimentatore ha a disposizione una bilancia a due piatti
(Figura 5-7).
Figura 5-7 – La bilancia a due piatti
9
L’esperimento consiste nel porre un certo numero di oggetti (0,1,2,..) su uno o su due piatti della
bilancia e leggere il “risultato” dell’esperimento su di una scala graduata, con valori positivi a
destra e negativi a sinistra.
Il problema verrà studiato nel caso di tre oggetti, O1, O2 e O3, con masse vere 1, 2 e 3
rispettivamente. 0 è la massa dell’oggetto nullo corrispondente allo zero vero della bilancia. Lo
zero della bilancia non è infatti aggiustabile e quando non vi sono oggetti sui due piatti la scala
graduata può indicare un valore diverso da zero.
“Pesare” gli oggetti significa stimare le masse vere 1, 2 e 3.
Il risultato sperimentale y sempre differisce dal valore vero per un errore sperimentale.
L’espressione
yi =
+
i
indica che l’i-esimo risultato è eguale al valore vero, media della popolazione dei risultati, più il
relativo errore.
L’errore sperimentale é una variabile a caso con media della popolazione (speranza matematica E)
eguale a 0:
E(i) = 0
e pertanto:
E(yi) =
Sia la varianza dell’errore sperimentale, e conseguentemente quella del risultato, 2:
Var (yi) = Var(i) = 2
Noi facciamo le ipotesi usuali che 2 sia indipendente dal valore della massa misurata e che gli
errori siano variabili incorrelate.
Strategia A
Iniziamo con una strategia sperimentale che indicheremo come Strategia A, che consiste nel porre
un oggetto alla volta sul piatto destro della bilancia. Per avere lo zero occorrerà anche “pesare”
l’oggetto nullo. La Figura 5-8 e la sottostante tabella illustrano i quattro esperimenti.
Figura 5-8 – Pesata di tre oggetti, strategia A.
10
Indice dell’esperimento
Oggetti sulla bilancia
Risultato
1
nessun oggetto
y1
2
oggetto 1 sul piatto di destra
y2
3
oggetto 2 sul piatto di destra
y3
4
oggetto 3 sul piatto di destra
y4
Introduciamo ora il concetto di MATRICE SPERIMENTALE, che ha tante righe quanti sono gli
esperimenti e tante colonne quanti sono gli oggetti. I dati nella matrice sono: 0 se un oggetto non
è sul piatto della bilancia, 1 se l’oggetto è sul piatto della bilancia:
0
0
0
1
0
0
0
1
0
0
0
1
Per i valori veri deve essere:
0
= 1 E(y1), speranza matematica quando non vi sono oggetti sui piatti
0 + 1 = 2
0 + 2 = 3
0 + 3 = 4
e
1
= 2 - 1
2
= 3 - 1
3
= 4 - 1
Le misure sperimentali dei valori veri sono:
bj = yj+1 - y1
b0 = y1
Le stime b sono variabili a caso, stime delle :
E(bj) = E(yj+1 - y1) = E(y j+1) - E(y1) = j+1 - 1 = j
e ciò significa che con la strategia A lo sperimentatore ottiene l’informazione richiesta.
11
Inoltre:
var(bj) = var( yj+1 - y1) = 2 2
2 2 é la qualità dell’informazione ottenuta mediante la strategia A, e il costo della strategia é di
40 € (quattro esperimenti).
Strategia A twin (A raddoppiata)
Se lo sperimentatore considera che la qualità dell’informazione ottenuta dalla strategia A è troppo
bassa, può ricordare che la media di un estimatore di una qualunque variabile a caso X ottenuta da
N ripetizioni ha varianza N volte inferiore alla varianza della variabile a caso.
Così lo sperimentatore può ripetere due volte gli esperimenti, con un costo di 80€.
La matrice sperimentale è mostrata sotto, accompagnata dalla colonna dei risultati.
Indice
Oggetto 1
Oggetto 2
Oggetto 3
Risultato
1
0
0
0
y1a
2
1
0
0
y2a
3
0
1
0
y3a
4
0
0
1
y4a
5
0
0
0
y1b
6
1
0
0
y2b
7
0
1
0
y3b
8
0
0
1
y4b
dell’esperimento
Risulta:
bj = (yj+1,a+yj+1,b)/2 - (y1a+y1b)/2
e facilmente:
var(bj) = var[(yj+1,a+yj+1,b)/2-(y1a+y1b)/2] = 2
La qualità degli estimatori é migliorata, ma il costo della sperimentazione è raddoppiato.
Strategia B
Sono possibili altre strategie.
La strategia B mette due oggetti sullo stesso piatto, tranne per la pesata dell’oggetto nullo (Figura
5-9.
12
Figura 5-9 – Pesata di tre oggetti, strategia B.
La matrice sperimentale (I dati nella matrice sono: 0 se un oggetto non è sul piatto della bilancia, 1
se l’oggetto è sul piatto della bilancia) è riportata nella tabella sottostante, insieme alla colonna
dei risultati sperimentali.
Indice
Oggetto 1
Oggetto 2
Oggetto 3
Risultato
1
0
0
0
y1
2
1
1
0
y2
3
1
0
1
y3
4
0
1
1
y4
dell’esperimento
Equazioni per le medie di popolazione:
0
=
1
0 + 1 + 2
=
2
+ 3
=
3
+ 2 + 3
=
4
0 + 1
0
e per le stime:
b1 = (y2 + y3 - y1 - y4) / 2
b2= (y2 + y4 - y1 - y3) / 2
b3= (y3 + y4 - y1 - y2) / 2
Facilmente si verifica che E(bi) = i , e pertanto anche la strategia B fornisce l’informazione
richiesta. Per b1:
E(b1) = E(y2+ y3-yj-y4) /2 = (E(y 2) + E(y3) - E(y1) - E(y4))/2 = (2 + 3 - 1 - 4) /2 = [ (0 + 1 + 2) +
(0 + 1 + 3) - (0) – (0 + 2 + 3) ] / 2 = [ (20 + 21 + 2+ 3) - (20 + 2 + 3) ] / 2 = 1
La varianza delle stime é illustrata solo per b1
var(b1 ) = Var [(y2 + y3 - y1- y4 ) / 2] =
= Var [(y2 + y3 - y1 - y4)] / 4 =
13
= [Var (y2)+ Var(y3) + Var(y1) + Var(y4)] / 4 =
= [ 2 + 2 + 2 + 2 ] / 4 = 2
Concludendo, la strategia B fornisce la informazione con qualità eguale a quella della strategia A
twin, ma con un costo che è la metà. Pertanto non è (sempre) necessario aumentare il numero
degli esperimenti per migliorare la qualità della informazione.
Strategia C
Vi è una ulteriore possibilità.
La strategia C usa ambedue i piatti (Figura 5-10) e tutti i risultati sono negativi.
Figura 5-10 – Pesata di tre oggetti, strategia C.
La matrice sperimentale si scrive con : 0 se un oggetto non è sul piatto della bilancia, 1 se
l’oggetto è sul piatto destro della bilancia, -1 se l’oggetto è sul piatto sinistro.
Indice
Oggetto 1
Oggetto 2
Oggetto 3
Risultato
1
-1
-1
-1
y1
2
+1
-1
-1
y2
3
-1
+1
-1
y3
4
-1
-1
+1
y4
dell’esperimento
Equazioni per le medie di popolazione:
0 - 1 - 2 - 3
=
1
0 + 1 - 2 - 3 =
2
0 - 1 + 2 - 3 =
3
0 - 1 - 2 + 3 =
4
e per le stime:
14
b1 = (y2 - y1) / 2
b2 = (y3 - y1) / 2
b3 = (y4 - y1) / 2
Facilmente si verifica che E(bi) = i , e pertanto anche la strategia C fornisce l’informazione
richiesta.
La varianza delle stime (esemplificata per b1) è:
var(b1 ) = Var [(y2 - y1) / 2] =
= Var [(y2 - y1)] / 4 =
= [Var (y2) + Var(y1)] / 4 =
= [ 2 + 2 ] / 4 = 2/2
Si conclude che la strategia C fornisce allo stesso prezzo della strategia B (40€) una informazione di
qualità migliore, pari a quella che si potrebbe ottenere con una strategia A quadrupla, al prezzo di
160 €.
Sono possibili altre strategie. Ma solo una di queste merita particolare attenzione.
Strategia D
Apparentemente è equivalente alla strategia C, in quanto l’unica differenza è che nella prima
pesata tutti gli oggetti sono sul piatto di destra anziché su quello di sinistra (Figura 5-11).
Figura 5-11 – Pesata di tre oggetti, strategia D.
La matrice sperimentale si scrive con : 0 se un oggetto non è sul piatto della bilancia, 1 se
l’oggetto è sul piatto destro della bilancia, -1 se l’oggetto è sul piatto sinistro.
Indice
Oggetto 1
Oggetto 2
Oggetto 3
Risultato
1
+1
+1
+1
y1
2
+1
-1
-1
y2
3
-1
+1
-1
y3
4
-1
-1
+1
y4
dell’esperimento
15
Equazioni per le medie di popolazione:
0 + 1 + 2 + 3
1
=
0 + 1 - 2 - 3 =
2
0 - 1 + 2 - 3 =
3
0 - 1 - 2 + 3 =
4
e per le stime:
b1 = (y1 + y2 - y3 - y4) / 4
b2 = (y1 - y2 + y3 - y4) / 4
b3 = (y1 - y2 - y3 + y4) / 4
Facilmente si verifica che E(bi) = i , e pertanto anche la strategia D fornisce l’informazione
richiesta.
La varianza delle stime (esemplificata per b1) è:
var(b1) = Var [y1 + y2 - y3 - y4) / 4] =
= Var [(y1 + y2 - y3 - y4)] / 16 =
= [Var (y1) + Var(y2) + Var(y3) + Var(y4)] / 16 =
= [ 2 + 2 + 2 + 2] / 16 = 2/4
Si conclude che la strategia D fornisce allo stesso prezzo della strategia C (40€) una informazione di
qualità migliore, pari a quella che si potrebbe ottenere con una strategia A ottupla, con 32
esperimenti e quindi al prezzo di 320 €.
La matrice sperimentale D è ottima nel caso dell’uso di due piatti (è impossibile ottenere una
minor varianza delle stime con quattro esperimenti), mentre la matrice sperimentale B è ottima
nel caso di utilizzo di un solo piatto.
La matrice D-bis
Indice
Oggetto 1
Oggetto 2
Oggetto 3
Risultato
1
-1
-1
-1
y1
2
-1
+1
+1
y2
3
+1
-1
+1
y3
4
+1
+1
-1
y4
dell’esperimento
é simmetrica rispetto a quella della strategia D (Figura 5-12).
16
Figura 5-12 – Pesata di tre oggetti, strategia D-bis.
e ovviamente si comporta come la matrice sperimentale D.
Le matrici sperimentali che permettono di ottenere la varianza minima delle stime, e quindi la
informazione di migliore qualità, sono note come matrici di Hadamard o di Plackett-Burman.
Le matrici di Hadamard H sono caratterizzate dal fatto che
HT H = N I
dove N è il numero degli esperimenti. Ne parleremo più avanti, a proposito di screening.
Il primo sguardo sul disegno sperimentale ha mostrato che:
1) abbiamo in generale necessità di avere informazione su tutto il dominio sperimentale e
l’approccio “grid search” è troppo oneroso;
2) possiamo avere qualità della informazione molto differenti come conseguenza di differenti
disegni sperimentali.
17
5.2 – CONCETTI DI BASE
Il Disegno Sperimentale (ED: Experimental Design) usa in modo estensivo la regressione ordinaria
con i minimi quadrati per trovare le relazioni tra risposte e fattori, e la ANOVA per l’analisi
statistica del significato degli effetti calcolati.
Per rendere più facile il trattamento matematico, ED utilizza fattori:
CENTRATI e
CODIFICATI.
Inoltre si cerca di utilizzare fattori indipendenti ed incorrelati (non sempre è possibile).
Sono indipendenti i fattori che possono essere fissati a vari livelli, senza che vi siano vincoli dovuti
agli altri fattori. Quando i fattori sono indipendenti, è sempre possibile fissare i livelli in modo che
i fattori siano incorrelati. Se la scelta dei livelli è fatta in modo sbagliato, i fattori possono essere, e
anche molto, correlati.
P.e., siano i (due) fattori la temperatura e la pressione in un reattore chimico. Questi fattori sono
indipendenti, ma, se lo sperimentatore fissa i livelli negli esperimenti come in Figura 5-13, i fattori
diventano molto correlati: è stata introdotta forzatamente una relazione tra i fattori.
Figura 5-13 – Scelta di livelli errata, che introduce correlazione tra i fattori
Nella metodologia della ricerca sperimentale si studiano strategie adatte a:
a) esplorare l’intero dominio sperimentale;
b) ridurre al minimo il numero degli esperimenti;
c) studiare contemporanemente un grande numero di fattori (spesso anche fattori con un piccolo
effetto),
con lo scopo di:
a) misurare l’effetto dei fattori e delle loro interazioni;
b) trovare l’ottimo o gli ottimi;
18
c) ottenere una precisione accettabile;
d) costruire un modello risposta.fattori;
e) individuare i fattori influenti.
Il minimo numero di livelli per studiare un fattore é 2.
Per questa ragione iniziamo con la descrizione del più semplice tipo di disegno sperimentale,
disegno che si utilizza spesso in una fase iniziale, in quanto relativamente economico, quando il
numero dei fattori non è molto grande.
19
5.2.1 – Disegni fattoriali completi 2k
5.2.1.1 – Disegno fattoriale completo 22
Il minimo numero di fattori è 2 (la sperimentazione con un solo fattore è relativamente banale e
non viene considerata nel MDOE, Multivariate Design Of Experiments).
Il minimo numero di livelli per studiare un fattore é 2.
Sembra pertanto ragionevole utilizzare disegni a due livelli: essi sono i più semplici e si applicano a
molte situazioni; il caso 2 livelli e k = 2 fattori, il disegno fattoriale completo 2 2, viene utilizzato in
seguito per introdurre alcuni concetti di base.
Consideriamo l’esempio già visto parlando di strategia one at a time, in cui sis tudia una reazione
chimica per l’effetto di due fattori, pH e temperatura.
RISPOSTA
RENDIMENTO
FATTORI
pH, Temperatura
Il dominio sperimentale é rettangolare, limitato per certe ragioni a pH tra 3 e 7 e temperatura tra
40 e 80°C (Figura 5-14).
Figura 5-14 – Dominio sperimentale
La strategia corrispondente al ”two-level full factorial design” sceglie gli esperimenti in modo che il
loro leverage sia il maggiore possibile entro i limiti imposti dal dominio sperimentale.
Il leverage è dato dalla diagonale principale della matrice Hat
h i x i T ( X T X) 1 x i
[5-1]
(vedi 4.8.6.6) e X è la matrice del modello.
Il leverage è massimo per i quattro punti estremi del dominio e pertanto il piano sperimentale del
disegno 22 è:
20
Esperimento
pH
Temperatura °C
1
3
40
2
7
40
3
3
80
4
7
80
Livello
pH
Temperatura
-1
3
40°
+1
7
80°
Si definiscono i livelli:
Il codice del livello costituisce per ciascuno dei fattori il fattore codificato, e la matrice
sperimentale:
Esperimento
X1
X2
(pH)
(Temperatura)
1
-1
-1
2
+1
-1
3
-1
+1
4
+1
+1
è eguale per tutti i disegni 22.
La Figura 5-15 mostra gli esperimenti nello spazio dei fattori codificati.
Figura 5-15 – Dominio sperimentale con i fattori codificati
Alla matrice sperimentale corrisponde la matrice del modello.
21
Si chiama matrice del modello (ed è la matrice che si utilizza nella regressione, per trovare il
modello matematico risposta-fattori) la matrice corrispondente al modello di regressione. Se il
modello è quello lineare semplice:
y = b0 + b1 x1 + b2 x2
la matrice del modello è eguale a quella sperimentale addizionata, in testa o in coda, con una colonna
di 1:
+1
-1
-1
+1
+1
-1
+1
-1
+1
+1
+1
+1
Dalla matrice del modello X si ottengono:
- la matrice di informazione XTX, che è diagonale:
4 0 0
0 4 0
0 0 4
e pertanto la matrice X è una matrice di Hadamard.
- la matrice di dispersione (XTX)-1, anche essa ovviamente diagonale:
0.25 0
0
0
0.25 0
0
0
0.25
- la matrice Hat X(XTX)-1XT, con i leverages sulla diagonale:
0.75
0.25
0.25
0.25
0.75
-0.25 0.25
0.25
-0.25 0.75
-0.25 0.25
0.25
-0.25
0.25
0.75
la cui somma è 3 (numero dei coefficienti del modello).
Si noti come la matrice hat non sia diagonale. Nel caso del modello lineare semplice, il piano di
regressione non passa (generalmente) attraverso i quattro valori della risposta, e la matrice hat,
moltiplicata per la risposta, fornisce i valori stimati della risposta, i valori della risposta proiettati
sul piano di regressione.
22
5.2.1.2 – Gli effetti
Con la matrice sperimentale si effettuano gli esperimenti, misurando il rendimento:
L’aumento del pH a bassa temperatura causa un aumento della resa del 20% (da 50 a 70).
L’aumento del pH ad alta temperatura causa un aumento della resa del 10% (da 80 a 90).
Effetto del fattore pH
L’effetto medio del fattore pH é 15%.
Effetto del pH
a temperature bassa
20 =
y2 - y1
Effetto del pH
a temperature alta
10 =
y4 - y3
L’effetto del pH dipende dalla temperatura: vi é INTERAZIONE.
Effetto medio SPECIFICO del pH
7.5 = (- y1 + y2 - y3 + y4) / 4
Effetto medio del pH
15
L’effetto medio specifico si riferisce ad una variazione 1 del valore della variabile codificata.
Analogamente l’effetto specifico del pH a temperatura bassa è 10, a temperatura alta è 5.
L’effetto medio si riferisce a tutto l’intervallo (2) del valore della variabile codificata.
Si noti come, operando con le variabili codificate, l’effetto sia eguale alla somma dei valori della
risposta (50 70 80 90), ciascuno moltiplicato per il corrispondente valore della variabile codificata
(-1 +1 -1 +1), il tutto diviso per il numero dei termini (4).
In generale (per i disegni fattoriali completi a due livelli, con effetti lineari e di interazione):
Effetto del fattore j
Numero dei livelli
i 1
yi codicei, j / Numero dei livelli
[5-2]
Effetto del fattore Temperatura
Effetto della temperatura a pH basso
30 =
y3 - y1
Effetto della temperatura a pH alto
20 =
y4 - y2
L’effetto della temperatura dipende dal pH: vi é INTERAZIONE.
Effetto medio specifico della temperatura = (- y1 - y2 + y3 + y4) / 4 = (-50-70+80+90) /4 = 12.5
23
Effetto “media”
MEDIA = (+ y1 + y2 + y3 + y4) / 4 = (50+70+80+90) / 4= 72.5
A questo punto abbiamo una prima visione dell’andamento della risposta n el dominio
sperimentale (Figura 5-16).
Figura 5-16 – Valori sperimentali e calcolati
5.2.1.3 – La matrice del modello
Per migliorare la conoscenza dell’andamento della risposta nel dominio sperimentale si ricorre alla
regressione ordinaria con i minimi quadrati. Il modello OLS
y = b0 + b1 x1 + b2 x2
ha tre coefficienti, e per calcolare i coefficienti sono necessarie almeno tre equazioni.
I quattro esperimenti ci danno la possibilità di valutazione del modello mediante convalida leaveone-out, ma in generale si preferisce utilizzare un modello più complesso:
y = b0 + b1 x1 + b2 x2 + b12 x1 x2
[5-3]
che oltre agli effetti lineari considera l’INTERAZIONE.
Il modello di regressione corrisponde alla MATRICE DEL MODELLO:
Esp.
Cost.
x1
x2
x1 x2
1
+1
-1
-1
+1
2
+1
+1
-1
-1
3
+1
-1
+1
-1
4
+1
+1
+1
+1
24
La matrice di dispersione è diagonale con elementi 0.25, ed è diagonale la matrice hat, con
elementi eguali ad 1. Pertanto moltiplicata per i valori della risposta, si ottengono i valori stimati
eguali a quelli sperimentali: la superficie di regressione (non planare) passa attraverso i quattro
punti sperimentali.
Si noti, nella matrice del modello, la colonna della costante, ha i valori quali si ottiene la media, e
che i valori della interazione x1 x2 sono il prodotto dei valori codificati dei due fattori. Da essi è
possibile calcolare la interazione:
Interazione = (+ y1 - y2 - y3+ y4 / 4 = (50 -70 -80 +90) /4 = -2.5
e conseguentemente ottenere tutti i coefficienti del modello, che, si rammenti, vale per le variabili
codificate:
b0 = 72.5
b1 = 7.5
b2 = 12.5
b12 = -2.5
Il modello [5-3] permette di conoscere il valore della risposta in ogni punto del dominio sperimentale
(Figura 5-17), ovviamente sotto l’ipotesi che il modello sia valido, ipotesi che dovrà essere verificata (e
vedremo come).
Nell’esempio considerato l’interazione é relativamente piccola, a fronte degli effetti lineari dei due fattori.
La Figura 5-18 mostra il risultato ottenuto in un caso di grande interazione positiva ed effetti lineari negativi
e relativamente piccoli.
Figura 5-17 – Valori della risposta nel dominio sperimentale
25
Figura 5-18 – Valori delle risposta in un caso di piccoli effetti negativi e grande interazione positiva
5.2.1.4 – Disegno fattoriale completo 23
Il Disegno fattoriale completo 23 viene illustrato mediante un esempio in cui viene studiata la
stabilità di un farmaco (percentuale del contenuto in principio attivo dopo 48 ore, a temperatura
relativamente elevata), in funzione di tre fattori:
Fattore 1: Umidità, in seguito UMID
Fattore 2: Forma farmaceutica, in seguito FORM
Fattore 3: Percentuale dell’eccipiente A nella miscela dei due possibili eccipienti, in seguito PERC
Il disegno fattoriale completo 23 (2 livelli, 3 fattori) richiede otto esperimenti, riportati nella tabella
seguente, insieme ai valori corrispondenti ai due livelli codificati.
Esperimento
1
2
3
4
5
6
7
8
LIVELLO
-1
+1
X1
-1
+1
-1
+1
-1
+1
-1
+1
UMID
55%
70%
X2
-1
-1
+1
+1
-1
-1
+1
+1
FORM
Polvere
Compresse
26
X3
-1
-1
-1
-1
+1
+1
+1
+1
PERC
0%
30%
Figura 5-19 –Dominio sperimentale ed esperimenti per il disegno fattoriale completo 23
La Figura 5-19 mostra la disposizione dei punti sperimentali nel dominio sperimentale. La matrice
del modello è mostrata nella tabella successiva, insieme ai valori misurati della variabile risposta.
Gli esperimenti sono stati eseguiti in ordine casuale, una regola estremamente importante che si
deve seguire con la sola eccezione dei disegni detti “antidrift”.
Si noti come la prima colonna (della media) sia una colonna di +1, la seconda, del primo fattore, sia
costituita da un -1 alternato ad un +1, la terza, del secondo fattore sia costituita da due -1 alternati
a due +1, la quarta, del terzo fattore, sia costituita da quattro -1, alternati (solo seguiti in questo
caso) da quattro +1. I valori delle interazioni di secondo grado e di quella di terzo grado si ricavano
dal prodotto dei valori dei fattori codificati corrispondenti.
Esp. Media X1
X2
X3
X 1X 2 X 1X 3 X 2X 3 X 1X 2 X 3 Y
1
+1
-1
-1
-1
+1
+1
+1
-1
87.5
2
+1
+1 -1
-1
-1
-1
+1
+1
83.2
3
+1
-1
+1 -1
-1
+1
-1
+1
84.5
4
+1
+1 +1 -1
+1
-1
-1
-1
80.5
5
+1
-1
-1
+1 +1
-1
-1
+1
88.0
6
+1
+1 -1
+1 -1
+1
-1
-1
62.0
27
7
+1
-1
+1 +1 -1
-1
+1
-1
91.8
8
+1
+1 +1 +1 +1
+1
+1
+1
61.4
La matrice del modello è una matrice di Hadamard, come lo è ogni matrice ottenuta con alcune
delle colonne, in quanto gli 8 vettori colonna sono ortogonali tra di loro. P.e. moltiplicando X1:e P =
X1X2X3 si ha:
X11 P 1 + X12 P 2 + X13 P3 + X14 P4 + X15 P5 + X16P6 + X17 P7 + X18 P8
=
(-1 -1) + (+1 +1) + (-1 +1) + (+1 -1 ) + (-1 +1) + (+1 -1) + (-1 -1) + (+1 +1) = 1 +1 -1 -1 -1 -1 +1 +1 = 0
mentre X1 moltiplicato per X1 dà come risultato 8, il valore comune alla diagonale della matrice di
informazione.
Figura 5-20 –Dominio sperimentale, valori sperimentali ed effetti
Il modello che gli otto esperimenti permettono è, come anticipato nella matrice del modello:
y = b0 + b1 x1 + b2 x2 + b3 x3 + b12 x1 x2 + b13 x1 x3 + b23 x2 x3 + b123 x1 x2 x3
[5-4]
con la media, tre effetti (primo ordine), tre interazioni del secondo ordine e una interazione del
terzo ordine.
Il calcolo della regressione fornisce:
b0 = 79.86
b1 = -8.087
b2 = -0.3125
b3 = -4.062
b12 = -0.5125
b13 = -6.013
b23 = 1.112
b123 = -0.5075
Si nota immediatamente che vi sono tre coefficienti (effetti specifici) molto elevati, l’effetto UMID,
l’effetto PERC, e la interazione tra i due UMID-PERC. In Figura 5-20, per esempio si nota come sia
UMID che PERC hanno un effetto negativo elevato. La forte interazione negativa indica che
l’umidità ha un effetto negativo molto elevato quando PERC è a livello alto, e PERC ha un effetto
negativo molto elevato quando UMID è al livello alto.
28
Lo studio prosegue, quasi sempre, con le superfici di isorisposta, che vengono riportate fissando i
due valori di FORM, che è il fattore che ha l’effetto minore, anche nelle interazioni.
Figura 5-21 – Superficie di risposta (a sinistra) e curve di isorisposta (a destra) per FORM a livello -1
(Polvere). Il punto in basso della superficie di risposta coincide con l’estremo alto a destra delle
curve di isorisposta.
Figura 5-22 – Superficie di risposta (a sinistra) e curve di isorisposta (a destra) per FORM a livello +1
(Compresse). Il punto in basso della superficie di risposta coincide con l’estremo alto a destra delle
curve di isorisposta.
29
5.2.1.5 – La notazione di Box
La notazione in Disegno sperimentale è basata sulla NUMERAZIONE STANDARD, ottenuta per
mezzo della notazione di Box, in cui ad ogni esperimento è assegnato un numero standard che
viene conservato anche quando l’ordine degli esperimenti, nella randomizzazione, viene cambiato.
Abbiamo già in precedenza utilizzato alcuni elementi della notazione di Box, la cui presentazione
viene ora completata.
Esp. Media X1
X2
X3
X 1X 2 X 1X 3 X 2X 3 X 1X 2 X 3
I
1
2
3
12
13
23
123
1
+1
-1
-1
-1
+1
+1
+1
-1
2
+1
+1 -1
-1
-1
-1
+1
+1
3
+1
-1
+1 -1
-1
+1
-1
+1
4
+1
+1 +1 -1
+1
-1
-1
-1
5
+1
-1
-1
+1 +1
-1
-1
+1
6
+1
+1 -1
+1 -1
+1
-1
-1
7
+1
-1
+1 +1 -1
-1
+1
-1
8
+1
+1 +1 +1 +1
+1
+1
+1
a
b
c
g
h
i
d
e
f
NOTAZIONE di BOX
a: Numero standard dell’esperimento
b: I é una colonna di +1, corrispondente alla media
c: la colonna del primo fattore, 1, è costituita da alternanze di -1 +1, iniziando con -1
d, e: in generale il fattore J è un vettore con 2j-1 esperimenti a livello -1, seguiti da 2j-1 esperimenti
a livello +1. La sequenza, se necessario, si ripete.
f,g,h,i: i segni delle interazioni si ottengono dal prodotto del valori dei corrispondenti fattori per lo
stesso esperimento.
30
5.2.1.6 – Algebra di colonna di Box
É basata sul semplicissimo prodotto dei segni di colonna e della corrispondente notazione di Box.
Regola 1
Una colonna di segni moltiplicata per una colonna di +1 (I) non cambia:
1.I = 1
I.I = I
123.I = 123
Regola 2
Una colonna moltipicata per se stessa dà una colonna di +1:
1.1 = I
123.123 = I
Si rammenti che nella notazione di Box
12, 13, 23, 123
significa che i segni in 12 sono ottenuti dal prodotto dei segni in 1 e 2, i segni in
123 sono ottenuti dal prodotto dei segni in 1, in 2 e in 3.
Vedremo come queste regole siano utili nella generazione degli alias.
5.2.2 – Conoscenza dell’esperimento
Generalmente lo sperimentatore ha una conoscenza notevole dei suoi esperimenti.
Questa conoscenza può consistere nella conoscenza della varianza dell’errore nella misura della
risposta, dalla quale facilmente si ottiene la varianza degli effetti e delle interazioni. lnoltre questa
conoscenza può suggerire, tenendo conto della scala di importanza degli obbiettivi, un diverso
ordine degli esperimenti (diverso da quello casuale), o l’utilizzo di particolari matrici sperimentali.
5.2.2.1 – Gli errori
Ogni effetto é la media pesata (per -1 o per +1) delle risposte e pertanto, se gli esperimenti sono
N e se è nota la varianza dell’errore 2 :
2b
2
2
k
N
2
[5-5]
dove b è il generico coefficiente di regressione. L’equazione [5-5] si ottiene applicando la regola
della propagazione delle varianze a variabili funzione di variabili indipendenti, e l’indipendenza è in
questo caso delle matrici di Hadamard, assicurata dalla matrice di informazione diagonale.
Frequentemente, la varianza dell’errore deve essere stimata dagli esperimenti.
Possiamo ripetere gli N esperimenti, calcolando N medie locali e calcolando la varianza
raggruppata con 2N-N d.o.f..
31
Alternativamente (e più frequentemente) vengono fatte alune determinazioni nel punto centrale.
Da esse si ottiene la stima della varianza e essi vengono anche utilizzate per verificare la validità
del modello.
La incertezza sulla stima di 2 mediante s2 ci é data dalla distribuzione 2 (2.14.2). L’intervallo di
fiducia, ad un livello di fiducia scelto, é:
2
2
sinistra
destra
s2
2
delimitato dai valori critici di sinistra e di destra della distribuzione 2, riportati sotto per il livello di
fiducia 95%.
.
Intervallo di fiducia di s2/2
da
a
1
0.0010
5.024
2
0.0253
3.689
3
0.0720
3.116
4
0.1210
2.786
10
0.3247
2.048
20
0.4796
1.709
Una possibilità si ha quando si hanno ragioni di ritenere che le interazioni di ordine più elevato
siano in realtà nulle e che la loro stima sia una misura dell’errore casuale.
In questo caso le interazioni stimate sono errori che provengono da una popolazione con varianza
data dalla [5-5], 2 / 2k , e la stima di 2 può essere ottenuta dalla somma dei quadrati di questi
errori, degli effetti scartati, come:
J
s 2 2 k b 2j / J
[5-6]
j1
con J d.o.f.
Sempre, quando la varianza è stimata con pochi gradi di libertà, occorre applicare la statistica di
Student per valutare il significato degli effettii.
ED sacrifica generalmente la valutazione della varianza per economizzare sul numero degli
esperimenti, e considera la risposta come omoscedastica, in quanto sarebbe necessario un
numero di esperimenti eccessivo per studiare la dipendenza della varianza della risposta dai livelli
dei fattori.
32
Oltre all’errore di misura della risposta, vi sono errori che dipendono dall’effetto sulla risposta di
fattori non controllati o da un controllo insufficiente dei fattori controllati. Questi sono
generalmente i fattori più importanti, ma il loro livello non sempre può essere fissato
accuratamente, con un conseguente rumore che si aggiunge alla e si confonde con la varianza
della risposta. I fattori non controllati aggiungono un rumore, quando essi oscillano casualmente
tra i loro livelli (Figura 5-23-B). I fattori non controllati possono causare una deriva, drift, quando
nel corso della successione degli esperimenti passano regolarmente da un livello ad un altro livello
(Figura 5-23-C). I fattori non controllati possono introdurre un errore sistematico, ma questo è
costante in una serie di esperimenti e si traduce solamente in una variazione della media, senza
azione sugli effetti e sulle interazioni dei fattori controllati di interesse (Figura 5-23-D).
Figura 5-23 – Effetto del fattore controllato 1 (A) e di fattori non controllati: B:con oscillazione
casuale tra i livelli; C: con variazione graduale (drift); D: con effetto sistematico, costante nella serie
di esperimenti.
33
5.2.2.2 – Disegni antidrift
Il drift é una sorgente di errore abbastanza commune, e la randomizzazione degli esperimenti é la
prima risposta a questo tipo di effetto dei fattori non controllati.
Nell esempio sottostante si ha un drift di 2 su Y per ogni ripetizione. Se gli esperimenti sono
condotti nell’ordine della numerazione standard si ha:
Esp.
X1
X2
X3
1
2
3
4
5
6
7
8
-1
+1
-1
+1
-1
+1
-1
+1
-1
-1
+1
+1
-1
-1
+1
+1
-1
-1
-1
-1
+1
+1
+1
+1
Ynodrift
90.8
88.9
87.5
83.5
91.0
74.5
91.4
67.9
Ydrift
90.8
90.9
91.5
89.5
99.0
84.5
103.4
81.9
Se gli esperimenti sono condotti in un ordine generato casualmente, p.e. 1, 3, 4, 7, 2, 5, 8, 6 si
ottiene
Esp.
X1
X2
X3
Ynodrift
Ydrift
1
3
4
7
2
5
8
6
-1
-1
+1
-1
+1
-1
+1
+1
-1
+1
+1
+1
-1
-1
+1
-1
-1
-1
-1
+1
-1
+1
+1
+1
90.8
87.5
83.5
91.4
88.9
91.0
67.9
74.5
90.8
89.5
87.5
97.4
96.9
101.0
79.9
88.5
Quando si calcolano i coefficienti, si ottiene:
No drift
84.4375
-5.7375
-1.8625
-3.2375
-1.1375
-4.2625
0.3125
-0.6125
b0
b1
b2
b3
b12
b13
b23
b123
Ordine standard
91.4375
-4.7375
0.1375
-1.1375
0.7625
-4.2625
0.3125
-0.6125
Se, invece dell’ordine standard
Esp.
X1
X2
X3
Ynodrift
1
-1
-1
-1
90.8
34
Ordine casuale
91.4375
-3.2375
-2.8625
0.2625
-1.6375
-4.2625
-0.1875
0.3875
2
3
4
5
6
7
8
+1
-1
+1
-1
+1
-1
+1
-1
+1
+1
-1
-1
+1
+1
-1
-1
-1
+1
+1
+1
+1
88.9
87.5
83.5
91.0
74.5
91.4
67.9
usiamo l’ordine seguente, studiato per limitare l’effetto :del drift,
Esp.
6
4
3
5
7
1
2
8
X1
X2
+1
+1
-1
-1
-1
-1
+1
+1
-1
+1
+1
-1
+1
-1
-1
+1
la stima degli effetti non è affetta da errore
No drift
b0
84.4375
b1
-5.7375
b2
-1.8625
b3
-3.2375
b12
-1.1375
b13
-4.2625
b23
0.3125
b123
-0.6125
X3
+1
-1
-1
+1
+1
-1
-1
+1
Ydrift
74.5
85.5
91.5
97.0
99.4
100.8
100.9
81.9
Ordine Antidrift
91.4375
-5.7375
-1.8625
-3.2375
-0.1375
-4.2625
4.3125
1.3875
p.e. b3 = (74.5-85.5-91.5+97+99.4-100.8-100.9+81.9)/8 = -3.2375
Disegni di questo tipo, illustrati per il disegno completo con tre fattori e due livelli, vengono detti
Disegni Antidrift.
35
5.2.3 – Qualità delle matrici
Quando uno sperimentatore ha un problema con due fattori e decide di effettuare solo tre
esperimenti, invece dei quattro richiesti dal disegno fattoriale complete a due livelli, ha la scelta
tra 84 possibili strategie. Ne confronteremo solo sei (Figura 5-24), rappresentative di altre
situazioni simmetriche.
Figura 5-24 – Strategie alternative per studiare due fattori con tre esperimenti
Il modello è necessariamente semplificato, in quanto con tre esperimenti si possono stimare al
massimo tre coefficienti, quelli di
y = b0 + b1 x1 + b2 x2
[5-7]
Vediamo le caratteristiche delle cinque strategie.
Strategia A
La matrice degli esperimenti é
x1 x2
-1 -1
-1 0
-1 1
e la matrice del modello é
I
1
2
+1 -1 -1
+1 -1 0
+1 -1 1
Questa matrice, con due colonne proporzionali, non può essere invertita. Poiché x1 è costante ed
eguale a -1, si sotituisce questo valore di x1 nella [5.7] ottenendo il modello semplificato:
y = b0 - b1 + b2 x2
[5-8]
in cui la media e l’effetto del fattore 1 non sono separabili. La nuova matrice del modello è:
36
I
2
+1 -1
+1 0
+1 +1
e le varianze delle stime sono: var(b0 - b1) = 0.333 2 , var(b2) = 0.5 2. La matrice di dispersione è
diagonale.
Strategia B
La matrice degli esperimenti é
x1 x2
-1 -1
0
0
+1 +1
e la matrice del modello é
I
1
2
+1 -1 -1
+1 0
0
+1 +1 +1
Questa matrice, con due colonne uguali, non può essere invertita. Poiché x1 = x2 gli effetti dei due
fattori non possono essere distinti. Dalla [5.7) si ottiene il modello semplificato:
y = b0 + (b1 + b2 )x1
[5-9]
in cui la media e l’effetto del fattore 1 non sono separabili. La nuova matrice del modello è:
I
1
+1 -1
+1 0
+1 +1
e le varianze delle stime sono: var(b0) = 0.333 2 , var(b1+b2) = 0.5 2. La matrice di dispersione è
diagonale.
Strategia C
La matrice degli esperimenti é
x1 x2
0
-1
0
0
0
+1
e la matrice del modello é
I
1
2
+1 0
-1
+1 0
0
+1 0
+1
Questa matrice, con due colonne costanti, non può essere invertita. Poiché x1 = 0 il suo effetto non
può essere valutato. Dalla [5.7) si ottiene il modello semplificato:
37
y = b0 + b2 x2
[5-10]
La nuova matrice del modello è:
I
+1
+1
+1
e le
2
-1
0
+1
varianze delle stime sono: var(b0) = 0.333 2 , var(b2) = 0.5 2. La matrice di dispersione è
diagonale.
Strategia D
La matrice degli esperimenti é
x1 x2
-1 -1
-1 0
0
0
e la matrice del modello é
I
1
2
+1 -1 -1
+1 -1 0
+1 0
0
La matrice di informazione può essere invertita, con la stima dei tre coefficienti della [5-7].
La matrice di dispersione non è diagonale:
1 1
0
1 2
-1
0 -1 2
Le varianze delle stime sono: var(b0) = 2 , var(b1) = 2 2, var(b2) = 2 2.
Strategia E
La matrice degli esperimenti é
x1 x2
-1 -1
-1 +1
+1 0
e la matrice del modello é
I
1
2
+1 -1 -1
+1 -1 +1
+1 +1 0
La matrice di informazione può essere invertita, con la stima dei tre coefficienti della [5-7].
La matrice di dispersione non è diagonale:
0.375 0.125 0
0.125 0.375 0
0
0
0.5
38
Le varianze delle stime sono: var(b0) = 0.375 2 , var(b1) = 0.375 2, var(b2) = 0.5 2. Si ricordi che
con quattro punti la varianza di tutti i coefficienti è 0.25.
Strategia F
La matrice degli esperimenti é
x1 x2
-1 -1
-1 +1
+1 0
e la matrice del modello é
I
1
2
+1 -1 -1
+1 -1 +1
+1 +1 +1
La matrice di informazione può essere invertita, con la stima dei tre coefficienti della [5-7].
La matrice di dispersione non è diagonale:
0.5
0.25
-0.25
0.25
0.5
-0.25
-0.25
-0.25
0.5
Le varianze delle stime sono: var(b0) = 0.5 2 , var(b1) = 0.5 2, var(b2) = 0.5 2. Si ricordi che con
quattro punti la varianza di tutti i coefficienti è 0.25.
La tabella seguente riassume le varianze dei coefficienti con le varie strategie. Lo sfondo azzurro
indica che i due effetti non sono separabili; lo sfondo giallo indica che il coefficiente non può
essere calcolato.
fattoriale completo 22
A
B
C
D
E
F
b0
0.25
0.333
0.333
0.333
1
0.375
0.5
b1
0.25
b2
0.25
0.5
0.5
2
0.375
0.5
0.5
2
0.5
0.5
XT X
Diagonale
Diagonale
Diagonale
Diagonale
Non diagonale
Non diagonale
Non diagonale
In conclusione con strategie differenti che usano lo stesso numero di esperimenti possiamo avere
varianze dei coefficienti molto differenti, e talora due coefficienti sono confuse o non possono
essere calcolati.
Anche se le varianze dei coefficienti possono essere utilizzate per valutare la qualità di una matrice
(p.e. F è nettamente migliore di D, con la stessa geometria dei punti, poiché il ridotto dominio
39
sperimentale di D ne penalizza le prestazioni), ci si chiede quali criteri possono essere utilizzati per
valutare la qualità di una matrice sperimentale.
5.2.4 – Criteri di valutazione della qualità
La valutazione della qualità di una matrice sperimentale é particolarmente importante quando
non esistono matrici sperimentali già costruite adatte all’obbiettivo e con caratteristiche note. In
questo caso necessario generare una serie di matrici sperimentali e valutarle.
5.2.4.1 – Generazione di matrici sperimentali
Si decide un possibile modello, che sarà caratterizzato da p coefficienti.
Vi sono M esperimenti possibili (esperimenti candidati).
Si decide il numero degli esperimenti, N ≥ p > M.
Vi sono
M!
(M N)! N!
matrici sperimentali possibili, combinazioni semplici di M elementi presi K alla volta (un
esperimento compare una sola volta tra gli N selezionati).
La generazione delle matrici sperimentali viene ripetuta per diversi valori di N, e le matrici
sperimentali vengono valutate con vari criteri.
I criteri di tipo I sono quelli che permettono di scegliere, fissato il valore di N, la matrice
sperimentale ottima.
I criteri di tipo II sono quelli che permettono di scegliere tra un insieme di matrici ottime secondo
un criterio di tipo I, con differenti valori di N, la matrice sperimentale di qualità accettabile.
5.2.4.2 – Criteri di tipo I
Criterio-D
Questo criterio é basato sul determinante D della matrice di informazione XTX. D é massimo per N
(numero degli esperimenti) costante per una matrice ortogonale. In questo caso la dispersione
degli effetti è minima e la matrice è ottima D.
Efficacia-D
É una misura della qualità relativa di due matrici:
Eff-D = 100 [det(XT1X1 / N1) / det(XT2X2 / N2)]1/p
40
Traccia
La traccia della matrice di dispersione (XTX )-1 é una misura media della varianza degli effetti. La
matrice con il valore minore (per N costante) della traccia è nota come ottima-A.
Autovalore
Una matrice (N costante) è ottima-E (da Eigenvalue) quando ha il valore minore del primo
autovalore della matrice di dispersione (XTX )-1 . Una matrice di dispersione ideale è diagonale con
elementi piccoli ed eguali e pertanto tutti gli auto valori sono piccoli ed eguali.
Criterio di Turing
Tu = [tr (XTX) tr (XTX)-1]1/2 /p
misura quanto mal condizionata è una matrice. Un criterio alternativo è dato dal rapporto tra il
massimo autovalore ed il minimo autovalore della matrice di informazione.
Sotto sono riportati i valori corrispondenti ai vari criteri per le matrici esaminate. Evidentemente la
matrice E è tra le matrici a tre esperimenti la migliore.
fattoriale completo
A
B
C
D
E
F
22
D
256
0
0
0
1
16
16
M
64/64
0
0
0
1/27
16/27
16/27
Eff D%
100
0
0
0
33
84
84
Traccia
0.75
Autovalore Tu
0.03125
1
5
1.25
1.5
5.271
0.125
0.5
1.825
1.054
1.225
5.2.4.3– Criteri di tipo II
Criterio-M o Efficacia M
Questo criterio considera il determinante M della matrice dei momenti XTX / N, la matrice dei
momenti del secondo ordine rispetto all’origine. Questo criterio é usato per confrontare matrici
con differente numero di esperimenti. Sia p il numero degli effetti (media, effetti, interazioni).
M = det(XTX / N) = det(XTX)/Np
Criteri basati sulla qualità dell’informazione desiderata
- varianza, funzione di informazione
- fattori di inflazione
41
- varianza massima in tutto il dominio di interesse
I fattori di inflazione (vedi 4.8.6.2) sono definiti come (dm è un elemento della matrice di
dispersione):
f v dm vv
I
(x iv x v ) 2
i 1
Gli Inflation Factors sono una misura globale della correlazione tra le variabili. Quando un
predittore ha fattore d’inflazione maggiore di 4-7 (opinioni discordanti) il predittore é troppo
correlato con gli altri, il determinante D è troppo piccolo, e la matrice sperimentale è di bassa
qualità.
La varianza della stima della risposta si ottiene dalla s 2yˆ s 2 h (vedi 4.8.6.6), e h è il leverage che si
può calcolare in ogni punto del domino sperimentale mediante la x (XTX) xT.
La funzione di informazione è semplicemente l’inverso della varianza.
Il leverage in ED è detto funzione di varianza. Il suo valore massimo nel dominio sperimentale è
una misura della varianza massima della risposta.
Efficacia G
Una matrice è ottima G tra una serie di matrici con lo stesso numero di esperimenti quando ha il
minimo valore del leverage massimo.
5.2.4.4– Altri criteri
Criteri economici:
- numero di esperimenti
- numero di livelli per ogni fattore
- costo di ogni esperimento
Criteri statistici:
- Analisi dei residui
- R2, Q2
42
5.2.4.5– Un esempio
Nello studio teorico degli effetti dei solventi si utilizza il modello di Koppel-Palm:
A = A0 + a1 Y + a2 P + a3 B + a4 E
dove A é il valore della proprietà (risposta) che dipende dal solvente (p.e., indice di rifrazione), A0 è
il valore della proprietà per un solvente di riferimento, Y è un effetto di polarizzazione connesso
con la costante dielettrica, P è una misura di polarizzabilità, B misura la nucleofilia, E la elettrofilia.
Lo studio riguarda 66 solventi:
N°
Solvente
B
E
Y
P
1
benzene
52
2.10
0.231
0.228
2
toluene
54
1.30
0.239
0.226
3
o-xylene
59
1.30
0.255
0.229
4
m-xylene
59
0.70
0.239
0.226
5
p-xylene
58
1.20
0.229
0.226
...
......
63 fenil-3 propanolo
117
8.90
0.437
0.235
64 metossi-2 etanolo
119
12.50
0.457
0.196
65 nitrometano
58
5.15
0.481
0.189
66 nitroetano
60
2.85
0.474
0.192
In questo caso (come in molti altri casi di problemi chimici) i fattori non possono essere variati
liberamente, in quanto legati ai solventi, che sono i soli esperimenti possibili. Pertanto non ci sono
matrici sperimentali già costruite adatte all’obbiettivo, che è quello di valutare in qualunque punto
del dominio sperimentale, delimitato dai valori minimo e massimo dei quattro fattori, le risposte
possibili.
Utilizzando tutti i solventi per costruire il modello si hanno i seguenti valori per alcuni dei criteri:
Determinante D
1790918
Determinante D1/ p
17.808
Determinante M
0.001423
Determinante M1/ p
0.26981
hmax
0.70
Traccia di (XTX )-1
0.4043
Efficacia G (%)
44.61
43
Sono state individuate 36 matrici ottime (con N tra 5 e 40)
N
Log D M1/ p
Nel dominio Nei punti sperimentali Traccia
hmax
Eff. G
hmax
5
2.06
0.412
5.57
1.58
3.388
63
6
2.52
0.418
6.35
1.31
2.914
63
7
3.07
0.439
3.58
0.86
2.103
83
…
…
…
Figura 5-25 – Determinante M in funzione del numero di esperimenti
Sulla base del determinante M si individua come miglior matrice sperimentale quella con sette
esperimenti, e si verifica (Criteri del tipo II) che il leverage per i 66 solventi è accettabile (<1). Per
avere un leverage accettabile in tutto il dominio sperimentale occorrerebbero ben 36 esperimenti.
Con i sette esperimenti (solventi) scelti si procede alle determinazioni sperimentali delle risposte.
44
5.3 – SCREENING
Lo screening viene condotto con numerose strategie, in funzione del numero dei fattori
possibilmente influenti. Quando questo numero è molto grande si ricorre a metodi quali le matrici
supersature, la biforcazione sequenziale,…
5.3.1 – Matrici di Plackett Burman
Quando il numero dei fattori non è elevatissimo, una delle strategie più diffuse utilizza le matrici di
Plackett Burman, matrici di Hadamard, per le quali è
HT H = N I
Con queste matrici si studiano N-1 fattori con N esperimenti.
Nel disegno fattoriale completo con tre fattori 23 sono necessari 8 esperimenti; la strategia di
screening con matrici Plackett-Burman richiede solamente 4 esperimenti. La matrice del modello
è:
+1
+1
+1
-1
+1
-1
+1
+1
+1
+1
-1
+1
+1
-1
-1
-1
Facilmente si verifica che si tratta di una matrice di Hadamard:
1
1
T
H H
1
1
1 1 1 1
1 1 1 1
1 1 1 1
1 1 1 1
1 1 1
4
0
1 1 1
0
1 1 1
1 1 1
0
0 0 0
4 0 0
4I 4
0 4 0
0 0 4
Le matrici di Plackett-Burman studiano solamente la media e gli effetti lineari dei fattori. Nel caso
di 3 fattori il disegno fattoriale completo permette di stimare anche le tre interazioni del secondo
ordine e quella del terzo ordine, che con il disegno di Plackett-Burman vengono sacrificate alla
economia.
Le matrici di Plackett-Burman possono essere scritte solo per multipli di 4, N= 4 k (k intero), cioé
per N=4, 8, 12, 16,....
La “regola magica” che permette di scrivere facilmente una matrice di Plackett-Burman è:
N
4
+
+
-
8
+
+
+
-
+
-
-
12
+
+
-
+
+
+
-
-
-
+
-
45
16
+
+
+
+
-
+
-
+
+
-
-
+
-
-
-
20
+
+
-
-
+
+
+
+
-
+
-
+
-
-
-
-
+
+
-
24
+
+
+
+
+
-
+
-
+
+
-
-
+
+
-
-
+
-
+
-
Con riferimento a N=4, la matrice di Plackett-Burman si ottiene dalla regola magica
-
-
-
+ + - che
fornisce il livello dei fattori nel primo esperimento:
Una colonna di +1 per la media
+1
+1
+1
-1
+1
-1
+1
+1
+1
+1
-1
+1
+1
-1
-1
-1
dalla regola magica
una ultima riga di -1
La costruzione delle righe da N=2 a N-1 avviene per rotazione
Prima riga
+1
+1
-1
L’ultimo elemento diventa il primo della riga successiva
Seconda riga
-1
+1
+1
Spostando a destra i primi elementi
Seconda riga
-1
+1
+1
Terza riga
+1
-1
+1
che può avvenire anche nell’altra direzione:
Prima riga
+1
+1
-1
Il primo elemento diventa l’ultimo della riga successiva
Seconda riga
+1
-1
+1
Spostando a sinistra i primi elementi
Seconda riga
+1
-1
+1
Terza riga
-1
+1
+1
con
Una colonna di +1 per la media
+1
+1
+1
-1
+1
+1
-1
+1
+1
-1
+1
+1
+1
-1
-1
-1
dalla regola magica
una ultima riga di -1
equivalente, a parte l’ordine degli esperimenti.
Altrettanto magica è la regola che inverte il segno della regola vista sopra e che ha come ultima
riga una colonna di +1. Il risultato è:
46
Una colonna di +1 per la media
+1
-1
-1
+1
+1
+1
-1
-1
+1
-1
+1
-1
+1
+1
+1
+1
dalla regola magica
una ultima riga di +1
Il procedimento in cui Il primo elemento diventa l’ultimo della riga successiva è stato utilizzato
nell’esempio seguente, in cui devono essere studiati 10 fattori. La matrice di Plackett-Burman che
si può utilizzare è quella con N = 12 per 11 fattori. Nell’esempio il fattore numero 11 è un fattore
fittizio.
La matrice è quella in Figura 5-26.
Figura 5-26 – Matrice di Plackett-Burman con dodici esperimenti
I valori sperimentali della variabile risposta per i dodici esperimenti:
47.8
80.6
118.4
14.6
80.6
103.4
72.6
103.4
141.4
161.4
6.4
29.4
permettono di ricavare i coefficienti (Figura 5-27):
47
Media
80.
1
1.4
2
-11.8
3
0.8
4
23.7
5
0.5
6
-1.3
7
3.3
8
38.1
9
2.2
10
-3.3
11
-3.0
Il coefficiente -3.0 del fattore fittizio (freccia verde nella Figura 5-27) indica come un coefficiente di
valore assoluto più o meno uguale non è significativo. Ripetendo il calcolo con valori casuali della
risposta (con un intervallo tra circa 0 e 120, come per la risposta vera) si ottengono i coefficienti in
Figura 5-28, il cui valore massimo è 5.5. Con più ripetizioni con risposta casuali, si deduce che
coefficienti con valore assoluto minore di 8 sono non significativi o poco significativi. Pertanto
degli otto fattori solo i fattori 2, 4 e 8 sono da considerare fattori influenti.
Figura 5-27 – Coefficienti (effetti) del modello con valori della risposta generati casualmente
48
Figura 5-28– Coefficienti (effetti) del modello
49
5.3.2– Disegni fattoriali frazionati
Il Full Factorial Design ha due inconvenienti:
1) aumentando il numero dei fattori, il numero degli esperimenti richiesti diventa elevati (p.e., 64
esperimenti con 6 fattori);
2) si possono stimare solo effetti lineari dei fattori e le interazioni (non lineari).
I disegni fattoriali frazionati su due livelli, Two-levels Fractional Factorial Design FFD, 2k-p, si
applicano quando il numero degli esperimenti richiesti dal disegno fattoriale completo è troppo
elevato, e con i disegni 2k-p (2 livelli, k fattori, p fattore di frazionamento) il numero degli
esperimenti viene dimezzato (p = 1) o ridotto ad ¼ (p = 2).
Gli FFD possono essere considerati parte della analisi di screening o di esplorazione. Il numero
degli esperimenti viene ridotto, ma si perdono le interazioni e non si considerano altri effetti non
lineari. Essi sono peraltro utensili estremamente potenti e utili, ma si richiede molta cura nella
scelta degli esperimenti e nella interpretazione dei risultati.
Essi verranno illustrate con un esempio numerico di Jacques Goupy, in cui la stabilità di una
emulsione (Y) viene studiata in funzione di tre fattori: SURF (concentrazione di un tensioattivo),
HCl (concentrazione di acido cloridrico), BIT (concentrazione di bitume)
La matrice del modello con il disegno fattoriale completo è:
Esp.
1
2
3
4
5
6
7
8
Media SURF
I
1
+1
-1
+1
+1
+1
-1
+1
+1
+1
-1
+1
+1
+1
-1
+1
+1
HCl
2
-1
-1
+1
+1
-1
-1
+1
+1
BIT
3
-1
-1
-1
-1
+1
+1
+1
+1
12
+1
-1
-1
+1
+1
-1
-1
+1
13
+1
-1
+1
-1
-1
+1
-1
+1
23
+1
+1
-1
-1
-1
-1
+1
+1
123
-1
+1
+1
-1
+1
-1
-1
+1
Y
Y
38
37
26
24
30
28
19
16
La incertezza sulla misura dei coefficienti, nota da esperienza precedenti ed espressa come
intervallo di fiducia, è ± 0.7. Corrisponde ad una deviazione standard 0.35, ad una varianza sulla
misura della Y di 1.
50
Gli effetti calcolati sono raccolti nella tabella seguente:
I
27.25
1
-1
2
-6
3
-4
12
-0.25
13
-0.25
23
0.25
123
0.00
Supponiamo ora di non poter effettuare otto esperimenti, ma solo la metà, gli esperimenti
indicate in Figura 5-29 a sinistra. Naturalmente utilizzeremo una matrice del modello con
solamente la media e tre fattori, senza interazioni.
Figura 5-29– Disegni frazionati 23-1
Esp.
I
1
2
3
Y
2
+1
+1
-1
-1
37
3
+1
-1
+1
-1
26
5
+1
-1
-1
+1
30
8
+1
+1
+1
+1
16
Riordiniamo gli esperimenti in modo che le colonne 1 e 2 assumano la successione della notazione
di Box, il fattore J (1 o 2) è un vettore con 2j-1 esperimenti a livello -1, seguiti da 2j-1 esperimenti a
livello +1.
Esp.
I
1
2
3
Y
5
+1
-1
-1
+1
30
2
+1
+1
-1
-1
37
3
+1
-1
+1
-1
26
8
+1
+1
+1
+1
16
51
Si nota immediatamente che i segni del fattore 3 sono eguali a quelli che sarebbero i segni della
interazione 12 in un disegno fattoriale completo 22. Si nota anche che questa matrice coincide con
quella di Plackett-Burman ottenuta dalla seconda regola magica, quella con i segni invertiti.
Confrontiamo gli effetti calcolati con il disegno fattoriale completo con quelli calcolati con questo
disegno ridotto, il disegno frazionato. La incertezza sui coefficienti è ora ±1, in quanto ogni
coefficiente viene calcolato da quattro termini.
Effetto
DISEGNO COMPLETO
DISEGNO FRAZIONATO
I
27.25
27.25
1
-1
-0.75
2
-6
-6.25
3
-4
-4.25
Tutti gli effetti coincidono entro la incertezza.
Si considerino ora per il disegno fattoriale complete l’effetto 3 e l’interazione 12.
Exp.
I
1
2
3
12
13
23
123
Y
1
+1
-1
-1
-1
+1
+1
+1
-1
38
2
+1
+1
-1
-1
-1
-1
+1
+1
37
3
+1
-1
+1
-1
-1
+1
-1
+1
26
4
+1
+1
+1
-1
+1
-1
-1
-1
24
5
+1
-1
-1
+1
+1
-1
-1
+1
30
6
+1
+1
-1
+1
-1
+1
-1
-1
28
7
+1
-1
+1
+1
-1
-1
+1
-1
19
8
+1
+1
+1
+1
+1
+1
+1
+1
16
E3 =(- y1- y2 - y3 - y4+ y5+ y6 + y7 + y8) / 8
E12 =(+ y1- y2 - y3 + y4+ y5- y6 - y7 + y8) / 8
La somma dell’effetto del fattore 3 e della interazione 12 é:
E3 + E12 =(- y2 - y3 + y5 + y8) / 4 = (-37-26+30+16)/4 = -4.25
ed é esattamente eguale all’effetto del fattore 3 calcolato con il disegno frazionato.
Si paga un prezzo per il numero ridotto degli esperimenti: gli effetti calcolati con il disegno
frazionato sono misti, confusi, “aliased”.
Tuttavia, quando le interazioni collegate ad un effetto sono trascurabili, il risultato è
soddisfacente.
52
Vediamo sotto la tavola completa della confusione, degli “alias” o dei “contrast”, effetto
combinato che viene indicato con la lettera λ per distinguerlo dagli effetti puri, indicati con E.
E
COMPLETO
Contrast
FRAZIONATO
ALIASED
(Alias, Effect)
EI
27.25
I
27.25
EI E123
E1
-1
1
-0.75
E1 E23
E2
-6
2
-6.25
E2 E13
E3
-4
3
-4.25
E3 E12
E12
-0.25
E13
-0.25
E23
0.25
E123
0
Generalmente si usa il disegno frazionato quando il numero dei fattori elevato, e le ipotesi sono le
seguenti:
A) Gli effetti del quarto ordine o di ordine maggiore sono trascurabili (interazioni di tre o più
fattori);
B) Un contrasto zero indica che tutti gli effetti aliased sono zero; meno probabilmente sono grandi
ma si compensano;
C) La interazione di due effetti piccolo é piccola;
D) La interazione di un effetto grande e di uno piccolo é generalmente piccola;
E) La interazione di due effetti grandi é probabilmente grande..
53
5.3.2.1 – Calcolo degli Alias
Il disegno fattoriale completo:
Esp.
I
1
2
3
12
13
23
123
Y
1
+1
-1
-1
-1
+1
+1
+1
-1
38
2
+1
+1
-1
-1
-1
-1
+1
+1
37
3
+1
-1
+1
-1
-1
+1
-1
+1
26
4
+1
+1
+1
-1
+1
-1
-1
-1
24
5
+1
-1
-1
+1
+1
-1
-1
+1
30
6
+1
+1
-1
+1
-1
+1
-1
-1
28
7
+1
-1
+1
+1
-1
-1
+1
-1
19
8
+1
+1
+1
+1
+1
+1
+1
+1
16
può essere diviso in due semidisegni:
Esp.
I
1
2
3
12
13
23
123
Y
5
+1
-1
-1
+1
+1
-1
-1
+1
30
2
+1
+1
-1
-1
-1
-1
+1
+1
37
3
+1
-1
+1
-1
-1
+1
-1
+1
26
8
+1
+1
+1
+1
+1
+1
+1
+1
16
1
+1
-1
-1
-1
+1
+1
+1
-1
38
6
+1
+1
-1
+1
-1
+1
-1
-1
28
7
+1
-1
+1
+1
-1
-1
+1
-1
19
4
+1
+1
+1
-1
+1
-1
-1
-1
24
nei quali sono riconoscibili due disegni 22. Sonoi due disegni di Figura 5-29.
Nei due disegni sono chiaramente riconoscibili gli alias, dello stesso segno nel primo disegno, di
segno opposto nel secondo disegno. Per il primo sarà, per esempio, 3 = E3 + E12 , per il secondo
sarà 3 = E3 - E12
Si ricordino gli alias per il primo disegno:
I = EI + E123
1 = E1 + E23
54
2 = E2 + E13
3 = E3 + E12
nella notazione di Box:
I = 123
1 = 23
2 = 13
3 = 12
Per l’altra matrice, il “Lower half-design”:
I = -123
1 = -23
2 = -13
3 = -12
5.3.2.2 – Notazione di Box e generazione degli Alias
Si ricordino le semplici regole base dell’algebra di colonna di Box:
Regola 1
Una colonna di segni moltiplicata per una colonna di +1 (I) non cambia:
1.I = 1
I.I = I
123.I = 123
Regola 2
Una colonna moltipicata per se stessa dà una colonna di +1:
1.1 = I
123.123 = I
Si rammenti anche che 123 indica un triplice prodotto. La scrittura 1.123 equivale a 1.1.2.3 e
pertanto a 23 in quanto per la regola 2 il prodotto 1 1 è la colonna I.
La generazione degli alias parte dall’obbiettivo
upper-half design
I = 123
lower half-design
Obbiettivo
I= -123
(Defining relation)
1.I = 1.123
Moltiplicazione
1.I = -1.123
1.I = 1
Regola 1
1.I = 1
1.I = 1.123
Regola 2
1.I= -1.123
55
1.1 = I
-1.1 = -I
1.123 = I.23
-1.123= -I.23
1 = I.23
1= -I.23
1 = 23
Alias
1= -23
2.I = 2.123
2.I = -2.123
2.123 =I.13
-2.123 =-I.13
2 =13
2 =-13
3.I = 3.123
3.I = 3.123
3.123 =I.12
3.123 =I.12
3 =12
3 =12
5.3.2.3 – Preparazione di un disegno frazionato
Per preparare un disegno frazionato per N fattori partiamo da un disegno complete per N-1
fattori. Nell’esempio si prapara un disegno frazionato per 5 fattori.
Consideriamo la interazione di ordine Massimo, in questo caso 1234, interazione che è
probabilmente molto piccola, trascurabile. I segni di questa interazione vengono utilizzati per
preparare il disegno frazionato con il nuovo fattore.
5 = 1234
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
I
1
2
3
4
12
13
14
23
24
34
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
123 124 134 234
+
+
+
+
+
+
+
+
Moltiplichiamo per 5 (il nuovo fattore) per ottenere il Generatore di Alias.
56
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
5=
1234
+
+
+
+
+
+
+
+
Generatore:
5.5=I=12345
Moltiplicando il generatore per 1 (poi per 2,3,4,5) si ottengono gli altri alias.Il primo, quello della
media, è dato dal generatore:
1.I = 1 = 1.12345 = I.2345 = 2345
I = EI + E12345
1 = E1 + E2345
2 = E2 + E1345
3 = E3 + E1245
4 = E4 + E1235
5 = E5 + E1234
Quindi si ottengono gli altri alias::
15 = 11234 = 234
25 = 21234 = 134
35 = 31234 = 124
45 = 41234 = 123
12 = 11345 = 345
13 = 11245 = 245
14 = 11235 = 235
23 = 21245 = 145
24 = 21235 = 135
34 = 31235 = 125
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
I=
12345
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
1=
2345
+
+
+
+
+
+
+
+
2
3=
=1345 1245
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
+
4=
1234
+
+
+
+
+
+
+
+
5=
1234
+
+
+
+
+
+
+
+
12=
345
+
+
+
+
+
+
+
+
13=
245
+
+
+
+
+
+
+
+
14=
235
+
+
+
+
+
+
+
+
15 =
234
+
+
+
+
+
+
+
+
23=
145
+
+
+
+
+
+
+
+
24=
135
+
+
+
+
+
+
+
+
25=
134
+
+
+
+
+
+
+
+
34=
125
+
+
+
+
+
+
+
+
35=
124
+
+
+
+
+
+
+
+
Nell’esempio seguente (preparazione di microsfere per estrusione-sferonizzazione) si devono
studiare 4 fattori. Un disegno fattoriale completo 2 4richiede 16 esperimenti. Operando con un
disegno frazionato ne bastano 24-1,8.
Solo il disegno completo può stimare tutti gli effetti della media, del primo ordine, del secondo
ordine (6), del terzo (3) e del quarto ordine (1):
57
45=
123
+
+
+
+
+
+
+
+
Y = b0 + b1 + b2 + b3 + b4 + b12 + b13 + b14 + b23 + b24 + b34 + b123 + b124 + b134 + b234 + b1234
FATTORI:
X1 tempo di sferonizzazione (min)
X2 velocità di sferonizzazione (rpm)
X3 carico di sferonizzazione (min)
X4 diametro di estrusione (mm)
RISPOSTA:
resa % (produzione di sfere)
La matrice sperimentale si ottiene dal disegno completo per tre fattori e con 4 = 123
Esp.
1
2
3
4
5
6
7
8
X1
+
+
+
+
X2
+
+
+
+
X3
+
+
+
+
X4
+
+
+
+
Matrice del modello
N.
1
2
3
4
5
6
7
8
X0
+
+
+
+
+
+
+
+
X1
+
+
+
+
X2
+
+
+
+
X3
+
+
+
+
X4
+
+
+
+
X12
+
+
+
+
X13
+
+
+
+
X14
+
+
+
+
X23
+
+
+
+
X24
+
+
+
+
X34
+
+
+
+
X123
+
+
+
+
X124
+
+
+
+
X134
+
+
+
+
X234
+
+
+
+
X1234
+
+
+
+
+
+
+
+
Il procedimento che scrive la matrice del modello considerando il modello completo è alternativo
a quello basato sul generatore di alias.
Poiché nello sviluppo della matrice frazionata é 4=123 nella matrice del modello alcune colonne
sono eguali: non possiamo stimare tutti i coefficienti e si ha confusione. Analizzando le colonne si
ha:
b0 confuso con b1234
b1 confuso con b234
b2 confuso con b134
b3 confuso con b124
58
b4 confuso con b123
b12 confuso con b34
b13 confuso con b24
b14 confuso con b23
Effettuiamo gli 8 esperimenti:
N.
1
2
3
4
5
6
7
8
ottenendo
X0
X1234
+
+
+
+
+
+
+
+
X1
X234
+
+
+
+
X2
X134
+
+
+
+
X3
X124
+
+
+
+
b0 + b1234
b1 + b234
b2 + b134
b3 + b124
b4 + b123
b12 + b34
b13 + b24
b14 + b23
X4
X123
+
+
+
+
X12
X34
+
+
+
+
=
=
=
=
=
=
=
=
+50.19
+11.99
- 6.01
+ 1.16
-17.39
- 0.91
+10.56
+ 5.41
X13
X24
+
+
+
+
X14
X23
+
+
+
+
Y
75.5
45.4
19.7
55.5
11.1
92.8
46.5
55.0
Conclusioni preliminari
Fattore X1: ha un forte effetto positive
Factor X2: ha un effetto negativo
Factor X4: ha un forte effetto negativo.
Vi é una forte interazione positive tra X1 e X3, non separabile dalla interazione tra X2 e X4.
Vi é anche una significativa interazione tra X2 e X3, non separabile da quella tra X1 e X4.
Per separare le interazioni sono stati effettuati gli altri otto esperimenti.
Esp.
9
10
11
12
13
14
15
16
X1
+
+
+
+
X2
+
+
+
+
X3
+
+
+
+
59
X4
+
+
+
+
-
Y
78.7
21.2
29.0
56.9
34.9
46.7
67.0
1.2
La matrice del per il semidisegno complementare è:
N.
X0
X1
X2
X3
X4
-X1234
-X234
-X134
-X124
-X123
1
+
+
2
+
+
3
+
+
4
+
+
+
+
5
+
+
6
+
+
+
+
7
+
+
+
+
8
+
+
+
+
e risulta:
b0 - b1234
=
+41.95
b1 - b234
=
-10.45
b2 - b134
=
- 3.43
b3 - b124
=
- 4.5
b4 - b123
=
-20.38
b12 - b34
=
+ 0.98
b13 - b24
=
- 3.05
b23 - b14
=
+ 0.08
Quindi:
b0 + b1234 + b0 - b1234 = 2b0 = 50.19 + 41.95 = 92.14
b0 = 92.14/2 = 46.07
b0 + b1234 - b0 + b1234 = 2b1234 = 50.19 - 41.95 = 8.24
b1234 = 8.24/2 = 4.12
X12
-X34
+
+
+
+
X13
-X24
+
+
+
+
X23
-X14
+
+
+
+
Y
78.7
21.2
29.0
56.9
34.9
46.7
67.0
1.2
Analogamente si ricavano gli altri coefficienti. Alternativamente con i sedici esperimenti si
ottengono direttamente tutti i coefficienti.
5.3.3 – Piani simplex e di Mozzo
Un simplesso (“Simplex”) è la figura geometrica più semplice in uno spazio k-dimensionale. In due
dimensioni il simplex è un triangolo (generalmente equilatero). Il disegno sperimentale simplex è
estremamente economico e può essere utilizzato solo con un modello che non prevede
interazioni:
y = b0 + b1 x1 + b2 x2
[5-7].
Il disegno é illustrato in Figura 5-30.
60
Figura 5-30–Simplex bidimensionale
Nel caso sia a = 1, b = 2, la matrice del modello è:
1
-1
-2
1.
1
-2
1
0
4
e la matrice di informazione risulta diagonale:
3 0 0
0 2 0
0 0 24
Il simplex tridimensionale (Figura 5-31) ha come matrice del modello:
1
-0.5
-0.5/30.5 -0.5/60.5
1
+0.5
-0.5/30.5 -0.5/60.5
1
0
1/30.5
-0.5/60.5
1
0
0
1.5/60.5
e la matrice di informazione, diagonale, è:
4.
0
0
0
0
0.5
0
0
0
0
0.5
0
0
0
0
0.
61
Figura 5-31–Simplex tridimensionale
Anche il disegno di Mozzo per due fattori (Figura 5-32) si utilizza con il modello senza interazioni
[5-7].
La matrice del modello è:
1
0.268
1
1
0.732
-0.732
1
-1
-0.268
e la matrice di informazione è diagonale:
3 0
0.
0 1.608 0
0 0
1.608
Figura 5-32 – Disegno di Mozzo per due fattori
62
Il disegno di Mozzo per tre fattori (Figura 5-33) utilizza il modello con una unica interazione [5-11].
y = b0 + b1 x1 + b2 x2 + b3 x3 + b12 x1 x2
[5-11]
La matrice del modello é:
1
0.268
1
-1.
0.268
1
0.732
-0.732
-1.
-0.536
1
-1
-0.268
-1.
0.268
1
-0.268
-1
1.
0.268
1
-0.732
0.732
1.
-0.536
1
1
0.268
1.
0.268
e la matrice di informazione è diagonale:
6
0
0.
0
0
0
3.22
0
0
0
0
0
3.22
0
0
0
0
0
6
0
0
0
0
0
0.86
Figura 5-33 – Disegno di Mozzo per tre fattori
63
5.4 – DISEGNI A QUADRATO LATINO
Questi disegni sono il primo esempio di disegni in cui i fattori hanno più di due livelli. Questi
disegni non vengono inclusi tra quelli delle superfici di risposta in quanto i problemi ai quali si
prestano non le richiedono.
Sono un esempio di disegni a blocchi randomizzati e il loro nome è dovuto al fatto che il grande
matematico Eulero da Basilea li utilizzò con una simbologia costituita da lettere latine.
Questi disegno vengono applicati quando lo sperimentatore ha interesse all’effetto di un solo
fattore, ma sa che vi sono numerosi fattori secondari che introducono errori. Questi fattori
dovrebbero essere noti e controllati, ma non sempre ciò è possibile.
Nei disegni a quadrato latino, quelli a quadrato greco-latini e qualle a quadrato iper-greco-latino, il
fattore di interesse è detto fattore di trattamento. Il quadrato latino prevede due fattori
secondari, quello greco-latino ne prevede tre, quello iper-greco-latino ne prevede quattro.
I fattori di disturbo sono utilizzati come variabili di blocco. Nei quadrati latini i fattori secondari
sono divisi in una griglia che ha la proprietà che ogni riga e ogni colonna riceve ciascun
trattamento esattamente una volta.
I vantaggi dei quadrati latini (con tre, quattro,… livelli dei fattori)
sono che il numero di
esperimenti è relativamente piccolo e che possono studiare più fattori secondari, di disturbo.
Gli svantaggi sono dovuti al fatto che il numero dei livelli dei fattori secondari deve essere eguale a
quello dei livelli del fattore di trattamento, e che il modello assume che non vi siano interazioni tra
i fattori, sia di trattamento che di disturbo.
Il numero di esperimenti nel caso di un disegno latino a tre livelli é nove, indicati
convenzionalmente con la matrice di lettere latine:
A
B
C
C
A
B
B
C
A
Le lettere latine indicano il livello del fattore di trattamento. La tabella seguente riporta i livelli
corrispondenti:
X1
Fattore che blocca la riga
3-Livelli
X2
Fattore che blocca la
64
X3
Fattore di
1
1
1
2
2
2
3
3
3
colonna
1
2
3
1
2
3
1
2
3
trattamento
1
2
3
3
1
2
2
3
1
Pertanto:
X1=1
X2=1
X3 =1
X1=1
X2=2
X3=2
X1=1
X2=3
X3=3
X1 =2
X2=1
X3=3
X1 =2
X2=2
X3=1
X1 =2
X2=3
X3=2
X1 =3
X2=1
X3=2
X1 =3
X2=2
X3=3
X1 =3
X2=3
X3=1
Il modello é:
Yijk = m + Ri + Cj + Tk +e
Yijk é un esperimento con X1 = i, X2 = j, X3 = k
X1 e X2 sono i fattori secondari, X3 il fattore di trattamento.
m è la media
Ri é l’effetto del blocco i, media di tutte le risposte per le quali X1 = i
Cj é l’effetto del blocco j, media di tutte le risposte per le quali X2 = j
Tk é l’effetto del trattamento, media di tutte le risposte per le quali X3 = k
L’esempio seguente riguarda il rendimento di una reazione chimica. Il fattore di trattamento è un
catalizzatore. I fattori secondari sono il modello di reattore e la temperatura. gni fattore ha tre
livelli: tre catalizzatori, tre reattori e tre temperature (vicine in quanto la reazione deve essere
condotta tra i 20 e i 30°C).
Si ottiene:
RISULTATI Xrc
65
73.9592 92.7331 84.8446
83.3342 72.7633 94.6948
93.3692 82.1565 74.1448
m, Media
83.5555
EFFETTI
0.2901
0.0419
-0.0013 -1.0045
-0.3320 Fattore X1 blocca la riga
1.0059
Fattore X2 blocca la colonna
-9.9331 10.0435 -0.1104 Fattore di trattamento
m + Ri + Cj + Tk
73.9113 92.8846 84.7411
83.4857 72.6598 94.6468
93.2657 82.1085 74.2963
ERRORE
0.0480
-0.1515 0.1035
-0.1515 0.1035
0.0480
0.1035
-0.1515
0.0480
Risultati – media
-9.5963 9.1776
1.2891
-0.2213 -10.7922 11.1393
9.8137
-1.3990
-9.4108
La matrice dei risultati, al netto della media, può essere vista come la somma di quattro
componenti, l’effetto dei fattori e l’errore:
66
I dati nella terza matrice rappresentano l’informazione richiesta, le differenze tra i tre catalizzatori.
I dati nella quarta matrice rappresentano l’errore. Il significato del risultato sperimentale (gli
effetti del trattamento) dipendono dalla relazione tra effetto del trattamento ed errore.
Sotto l’ipotesi nulla il catalizzatore non ha effetto, le varianze per il trattamento e per l’errore
possono essere considerate come stime indipendenti della stessa varianza.
La varianza del trattamento è data dalla somma dei quadrati divisa per il numero dei dati
indipendenti che in questo caso é 2 (la somma degli effetti è 0): Si costruisce la tabella ANOVA:
Sorgente di variazione
D.o.f.
Somma dei quadrati Varianza
F
Significato %
Righe (R)
r-1
0.5885
0.2943
5.45
15.5
Colonne (C)
r-1
6.0626
3.0313
56.13
1.76
Trattamento (Tr)
r-1
598.652
299.326 11086
0.01
Errore (E)
(r-1)(r-2)
0.1079
Media (m)
1
Totale(Tot)
r2
0.054
F2,2 (95%) critico è 19. Evidentemente il trattamento (catalizzatore ha un effetto significativo.
Anche significativo è l’effetto di X2, mentre X1 non ha effetto significativo.
Rammentando che i livelli del trattamento sono:
67
X3 =1
X3=2
X3=3
X3=3
X3=1
X3=2
X3=2
X3=3
X3=1
è evidente che l’effetto massimo è quello del catalizzatore 2 e quello minimo del catalizzatore 1.
68
5.5 - SUPERFICI DI RISPOSTA
Si tratta dei disegni che utilizzano modelli matematici di secondo grado. La denominazione
comune di metodi delle superfici di risposta è dovuta al fatto che il loro studio è generalmente
accompagnato dai grafici delle superfici di risposta o delle curve di isorisposta. Ovviamente si
possono tracciare le superfici di risposta anche per modelli lineari, con lo scopo principale di
evidenziare l’effetto non lineare delle interazioni.
Le superfici di risposta sono estremamente utili nel caso di effetti non lineari non solo per
individuare l’ottimo, Massimo o minimo della risposta, ma anche per avere uno studio completo
della risposta nel dominio sperimentale.
Nel caso di effetti non lineari è necessario un modello quadratico, una serie di Taylor che
approssima la risposta non lineare:
y b 0 b1 x1 b 2 x 2 b11 x12 b 22 x 22 b12 x1 x 2
[5-12]
5.5.1 . Disegni 3k
I disegni fattoriali completi a tre livelli sono relativamente poco usati, in quanto il numero degli
esperimenti cresce molto con il numero dei fattori, 9 esperimenti con due fattori, 27 con 3, 81 con
4 fattori. Si preferiscono disegni più economici.
Pertanto accenneremo solo ad alcune caratteristiche del disegno fattoriale completo a tre livelli e
due fattori, 32.
La matrice del modello [5-12] è:
m
1
1
1
1
1
1
1
1
1
x1
-1
0
1
-1
0
1
-1
0
1
x2
-1
-1
-1
0
0
0
1
1
1
x12
1
0
1
1
0
1
1
0
1
x22
1
1
1
0
0
0
1
1
1
La matrice di dispersione:
0.556
0.
0.
-0.333
0.
0.167
0.
0.
0.
0.
0.167
0.
-0.333
0.
0.
0.5
-0.333
0.
0.
0.
0.
0.
0.
0.
69
x1 x2
1
0
-1
0
0
0
-1
0
1
-0.333 0.
0.
0.
0.
0.
non è diagonale.
0.
0.
0.5
0.
0.
0.25
La matrice Hat
0.806
0.222
-0.028
0.222
-0.111
-0.111
-0.028
-0.111
0.139
0.222
0.556
0.222
-0.111
0.222
-0.111
-0.111
0.222
-0.111
-0.028
0.222
0.806
-0.111
-0.111
0.222
0.139
-0.111
-0.028
0.222
-0.111
-0.111
0.556
0.222
0.222
0.222
-0.111
-0.111
-0.111
0.222
-0.111
0.222
0.556
0.222
-0.111
0.222
-0.111
-0.111
-0.111
0.222
0.222
0.222
0.556
-0.111
-0.111
0.222
-0.028
-0.111
0.139
0.222
-0.111
-0.111
0.806
0.222
-0.028
-0.111
0.222
-0.111
-0.111
0.222
-0.111
0.222
0.556
0.222
0.139
-0.111
-0.028
-0.111
-0.111
0.222
-0.028
0.222
0.806
indica un leverage elevato per i vertici, che trova riscontro nella funzione di informazione (Figura
5-34) su cui influisce il segno del prodotto dei fattori.
Figura 5-34 –Funzione di informazione per il disegno fattoriale completo 32.
70
5.5.2 – Disegni compositi
I disegni compositi hanno la caratteristica della ruotabilità (rotatability)
Dal leverage in un punto x:
h x T (XT X) 1 x
si ottiene la varianza del modello (la superficie di risposta):
s 2yˆ s 2 h
e la funzione di informazione, inverso della varianza.
Un disegno sperimentale é ruotabile quando questa varianza é costante a distanza costante dal
centro del modello, il vettore che corrisponde alle coordinate 0.
Figura 5-35 – Disegno Composito centrale circoscritto
Il Disegno composito centrale o di Box-Wilson, mostrato in Figura 5-35 per due fattori, consiste di
tre parti.
Parte 1: un disegno base fattoriale completo (come in Figura 5-35) o frazionato con F esperimenti;
Parte 2: un esperimento al centro del dominio sperimentale;
Parte 3: alcuni esperimenti a una distanza dal centro, disposti simmetricamente secondo quello
che viene chiamato un disegno a stella ( a quattro, sei, otto punte).
Generalmente nel centrano si effettuano più esperimenti, e queste repliche sono utilizzate non
per costruire il modello ma per stimare la varianza della risposta e la validità del modello.
Per avere ruotabilità, deve essere la radice quarta del numero di esperimenti della parte I. Per
due fattori:
=41/4 =2
71
m
1
1
1
1
1
1
1
1
1
x1
-1
-1
1
1
-1.4142
1.4142
0
0
0
x2
-1
1
-1
1
0
0
-1.4142
1.4142
0
x12
1
1
1
1
2
2
0
0
0
x22
1
1
1
1
0
0
2
2
0
x1 x2
1
-1
-1
1
0
0
0
0
0
Con tre fattori =81/4 = 1.6818 e la matrice sperimentale è:
Esp
x1
x2
x3
1
-1.0000 -1.0000 -1.0000
2
-1.0000 -1.0000 1.0000
3
-1.0000 1.0000 -1.0000
4
-1.0000 1.0000 1.0000
5
1.0000 -1.0000 -1.0000
6
1.0000 -1.0000 1.0000
7
1.0000 1.0000 -1.0000
8
1.0000 1.0000 1.0000
9
-1.6818 0
0
10
1.6818 0
0
11
0
-1.6818 0
12
0
1.6818 0
13
0
0
-1.6818
14
0
0
1.6818
15
0
0
0
e permette la stima di 15 coefficienti, ma frequentemente viene utilizzato il modello, con 10
coefficienti:
y b 0 b1 x1 b 2 x 2 b 3 x 3 b11 x12 b 22 x 22 b 33 x 32 b12 x1 x 2 b13 x1 x 3 b 23 x 2 x 3
[5-13]
Il modello composito mostrato nella Figura 5-35 non è l’unico tipo di CCD (central composite
design). La Figure 5-36 e 5-37 mostrano oltre al disegno composito più utilizzato, descritto in
precedenza, altri due tipi di disegno composito. La tabella sommarizza alcune loro caratteristiche.
72
Disegno
Ruotabile Livelli Punti fuori
dall’intervallo ±1
Accuratezza delle stime
Circoscritto (CCC)
Si
5
Si
Buona sull’intero dominio
Inscritto (CCI)
Si
5
No
Buona nella parte centrale
A facce centrate
(CCF)
No
3
No
Molto buona nell’intero dominio,
ma con stima non eccellente dei
coefficienti quadratici
Figura 5-36 – Disegni compositi per due fattori
Figura 5-37– Disegni compositi per tre fattori
73
Le Figure da 5-38 a 5-40 mostrano come variano il leverage e la funzione di informazione nel
dominio sperimentale, per il CCC a due fattori, confrontato con il disegno fattoriale completo 2 2.
Nel caso del disegno CCC il modello considerato è quello [5-12].
Figura 5-38– Leverage per il CCC (a sinistra) e per il FF a destra
Figura 5-39–Linee di isoleverage per il CCC
74
Figura 5-40–Superfici di funzione di informazione per il CCC (a sinistra) e per il FF a destra
Il disegno ruotabile CCC non è ortogonale. Nella matrice di dispersione:
1
0
0
-0.5
-0.5
0
0
0.125 0
0
0
0
0
0
0.125 0
0
0
-0.5 0
0
0.344 0.219 0
-0.5 0
0
0.219 0.348 0
0
0
0
0
0
0.25
vi sono tre termini non nulli fuori dalla diagonale.
Disegni quasi-ortogonali possono essere ottenuti cambiando il valore di α in:
4
n1 n 2 n1
2 n41
dove n1 é il numero dei punti del disegno fattoriale base, e n 2 sono gli altri punti, comprese
eventuali repliche del punto centrale.
Nel caso di due fattori, con un solo punto centrale, α per un disegno quasi ortogonale è 1,
corrispondente al disegno CCI. La matrice di dispersione è:
75
0.556
0.
0.
-0.333
-0.333
0.
0.
0.167
0.
0.
0.
0.
0.
0.
0.167
0.
0.
0.
-0.3333
0.
0.
0.5
0.
0.
-0.333
0.
0.
0.
0.5
0.
0.
0.
0.
0.
0.
0.25
con due soli termini (e più piccoli) fuori dalla diagonale.
5.5.2.1 – Un esempio con due risposte
La sintesi di una ammina da un chetone è complicata dalla formazione di un prodotto secondario.
La sintesi viene studiata in funzione di tre fattori (concentrazione del chetone, concentrazione
dello scavenger per la eliminazione dell’acqua, e temperatura), e le risposte sono due, la resa
percentuale in ammina e la percentuale di prodotto secondario formata. Lo scopo è quello di
trovare le condizioni in cui la resa in ammina è massima (almeno 85%) e la concentrazione del
prodotto secondario è minima (minore del 10%).
La matrice scelta è quella di un disegno CCC per tre fattori, e la matrice del modello è:
m
X1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
La matrice
X3
X2
-1.0000 -1.0000
-1.0000 -1.0000
-1.0000 1.0000
-1.0000 1.0000
1.0000 -1.0000
1.0000 -1.0000
1.0000 1.0000
1.0000 1.0000
-1.6818 0
1.6818 0
0
-1.6818
0
1.6818
0
0
0
0
0
0
di dispersione non
X12
X22
X32
X1 X2
-1.0000 1
1
1
1
1.0000 1
1
1
1
-1.0000 1
1
1
-1
1.0000 1
1
1
-1
-1.0000 1
1
1
-1
1.0000 1
1
1
-1
-1.0000 1
1
1
1
1.0000 1
1
1
1
0
2.82843 0
0
0
0
2.82843 0
0
0
0
0
2.82843 0
0
0
0
2.82843 0
0
-1.6818 0
0
2.82843 0
1.6818 0
0
2.82843 0
0
0
0
0
0
è diagonale, e vi sono sei elementi non nulli
X1 X3
1
-1
1
-1
-1
1
-1
1
0
0
0
0
0
0
0
fuori
X2 X3
1
-1
-1
1
1
-1
-1
1
0
0
0
0
0
0
0
dalla diagonale
principale, elementi che indicano correlazione tra i coefficienti dei quadrati e la media, e tra i
coefficienti dei quadrati stessi (r = 0.62).
0.988
0
0
0.
0
0.073
0
0.
0
0
0.073
0.
0
0
0.
0.073
-0.337
0
0.
0
-0.337
0
0.
0
-0.337
0
0.
0
76
0
0
0.
0
0
0
0.
0
0
0
0.
0
-0.337
-0.337
-0.337
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0.165
0.103
0.103
0
0
0
0.103
0.165
0.103
0
0
0
0.103
0.103
0.165
0
0
0
0
0
0
0.125
0
0
0
0
0
0
0.125
0
0
0
0
0
0
0.125
I risultati sperimentali sono:
Resa Ammina Resa calcolata Prodotto secondario Resa calcolata
81.3
82.18
10.5
10.11
85.2
86.06
5.3
4.84
91.4
90.57
7.9
8.00
91.2
89.39
4.7
4.73
50.4
51.54
2.7
2.30
72.4
72.56
6.7
6.24
77.2
75.67
5.7
5.79
93.2
91.65
11.7
11.72
85.3
85.51
1.7
1.95
60.9
61.63
1.
1.27
79.2
77.07
10.3
11.14
97.1
100.17
14.3
13.98
70.3
70.18
4.7
4.88
85.8
86.87
5.1
5.44
85.1
84.94
2.
1.91
da confrontare con quelli calcolati dal modello. L’errore massimo é circa 3 per la resa dell’ammina
e circa 0.5 per quella del prodotto secondario. I valori sono calcolati mediante i coefficienti del
modello:
b0
b1
b2
b3
b11
b22
b33
b12
b13
b23
Coefficienti
(ammina)
84.938
-7.098
6.869
4.962
-4.018
1.303
-2.268
3.938
4.288
-1.263
Coefficienti
(prod.sec.)
1.911
-0.203
0.844
0.166
-0.107
3.764
1.148
1.4
2.3
0.5
77
Figura 5-41–Linee di isorisposta per la resa in ammina a livello di temperatura minimo
(sinistra) e massimo (destra)
Figura 5-42–Linee di isorisposta per la resa in prodotto scondario a livello di
temperatura minimo (sinistra) e massimo (destra)
Le Figure 5-41 e 5-42 mostrano come variano le risposte nel dominio sperimentale.
Sovrapponendo le linee di isorisposta per l’ammina e il prodotto secondario (Figure 5-43 e 5-44) è
possibile individuare zone che soddisfano l’obbiettivo, una quasi soddisfacente a temperatura
bassa, una larga e molto soddisfacente a temperatura alta.
78
Figura 5-43–Linee di isorisposta sovrapposte. Livello di temperatura minimo. La zona in
colore è considerata quasi soddisfacente.
Figura 5-44–Linee di isorisposta sovrapposte. Livello di temperatura massimo. La zona
in colore più scuro è considerata molto soddisfacente, quella in colore più chiaro è
considerata soddisfacente.
79
5.5.3 – Disegni di Doehlert
I disegni di Doehlert (DD) sono, insieme a quelli di Box-Behnken, largamente utilizzati.
Questi disegni vengono utilizzati per un numero di fattori da due a cinque, e sono più economici
del disegno composito. Hanno la caratteristica ulteriore di avere un numero di livelli diversi per i
fattori. Il disegno per due fattori ha la forma di un esagono regolare, e uno dei due fattori ha
cinque livelli, mentre l’altro ne ha tre. Lo sperimentatore può evidentemente decidere quale dei
due fattori deve avere cinque livelli, o usare il disegno ruotato equivalente (Figura 5-45).
Figura 5-45 – Disegno di Doehlert per due fattori
Il disegno di Doehlert ha anche il vantaggio che si può utilizzare in modo sequenziale. Se un primo
esame ha indicato che l’ottimo ricercato può essere fuori dal dominio studiato, per esempio verso
valori alti del primo fattore e bassi del secondo, si può costruire un nuovo disegno trattenendo
quattro esperimenti del precedente (Figura 5-46), ed eventualmente continuare sempre
trattenendo quattro esperimenti del disegno precedente.
Figura 5-46 – Disegni sequenziali di Doehlert
80
Il modello che si utilizza con il disegno di Doehlert per due fattori è:
y b 0 b1 x1 b 2 x 2 b11 x12 b 22 x 22 b12 x1 x 2
e la matrice di disegno è:
m X1
X2
X1 X2
1. 0.
0.
0.
1. 1.
0.
0.
1. 0.5 0.866 0.433
1. -0.5 0.866 -0.433
1. -1. 0.
0.
1. -0.5 -0.866 0.433
1. 0.5 -0.866 -0.433
X 12
0.
1.
0.25
0.25
1.
0.25
0.25
La matrice di dispersione:
1 0
0
0
0 0.333 0
0
0 0
0.333 0
0 0
0
1.333
-1 0
0
0
-1 0
0
0
-1
0
0
0
1.5
0.833
[5-12]
X 22
0.
0.
0.75
0.75
0.
0.75
0.75
-1
0
0
0
0.833
1.5
ha tre elementi fuori dalla diagonale, elementi connessi ai termini quadratici.
La matrice Hat non è diagonale: il modello non passa attraverso turri i punti sperimentali.
1
0
0
0
0
0
0
0
0.833
0.167
-0.167
0.167
-0.167
0.167
0
0.167
0.833
0.167
-0.167
0.167
-0.167
0
-0.167
0.167
0.833
0.167
-0.167
0.167
0
0.167
-0.167
0.167
0.833
0.167
-0.167
0
-0.167
0.167
-0.167
0.167
0.833
0.167
0.
0.167
-0.167
0.167
-0.167
0.167
0.833
Il leverage è eguale per tutti i punti sull’esagono. Il punto al centro ha leverage maggiore, e
pertanto la funzione di informazione, mostrata nella Figura 5-47, mostra un avvallamento nella
zona centrale.
Le matrici di Doehlert sono ruotabili.
81
Figura 5-47 – Funzione di informazione per il disegno di Doehlert per due fattori
I disegni di Doehlert si ottengono dalla tabelle seguente, dove il riquadro blu indica il disegno a
due fattori. Aggiungendo i termini in rosso si ottiene il disegno per tre fattori. Aggiungendo ancora
i termini in lilla si ottiene il disegno per quattro fattori. Con i termini in verde si ottiene il disegno
per cinque fattori.
Il disegno per tre fattori è visualizzato nella Figura 5-48.
Tabella 5.1 - Disegni di Doehlert
X1
X2
0
1.
0.5
-0.5
-1
-0.5
0.5
0.5
-0.5
0
0.5
-0.5
0
0.5
-0.5
0
0
0.5
-0.5
X3
0
0
0.866
0.866
0
-0.866
-0.866
0.289
0.289
-0.577
-0.289
-0.289
0.577
0.289
0.289
-0.577
0
-0.289
-0.289
X4
0
0
0
0
0
0
0
0.816
0.816
0.816
-0.816
-0.816
-0.816
0.204
0.204
0.204
-0.612
-0.204
-0.204
82
X5
0
0
0
0
0
0
0
0
0
0
0
0
0
0.791
0.791
0.791
0.791
-0.791
-0.791
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0.5
-0.5
0
0
0
0.5
-0.5
0
0
0
0.577
0
0.289
0.289
-0.577
0
0
-0.289
-0.289
0.577
0
0
-0.204
0.612
0.204
0.204
0.204
-0.612
0
-0.204
-0.204
-0.204
0.612
0
-0.791
-0.791
0.158
0.158
0.158
0.158
0.632
-0.158
-0.158
-0.158
-0.158
0.632
0
0
0.775
0.775
0.775
0.775
0.775
-0.775
-0.775
-0.775
-0.775
-0.775
Figura 5-48 – Disegno di Doehlert per tre fattori
Si noti come il DD per due fattori può essere ricavato da un ipotetico DD per un fattore (Figura 549 A), costituito dai tre esperimenti rossi. Per il nuovo fattore si aggiungono quattro esperimenti
(due in ambedue le direzioni del nuovo fattore, gli esperimenti 4 e 5 per il livello alto del secondo
fattore, gli esperimenti 6 e 7 per il livello basso). Il valore del primo fattore per questi esperimenti
cade al centro di uno degli intervalli del primo fattore per il DD a un fattore (p.e., 4 e 6 a metà
dell’intervallo da 1 a 2. Il livello alto del secondo fattore per l’esperimento 4 viene scelto in modo
che le distanza 4-1 e 4-2 siano egualo alla distanza 1-2.
Analogamente si noti come il disegno per tre fattori include nel piano X3 = 0 il disegno per due
fattori, con sette esperimenti, i primi della Tabella 5-1, ricopiati sotto. con accanto il valore X3 = 0.
83
Esper.
1
2
3
4
5
6
7
8
9
10
11
12
13
X1
X2
0
1.
0.5
-0.5
-1
-0.5
0.5
0.5
-0.5
0
0.5
-0.5
0
X3
0
0
0.866
0.866
0
-0.866
-0.866
0.289
0.289
-0.577
-0.289
-0.289
0.577
0
0
0
0
0
0
0
0.816
0.816
0.816
-0.816
-0.816
-0.816
Gli altri esperimenti mostrano, proiettati nel piano dei primi due fattori (Figura 5-49 B), la stessa
geometria esagonale. Le sei proiezioni sono al centro del simplesso corrispondente e i livelli del
terzo fattore sono tali che le distanze tra i nuovi punti ed i tre del simplesso corrispondente siano
eguali a quelle tra gli elementi del simplesso (p.e. la distanza 8-1 sia eguale a 8-2 e a 8-3, e anche a
1-2 ,1-3, 2-3.
Queste simmetrie rendono relativamente facile la costruzione delle matrici di Doehlert.
Figura 5-49 – Proiezione del disegno di Doehlert per due fattori nel piano del primo
fattore (A) e disegno per tre fattori nel piano dei due primi fattori (B).
84
Le matrici di Doehlert (come tutte le matrici ruotabili) può essere ruotata, ottenendo
matrici come quella nella Figura 5-50.
Figura 5-50 – Disegno di Doehlert ruotato di 45° in senso antiorario
a cui corrisponde la matrice del modello:
X 12
0
X 22
0
m X1
1 0
X2
0
X1 X2
0
1
0.7071
-0.7071 0.5000 0.5000 -0.5000
1
0.9659
0.2588
0.9330 0.0670 0.2500
1
0.2588
0.9659
0.0670 0.9330 0.2500
1
-0.7071 0.7071
1
-0.9659 -0.2588 0.9330 0.0670 0.2500
1
-0.2588 -0.9659 0.0670 0.9330 0.2500
0.5000 0.5000 -0.5000
che ha matrice di dispersione esattamente eguale a quella della matrice originale.
5.5.4 – Disegni di Box-Behnken
Come i disegni centrali compositi, i disegni di Box-Behnken sono utilizzati con modelli quadratici
completi, sono ruotabili e quando i fattori sono tre o quattro richiedono meno esperimenti dei
CCD. Ogni fattore è rappresentato a tre livell.
Il disegno di Box-Behnken per tre fattori è mostrato nella Figura 5-51.
85
Figura 5-51 – Disegno di Box-Behnken per tre fattori
La matrice del modello per il disegno con tre fattori è:
Esp.
1
2
3
4
5
6
7
8
9
10
11
12
13
m
1
1
1
1
1
1
1
1
1
1
1
1
1
X1
-1
-1
1
1
-1
-1
1
1
0
0
0
0
0
X2
-1
1
-1
1
0
0
0
0
-1
-1
1
1
0
X3
0
0
0
0
-1
1
-1
1
-1
1
-1
1
0
X 12
1
1
1
1
1
1
1
1
0
0
0
0
0
X 22
1
1
1
1
0
0
0
0
1
1
1
1
0
X 32
0
0
0
0
1
1
1
1
1
1
1
1
0
X1 X2
1
-1
-1
1
0
0
0
0
0
0
0
0
0
X 1X 3
0
0
0
0
1
-1
-1
1
0
0
0
0
0
X 2X 3
0
0
0
0
0
0
0
0
1
-1
-1
1
0
La matrice di informazione e quella di dispersione non sono diagonali, ma hanno sei termini diversi
da zero fuori dalla diagonale principale, in corrispondenza dei termini quadrati.
13
0
0
0
8
0
8
0
0
0
0
0
8
0
0
0
0
0
8
0
8
0
0
0
8
8
0
0
0
4
8
0
0
0
4
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
86
8
8
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
4
4
0
0
0
8
4
0
0
0
4
8
0
0
0
0
0
4
0
0
0
0
0
4
0
0
0
0
0
4
1
0
0
0
-0.5
0
0.125 0
0
0
0
0
0.125 0
0
0
0
0
0.125 0
-0.5 0
0
0
0.4375
-0.5 0
0
0
0.1875
-0.5 0
0
0
0.1875
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
La matrice Hat non é diagonale:
0.75
0
0
0.25
0.125
0.125
-0.125
-0.125
0.125
0.125
-0.125
-0.125
0
0
0.75
0.25
0
0.125
0.125
-0.125
-0.125
-0.125
-0.125
0.125
0.125
0
0
0.25
0.75
0
-0.125
-0.125
0.125
0.125
0.125
0.125
-0.125
-0.125
0
0.25
0
0
0.75
-0.125
-0.125
0.125
0.125
-0.125
-0.125
0.125
0.125
0
0.125
0.125
-0.125
-0.125
0.75
0
0
0.25
0.125
-0.125
0.125
-0.125
0
-0.5
0
0
0
0.1875
0.4375
0.1875
0
0
0
-0.5
0
0
0
0.1875
0.1875
0.4375
0
0
0
0
0
0
0
0
0
0
0.25
0
0
0.125
0.125
-0.125
-0.125
0
0.75
0.25
0
-0.125
0.125
-0.125
0.125
0
-0.125
-0.125
0.125
0.125
0
0.25
0.75
0
0.125
-0.125
0.125
-0.125
0
-0.125
-0.125
0.125
0.125
0.25
0
0
0.75
-0.125
0.125
-0.125
0.125
0
0
0
0
0
0
0
0
0
0.25
0
0
0
0
0
0
0
0
0
0
0.25
0.125
-0.125
0.125
-0.125
0.125
-0.125
0.125
-0.125
0.75
0.
0.
0.25
0
0.125
-0.125
0.125
-0.125
-0.125
0.125
-0.125
0.125
0
0.75
0.25
0
0
-0.125
0.125
-0.125
0.125
0.125
-0.125
0.125
-0.125
0.
0.25
0.75
0
0
-0.125
0.125
-0.125
0.125
-0.125
0.125
-0.125
0.125
0.25
0
0
0.75
0
0
0
0
0
0
0
0
0
0
0
0
0
1
e indica un leverage relativamente alto nel punto centrale, con conseguente funzione di
informazione bassa (Figura 5-52, sinistra). Se si effettuano più repliche nel punto centrale (le
repliche sono utili anche per la determinazione della varianza dell’errore nella misura della
risposta) si ha una stima più uniforme e migliore della varianza della risposta su tutto il dominio
sperimentale. La Figura 5-52 a destra mostra l’effetto dell’aggiunta di due ripetizioni
dell’esperimento nel punto centrale. La matrice di dispersione, sotto, è cambiata notevolmente
nei termini che riguardano la media e i termini quadrati. Il coefficiente di correlazione tra i termini
quadrati è sceso da 0.43 a 0.08 circa.
0.333
0
0
0
0
0
0.125 0
0
0
0.125 0
-0.167 -0.167 -0.1675 0
0
0
0
0
0
0
0
0
87
0
0
0
0
0
0
0
-0.167
-0.167
-0.167
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0.125
0
0
0
0
0
0
0
0.271
0.021
0.021
0
0
0
0
0.021
0.271
0.021
0
0
0
0
0.021
0.021
0.271
0
0
0
0
0
0
0
0.25
0
0
0
0
0
0
0
0.25
0
0
0
0
0
0
0
0.25
Figura 5-52 – Funzione di informazione per il disegno di Box-Behnken per tre fattori
calcolata al livello 0 del terzo fattore. A sinistra con un solo punto centrale, a destra con
tre repliche dell’esperimento centrale.
La tabella 2.5 riporta l’efficienza (rapporto tra numero dei coefficienti e numero degli esperimenti)
pei i disegni compositi centrali (CCD), i disegni di Box–Behnken (BBD) e quelli di Doehlert (DM).
Tabella 5.2 – Efficienza di disegni ruotabili
Esperimenti
Fattori
2
3
4
5
6
7
8
Coefficienti
6
10
15
21
28
36
45
CCD
9
15
25
43
77
143
273
DM
7
13
21
31
43
57
73
BBD
–
13
25
41
61
85
113
88
Efficienza
CCD
0.67
0.67
0.60
0.49
0.36
0.25
0.16
DM
0.86
0.77
0.71
0.68
0.65
0.63
0.62
BBD
–
0.77
0.60
0.61
0.46
0.42
0.40
5.5.5 – Disegni ibridi di Roquemaure
Sono disegni quasi saturi (un disegno saturo ha tanti esperimenti quanti sono i coefficienti da
stimare). Si dicono ibridi in quanto cercano un compromesso tra isovarianza in rotazione e
ortogonalità. Esistono piani di Roquemaure per tre, quattro e sei fattori. Non sono unici, nel senso
che per lo stesso numero di fattori si hanno più disegni di Roquemaure.
Nel caso di tre fattori, uno dei disegni (Figura 5-53) è quello con matrice sperimentale:
Esp.
1
2
3
4
5
6
7
8
9
10
11
Fattore1
0
0
-1.414
+1.414
-1.414
+1.414
-2
+2
0
0
0
Fattore 2
0
0
-1.414
-1.414
+1.414
+1.414
0
0
-2
+2
0
Fattore 3
+2
-2
+1
+1
+1
+1
-1
-1
-1
-1
0
Figura 5-53 –Un disegno di Roquemaure per tre fattori
La matrice del modello è:
Esp.
1
m
1
X1
0
X2
0
X3
+2
X 12
0
X 22
0
89
X 32
4
X 1X 2 X 1X 3
0
0
X 2X 3
0
2
3
4
5
6
7
8
9
10
11
1
1
1
1
1
1
1
1
1
1
0
-1.414
+1.414
-1.414
+1.414
-2
+2
0
0
0
0
-1.414
-1.414
+1.414
+1.414
0
0
-2
+2
0
-2
+1
+1
+1
+1
-1
-1
-1
-1
0
0
2
2
2
2
4
4
0
0
0
0
2
2
2
2
0
0
4
4
0
4
1
1
1
1
1
1
1
1
0
0
2
-2
-2
2
0
0
0
0
0
0
-1.414
+1.414
-1.414
+1.414
2
-2
0
0
0
0
-1.414
-1.414
+1.414
+1.414
0
0
2
-2
0
La matrice di informazione mostra sei elementi fuori dalla diagonale, quelli cinvolgenti i termni
quadrati:
11
0
0
0
16
16
16
0
0
0
0
16
0
0
0
0
0
0
0
0
0
0
16
0
0
0
0
0
0
0
0
0
0
16
0
0
0
0
0
0
16
0
0
0
48
16
16
0
0
0
16
0
0
0
16
48
16
0
0
0
16
0
0
0
16
16
40
0
0
0
0
0
0
0
0
0
0
16
0
0
0
0
0
0
0
0
0
0
16
0
0
0
0
0
0
0
0
0
0
16
La funzione di informazione è mostrata in Figura 5-54 per i tre piani X3 = -1, X3 = 0, X3 = 1, e risulta
simmetrica rispetto al livello X3 = 0, e ruotabile nel piano dei primi due fattori.
Figura 5-54 – Funzioni di informazione per il disegno di Roquemaure a 3 fattori.
Fattore 3 = A: -1, B: 0; C: +1.
Nei piani X1 = -2, X1 = -1, X1 = 0, X1 = 1, X1 = 2, il leverage non è ruotabile (Figura 5-55). Vi è
simmetria rispetto al piano X1 = 0, e i leverage nei piano del fattore 2 con il fattore 3 sono eguali a
quelli nella Figura 5-55.
90
Figura 5-55 – Leverage per il disegno di Roquemaure a 3 fattori.
Fattore 1 = A: 0, B: 1 o -1; C: 2 o -2.
La Figura 5-56 mostra un secondo disegno di Roquemaure per tre fattori. La tabella sottostante
confronta il nuovo disegno a destra con quello visto in precedenza, a sinistra.
Esp.
1
2
3
4
5
6
7
X1
0
0
-1.414
+1.414
-1.414
+1.414
-2
X2
0
0
-1.414
-1.414
+1.414
+1.414
0
X3
X1
X2
X3
+2
0
0
2.449
-2
0
0 -2.449
+1 -0.751 -2.106
-1
+1
0.751 -2.106
1
+1 -0.751
2.106
1
+1
0.751
2.106
-1
-1 -2.106 -0.751
1
91
8
9
10
11
+2
0
0
0
0
-2
+2
0
-1
-1
-1
0
2.106
-2.106
2.106
0
-0.751
0.751
0.751
0
-1
-1
1
0
Le differenze consistono soprattutto in una minore simmetria. Inoltre, nel primo disegno i fattori 1
e 2 hanno i livelli -2, -1.4 (√2), 0, 1.4 e 2 , grosso modo con un dislivello doppio tra 0 e il primo
livello rispetto a quello tra il primo livello e il secondo livello. Invece il terzo fattore ha i livelli
equispaziati. Nel secondo disegno di Roquemaure i livelli dei fattori non sono ancora equispaziati,
-2.1, -0.75, 0, 0.75, 2.1, ma il primo livello è più vicino allo 0 che al secondo livello.
Figura 5-56 – Un secondo disegno di Roquemaure per tre fattori
La matrice del modello per il secondo disegno di Roquemaure è:
Esp.
1
2
3
4
5
6
7
8
9
10
m
1
1
1
1
1
1
1
1
1
1
X1
0
0
-0.751
0.751
-0.751
0.751
-2.106
2.106
-2.106
2.106
X2
0
0
-2.106
-2.106
2.106
2.106
-0.751
-0.751
0.751
0.751
X3
2.449
-2.449
-1
1
1
-1
1
-1
-1
1
X 12
0
0
0.564
0.564
0.564
0.564
4.435
4.435
4.435
4.435
X 22
0
0
4.435
4.435
4.435
4.435
.564
.564
.564
.564
92
X 32
5.997
5.997
1
1
1
1
1
1
1
1
X 1X 2
0
0
1.582
-1.582
-1.582
1.582
1.582
-1.582
-1.582
1.582
X 1X 3
0
0
.751
.751
-.751
-.751
-2.106
-2.106
2.106
2.106
X 2X 3
0
0
2.106
-2.106
2.106
-2.106
-.751
.751
-.751
.751
11
1
0
0
0
0
0
0
0
0
e la matrice di informazione è:
11
0
0
0
20
20
20
0
0
0
0
20
0
0
0
0
0
0
0
0
0
0
20
0
0
0
0
0
0
0
0
0
0
20
0
0
0
0
0
0
20
0
0
0
80
20
20
0
0
0
20
0
0
0
20
80
20
0
0
0
20
0
0
0
20
20
80
0
0
0
0
0
0
0
0
0
0
20
0
0
0
0
0
0
0
0
0
0
20
0
0
0
0
0
0
0
0
0
0
20
5.5.6 – Disegni D-ottimi
Sono disegni che si utilizzano spesso quando il dominio sperimentale non è interamente
accessibile a causa di vincoli pratici. Si utilizzano anche quando si vogliono fare meno esperimenti
di quelli previsti da un disegno classico non saturato, e in ambedue i casi si impone il numero di
esperimenti, cercando tra le combinazioni di esperimenti possibili quella con il più elevato
determinante (della matrice di informazione, e pertanto dopo aver scelto un modello).
La ricerca della combinazione ottima non può essere effettuata in modo sistematico, dato il
numero generalmente enorme di combinazioni. Si ricorre ad algoritmi della famiglia dell’algoritmo
di scambio di Fedorov o agli algoritmi genetici (vedi 4.8.8.7.6).
L’algoritmo di Fedorov:
1) inizia con una scelta casuale degli esperimenti;
2) si calcola il determinante della matrice di informazione con gli esperimenti selezionati;
3) sempre casualmente si sceglie uno degli esperimenti selezionati in precedenza;
4) si sostituisce questo esperimento con un altro scelto casualmente (evitando duplicazioni);
5) se il determinante è maggiore di quello calcolato al punto 2 si aggiorna il complesso degli
esperimenti selezionati e si torna al punto 2.
L’algoritmo di Fedorov è stato applicato ad un esempio con due fattori. I livelli possibili sono
raccolri nella tabella seguente:
N°
1
2
3
X
0.0000
0.1031
0.8247
Y
1.1590
0.6418
0.0575
N°
11
12
13
X
0.1031
0.0773
0.8763
Y
0.9004
0.3257
0.7375
93
N°
21
22
23
X
0.3351
0.4897
0.5541
Y
0.9962
0.3640
0.6801
4
5
6
7
8
9
10
1.1727
2.4485
2.0876
2.2809
2.3840
2.2423
2.5000
0.0096
0.0287
0.8525
1.3123
2.1264
2.0785
2.4330
14
15
16
17
18
19
20
1.9588
2.3840
1.8557
2.3711
2.4613
2.2680
2.2809
0.0000
0.4502
1.1782
0.9866
1.8103
1.8774
2.5000
24
25
26
27
28
29
30
1.6624
2.2423
2.0361
2.4871
2.0876
2.5000
2.1778
0.0000
0.2874
1.4080
1.3985
1.7146
2.1073
2.3563
L’algoritmo inizia con la scelta casuale degli esperimenti 24,28,18,22,8,13. Nel primo ciclo
l’esperimento 18 viene sostituito con il 26. Il determinante diminuisce. La matrice sperimentale è
peggiore. Nel secondo ciclo l’esperimento 22 viene sostituito con il 15. Il determinante aumenta e
l’esperimento 15 sostituisce definitivamente il 22. Subito dopo l’esperimento 15 viene sostituito
con il 7. Il determinante aumenta ed il 7 sostituisce definitivamente il 15. L’algoritmo continua sino
a quando il determinante ottimo rimane costante per un certo numero di cicli. Nell’esempio la
scelta finale, individuata al ciclo 527, non ha trovato un disegno migliore dopo altri 9500 cicli.
La tabella sottostante riporta solo un estratto dei risultati.
Ciclo
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
24
24
24
24
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
20
28
28
28
28
28
28
28
28
28
28
28
28
28
28
28
28
28
28
28
28
28
28
28
28
28
28
Esperimenti
18 22
26 22
18 15
18 7
18 7
4
7
4
7
4
7
4
7
4
7
4
7
4
7
4
7
4
7
4
7
4
7
4
7
4
7
4
7
4
7
1
7
1
7
1
7
1
7
1
7
1
5
8
8
8
8
8
8
8
8
8
8
8
8
8
8
8
8
8
8
8
8
8
17
17
17
17
17
13
13
13
13
13
13
13
13
13
13
13
13
13
13
13
13
13
13
13
13
13
13
13
13
13
13
Determinante
0.003250
0.000064
0.009667
0.178100
4.792310
90.582861
0.113325
38.152800
0.394352
13.158075
2.859249
68.593502
2.310400
3.351213
15.997262
0.443494
9.496733
3.987597
0.384176
1.424605
126.391853
193.295015
0.033895
7.542794
0.411390
228.145310
94
57
74
86
114
283
527
21
21
21
21
21
21
28
28
28
28
29
29
1
1
1
1
1
1
5
5
5
5
5
5
17
7
8
10
10
8
13
13
13
13
13
13
381.060803
384.985578
502.807084
516.575133
589.346041
657.864488
La Figura 5-57 mostra gli esperimenti candidati, la scelta iniziale (B) e la scelta ottima (C). Gli
esperimenti candidati non coprono una grande porzione del dominio sperimentale. La scelta
casuale iniziale esplora molto poco il primo fattore, mentre la scelta ottima vede i sei esperimenti
ben distribuiti nello spazio sperimentale.
Figura 5-57 – Esperimenti possibili (A), scelta casuale iniziale (B), scelta con algoritmo di Fedorov
(C)
95
5.6 - ANALISI DELLA VARIANZA
L’analisi della varianza è lo strumento statistico più utilizzato in ED.
Gli obbiettivi della ANOVA sono di valutare:
a) la validità del modello di regressione;
b) il significato dei coefficienti del modello.
Abbiamo già visto un esempio della analisi della varianza a due vie in 2.20.2. In ED si utilizza la
ANOVA a due o più vie. Qui vedremo alcuni esempi applicati al caso di due fattori, due vie.
Il primo esempio riguarda un caso classico, in cui oltre agli esperimenti indicati dal disegno
sperimentale, in questo caso un fattoriale completo 22, vengono effettuati alcuni esperimenti al
centro del modello. Da questi esperimenti si ottiene la varianza dell’errore sulla misura della
variabile risposta. La ANOVA a due vie è simile a quella vista in 2.20.2. La principale differenza è
che la varianza dell’errore è stimata dalle ripetizioni nel punto centrale, non utilizzate per costruire
il modello, anziché dalle dispersioni entro-nidi, che comporterebbero un numero elevato di
esperimenti, senza valutare la bontà del modello nel punto centrale.
Si calcolano gli effetti specifici del fattore 1 o di colonna, 6.25, e del fattore 2 o di riga, -3.75.
Il modello
xirc = μ + φ (c) + ϒ(r) + υ(r,c) +εi,
da cui la stima del modello:
xirc = mGEN + f (c) + g(r) + v(r,c)
permette di stimare l’interazione
v(r,c) =
xirc - mGEN - f (c) - g(r) = -1.25
96
Si ha:
R
s 2Riga C
(m r m GEN ) 2
r 1
R 1
56.25
C
2
s Colonna
R
(m c m GEN ) 2
c 1
C 1
C R
s 2Interazion e
(x rc m GEN
156.25
g(r ) f (c)) 2
c1 r 1
6.25
(R 1)(C 1)
Le varianze vengono confrontate con la varianza dell’errore, stimata dalle ripetizioni nel punto
centrale.
Sorgente di variazione
Totale
Media
Fattore 2 (Riga)
Fattore 1 (Colonna)
Interazione
Errore
d.o.f
4
1
1
1
1
2
Somma dei quadrati
1625.00
1406.25
56.25
156.25
6.25
1.28
Varianza
56.25
156.25
6.25
0.64
F
87.89
244.14
9.77
Il valore critico della F di Fisher è:
Fcrit (1,2,0.95) = 18.51
e pertanto gli effetti dei due fattori sono significativi mentre non è significativo l’effetto
dell’interazione.
Il valore critico della statistica F é elevato, in quanto la varianza dell’errore è stata ottenuta con
sole tre determinazioni, due gradi di libertà. Se la stessa varianza fosse stata ottenuta con cinque
determinazioni nel punto centrale il valore critico Fcrit(1,4,0.95) sarebbe stato 7.71 e l’interazione
sarebbe stata significativa.
Il modello stimato fornisce nel punto centrale il valore 18.75, media generale dei quattro
esperimenti.
La media delle tre repliche nel punto centrale è 19.
La differenza tra i due valori misura la bontà del modello nel punto centrale, ed è detta “lack-offit”:
Lack-of-fit = 19 – 18.75 = 0.25
Il test di Student corrispondente calcola la t con due gradi di libertà:
97
t
0.25
0.625
0.8 2
Il valore critico è 4.3. Il test passa: l’ipotesi nulla, che non vi sia differenza significativa tra il valore
misurato (19) e il valore ipotesi (18.75, l’ipotesi che il modello sia valido nel punto centrale), è
accettata.
Si consideri un secondo esempio.
Esperimento
Fattore 1
Fattore 2
Risposta y
1
-1
-1
78.1
2
+1
-1
92.8
3
-1
+1
77.8
4
+1
+1
96.8
5
0
0
83.7
La varianza dell’errore s2 é stata stimata come 1.34 mediante cinque esperimenti aggiuntivi al
centro del disegno.
Il modello
y = b0 + b1 x1 + b2 x2 + b12 x1 x2
[5-3]
corrisponde alla matrice:
I
1
2
12
1 -1 -1 1
1 1
-1 -1
1 -1 1
-1
1 1
1
1
1 0
0
0
al vettore dei coefficienti:
b0 85.84
b1 8.425
b2 0.925
b12 1.075
alle risposte stimate dal modello con i relativi residui:
N°
y
ŷ
ŷ -y
( ŷ -y)2
d = y-b0-b1x1
12
d 12
-b2x2-b12x1x2
1
78.1
77.565
-0.535
0.286225
1.61
1
1.61
2
92.8
92.265
-0.535
0.286225
-0.54
-1
0.54
3
77.8
77.265
-0.535
0.286225
-0.54
-1
0.54
98
4
96.8
96.265
-0.535
0.286225
1.61
1
1.61
5
83.7
85.84
2.14
4.5796
-2.14
0
0
Somma
5.7245
4.3
Lo scostamento del modello dai punti sperimentali, varianza del lack-of-fit, si ottiene dalla somma
dei residui divisa per i gradi di libertà, il numero degli esperimenti diminuito del numero dei
coefficienti:
5
2
s lack
( y i ŷ i ) 2
i 1
54
5.7245
Il modello viene valutato mediante un test di Fisher, con la variabile F ottenuta come rapporto tra
la varianza del lack-of-fit e la varianza dell’errore misurata sulle cinque ripetizioni:
F = 5.72 / 1.34 = 4.27
Il valore critico della F con 1 e 4 d.o.f. al 95% di fiducia é 7.71, e pertanto l’ipotesi nulla viene
accettata. Il modello è valido, entro l’errore sperimentale.
Sorgente di
variazione
Totale
Somma dei
d.o.f
quadrati
37140.22
y i2
Varianza
F
5
i
Regressione
ŷ i2
37134.50
4
9283.63
6928
36842.53
1
36842.53
27494
283.92
1
283.92
212
3.42
1
3.42
2.55
4.63
1
4.63
3.45
5.72
5-4 =1
5.72
4.27
i
b0
b 02
i
b1
(b1 x1)2
i
b2
(b 2 x 2 ) 2
i
b12
(b12
x1 x 2 )2
i
Residui
(yi
ŷ i ) 2
i
Varianza
dell’errore
1.34
(le somme dei quadrati possono essere calcolate con le formule in seconda colonna in quanto le
quattro colonne del modello sono incorrelate).
99
Il valore critico della F di Fisher è 7.71, e pertanto il secondo fattore e la interazione non sono
significativi.
La tabella ANOVA del secondo esempio è solo apparentemente diversa da quella del primo
esempio, ed è più adatta alla visualizzazione dei risultati statistici quando il numero dei coefficienti
è elevato, come nell’esempio seguente.
In questo terzo esempio cinque fattori sono stati studiati mediante un disegno composito a facce
centrate costruito intono ad un disegno fattoriale frazionato 25-1, con alias 5 =1234. Il numero degli
esperimenti è conseguentemente 1 (centrale) + 16 (il disegno frazionato 2 5-1) + 10 (due
esperimenti a stella con α =1 per ogni fattore).
La matrice di disegno si riferisce al modello
y b 0 b1 x1 b 2 x 2 b 3 x 3 b 4 x 4 b 5 x 5 b11 x 12 b 22 x 22 b 33 x 32 b 44 x 24 b 55 x 52
b12 x1 x 2 b13 x1 x 3 b14 x1 x 4 b15 x1 x 5 b 23 x 2 x 3 b 24 x 2 x 4 b 25 x 2 x 5
b 34 x 3 x 4 b 35 x 3 x 5 b 45 x 4 x 5
che ha 21 coefficienti.
I
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
0
-1
1
0
0
0
0
0
2
-1
-1
1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
1
1
0
0
0
-1
1
0
0
0
3
-1
-1
-1
-1
1
1
1
1
-1
-1
-1
-1
1
1
1
1
0
0
0
0
0
-1
1
0
4
-1
-1
-1
-1
-1
-1
-1
-1
1
1
1
1
1
1
1
1
0
0
0
0
0
0
0
-1
5
1
-1
-1
1
-1
1
1
-1
-1
1
1
-1
1
-1
-1
1
0
0
0
0
0
0
0
0
11
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
0
1
1
0
0
0
0
0
22
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
0
0
0
1
1
0
0
0
33
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
0
0
0
0
0
1
1
0
44
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
0
0
0
0
0
0
0
1
55
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
0
0
0
0
0
0
0
0
12
1
-1
-1
1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
1
0
0
0
0
0
0
0
0
100
13
1
-1
1
-1
-1
1
-1
1
1
-1
1
-1
-1
1
-1
1
0
0
0
0
0
0
0
0
14
1
-1
1
-1
1
-1
1
-1
-1
1
-1
1
-1
1
-1
1
0
0
0
0
0
0
0
0
15
-1
-1
1
1
1
1
-1
-1
1
1
-1
-1
-1
-1
1
1
0
0
0
0
0
0
0
0
23
1
1
-1
-1
-1
-1
1
1
1
1
-1
-1
-1
-1
1
1
0
0
0
0
0
0
0
0
24
1
1
-1
-1
1
1
-1
-1
-1
-1
1
1
-1
-1
1
1
0
0
0
0
0
0
0
0
25
-1
1
-1
1
1
-1
1
-1
1
-1
1
-1
-1
1
-1
1
0
0
0
0
0
0
0
0
34
1
1
1
1
-1
-1
-1
-1
-1
-1
-1
-1
1
1
1
1
0
0
0
0
0
0
0
0
35
-1
1
1
-1
-1
1
1
-1
1
-1
-1
1
1
-1
-1
1
0
0
0
0
0
0
0
0
45
-1
1
1
-1
1
-1
-1
1
-1
1
1
-1
1
-1
-1
1
0
0
0
0
0
0
0
0
1 0
1 0
1 0
N°
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
Somma
0
0
0
0
0
0
1
0
0
y
12.76
11.73
7.89
14.27
11.13
14.96
11.48
11.94
6.96
10.78
7.42
7.66
10.44
11.25
6.61
11.6
11.25
9.51
13.22
13.57
10.21
10.09
11.61
13.92
10.09
9.86
13.34
0 0
-1 0
1 0
ŷ
12.905
11.887
7.687
14.338
11.177
15.277
11.437
11.909
6.876
10.966
7.246
7.499
10.516
11.338
6.338
11.599
11.714
10.018
12.596
12.638
11.026
10.155
11.429
13.462
10.432
10.319
12.765
0
0
0
0
0
0
ŷ -y
-0.145
-0.157
0.203
-0.068
-0.047
-0.317
0.043
0.031
0.084
-0.186
0.174
0.161
-0.076
-0.088
0.272
0.001
-0.464
-0.508
0.624
0.932
-0.816
-0.065
0.181
0.458
-0.342
-0.459
0.575
1
0
0
0
1
1
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
( ŷ -y)2
0.0210
0.0247
0.0411
0.0046
0.0022
0.1007
0.0018
0.0009
0.0071
0.0348
0.0301
0.0260
0.0058
0.0078
0.0739
0.0000
0.2156
0.2576
0.3889
0.8695
0.6665
0.0043
0.0329
0.2098
0.1169
0.2103
0.3303
3.6852
La varianza del lack-of-fit (27-21 = 6 gradi di libertà) è 0.614.
La varianza dell’errore è stata ottenuta ripetendo altre 5 volte il punto centrale, ed è pari a 0.43.
Il modello viene valutato mediante un test di Fisher, con la variabile F ottenuta come rapporto tra
la varianza del lack-of-fit e la varianza dell’errore misurata sulle cinque ripetizioni:
F = 0.614 / 0.43= 1.4
Il valore critico della F con 1 e 4 d.o.f. al 95% di fiducia é 7.71, e pertanto l’ipotesi nulla viene
accettata. Il modello è valido, entro l’errore sperimentale.
101
I coefficienti sono riportati nella tabella seguente, insieme ai corrispondenti termini sulla
diagonale della matrice di dispersione ed alle conseguenti varianza e deviazione standard.
N°
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
21
21
b0
b1
b2
b3
b4
b5
b11
b22
b33
b44
b55
b12
b13
b14
b15
b23
b24
b25
b34
b35
b45
Coefficiente
11.714
1.289
-0.806
0.637
-1.515
1.223
-0.407
0.118
-0.922
0.233
-0.172
0.290
0.043
0.014
-0.030
-0.073
-0.072
0.175
0.264
-0.215
-0.189
Diagonale
0.1380
0.0556
0.0556
0.0556
0.0556
0.0556
0.4091
0.4091
0.4091
0.4091
0.4091
0.0625
0.0625
0.0625
0.0625
0.0625
0.0625
0.0625
0.0625
0.0625
0.0625
Varianza
0.0593
0.0239
0.0239
0.0239
0.0239
0.0239
0.176
0.176
0.176
0.176
0.176
0.0269
0.0269
0.0269
0.0269
0.0269
0.0269
0.0269
0.0269
0.0269
0.0269
Dev.ST.
0.244
0.154
0.154
0.154
0.154
0.154
0.420
0.420
0.420
0.420
0.420
0.164
0.164
0.164
0.164
0.164
0.164
0.164
0.164
0.164
0.164
Sono segnati in rosso i coefficienti il cui valore assoluto è maggiore di 2.13 volte la deviazione
standard (valore critico della t di Student con 4 gradi di libertà).
Alternativamente si utilizza l’analisi della varianza.
Una tabella ANOVA semplice, dove le somme dei quadrati sono quelle della Y misurata intorno alla
media, della Y stimata dal modello intorno alla media, e della Y stimata intorno alla Y misurata (la
varianza dei residui). Il valore critico di F é 3.86. Il test non passa indicando che almeno uno dei
coefficienti della regressione è significativo.
Sorgente di variazione
Totale
Regressione
Lack-of-fit
Somma
dei quadrati
132.850
129.165
3.685
d.o.f
Varianza
27
21
6
6.15
0.6142
Alternativamente, per ogni coefficiente k si stima la soma dei quadrati come:
102
F
10.01
ŷ i
i1
27
SOMMA k
b k x i,k
c k
21
2
La somma totale è la somma di tutte le SOMMAk.
Le varianze vengono confrontate con la varianza dell’errore. Il valore critico della F di Fisher è 7.71
e solo i coefficienti segnati in rosso hanno n effetto significativo.
Sorgente di variazione
Totale
Coefficiente 1
Coefficiente 2
Coefficiente 3
Coefficiente 4
Coefficiente 5
Coefficiente 6
Coefficiente 7
Coefficiente 8
Coefficiente 9
Coefficiente 10
Coefficiente 11
Coefficiente 12
Coefficiente 13
Coefficiente 14
Coefficiente 15
Coefficiente 16
Coefficiente 17
Coefficiente 18
Coefficiente 19
Coefficiente 20
Coefficiente 21
Residui
Varianza dell’errore
Somma
dei quadrati
3846.807
3705.119
29.928
11.681
7.296
41.314
26.938
2.988
0.249
15.316
0.974
0.535
1.346
0.028
0.003
0.014
0.084
0.081
0.490
1.113
0.740
0.570
3.6852
d.o.f
Varianza
27
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
1
6
4
103
3705.119
29.928
11.681
7.296
41.314
26.938
2.988
0.249
15.316
0.974
0.535
1.346
0.028
0.003
0.014
0.084
0.081
0.490
1.113
0.740
0.570
0.614
0.430
F
8616
69.6
27.2
17.0
96.1
62.6
6.9
0.6
35.6
2.3
1.2
3.1
0.1
0.0
0.0
0.2
0.2
1.1
2.6
1.7
1.3
1.4
5.7 – DISEGNO SULLE PROPRIETÁ PRINCIPALI
I chimici devono pianificare esperimenti per i quali i fattori sono particolari, tipici dei problemi
chimici. Per esempio i chimici usano solventi, in cui far avvenire una reazione o per una estrazione.
In qualche caso la scelta è tra un paio di solventi, e il disegno sperimentale è semplice in quanto
uno dei solventi è il livello basso del fattore “solvente”, l’altro solvente è il livello alto. Ma in molti
altri casi la scelta è tra decine di possibili solventi. I solventi possono servire semplicemente come
diluenti, ma più spesso possono influenzare il trasporto di calore nella massa di reazione,
interagire con i reagenti e influenzare la loro energia e il meccanismo della reazione. Come
scegliere i solventi per i nostri esperimenti?
I chimici usano sostituenti, quando l’esperimento consiste nel determinare la attività
farmacologica o la tossicità di un composto originato da un composto di partenza.
Per esempio si vuole indagare sulla tossicità di composti come
con differenti sostituenti X1 e X2. Dato il numero estremamente elevato di sostituenti possibili, da
innalzare al quadrato, il numero degli esperimenti possibili è incredibilmente alto, e nella sintesi
pratica il chimico si limita a esplorare un numero ridotto di sostituenti appartenenti a famiglie ben
definite.
I chimici spesso devono scegliere dei campioni tra un certo numero di campioni candidati, per
esempio per calibrare una tecnica di determinazione. Quali sono i fattori che descrivono un
campione chimico? Certamente la composizione, non sempre facilmente determinabile, e per un
campione reale riconducibile spesso a centinaia di specie chimiche, centinaia di fattori. A volte un
campione può essere descritto da opportune quantità fisiche, p.e. da uno spettro. Uno spettro
può essere costituito da centinaia di assorbanze, centinaia di fattori.
Rolf Carlson, della Università di Tromso, studiò 103 solventi, e per descriverli utilizzò nove
quantità:
1) punto di fusione (mp);
2) punto di ebollizione (bp)
104
3) costante dielettrica (de);
4) momento dipolare (my);
5) indice di rifrazione (n);
6) il parametro empirico di polarità di Reichardt (E);
7) densità (d);
8) lipofilia (logP);
9) solubilità in acqua (aq).
L’analisi delle componenti principali dei dati auto scalati (Figura 5-58) permise di associare alle
prime due componenti un significato fisico, quello di direzione di polarità alla prima componente,
quello di direzione di polarizzabilità alla seconda componente. Per questa ragione Rolf Carlson
coniò la parola “proprietà principali”, indicando le componenti a cui è associato un significato
chimico-fisico.
Figur 5-58 – Proiezione sulle componenti principali dei 103 solventi di Rolf Carlson
Il disegno sperimentale viene effettuato sulle proprietà principali. La Figura 5-59 (A) mostra i sei
esperimenti selezionati mediante l’algoritmo di Fedorov per un modello quadratico completo.
Nella Figura 5-59 (B) sono indicati gli esperimenti che l’algoritmo di Fedorov sceglierebbe se fosse
libero di operare la scelta all’interno di un dominio sperimentale delimitato dai minimi e dai
massimi degli scores dei 103 solventi. La differenza è grande a destra, dove vi sono pochi solventi
105
ad alta polarità. Tuttavia il determinante dei sei solventi selezionati non è molto inferiore al
determinante della scelta (irreale) B, 0.2 1013 contro 3.3 1013.
Figura 5-59 –Esperimenti (solventi) scelti con un modello quadratico completo (A). Esperimenti che
verrebbero scelti se il dominio sperimentale fosse esplorabile liberamente (B):
Un altro esempio di utilizzo del disegno sulle componenti principali é nella scelta di campioni per
la calibrazione. La spettrometria nel vicino infrarosso (NIR) è una tecnica largamente utilizzata
nel controllo di qualità, sia del prodotto finito che delle materie prime.
La calibrazione viene realizzata su di un certo numero di campioni per i quali è nota la quantità
chimica, risposta che si vuole predire con il modello di calibrazione.
Vi sono generalmente molti campioni disponibili, e occorre decidere quanti e quali devono
essere utilizzati per la calibrazione. La quantità chimica dovrà essere determinata su questi
campioni, generalmente con un metodo lungo e costoso. La scelta dei campioni viene effettuata
utilizzando gli spettri NIR, che si ottengono economicamente e in pochissimo tempo. Poiché
questi spettri son descritti da un numero elevato di variabili, si calcolano le componenti principali
dei dati centrati o autoscalati, e un disegno viene utilizzato per scegliere i campioni. La Figura 560 mostra come i campioni estremi sulle componenti principali (quindi quelli con alto leverage,
suscettibili di essere scelti da qualunque disegno) corrispondono a campioni con valori estremi
delle quantità chimica da determinare.
106
Figura 5-60 – Componenti principali di spettri NIR di 60 farine di soia (in alto) e composizione
delle farine in umidità, proteine e grassi
5.8 – DISEGNI UNIFORMI
Nel caso precedente, e generalmente nei problemi di campionamento, sia per la calibrazione sia
per la descrizione di una classe (in connessione con i metodi di modellamento di classe) si
utilizzano disegni “uniformi” che hanno lo scopo di ottenere una distribuzione dei campioni
(esperimenti) selezionati il più possibile vicina ad una distribuzione uniforma, particolarmente
adatta nel caso di modelli matematici complessi.
Quando (4.8.4) abbiamo introdotto la calibrazione multivariata abbiamo affermato che per lo
sviluppo di un modello di calibrazione è necessario un numero sufficiente di campioni ben scelti.
In calibrazione univariata, nessun sperimentatore (forse) utilizzerebbe una scelta di campioni
quale quella in Figura 5-61, con due oggetti estremi il cui leverage determina la giacitura della
107
retta di regressione, sulla quale hanno un effetto relativamente piccolo i cinquanta oggetti disposti
intorno ad una retta (Figura 5-61 B).
Figura 5-61 – Un disegno non corretto per la regressione univariata (A) e la regressione dopo
eliminazione dei due outliers.
In calibrazione multivariata invece si assiste spesso a scelte non corrette dei campioni con i quali si
sviluppa un modello d regressione. Nel controllo di qualità i campioni che soddisfano il controllo
sono molti, quasi tutti. Invece i campioni non soddisfacenti sono pochi, e a volte è necessario
prepararli appositamente. La Figura 5-62 mostra un esempio reale con circa ottocento campioni
che soddisfano il controllo, racchiusi entro l’ellisse di fiducia al 98%. Questi campioni condizionano
il modello di regressione (in questo caso ottenuto con PLS). Se si osserva l’andamento dei residui
(Figura 5-63) si nota come questi siano mediamente più elevati per i circa quaranta campioni di
qualità non soddisfacente, mentre il modello dovrebbe essere meglio predittivo proprio per i
campioni non soddisfacenti.
108
Figura 5-62 – Regressione PLS con ottocentoquaranta campioni
Figura 5-63 – Residui assoluti per l’esempio precedente e curva di regressione quadratica.
Un disegno uniforme evita di utilizzare troppi oggetti simili. Inoltre la selezionedi campioni
(esperimenti) si presta all’utilizzo di modelli matematici complessi.
Ricorderemo tre tipi di disegni uniformi, quelli di Kennard-Stone, quelli di Puchwein, e quelli di
Naes.
109
5.8.1 – Disegni di Kennard-Stone
I disegni di Kennard-Stone (R.W. Kennard and L.A. Stone, Computer aided design of experiments, Technometrics
11 (1969) 137-148) estraggono da una popolazione di oggetti (esperimenti) candidati un sottoinsieme
con distribuzione il più possibile uniforme. Una variante (R.D. Snee, Validation of regression models:
methods and examples, Technometrics 19 (1977) 415-428)
estrae due sottoinsiemi (disegno di Kennard-
Stone twin), che si utilizzano uno per calcolare un modello, l’altro per la convalida.
L’algoritmo di Kennard-Stone KS viene illustrato con un esempio di soli quindici oggetti descritti da
due variabili:
X
30
45
150
221
360
Y
250
300
61
346
456
X
430
504
561
615
623
Y
630
510
248
495
317
X
631
730
800
851
924
Y
544
589
120
607
123
In pratica l’algoritmo viene applicato alle componenti principali (due - quattro) dei dati centrati o
autoscalati. Spesso gli scores vengono standardizzati, in modo che le distanze abbiano il significat
di distanze di Mahalanobis.
KS lavora sulla matrice delle distanze tra oggetti. I primi due oggetti selezionati sono quelli più
lontani, in questo caso gli oggetti 1 e 15 (Figura 5-64).
i
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
1
0.0
52.2
223.
213.
389.
551.
540.
531.
634.
596.
669.
777.
780.
895.
903.
9
8
0
7
6
0
2
8
1
8
9
3
261.
181.
351.
507.
504.
518.
602.
578.
634.
743.
776.
862.
0
9
5
1
8
6
4
2
8
5
2
5
0.0
293.
447.
634.
571.
451.
636.
537.
681.
784.
652.
888.
7
4
2
8
5
1
8
7
3
7
5
0.0
177.
352.
327.
353.
421.
403.
455.
564.
621.
681.
3
6
1
8
2
0
3
0
5
9
0.0
187.
153.
289.
258.
297.
284.
393.
553.
513.
6
8
2
0
5
9
2
6
7
0.0
141.
403.
229.
367.
218.
302.
630.
421.
0
8
0
7
6
8
1
6
0.0
268.
112.
226.
131.
239.
489.
360.
1
0
7
5
4
6
3
0.0
252.
92.8
304.
380.
271.
461.
2
6
1
5
2
3
4
5
6
7
8
52.2
0.0
223.
261.
9
0
213.
181.
293.
8
9
7
389.
351.
447.
177.
0
5
4
3
551.
507.
634.
352.
187.
7
1
2
6
6
540.
504.
571.
327.
153.
141.
6
8
8
1
8
0
531.
518.
451.
353.
289.
403.
268.
0
6
5
8
2
8
1
8
110
0
896.6
776.5
737.5
655.0
707.9
571.1
383.9
9
634.
602.
636.
421.
258.
229.
112.
252.
0.0
178.
51.5
148.
418.
261.
2
4
1
2
0
0
0
8
5
2
2
1
596.
578.
537.
403.
297.
367.
226.
92.8
227.
292.
264.
368.
0
8
2
8
0
5
7
7
1
3
8
9
1
669.
634.
681.
455.
284.
218.
131.
304.
0.0
108.
456.
228.
1
1
8
7
3
9
6
5
2
7
4
8
1
777.
743.
784.
564.
393.
302.
239.
380.
148.
292.
108.
0.0
474.
122.
2
8
5
3
0
2
8
4
6
5
3
7
2
3
1
780.
776.
652.
621.
553.
630.
489.
271.
418.
264.
456.
474.
0.0
489.
3
9
2
7
5
6
1
6
1
2
8
4
2
1
895.
862.
888.
681.
513.
421.
360.
461.
261.
368.
228.
122.
489.
4
3
5
5
9
7
6
3
5
2
9
8
3
7
1
903.
896.
776.
737.
655.
707.
571.
383.
483.
358.
512.
504.
5
0
6
5
5
0
9
1
9
6
1
9
8
2
178.
0.0
2
51.5
227.
1
483.6
358.1
512.9
504.8
124.0
7
0.0
489.5
124.
489.
0.0
0
5
Figura 5-64 – Gli oggetti dell’ esempio per KS e i primi due oggetti selezionati.
Per ogni oggetto non selezionato si valutano le distanze dagli oggetti selezionati (Figura 5-65).
111
Figura 5-65 – Distanze tra oggetti selezionati e oggetti non selezionati
In questo esempio e a questo punto dell’algoritmo, ogni oggetto ha due distanze dagli oggetti
selezionati 1 e 15.
Si sceglie la distanza minore (Figura 5-66).
Figura 5-66 – Distanze minime degli oggetti non selezionati dagli oggetti selezionati.
Viene selezionato l’oggetto che ha la massima distanza minima. La tabella sottostante indica che è
l’oggetto 6.
Oggetto
2
3
Oggetto selezionato con distanza minima
1
1
112
Distanza minima
52.2
223.9
4
5
1
1
1
1
15
15
15
15
15
15
15
6
7
8
9
10
11
12
13
14
213.8
389.0
551.7
540.6
383.9
483.6
358.1
512.9
504.8
124.0
489.5
Per ogni oggetto non selezionato si valutano le distanze dagli oggetti selezionati (Figura 5-67), che
ora sono 3.
Figura 5-67 – Distanze tra i tre oggetti selezionati e oggetti non selezionati
In questo esempio e a questo punto dell’algoritmo, ogni oggetto ha tre distanze dagli oggetti
selezionati 1, 6 e 15.
Si sceglie la distanza minore (Figura 5-68).
113
Figura 5-68 –– Distanze minime degli oggetti non selezionati dai tre oggetti selezionati.
Viene selezionato l’oggetto che ha la massima distanza minima. La tabella sottostante indica che è
l’oggetto 14.
Oggetto
2
3
4
5
7
8
9
10
11
12
13
14
Oggetto selezionato con distanza minima Distanza minima
1
52.2
1
223.9
1
213.8
6
187.6
6
141.0
15
383.9
6
229.0
15
358.1
6
218.6
6
302.8
15
124.0
6
421.6
L’algoritmo continua con lo stesso meccanismo e seleziona successivamente gli oggetti 8, 9, 3, 4, 5,
13. La Figure 5-69 e 5-70 illustrano la situazione dopo cinque e sette selezioni, ed evidenziano
come gli oggetti selezionati siano ben distribuiti coprendo tutto il dominio sperimentale.
114
Figura 5-69 – Primi cinque oggetti selezionati dall’algoritmo di Kennard-Stone.
Figura 5-70 – Primi sette oggetti selezionati dall’algoritmo di Kennard-Stone.
5.8.2 – Disegni di Puchwein
Anche in questo caso l’algoritmo lavora sugli scores standardizzati delle prime componenti
principali, calcolate con i dati centrati, autoscalati, o dopo opportuno pretrattamento.
L’algoritmo di Puchwein (G. Puchwein, Selection of calibration samples for near-infrared spectrometry by factor
analysis of spectra, Anal. Chem. 60 (1988) 569-573)
inizia con il calcolo delle distanze dal centroide di tutti
115
gli oggetti candidati. L’oggetto più lontano dal centroide è selezionato per primo, e scelto come
oggetto di riferimento.
Si definisce una distanza critica D, che nell’esempio è poco meno di un terzo della distanza
massima dal centroide (0.75).
Gli oggetti con distanza minore di D da un oggetto selezionato in precedenza vengono eliminati.
Nell’esempio di Figura 5-71, l’oggetto più lontano dal centroide è il numero 10, oggetto di
riferimento.
Esso elimina il solo oggetto 1.
Nel passo successivo si sceglie l’oggetto non selezionato e non eliminato più lontano dal centroide.
Figura 5-71 – Primo oggetto selezionato dall’algoritmo di Puchwein
Selezionato
Distanza
dal
centroide
10
43
28
3
2.5532
1.9450
1.8866
1.8466
15
1.7740
50
37
5
49
6
1.6893
1.6024
1.6014
1.5699
1.5208
Eliminato
Distanza dal
selezionato
1
22
4
9
30
17
38
8
0.7125
0.6646
0.5508
0.7130
0.5471
0.4131
0.3802
0.6272
32
16
0.3403
0.5880
Eliminato
Distanza dal
selezionato
24
45
19
48
18
42
33
0.6929
0.3320
0.3794
0.3036
0.4303
0.5858
0.5974
41
0.5833
116
Eliminato
Distanza dal
selezionato
40
0.5763
26
0.5833
31
0.4399
34
0,5671
Successivamente viene selezionato l’oggetto 43, che elimina (vedi la tabella precedente) gli oggetti
22,24 e 40.
Il terzo selezionato è l’oggetto 28, seguito dal 3. La Figura 5-72 mostra la situazione dopo la
selezione di questi quattro oggetti.
Figura 5-72 – Primi quattro oggetti selezionati dall’algoritmo di Puchwein
Figura 5-73 – Primi sei oggetti selezionati dall’algoritmo di Puchwein
La Figura 5-73 mostra la situazione dopo la selezione di sei oggetti. La Figura 5-74 mostra il
risultato finale, quando sono stati scelti 15 oggetti e gli altri sono stati eliminati.
117
Figura 5-74 – Selezione finale (15 oggetti) con l’algoritmo di Puchwein
Se la selezione non è soddisfacente, per esempio se sono stati selezionati troppi oggetti, non ci si
ferma prima (inizialmente l’algoritmo non seleziona oggetti vicini al centroide), ma si ripete con
una distanza critica maggiore. In questo caso, utilizzando una distanza critica 1.25, ogni selezione
elimina più oggetti (Figura 5-75), e la selezione finale (Figura 5-76) è di soli sette oggetti, ben
distribuiti nel dominio sperimentale.
Figura 5-75 – Primi tre oggetti selezionati dall’algoritmo di Puchwein con distanza critica 1.25
118
Figura 5-76 – Selezione finale (7 oggetti) con l’algoritmo di Puchwein e distanza critica 1.25
Analogo all’algoritmo di Puchwain è l’algoritmo di Wootton, che inizia selezionando un oggetto
arbitrario. In Figura 5-77 è stato scelto l’oggetto centrale, il 20. Il primo scelto è quello più vicino
all’ultimo scelto, purché la distanza non sia superiore a quella critica. Quelli ancora più vicini sono
eliminati. Il risultato finale è eguale a quello dell’algoritmo di Puchwain.
Figura 5-77 – Selezioni (1: prima, 2:seconda; 3: decima; 4: finale) con l’algoritmo di Wootton
119
5.8.3 – Disegni di Naes
Meno originali sono i disegni di Naes (T. Næs, The design of calibration in NIR reflectance analysis by clustering,
J. Chemometrics 1 (1987) 121-134).
Essi sono basati sul clustering (Naes suggerisce il complete linkage).
Si fissa un numero di clusters, eguale a quello degli oggetti che si vogliono selezionare (Figura 578).
Figura 5-78 – Dendrogramma (complete linkare, nessun pretrattamento) dei dati usati come
esempio per l’algoritmo di Puchwain.
120
Figura 5-79 – Clusters e oggetti selezionati con l’algoritmo di Naes.
Per ogni cluster (Figura 5-79) si sceglie un oggetto, quello più lontano dal centroide (ma in questo
modo l’algoritmo di Naes tende a lasciare piuttosto sguarnita la zona intorno al centroide).
121
5.9 – DISEGNI PROPORZIONALI
A volte occorre selezionare un insieme di oggetti in modo che la distribuzione degli oggetti
selezionati sia il più possibile simile a quella di tutti gli oggetti disponibili.
5.9.1 Disegni proporzionali mediante funzioni potenziali
Una delle tecniche di disegno proporzionale (C. Pizarro Millan, M. Forina, C. Casolino, R. Leardi,
Chemometrics and Intelligent Laboratory Systems 40 _1998. 33–52)
utilizza la distribuzione di probabilità
calcolata mediante le funzioni potenziali (vedi 4.7.11.8).
La densità di probabilità multivariata in un punto x è calcolata come somma dei contributi degli Ic
oggetti nella categoria c considerata:
2
1 x v x iv
I
I V
1
1
2 k s v
f (x) x, xi
e
I
k s 2
i 1
i 1
v 1 v
dove k é il coefficiente di smoothing e sv é la deviazione standard della variabile v.
La selezione di un subset di M oggetti da un insieme di I > M oggetti è realizzata come segue:
a) Si calcola il potenziale f ( x j )
x , x
I
j
i
per ogni oggetto
i 1
b) Si seleziona l’oggetto con il potenziale maggiore
c) Si ricalcola il potenziale per ogni oggetto o in ogni punto sottraendo il contributo individuale
dell’oggetto selezionato k moltiplicato per un fattore di selezione r, usualmente
r
I
M
(rapporto tra il numero totale di oggetti e il numero M di oggetti da selezionare). Così:
f ( x)
Nuovo
I
x, x i r x, x k
i 1
o avendo selezionato Z M oggetti:
I
f (x) Nuovo x, x i r
i 1
x, x k (z)
Z
z 1
dove z é l’ordine di selezione e k(z) é l’indice dell’oggetto scelto.
122
Gli steps b) e c) sono ripetuti sino a quando sono scelti gli M oggetti desiderati.
La Figura 5-80 mostra la distribuzione di probabilità calcolata con il metodo delle funzioni
potenziali per un insieme di dati uni-variato di 10 oggetti. La Figura 5-81 mostra come il primo
oggetto selezionato sia quello più vicino al picco di densità. La Figura 5-82 mostra l’evoluzione
della densità di probabilità via via che i dieci oggetti previsti sono selezionati.
Figura 5-80 – Distribuzione di probabilità per un insieme di dati uni variato con 100 oggetti
Figura 5-81 – Distribuzione di probabilità per un insieme di dati uni variato con 100 oggetti dopo la
prima selezione (su 10)
123
Figura 5-82 – Distribuzione di probabilità per un insieme di dati uni variato con 100 oggetti dopo le
dieci selezioni
La Figura 5-83 si riferisce ad un set con distribuzione bimodale e 165 oggetti. La prima selezione è
in corrispondenza del picco più alto. L’evoluzione per le dieci selezioni è mostrata nella Figura 584.
Figura 5-83 – Distribuzione di probabilità bimodale per un insieme di dati univariato con 165
oggetti e dopo la prima selezione (su 10)
124
Figura 5-84 – Distribuzione di probabilità bimodale per un insieme di dati univariato con 165
oggetti dopo le dieci selezioni
Figura 5-85 – Distribuzione di probabilità bimodale per un insieme di dati univariato con 165
oggetti e sua ricostruzione (in blu) con i dieci oggetti selezionati
La Figura 5-85 confronta la distribuzione di probabilità con tutti i centosessantacinque oggetti e
quella calcolata con i dieci oggetti selezionati.
Quando il numero di oggetti da selezionare è aumentato a venti l’evoluzione della densità di
probabilità è quella in Figura 5-86.
125
Figura 5-86 – Distribuzioni di probabilità bimodale per un insieme di dati univariato con 165
oggetti nella selezione di 20 oggetti
Figura 5-87 – Distribuzione di probabilità bimodale per un insieme di dati univariato con 165
oggetti e sua ricostruzione (in blu) con i venti oggetti selezionati
La Figura 5-87 confronta la distribuzione di probabilità con tutti i centosessantacinque oggetti e
quella calcolata con i venti oggetti selezionati, più vicina a quella originale della corrispondente in
Figura 5-86.
126
5.9.2 – Disegni statistici
Sono i disegni che selezionano il subset in modo che le sue caratteristiche, medie, varianze,
covarianze, siano il più prossime possibili a quelle dell’intero insieme.
Un procedimento è quello basato sugli algoritmi genetici (GA). Una alternativa è quella di utilizzare
algoritmi tipo Fedorov.
Si procede alla ricerca di un sottoset la cui matrice di varianza-covarianza (Cs) sia il più possibile
simile alla matrice di varianza-covarianza del dataset originale (Cx). La similitudine S tra le due
matrici è calcolata come inverso della somma dei quadrati degli elementi della matrice differenza
D:
D = C x - Cs
Per un dataset con V variabili,
S
1
V V
d ij2
i 1 j1
Viene introdotta una funzione di penalità legata al numero degli oggetti scelti, in modo che in caso
due sottoset abbiano uguale similarità sia favorito quello costituito da meno oggetti. Poiché
questa funzione di penalità deve essere molto leggera, non troppo influente nella ricerca della
soluzione, si usa il logaritmo decimale del numero degli oggetti nel sottoset (n).
La risposta da massimizzare mediante GA è quindi:
risposta
S
log( n )
La popolazione di partenza viene costituita con individui generati casualmente con probabilità di
selezione pari al rapporto tra oggetti da selezionare e oggetti totali, evitando che il caso produca
un numero troppo elevato di oggetti selezionati, vincolo che viene osservato anche durante
l’evoluzione dell’algoritmo GA.
5.9.3 – Un esempio nel campionamento di un olio di oliva DOP
Un campionamento dell’olio di oliva extravergine PDO “Riviera Ligure” con le tre denominazioni
geografiche addizionali, Riviera dei fiori, Riviera del ponente savonese, Riviera di levante è stato
effettuato con lo scopo di mettere a punto un modello basato su di una serie di determinazioni
127
quali NIR, naso artificiale, spettroscopia UV e visibile per la caratterizzazione e la possibilità di
individuare adulterazioni.
La composizione dell’olio di oliva dipende da molti fattori: posizione geografica, composizione del
terreno, esposizione, fertilizzanti, trattamenti con pesticidi, percentuale delle cultivar, mese di
raccolta delle olive, condizioni fitosanitarie, procedimento di raccolta delle olive, tempo e
condizioni della loro conservazione, tecnica di spremitura, condizioni e tempo di conservazione
dell’olio.
La Figura 5-88 mostra i campioni autentici disponibili in una certa annata di produzione.
Figura 5-88 – Campioni autentici disponibili per la caratterizzazione dell’olio di oliva DOP Riviera
Ligure
Una scelta di un numero opportune di campioni é necessaria per evitare un numero troppo eevato
di campioni con caratteristiche simili e per ridurre il costo delle determinazioni.
La selezione è stata effettuata in due fasi. Inizialmente è stato applicato in ogni sottoregione
l’algoritmo di Kennard Stone, sui due fattori latitudine e longitudine, selezionando dieci campioni
in ogni sottoregione.
La Figura 5-89 mostra la distribuzione dei trenta campioni selezionati.
128
Figura 5-89 – Distribuzione dei campioni selezionati mediante algoritmo di Kennard-Stone
Quindi, in ogni sottoregione, é stato applicato il metodo del disegno proporzionale mediante
funzioni potenziali, per rappresentare la densità della produzione, e possibilmente anche
rappresentare fattori di variabilità diversi dai due geografici. Ovviamente i campioni già selezionati
sono stati esclusi dalla ulteriore selezione.
Sono stati selezionati altri trentacinque campioni, di cui quindici nella Riviera dei fiori, che é la
sottoregione con la maggiore produzione di olio di oliva.
I campioni selezionati sono evidenziati nella Figura 5-90.
Figura 5-90 – Distribuzione dei campioni selezionati mediante il metodo delle funzioni potenziali.
La Figura 5-91 mostra la distribuzione di densità di tutti gli oli della Riviera dei fiori (A) e quella
calcolata mediante i campioni selezionati.
129
Figura 5-91 – Densità della produzione stimata con tutti i campioni disponibili (dopo selezione KS) e
con i campioni selezionati mediante le funzioni potenziali.
5.10 – OTTIMIZZAZIONE SEQUENZIALE
Quando non è richiesta la conoscenza dell’andamento della risposta in tutto il dominio
sperimentale, ma si vuole conoscere, e con precisione, la posizione dell’ottimo, allora si possono
utilizzare i metodi della ottimizzazione sequenziale.
Il metodo “one-at-a-time” è un prototipo di ottimizzazione sequenziale, quando viene arricchito,
dopo la prima esplorazione, ripetendo la sequenza. La Figura 5-92 mostra che dopo aver esplorato
il fattore 1 sino al punto di minimo A, e quindi il fattore 2 sino al minimo B, si può continuare lungo
il fattore 1 sino a C, lungo il fattore 2 sino a D e così via.
130
Figura 5-92 – Metodo di esplorazione “un fattore alla volta” modificato
Non si utilizzano nel disegno sperimentale metodi matematici ben noti, i vari algoritmi del
gradiente coniugato, e questo per la semplice ragione che la superficie reale, sperimentale, di
risposta, non è una superficie liscia, ma una superficie molto irregolare a causa dell’errore
sperimentale.
5.10.1 – EVOP
Il metodo EVOP, da EVolutionary OPtimization, (Box, G. E. P. Evolutionary operation: A method for increasing
industrial productivity. Applied Statistics 6(1957) 81-101)
é basato sul movimento di un disegno fattoriale
completo 2k nella direzione di massimo avvicinamento all’ottimo (Figura 5-93).
Utilizzando il modello semplificato
y = b0 + b1 x1 + b2 x2
i due coefficienti sono le derivate della risposta nelle direzioni dei due assi. Se l’ottimo è il
massimo della risposta e i coefficienti sono positivi, il disegno si sposta verso valori maggiori dei
due fattori, lateralmente se uno dei due coefficienti è molto minore dell’altro, diagonalmente se i
due coefficienti non sono troppo diversi.
In questo modo si conservano uno o due esperimenti precedenti. L’evoluzione si arresta quando il
“quadratino” torna indietro, come succede nell’esempio in figura con il decimo quadratino, dopo il
quale si ritorna al nono.
131
Figura 5-93– EVOP
La regola che definisce il movimento del quadrato è molto semplice. I segni dei coefficienti
individuano il quadrante (Figura 5-94), il cui angolo è diviso in tre settori di 30°. Il rapporto è la
tangente di un angolo che è compreso in uno dei tre settori. Un angolo entro i 30° determina lo
spostamento orizzontale del quadrato, un angolo tra 60 e 90° determina lo spostamento in alto. Il
settore intermedio determina lo spostamento in diagonale.
Figura 5-94 – EVOP: scelta della direzione
Il metodo EVOP può essere perfezionato con l’utilizzo di disegni quali quello di Doehlert o quello di
Box-Behnken.
132
5.10.2 – Simplex
Il simplex (simplesso) è la figura geometrica più semplice nello spazio n-dimensionale. In una
dimensione il simplex è un segmento, in due un triangolo, in tre un tetraedro.
La ricerca dell’ottimo mediante il simplex segue regole che con il tempo si sono perfezionate
(Dantzig, G. B. Linear Programming and Extensions. Princeton, NJ: Princeton University Press, 1963. Nelder, J. A. and
Mead, R. "A Simplex Method for Function Minimization."Comp. J. 7, 308-313, 1965, S. N. Deming and S. L. Morgan,
Simplex optimization of variables in analytical chemistry, Anal. Chem. 1973, 45(3), 278A-283).
Figura 5-95 – Il simplex bidimensionale
Nel caso bidimensionale il simplex è generalmente un triangolo equilatero (Figura 5-95). Si inizia
ponendolo in una zona del dominio sperimentale, uno dei vertici o il centro.
Per ciascuno dei vertici si esegue l’esperimento e si misura la risposta.
La risposta è la migliore (la massima o la minima a seconda che l’ottimo sia il massimo o il minimo
della risposta, in Figura 5-95 la risposta considerata migliore è la massima) nel vertice B, la
peggiore nel vertice W, la seconda migliore nel vertice S. Nel caso di più dimensioni tra S e W ci
saranno uno o più altri vertici del simplex.
133
1) Upset
Il primo movimento del simplex è il ribaltamento, Upset, in direzione opposta a W, il vertice
peggiore. Il ribaltamento (come tutte le altre operazioni del simplex) ha equazioni matematiche
molto semplici (Figura 5-96).
Figura 5-96 – Simplex bidimensionale: ribaltamento
La risposta viene misurata in U. Si possono verificare quattro casi.
Caso U1
U è migliore di B:
W<S<B<U
Si va al punto 2, Ampliamento
Figura 5-97 – Simplex bidimensionale, Ribaltamento caso U1
134
Caso U2
U è peggiore di B, ma è migliore di S:
W<S<U<B
UBS è il nuovo simplex con cui si torna a Upset. Il nuovo punto ribaltato sarà opposto a S.
Figura 5-98 – Simplex bidimensionale, Ribaltamento caso U2
Caso U3
U è peggiore di S, ma è migliore di W:
W<U<S<B.
Si va al punto 3, Contrazione Upset
Figura 5-99 – Simplex bidimensionale, Ribaltamento caso U3
135
Caso U4
U è peggiore di W, quindi di tutti e tre i vertici del simplex originale U<W<S<B
Si va al punto 4, Contrazione
Figura 5-100 – Simplex bidimensionale, Ribaltamento caso U4
2) Ampliamento
Nel caso U1, la direzione verso U è molto promettente, e viene esplorata ulteriormente,
allargando il simplex (Figura 5-101).
Figura 5-101 – Simplex bidimensionale, Allargamento
136
Sono previste due possibilità.
Caso U1-A1
Il punto A è migliore di U (Figura 5-102).
La direzione si è rivelata ottima.
ABS è il nuovo simplex con cui si torna a Upset.
Figura 5-102 – Simplex bidimensionale, Allargamento caso A1
Caso U1-A2
Il punto A NON è migliore di U (Figura 5-103). La direzione buona da B verso U, mostra poi un
peggioramento. UBS è il nuovo simplex con cui si torna a Upset.
Figura 5-103 – Simplex bidimensionale, Allargamento caso A2
137
3) Contrazione upset
Poiché W<U<S<B la ricerca procede nella direzione di U, migliore di W, ma dimezzando in quanto
U è peggiore sia di B che di S.
La Figura 5-104 mostra la posizione del nuovo esperimento CU (Contracted Upset)
Figura 5-104 – Simplex bidimensionale, Ribaltamento con contrazione
Sono previste due possibilità.
Caso U3-CU1
S<CU (Figura 5-105)
CU-B-S è il nuovo simplex con cui si torna a Upset.
Figura 5-105 – Simplex bidimensionale, Ribaltamento con contrazione, Caso CU1
138
Caso U3-CU2
CU<S (Figura 5-106)
Figura 5-106 – Simplex bidimensionale, Ribaltamento con contrazione, Caso CU2
Si effettua una ulteriore contrazione verso il vertice B (contrazione al vertice dopo upset e
contrazione) (Figura 5-107):
Figura 5-107 – Simplex bidimensionale, Ribaltamento con contrazione, Caso CU2, e contrazione al
vertice
P1-P2-B è il nuovo simplex con cui si torna a Upset.
139
4) Contrazione
Poiché U<W<S<B la ricerca si affina all’interno del simplex di partenza, dimezzandolo
La Figura 5-108 mostra la posizione del nuovo esperimento C (Contracted)
Figura 5-108 – Simplex bidimensionale, Contrazione
Sono previste due possibilità.
Caso U4-C1
S<C (Figura 5-109)
C-B-S è il nuovo simplex con cui si torna a Upset.
Figura 5-109 – Simplex bidimensionale, Contrazione, Caso C1
140
Caso U4-C2
C<S (Figura 5-110)
Figura 5-110 – Simplex bidimensionale, Contrazione, Caso C2
Si effettua una ulteriore contrazione verso il vertice S (contrazione al vertice dopo upset e
contrazione) (Figura 5-111):
Figura 5-111 – Simplex bidimensionale, Contrazione, Caso C2, e contrazione al vertice
Q1-Q2-B è il nuovo simplex con cui si torna a Upset.
141
La Figura 5-112 raccoglie tutti i possibili movimenti del simplex. Nella Figura 5-113 è riassunta la
strategia di movimento.
Figura 5-112 – Simplex bidimensionale: Schema di tutti i possibili movimenti
Figura 5-113 – Strategia di movimento del simplex
142
Si noti ancora come in tutte le operazioni di calcolo di una nuova coordinata dalle coordinate di W,
S, B, la somma dei coefficienti è sempre 1 (Figure 5-96, 5-101, 5-104, 5-107, 5-108, 5-111).
La ottimizzazione con simplex dipende grandemente dalla posizione iniziale del simplex e dalla sua
dimensione di partenza. L’effetto di questa può essere valutato dall’esempio nella Figura 5-114.
Figura 5-114 – Evoluzione del simplex a partire da simplex iniziali di dimensioni diverse
La tabella seguente riporta le successioni dei movimenti per i simplex in Figura 5-114, movimenti
che sono indicati con
143
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
1
R
R
R
R
R
R
R
R
R
R
R
R
R
R
R
R
R
R
A
CV
RCV
CV
2
R
R
R
R
R
R
R
A
CV
R
RCV
RCV
C
3
R
A
CV
R
A
CV
R
A
CV
R
R
A
RCV
RCV
A
4
CV
CV
R
R
R
CV
R
RCV
RCV
Infine occorre rilevare che nel caso di superfici complesse, è bene porre il simplex di partenza ai
vari vertici del dominio sperimentale e al centro, per ridurre la possibilità che il simplex si arresti in
un ottimo relativo.
144
5.11 – MISCELE
Le miscele sono molto importanti in chimica. Sono miscele di composti puri, ma sopratutto
miscele di miscele. Un profumo è una miscela di essenze, ciascuna delle quali è una miscela di
moltissimi composti puri. Un wisky blended è una miscela di wiskies diversi. Nello “assemblage”
dei vini si miscelano vini diversi con lo scopo di compensarne i difetti.
In un esperimento con miscele, i fattori sono le differenti proporzioni dei costituenti della miscela.
Il fatto che la somma delle proporzioni dei differenti fattori debba essere eguale a 100% complica
il disegno sperimentale e l’analisi dei risultati sperimentali. Il dominio sperimentale non è
rettangolare, come generalmente per fattori senza vincoli, ma ha forma triangolare (Figura 5-115),
tetraedrica, ipertetraedrica.
Figura 5-115 – Diagramma ternario
Il diagramma ternario permette di associare facilmente ad ogni punto le percentuali dei
costituenti, tracciando per ogni costituente la parallela per A all’asse di B, per B all’asse di C, per C
all’asse di A.
In questo dominio (considereremo prevalentemente miscele ternarie) dovremo ricercare,
mediante un opportuno disegno sperimentale, l’ottimo della risposta e conoscere come varia la
risposta nel domino sperimentale (Figura 5-116).
Oltre a questo vincolo primario possono esserci (caso piuttosto frequente) vincoli ulteriori, come
nella Figura 5-117, e naturalmente ciò complica ancora di più la situazione.
145
Figura 5-116 – Dominio sperimentale con linee di isorisposta
Figura 5-117 – Dominio sperimentale limitato ad una parte del dominio tetraedrico
Occorre ancora considerare che sono possibili tre casi, che corrispondono a:
1) la variabile risposta è studiata solo in funzione delle percentuali dei costituenti;
2) la variabile risposta è studiata anche in funzione della quantità totale di miscela;
3) la variabile risposta è studiata anche in funzione di altri fattori.
5.11.1 – Reti di Scheffé
La variabile risposta è studiata solo in funzione delle percentuali dei costituenti.
146
Il disegno sperimentale per le miscele, sia per le sue peculiarità che per la sua importanza pratica,
ha sviluppato strategie e terminologie speciali, iniziando con il lavoro pionieristico di Henry
Scheffé. Per esplorare il dominio sperimentale è desiderabile una distribuzione uniforme,
equispaziata, degli esperimenti. Le “reti” di Sheffé, per una miscela di q componenti, sono
caratterizzate dal valore di m, numero delle divisioni della percentuale di ogni costituente. Una
rete (q,m) studia m+1 livelli equispaziati dei costituenti, con xi =
1/m, 2/m,….1. i indica il
costituente (Figura 5-118).
Figura 5-118 – Reti di Scheffé (m= 1, 2, 3, 4)
La risposta è codificata, come in Figura 5-119.
Figura 5-119 – Codifica della risposta nelle reti di Scheffé
147
La rete di Scheffé lineare (3,1), con m=1, prevede tre esperimenti, con xi = 1/m =.1.
La rete quadratica (3,2) prevede sei esperimenti, con xi = 1/2 e 1.
Gli esperimenti sono indicati con le notazioni:
xrwz
che indicano le proporzioni dei costituenti, analogamente a quanto visto per la risposta in Figura 5119. Pertanto, per esempio, x1 indica A puro, x112 indica l’esperimento con 2/3 di A e 1/3 di B, x23
indica l’esperimento con 50% di B e 50% di C.
Un polinomio di grado m con q variabili x1, x2 …xq, è detto polinomio (q,m) o polinomio canonico,
che ha la qualità di poter invertire la matrice di informazione corrispondente..
I polinomi canonici più semplici sono:
q
i xi
y
1) lineare:
i 1
q
i 1
3) cubico completo: y
q
i xi ij xi x j
y
2) quadratico:
q
q
i 1 j i
q
q
q
q
i xi ij xi x j
i 1
i 1 ji
q
i 1 ji k i, j
ijk x i x j x k
q
q
ij xi x j (xi x j )
i 1 j i
A prima vista sorprende non vedere tra i coefficienti la costante. Ma si osservi come nella
espressione usuale
q
y 0 i xi
i 1
la costante può essere sostituita dalla somma dei fattori:
q
q
i 1
i 1
y 0 xi i xi
q
( 0 i ) xi
i 1
q
i xi
i 1
e scomparire nei termini lineari.
q
Del resto il vincolo
xi
1 permette di modificare agevolmente i polinomi canonici, per
i 1
esempio arrivando nel caso del polinomio lineare a modelli del tipo:
y
3
i xi 1x1 2x 2 3 (1 x1 x 2 ) 3 (1 3 ) x1 (2 3 ) x 2
I 1
Nel caso del modello quadratico (Modello 1) con tre componenti (q=3):
y
3
3
3
i x i ij x i x j
i 1
i 1 j i
la eliminazione del componente 3 porta alla equazione (Modello 2):
148
y 0 1x1 2 x 2 12 x1 x 2 11 x12 22 x 22
e riesce:
δ0 = β3
δ1 = β1 – β3 + β13
δ2 = β2 – β3 + β13
δ12 = β12 – β13 – β23
δ11 = - β13
δ22 = - β23
In uno studio sono stati ottenuti i seguenti risultati.
La matrice del modello 1: y
x1
1
0
0
0.5
0.5
0
x2
0
1
0
0.5
0
0.5
x3
0
0
1
0
0.5
0.5
x1x2
0
0
0
0.25
0
0
1x1 2 x 2 3 x 3 12 x1 x 2 13 x1 x 3 23 x 2 x 3 é
x1x3
0
0
0
0
0.25
0
x2x3
0
0
0
0
0
0.25
Y
80
10
63
70
196.5
161.5
La matrice del modello 2: y 0 1x1 2 x 2 12 x1 x 2 11 x12 22 x 22 é
Cost x1
x2
x1x2
x12
x22
Y
1
1
0
0
1
0
80
1
0
1
0
0
1
10
1
0
0
0
0
0
63
1
0.5
0.5
0.25
0.25
0.25
70
1
0.5
0
0
0.25
0
196.5
1
0
0.5
0
0
0.25
161.5
Si stimano i coefficienti per i due modelli:
β1
80
β2
10
β3
63
β12
100
β13
500
β23
500
149
δ0
63
δ1
517
δ2
447
δ12
-900
δ11
-500
δ22
-500
La matrice di dispersione per il modello 1 è:
1
0
0
-2
-2
0
0
1
0
-2
0
-2
0
0
1
0
-2
-2
-2 -2 0
24 4
4
-2 0
-2 4
24 4
0
-2 -2 4
4
24
Ad essa corrispondono i coefficienti di correlazione tra i coefficienti β:
1
0
0
-0.408 -0.408 0
0
1
0
-0.408 0
-0.408
0
0
1
0
-0.408 -0.408
-0.408 -0.408 0
1
0.167
0.167
-0.408 0
-0.408 0.167
1
0.167
0
-0.408 -0.408 0.167
0.167
1
La matrice di dispersione per il modello 2 è:
1 -3 -3 4
2
2
-3 26 9
-28 -24 -6
-3 9
26 -28 -6 -24
4 -28 -28 64 24 24
2 -24 -6 24 24 4
2 -6 -24 24 4
24
Ad essa corrispondono i coefficienti di correlazione tra i coefficienti δ:
1
-0.588 -0.588 0.5
0.408 0.408
-0.588 1
0.346 -0.686 -0.961 -0.240
-0.588 0.346 1
-0.686 -0.240 -0.961
0.5
-0.686 -0.686 1
0.612 0.612
0.408 -0.961 -0.240 0.612 1
0.167
0.408 -0.240 -0.961 0.612 0.167 1
Ad ambedue i modelli corrisponde una matrice hat identità (i modelli matematici restituiscono
perfettamente i valori della risposta nei sei esperimenti), e la matrice di dispersione ha eguale
determinante, ma i risultati forniti dal modello 1 sembrano più facilmente interpretabili. Inoltre il
modello 2 mostra una elevata correlazione tra i coefficienti δ, in particolare quelli tra le variabili ed
i loro quadrati.
150
La Figura 5-120 mostra le linee di isorisposta nel dominio sperimentale.
La Figura 5-121 mostra la funzione di informazione nel dominio sperimentale, dove ha valore 1 in
corrispondenza dei sei punti sperimentali. Ovviamente la funzione di nformazione non dipende
dalla risposta.
Figura 5-120 – Linee di isorisposta per l’esempio
Figura 5-121 – Funzione di informazione
Una alternativa ai due modelli che abbiamo visto, uno con le tre variabili di composizione e l’altro
con due delle tre variabili, è la rotazione su due “variabili matematicamente indipendenti”. La
151
rotazione avviene dopo centraggio sul punto centrale della miscela, di composizione 0.333, 0.333,
0.333 (Figura 5-122).
Figura 5-122 –Trasformazione delle coordinate
Nel nuovo spazio il dominio sperimentale continua ad essere triangolare. La matrice del modello:
y 0 1x1 2 x 2 12 x1 x 2 11 x12 22 x 22
con la colonna della risposta è:
Cost x1
1
0.3175
x2
0.5
x1x2
0.15875
x12
x22
0.100806 0.25
Y
80
1
0.3175
-0.5
-0.15875
0.100806 0.25
10
1
-0.5485 0
0
0.30085
0
63
1
0.3175
0
0.100806 0
70
1
-0.1175 0.25
1
-0.1175 -0.25 0.029375
0
-0.029375 0.01381
0.01381
0.0625 196.5
0.0625 161.5
Si calcolano i coefficienti:
ϒ0
177.754
ϒ1
-138.251
ϒ2
70
ϒ12
0
ϒ11
-633.487
ϒ22
-100
152
La matrice hat è la matrice identità, e anche questo modello passa perfettamente attraverso i
punti sperimentali.
La matrice di dispersione
0.6310
0.0343
0
0
-2.3671
-2.0776
0.0343
3.2250
0
0
3.9845
-5.2236
0
0
4.4078
-12.1813 0
0
0
-12.1813 52.8471
0
0
0
24.0383 -2.6177
-2.0776 -5.2236 0
0
-2.6177
-2.3671 3.9845
0
0
24
corrisponde alla matrice dei coefficienti di correlazione tra i coefficienti ϒ:
1
0.0240
0
0
-0.6078 -0.5339
0.0240
1
0
0
0.4525
0
0
1
-0.7981 0
0
0
-0.7981 1
0
0
0
0
1
-0.1090
-0.5339 -0.5937 0
0
-0.1090 1
-0.6078 0.4525
-0.5937
0
La trasformazione sulle variabili matematicamente indipendenti appare pertanto un esercizio
inutile, in quanto si perde completamente il contatto con le variabili originali (le percentuali dei
costituenti) senza alcun reale vantaggio.
5.11.2 – Disegni di Snee-Marquardt
Sono disegni che si utilizzano per individuare i costituenti importanti, tra i q costituenti delle
miscele. In Figura 5-123 (per il caso di q =3) si nota un esperimento centrale, tre esperimenti ai
vertici, tre esperimenti laterali, x12 x13 x23, e tre esperimenti interni, x111123 x122223 x123333 per i quali
uno dei tre costituenti è a livello 4/6, gli altri due a livello 1/6. I tre esperimenti laterali vengono
utilizzati quando si ritiene che l’assenza totale di un costituente ha un grande effetto sulla risposta.
Nell’ esempio seguente sono stati utilizzati i dieci punti con diversi modelli:
1) y
2) y
3) y
4) y
5) y
1x1 2 x 2 3 x 3
1x1 2 x 2 3 x 3 12 x1 x 2 13 x1 x 3 23 x 2 x 3
0 1x1 2 x 2 12 x1 x 2
0 1x1 3 x 3 13 x1 x 3
0 2 x 2 3 x 3 23 x 2 x 3
153
6) y 1x1 2 x 2 3 x 3 12 x1 x 2 13 x1 x 3 23 x 2 x 3 11 x12 22 x 22 33 x 32
ottenendo i risultati della seguente tabella, in cui Y indica la risposta misurata, e nell’ultima riga è
riportata la deviazione standard della differenza tra Y e la risposta predetta dal modello.
Il modello 2) fornisce sia i valori corretti della risposta sia quelli dei coefficienti: i coefficienti β 13 e
β23 sono praticamente nulli. Il coefficiente β3 può essere incorporato in β0, β1 e β2, fornendo lo
stesso risultato del modello 3). Il risultato con i modelli 4) e 5) indica che i componenti 1 e 2 sono
essenziali. Il risultato con il modello 6) è buono per quanto riguarda la predizione, ma i coefficienti
di regressione non danno indicazioni circa la rilevanza dei costituenti. Le linee di isorisposta per il
modello 2) sono mostrate nella Figura 5-124.
Y
80.
63.
30.
96.5
55.
46.5
79.95
71.4
46.6
68.8
St.Dev.
1
89.815
72.815
28.704
81.315
59.260
50.759
76.797
68.297
46.241
63.778
7.11
2
80
63
30
96.5
55
46.5
79.945
71.445
46.611
68.778
0.00006
3
80.
63.
30.
96.5
55.
46.5
79.95
71.4
46.6
68.8
0.00000
4
89.875
72.807
28.764
81.341
59.167
50.785
76.777
68.294
46.221
63.747
7.11
5
89.807
72.875
28.764
81.341
59.285
50.667
76.794
68.277
46.2212
63.747
7.11
6
80.00
63.01
30.01
96.51
55.01
46.51
79.95
71.46
46.62
68.79
0.009
Figura 5-123 – Disegni di Snee-Marquardt
154
Figura 5-124 – Linee di isorisposta per l’esempio di disegno di Snee-Marquardt e il modello 2)
5.11.3 – Disegni di Phan-Tan-Luu
Sono disegni che si utilizzano per individuare il modello più adeguato, e sono basati su di uno
studio sequenziale, che prevede oltre agli esperimenti utilizzati per calcolare i coefficienti del
modello, una serie di esperimenti per il controllo del modello stesso.
La Figura 5-125 mostra per il caso di tre costituenti, la successione degli esperimenti
Figura 5-125 – Disegni di Phan-Tan-Luu, 1: lineare, 2: quadratico, 3: cubico ridotto o speciale, 4:
cubico completo; 5: quartico.
155
5.11.4 – Il caso di ulteriori vincoli
Frequentemente oltre al vincolo costituito dal fatto che la somma delle percentuali dei costituenti
deve essere eguale a 1, nello studio di miscele occorre considerare altri vincoli.
In alcuni casi, come nell’esempio in Figura 5-126, la soluzione è semplice in quanto il dominio
sperimentale è riconducibile a quello ordinario delle miscele, e può essere trattato analogamente.
Figura 5-126 – Vincoli riconducibili a un dominio sperimentale triangolare
In altri casi il dominio sperimentale ha una geometria complessa.
La Figura 5-127 mostra un dominio ridotto, dovuto ai vincoli A<0.6, D<0.5.
Figura 5-127 – Dominio sperimentale tetraedrico e dominio ridotto ad esaaedro da vincoli
In casi come questo non esistono disegni sperimentali disponibili. Una possibilità è quella di
ottenere un disegno uniforme, a partire da una serie di esperimenti candidati nel dominio
156
sperimentale, per esempio mediante l’algoritmo di Kennard-Stone. Un’altra possibilità è quella di
utilizzare un metodo tipo Fedorov o algoritmi genetici per individuare il disegno D-ottimo.
Nel caso del dominio ridotto in Figura 5-127, si desidera selezionare dieci esperimenti, un disegno
saturo con i quattro termini lineari e le sei interazioni del secondo ordine. Si sono individuati 56
esperimenti esplorando i costituenti con passo 0.2:
Esperimento
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
……
A
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
0.0
B
0.0
0.0
0.0
0.0
0.0
0.0
0.2
0.2
0.2
0.2
0.2
0.4
0.4
0.4
0.4
0.6
0.6
0.6
0.8
0.8
C
0.0
0.2
0.4
0.6
0.8
1.0
0.0
0.2
0.4
0.6
0.8
0.0
0.2
0.4
0.6
0.0
0.2
0.4
0.0
0.2
D
1.0
0.8
0.6
0.4
0.2
0.0
0.8
0.6
0.4
0.2
0.0
0.6
0.4
0.2
0.0
0.4
0.2
0.0
0.2
0.0
Mediante un algoritmo di Fedorov doppio, in cui in ogni iterazione si scambiano uno o due
esperimenti, si sono individuati 10 esperimenti D-ottimi (l’algoritmo ha girato dieci volte con
diverso seme per la generazione di numeri casuali, in modo da avere una ragionevole probabilità
di individuare il vero ottimo). Successivamente si sono utilizzati 256 esperimenti candidati,
esplorando i costituenti con passo 0.05. Il questo caso l’algoritmo di Fedorov iniziava non con una
selezione casuale, ma con gli esperimenti prescelti con passo 0.2. Anche in questo caso l’algoritmo
è stato applicato molte volte, e il disegno D-ottimo scelto è quello costituito dai primi dieci
esperimenti (Figura 5-128) nella tabella seguente:
Esperimento
1
2
3
4
A
0
0
0.5
0
B
0
0
0.5
0.4
C
1
0.5
0
0.6
157
D
0
0.5
0
0
5
6
7
8
9
10
4a
5a
0.6
0.3
0.5
0
0
0.5
0
0.6
0
0.5
0
0.5
1
0
0.6
0.1
0.1
0
0
0
0
0.5
0.4
0
0.3
0.2
0.5
0.5
0
0
0
0.3
Gli ultimi due esperimenti, simmetrici agli esperimenti 4 e 5 per i costituenti B e C, forniscono un
insieme altrettanto buono, e vi sono ulteriori casi di scelte equivalenti.
Figura 5-128 – Esperimenti selezionati nel dominio sperimentale ridotto
5.11.5 – Fattori: costituenti e quantità totale della miscela
Il dominio sperimentale ha forma ovviamente più complessa. La Figura 5-129 mostra il caso di una
miscela ternaria e la quantità totale della miscela esplorata a tre livelli (per poter valutare
eventuale non linearità. Per un modello con la costante (corrispondente al valore nel punto
centrale con la quantità totale a livello 0), quattro termini lineari e sei interazioni, occorrono 11
esperimenti. In Figura 5-129 ne sono indicati 12: quello centrale può non essere utilizzato per il
modello, ma per la convalida.
Ovviamente questa situazione rientra tra quelle considerate nel capitoletto seguente.
158
Figura 5-129 – Dominio sperimentale per una miscela di tre costituenti e la quantità totale
esplorata a tre livelli.
5.11.6 – Fattori: costituenti e altri (fattori di processo)
Si possono avere ovviamente moltissime combinazioni, di numero di costituenti e di fattori
addizionali, detti fattori di processo. Le Figure da 5-130 a 5-133 mostrano alcune possibilità di
disegno per il caso di tre fattori d processo e miscele di tre componenti. Il numero di esperimenti
varia da 28 a 56, e indica la possibilità di utilizzare modelli molto complessi. Lo studio può essere
frazionato, nella fase di modellamento, considerando livelli costanti per le variabili di processo, o
per le miscele.
La Figura 5-130 mostra un disegno combinato definito come combinazione di un simplex senza
centroide e di un fattoriale completo per i fattori di processo. Il numero di esperimenti è 48.
La Figura 5-131 mostra l’alternativa con 56 esperimenti, combinazione di una simplex con
centroide e di un fattoriale completo per i fattori di processo.
La Figura 5-132 mostra il disegno con 28 esperimenti, analogo al disegno in Figura 5-130, ma con
un disegno fattoriale frazionato per i fattori di processo.
La Figura 5-133 mostra come è possibile utilizzare il disegno fattoriale frazionato per i fattori di
processo, alternando disegni “upper-half” con disegni “lowel-half”.
159
Figura 5-130 - Disegno combinazione di un simplex e di un fattoriale completo per i fattori di
processo
Figura 5-131 - Disegno combinazione di un simplex con centroide e di un fattoriale completo per i
fattori di processo
160
Figura 5-132 - Disegno combinazione di un simplex con centroide e di un fattoriale frazionato per i
fattori di processo
Figura 5-133 - Disegno combinazione di un simplex con centroide e di un fattoriale frazionato per i
fattori di processo, con alternanza di disegni upper-half e lower-half.
161
5.11.7 – Alcuni esempi
Vengono nel seguito illustrati i principi del disegno sperimentale per miscele con esempi che
utilizzano strategie alternative a quelle esposte precedentemente, e che possono pertanto dare
un’idea della varietà di possibilità offerte, sempre nel quadro della scelta di insiemi di esperimenti
di qualità.
5.11.7.1 - Esperimento di Claringbold
L’esempio seguente (esperimento di Claringbold, da Laura F. Ruano, Tesi di dottorato, Barcellona, Istituto Chimico
di Sarria, Direttore di tesi Xavier Tomàs Morer)
considera la somministrazione di una miscela di tre ormoni
a dodici ratti. I fattori sono le percentuali dei tre ormoni, e la quantità totale, selezionata ai livelli
1, 2 e 4. La risposta era una opportuna trasformata della percentuale di ratti che diedero risposta
al trattamento.
Per ogni livello della quantità totale si utilizzò il disegno simplex in Figura 5-134.
Figura 5-134 – Disegno per le miscele nell’esperimento di Claringbold.
La tabella seguente mostra i livelli per i 30 esperimenti, e il corrispondente valore della risposta.
Esperimento
1
2
3
4
5
6
7
8
A
1
1
1
0
0
0
0
0
B
0
0
0
1
1
1
0
0
C
0
0
0
0
0
0
1
1
q
1
2
4
1
2
4
1
2
Y
24.09
40.20
65.61
49.80
49.80
81.70
30.00
45.00
162
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
0
0.333
0.333
0.333
0.667
0.667
0.667
0.667
0.667
0.667
0.333
0.333
0.333
0.333
0.333
0.333
0.
0
0
0
0
0
0
0.333
0.333
0.333
0.333
0.333
0.333
0
0
0
0.667
0.667
0.667
0
0
0
0.667
0.667
0.667
0.333
0.333
0.333
1
0.333
0.333
0.333
0
0
0
0.333
0.333
0.333
0
0
0
0.667
0.667
0.667
0.333
0.333
0.333
0.667
0.667
0.667
4
1
2
4
1
2
4
1
2
4
1
2
4
1
2
4
1
2
4
1
2
4
40.20
24.09
30.00
49.80
8.30
35.26
60.00
8.30
30.00
60.00
35.26
35.26
60.00
30.00
40.20
40.20
24.09
35.26
54.74
35.26
35.26
49.80
Il modello
y 1x1 2 x 2 3 x 3 12 x1 x 2 13 x1 x 3 23 x 2 x 3 1q x1 q 2q x 2 q 3q x 3 q
é risultato il migliore tra i modelli usuali (modelli alternativi con le trasformate:
)
hanno dato risultati leggermente migliori). Le linee di isorisposta in Figura 5-135 indicano
chiaramente che il massimo effetto si ha ad elevate quantità totale e percentuale di B.
163
Figura 5-135 – Linee di isorisposta per l’esperimento di Claringbold
La tabella ANOVA
Sorgente
variazione
Totale
di d.o.f.
30
Somma
quadrati
56123.72
dei Varianza
Media
29
7523.45
Regressione
9
6659.44
739.94
Errore
20
864.01
43.20
F
17.13
indica che il modello è significativo (Fcritico = 2.39).
Quando si considerano i coefficienti, la incertezza si ottiene dalla diagonale della matrice di
dispersione e dalla varianza dell’errore.
Coefficiente
b1
b2
b3
b12
b13
b23
b1q
b2q
b3q
Valore
4.47
34.05
35.08
-50.57
-26.86
-47.02
16.00
10.83
2.26
Deviazione standard
6.16
6.16
6.16
15.82
15.82
15.82
2.15
2.15
2.15
164
Tenendo conto del valore critico della t di Student appare evidente che tre coefficienti non sono
significativi.
5.11.7.2 – Esperimento di Cornell
Questo esperimento, la formulazione di una bevanda tropicale, è stato descritto da John H.
Cornell, Experiments with mixtures, Wiley, 1990.
Una bevanda tropicale è costituita da una miscela di succhi di melone d’acqua, arancia, ananas e
pompelmo. La percentuale del succo di melone non può essere superiore all’80%. La variabile
risposta è un punteggio mediato su quaranta assaggiatori.
Gli sperimentatori decidono di utilizzare il modello:
y 1x1 2 x 2 3 x 3 4 x 4 12 x1 x 2 13 x1 x 3 14 x1 x 4 23 x 2 x 3 24 x 2 x 4 34 x 3 x 4
che richiede dieci esperimenti, indicati nella Figura 5-136.
Gli esperimenti, insieme alle colonne della matrice del disegno, sono i primi dieci della tabella
successiva. Con essi è stato costruito un primo modello, saturo. Successivamente, sulla base dei
risultati del primo modello, sono stati aggiunti altri sei esperimenti, in zone ritenute di particolare
interesse.
Figura 5-136 – Disegno per le miscele di succhi
E
1
2
3
4
1
0.80
0.80
0.80
0.40
2
0.20
0
0
0.20
3
0
0.20
0
0.20
4
0
0
0.20
0.20
12
0.16
0
0
0.08
13
0
0.16
0
0.08
14
0
0
0.16
0.08
165
23
0
0
0
0.04
24
0
0
0
0.04
34
0
0
0
0.04
Y
6.50
6.96
6.00
6.82
Y*
6.5
6.96
6.
6.82
Y **
6.70
6.97
6.01
6.88
5
6
7
8
9
10
11
12
13
14
15
16
0
0
0
0
0
0
0.80
0.80
0.80
0.40
0.40
0.40
1.00
0
0.50
0
0.50
0
0.10
0
0.10
0.30
0.30
0
0
1.00
0.50
0
0
0.50
0.10
0.10
0
0.30
0
0.30
0
0
0
1.00
0.50
0.50
0
0.10
0.10
0
0.30
0.30
0
0
0
0
0
0
0.08
0
0.08
0.12
0.12
0
0
0
0
0
0
0
0.08
0.08
0
0.12
0
0.12
0
0
0
0
0
0
0
0.08
0.08
0
0.12
0.12
0
0
0.25
0
0
0
0.01
0
0
0.09
0
0
0
0
0
0
0.25
0
0
0
0.01
0
0.09
0
0
0
0
0
0
0.25
0
0.01
0
0
0
0.09
5.80
5.65
5.93
5.05
5.36
5.72
7.25
6.20
6.47
7.21
6.53
6.88
5.8
5.65
5.93
5.05
5.36
5.72
6.74
6.49
6.25
7.24
6.34
6.82
5.79
5.65
5.89
5.05
5.38
5.73
6.84
6.50
6.35
7.33
6.45
6.78
1: Melone: 2: Arancia 3: Ananas 4: Pompelmo
*: per gli esperimenti 11-16 sono valori predetti con il primo modello calcolato con i primi 10 esperimenti
**: tutti i valori sono calcolati con il secondo modello.
Le ultime due colonne riportano i valori calcolati della risposta con i due modelli.
La tabella seguente riposta i valori dei coefficienti per i due modelli.
Primo modello Secondo modello
5.802
5.871
5.8
5.795
5.65
5.652
5.05
5.052
4.365
5.288
7.4275
7.125
2.1775
1.903
0.82
0.681
-0.26
-0.155
1.48
1.532
La Figura 5-137 mostra la risposta nei piani degli esperimenti aggiuntivi.
Figura 5-137 – Linee di isorisposta per il secondo modello nei piani dei sei esperimeni addizionali.
166
J. Cornell utilizza in questo esperimento un procedimento semplice per il calcolo dei coefficienti di
regressione.
Il sistema sufficiente di equazioni:
1) 0.80 β1 + 0.20 β2 + 0 β3 + 0 β4 + 0.16 β12 + 0 β13 + 0 β14 + 0 β23 + 0 β24 + 0 β34 =6.50
2) 0.80 β1 + 0 β2 + 0.20 β3 + 0 β4 + 0 β12 + 0.16 β13 + 0 β14 + 0 β23 + 0 β24 + 0 β34 =6.96
3) 0.80 β1 + 0 β2 + 0 β3 + 0.20 β4 + 0 β12 + 0 β13 + 0.16 β14 + 0 β23 + 0 β24 + 0 β34 =6.00
4) 0.40 β1 + 0.20 β2 + 0.20 β3 + 0.20 β4 + 0.08 β12 + 0.08 β13 + 0.08 β14 + 0.04 β23 + 0.04 β24 + 0.04 β34 =6.82
5) 0 β1 + 1.00 β2 + 0 β3 + 0 β4 + 0 β12 + 0 β13 + 0 β14 + 0 β23 + 0 β24 + 0 β34 = 5.80
6) 0 β1 + 0 β2 + 1.00 β3 + 0 β4 + 0 β12 + 0 β13 + 0 β14 + 0 β23 + 0 β24 + 0 β34 = 5.65
7) 0 β1 + 0.50 β2 + 0.50 β3 + 0 β4 + 0 β12 + 0 β13 + 0 β14 + 0.25 β23 + 0 β24 + 0 β34 = 5.93
8) 0 β1 + 0 β2 + 0 β3 + 1.00 β4 + 0 β12 + 0 β13 + 0 β14 + 0 β23 + 0 β24 + 0 β34 = 5.05
9) 0 β1 + 0.50 β2 + 0 β3 + 0.50 β4 + 0 β12 + 0 β13 + 0 β14 + 0 β23 + 0.25 β24 + 0 β34 = 5.36
10) 0 β1 + 0 β2 + 0.50 β3 + 0.50 β4 + 0 β12 + 0 β13 + 0 β14 + 0 β23 + 0 β24 + 0.25 β34 = 5.72
11) 0.80 β1 + 0.10 β2 + 0.10 β3 + 0 β4 + 0.08 β12 + 0.08 β13 + 0 β14 + 0.01 β23 + 0 β24 + 0 β34 = 7.25
12) 0.80 β1 + 0 β2 + 0.10 β3 + 0.10 β4 + 0 β12 + 0.08 β13 + 0.08 β14 + 0 β23 + 0 β24 + 0.01 β34 = 6.20
13) 0.80 β1 + 0.10 β2 + 0 β3 + 0.10 β4 + 0.08 β12 + 0 β13 + 0.08 β14 + 0 β23 + 0.01 β24 + 0 β34 = 6.47
14) 0.40 β1 + 0.30 β2 + 0.30 β3 + 0 β4 + 0.12 β12 + 0.12 β13 + 0 β14 + 0.09 β23 + 0 β24 + 0 β34 = 7.21
15) 0.40 β1 + 0.30 β2 + 0 β3 + 0.30 β4 + 0.12 β12 + 0 β13 + 0.12 β14 + 0 β23 + 0.09 β24 + 0 β34 = 6.53
16) 0.40 β1 + 0 β2 + 0.30 β3 + 0.30 β4 + 0 β12 + 0.12 β13 + 0.12 β14 + 0 β23 + 0 β24 + 0.09 β34 = 6.88
può essere notevolmente semplificato, data la presenza di molti zeri in:
1) 0.80 β1 + 0.20 β2 + 0.16 β12 =6.50
2) 0.80 β1 + 0.20 β3 + 0.16 β13 =6.96
3) 0.80 β1 + 0.20 β4 + 0.16 β14 =6.00
4) 0.40 β1 + 0.20 β2 + 0.20 β3 + 0.20 β4 + 0.08 β12 + 0.08 β13 + 0.08 β14 + 0.04 β23 + 0.04 β24 + 0.04 β34 =6.82
5) 1.00 β2 = 5.80
6) 1.00 β3 = 5.65
7) 0.50 β2 + 0.50 β3 + 0.25 β23 = 5.93
8) 1.00 β4 = 5.05
9) 0.50 β2 + 0.50 β4 + 0.25 β24 = 5.36
10) 0.50 β3 + 0.50 β4 + 0.25 β34 = 5.72
11) 0.80 β1 + 0.10 β2 + 0.10 β3 + 0.08 β12 + 0.08 β13 + 0.01 β23 = 7.25
12) 0.80 β1 + 0.10 β3 + 0.10 β4 + 0.08 β13 + 0.08 β14 + 0.01 β34 = 6.20
13) 0.80 β1 + 0.10 β2 + 0.10 β4 + 0.08 β12 + 0.08 β14 + 0.01 β24 = 6.47
14) 0.40 β1 + 0.30 β2 + 0.30 β3 + 0.12 β12 + 0.12 β13 + 0.09 β23 = 7.21
15) 0.40 β1 + 0.30 β2 + 0.30 β4 + 0.12 β12 + 0.12 β14 + 0.09 β24 = 6.53
16) 0.40 β1 + 0.30 β3 + 0.30 β4 + 0.12 β13 + 0.12 β14 + 0.09 β34 = 6.88
Le equazioni 5,6,8 forniscono direttamente tre coefficienti, β2, β3 e β4,. La 7. la 9 e la 10 forniscono
facilmente β23, β24 e β34. I dieci coefficienti rimasti si calcolano mediante sistemi ridotti, che a
causa dei valori dei coefficienti si risolvono facilmente.
Naturalmente il risultato è eguale a quello che si ottiene utilizzando la matrice di dispersione, ma il
procedimento era di particolare utilità quando non tutti avevano la possibilità di utilizzare moduli
di calcolatore per la inversione di matrici.
167
5.11.7.3 – Esperimento di Mazerolles
Questo esperimento (Gérard Mazerolles, Tesi, Università Paul Cézanne, Marsiglia-Aix-enProvence) riguarda la ottimizzazione della separazione di tredici costituenti dell’aroma di vaniglia
mediante cromatografia liquida. Qui viene presentata solo una parte dello studio.
Ottimizzazione in questo caso significa migliorare la separazione tra i picchi cromatografici,
utilizzando un indice di separazione che nell’esempio è si ottiene da una funzione del prodotto
delle distanze (differenze tra i tempi di eluizione) tra picchi contigui. IL parametro viene
successivamente indicato con R (Vi sono molti indici di separazione. In questo esempio è stato
utilizzato un indice molto semplice.
La strategia applicata inizia con quattro pseudo-solventi puri (non potendosi fare esperimenti con i
solventi puri):
S1
S2
S3
S4
Acqua
97%
1%
1%
1%
Acetonitrile
1%
97%
1%
1%
Tetraidrofurano
1%
1%
97%
1%
Metanolo
1%
1%
1%
97%
e con l’utilizzo della matrice di disegno seguente, che è della famiglia dei disegni di SneeMarquardt:
Esperimento
1
2
3
4
5
6
7
8
9
10
11
12
13
S1
1
0
0
0
0.625
0.125
0.125
0.125
0
0.3333
0.3333
0.3333
0.25
S2
0
1
0
0
0.125
0.625
0.125
0.125
0.3333
0
0.3333
0.3333
0.25
S3
0
0
1
0
0.125
0.125
0.625
0.125
0.3333
0.3333
0
0.3333
0.25
S4
0
0
0
1
0.125
0.125
0.125
0.625
0.3333
0.3333
0.3333
0
0.25
La Figura 5-138 mostra due rappresentazioni grafiche alternative per il disegno sperimentale nel
caso di miscele quaternarie. Una ovvia possibilità è quella a sinistra, in cui i tre assi sono connessi a
tre dei quattro componenti.
168
A destra vengono utilizzate le componenti principali dei dati centrati. La matrice di disegno ha tre
componenti principali (a causa della chiusura a uno), e queste componenti hanno identico
autovalore. Il grafico contiene interamente la informazione ed è spesso di interpretazione più
facile di quanto avvenga con la rappresentazione usuale, tipo quella in Figura 5-136.
Figura 5-138 – Disegno sperimentale dell’esperimento di Mazerolles
Questo primo disegno non sembrò soddisfacente alla luce dei primi risultati, in quanto una
percentuale elevata delle fasi non acquose eluiva molto presto e sovrapposti circa metà dei
composti (Figura 5-139), con R piuttosto basso, a cui si attribuisce il valore di riferimento 1.
Figura 5-139 – Cromatogramma idealizzato con una miscela 50% acqua 50% metanolo
169
Pertanto si ridefinirono gli pseudo-solventi puri, come segue:
S1
S2
S3
S4
Acqua
97%
50%
50%
50%
Acetonitrile
1%
50%
0%
0%
Tetraidrofurano
1%
0%
50%
0%
Metanolo
1%
0
50%
50%
La matrice sperimentale rimane quella precedente. Se si esprimono le condizioni sperimentali in
funzione dei solventi puri si ottiene:
Esperimento
1
2
3
4
5
6
7
8
9
10
11
12
13
Acqua
0.97
0.5
0.5
0.5
0.79
0.56
0.56
0.56
0.5
0.66
0.66
0.66
0.62
Acetonitrile
0.01
0.5
0
0
0.07
0.31
0.065
0.065
0.166
0
0.17
0.17
0.126
Metanolo*
0.01
0
0.5
0
0.07
0.065
0.31
0.065
0.166
0.17
0
0.17
0.126
Tetraidrofurano*
0.01
0
0
0.5
0.07
0.065
0.065
0.31
0.166
0.17
0.17
0
0.126
(* l’ordine diverso d metanolo e tetraidrofurano è copiato dalla documentazione originale).
La Figura 5-140 mostra i tredici esperimenti nello spazio dei quattro solventi puri.
Figura 5-140 – Esperimenti di Mazerolles nello spazio dei quattro solventi puri (sono indicate le tre
terne di esperimenti con la stessa percentuale di acqua).
170
Figura 5-141 – Cromatogrammi corrispondenti ai tredici esperimenti di Figura 5-140 con R (relativo
all’esperimento 3, miscela 50% acqua 50% metanolo)
L’esperimento 10, con il 66% di acqua e per il resto parti eguali di metanolo e tetraidrofurano,
fornisce la separazione migliore. Due picchi sono dovuti alla sovrapposizione di due composti. Lo
studio è continuato con una esplorazione della zona intorno all’esperimento 10, ma senza
importanti miglioramenti. La conclusione è che la colonna cromatografica utilizzata non è
sufficiente alla separazione di tutti i composti nell’aroma di vaniglia, pur avendone ottimizzate le
prestazioni.
5.11.7.4 – Esperimento di Tino
Tino è un produttore di vini di pregio. Il suo cavallo di battaglia è un rosso che viene prodotto da
un particolare vitigno al quale le norme prevedono possa essere aggiunta uva di altre due varietà,
ma in percentuale complessiva non superiore al 10%. Nella produzione intervengono tre fattori
che riguardano il tipo di lievito, e due temperature durante la fermentazione.
A Tino viene consigliato un disegno combinazione di un simplex con centroide per le varietà e di
un fattoriale completo 22 per i fattori di processo.
171
Nel simplex A indica il vitigno principale puro, B e C le miscele degli altri vitigni con il 90% del
vitigno principale.
Il simplex con centroide (Figura 5-142) permette modelli locali del tipo cubico speciale:
y
1x1 2 x 2 3 x 3 12 x1 x 2 13 x1 x 3 23 x 2 x 3 123 x1 x 2 x 3
In tutto vengono effettuati 56 esperimenti. La valutazione del colore è stata effettuata su di una
scala da 0 a 10, dove un punteggio superiore a 5 è considerato soddisfacente e uno superiore a 8 è
considerato eccellente.
Figura 5-142 – Simplex con centroide per l’esempio di Tino
La matrice dei 56 esperimenti è riportata sotto con la valutazione (nella prima riga le cifre
indicanole miscele dei vitigni, le lettere indicano i tre fattori):
1
1
1
1
1
1
1
1
1
0
0
0
0
0
0
0
2
0
0
0
0
0
0
0
0
1
1
1
1
1
1
1
3
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
K
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
L
-1
-1
1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
1
M
-1
-1
-1
-1
1
1
1
1
-1
-1
-1
-1
1
1
1
Risposta
1.84
2.86
3.01
4.13
1.65
2.32
3.04
4.13
0.67
1.10
1.21
1.67
0.58
0.97
1.16
172
0
0
0
0
0
0
0
0
0
05
05
05
05
05
05
05
05
0.5
0.5
0.5
0.5
0.5
0.5
0.5
0.5
0
0
0
0
0
0
0
0
0.333
0.333
0.333
0.333
0.333
0.333
0.333
0.333
1
0
0
0
0
0
0
0
0
0.5
0.5
0.5
0.5
0.5
0.5
0.5
0.5
0
0
0
0
0
0
0
0
0.5
0.5
0.5
0.5
0.5
0.5
0.5
0.5
0.333
0.333
0.333
0.333
0.333
0.333
0.333
0.333
0
1
1
1
1
1
1
1
1
0
0
0
0
0
0
0
0
0.5
0.5
0.5
0.5
0.5
0.5
0.5
0.5
0.5
0.5
0.5
0.5
0.5
0.5
0.5
0.5
0.333
0.333
0.333
0.333
0.333
0.333
0.333
0.333
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
-1
1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
1
1
-1
-1
1
1
1
-1
-1
-1
-1
1
1
1
1
-1
-1
-1
-1
1
1
1
1
-1
-1
-1
-1
1
1
1
1
-1
-1
-1
-1
1
1
1
1
-1
-1
-1
-1
1
1
1
1
1.30
1.51
1.60
2.32
2.57
1.21
2.12
2.00
2.75
1.29
1.53
1.93
2.26
1.18
1.45
1.85
2.06
1.42
1.81
2.57
3.15
1.45
1.93
2.39
2.82
1.16
1.50
1.83
2.22
1.07
1.28
1.60
2.10
1.59
1.68
1.94
2.60
1.41
1.54
2.05
2.32
Le curve di isorisposta nella Figura 5-143 indicano chiaramente che un risultato eccellente si
ottiene con i primi due fattori di processo a livello alto e il terzo a livello preferibilmente basso.
173
Per quanto le valutazioni migliori si ottengano con miscele costituite dal solo vitigno principale,
risultati eccellenti possono essere ottenuti anche aggiungendo percentuali elevate del vitigno B
sino al 50% circa della quantità ammessa.
Figura 5-143 – Curve di isorisposta per l’esperimento di Tino
La tabella seguente raccoglie i coefficienti di regressione e la loro deviazione standard, ricavata
dalla radice della diagonale della matrice di dispersione e dalla deviazione standard dell’errore
sulla risposta, tipico del gruppo di valutatori (0.1). In colore sono indicati i coefficienti non
significativi, in rosso quelli il cui valore assoluto è inferiore alla deviazione standard, in arancio
quelli il cui valore assoluto è inferiore a due volte la deviazione standard. I coefficienti non
significativi coinvolgono in generale il terzo vitigno e il terzo fattore di processo.
Coefficiente
1
2
3
12
13
23
123
1A
Valore Deviazione
standard
9.019
0.071
3.401
0.071
6.3136
0.071
-16.590
0.145
-3.107
0.346
0.597
0.346
49.244
2.290
1.536
0.071
174
2A
3A
12A
13A
23A
123A
1B
2B
3B
12B
13B
23B
123B
1B
2B
3B
12B
13B
23B
123B
1C
2C
3C
12C
13C
23C
123C
1AB
2AB
3AB
12AB
13AB
23AB
123AB
1AC
2AC
3AC
12AC
13AC
23AC
123AC
1BC
2BC
3BC
12BC
13BC
23BC
0.560
0.783
-3.020
-1.684
-0.420
1.611
2.209
0.790
1.255
-4.157
-0.171
0.206
2.665
-0.275
-0.248
0.030
0.525
-0.081
-0.599
-0.097
0.206
-0.084
0.001
-0.390
-0.221
0.691
6.082
-0.137
-0.140
0.529
0.288
-0.853
-0.800
-1.885
0.299
-0.076
-0.146
-0.597
-1.351
0.396
5.558
0.132
-0.109
-0.124
-0.265
-0.365
0.887
0.071
0.071
0.145
0.346
0.346
2.290
0.071
0.071
0.071
0.145
0.346
0.346
2.290
0.071
0.071
0.071
0.145
0.346
0.346
2.290
0.071
0.071
0.071
0.145
0.346
0.346
2.290
0.071
0.071
0.071
0.145
0.346
0.346
2.290
0.071
0.071
0.071
0.145
0.346
0.346
2.290
0.071
0.071
0.071
0.145
0.346
0.346
175
123BC
-4.614
2.290
176
5.11.7.5 – Esperimento dei ragnetti rossi
Si tratta di parassiti delle fragole.
Anche questo esperimento è stato descritto da John H. Cornell, Experiments with mixtures, Wiley,
1990. Nella strategia vi sono due elementi interessanti, il disegno che parte da un disegno quasi
classico, e si estende allo studio di una zona particolare, e l’utilizzo di modelli particolari.
Le miscele sono costituite da tre pesticidi, e la risposta è una misura della popolazione dei ragnetti
rossi sopravvissuta al trattamento.
Il disegno iniziale corrisponde ai sette esperimenti rossi nella Figura 5-144. L’esperimento 7 è
anomalo, e sostituisce il classico punto centrale, per studiare meglio il pesticida C. In un secondo
tempo, essendo il pesticida C una polvere bagnabile e sospettandosi che il suo effetto potesse
essere additivo quando usata in combinazione con A e B, si aggiunsero altri otto esperimenti, in
blu nella Figura 5-144.
I sette esperimenti iniziali permettono di utilizzare il modello cubico speciale:
y
1x1 2 x 2 3 x 3 12 x1 x 2 13 x1 x 3 23 x 2 x 3 123 x1 x 2 x 3
Figura 5-144 – Esperimenti per il problema dei ragnetti rossi
Dalla matrice sperimentale (a cui è aggiunta sotto la risposta, calcolata con il modello cubico
speciale e con un secondo modello):
Esperimento A
B
1
1.00 0
C
0
R
49.8
R calcolata (1) R calcolata (2)
49.7
49.2
177
2
3
4
5
6
7
8
9
10
11
12
13
14
15
0.50
0
0
0
0.50
0.20
0
0
0.25
0.75
0.40
0.30
0.25
0.10
0.50
1.00
0.50
0
0
0.20
0.75
0.25
0
0
0.40
0.30
0.25
0.10
0
0
0.50
1.00
0.50
0.60
0.25
0.75
0.75
0.25
0.20
0.40
0,50
0.80
35.8
84.2
52.4
20.1
34.7
26.1
66.0
39.4.
28.8
41.3
32.7
29.6
27.9
23.3
36.8
83.3
52.2
20.1
34.3
28.3
67.9
36.3
27.1
41.9
30.7
28.8
28.4
26.3
35.4
83.5
52.3
21.0
35.1
26.8
67.9
36.6
28.0
42.1
32.5
29.6
28.2
23.9
si ottiene la matrice del modello, evidenziata sotto per il modello cubico speciale:
Esperimento
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
1
1.00
0.50
0
0
0
0.50
0.20
0
0
0.25
0.75
0.40
0.30
0.25
0.10
2
0
0.50
1.00
0.50
0
0
0.20
0.75
0.25
0
0
0.40
0.30
0.25
0.10
3
0
0
0
0.50
1.00
0.50
0.60
0.25
0.75
0.75
0.25
0.20
0.40
0.50
0.80
12
0
0.25
0
0
0
0
0.04
0
0
0
0
0.16
0.09
0.0625
0.01
13
0
0
0
0
0
0.25
0.12
0
0
0.1875
0.1875
0.08
0.12
0.125
0.08
23
0
0
0
0.25
0
0
0.12
0.1875
0.1875
0
0
0.08
0.12
0.0625
0.08
123
0
0
0
0
0
0
0.024
0
0
0
0
0.032
0.036
0.03125
0.008
12/(1+2)
0
0.25
0
0
0
0
0.1
0
0
0
0
0.2
0.15
0.125
0.05
R
49.8
35.8
84.2
52.4
20.1
34.7
26.1
66.0
39.4.
28.8
41.3
32.7
29.6
27.9
23.3
I coefficienti del modello sono riportati sotto, con la loro deviazione standard ottenuta dalla radice
sugli elementi della diagonale della matrice di dispersione e dalla deviazione tandard dell’errore,
valutata dallo scarto tra risposta misurata e risposta calcolata dal modello in 1.57.
Coefficiente Deviazione standard
1
49.689
1.478
2
83.348
1.468
3
20.139
1.300
12
-119.005
7.345
13
-2.368
6.579
23
1.832
6.468
123
-233.070
38.097
178
Poiché b13 e b23 sono molto piccoli e b123 è teoricamente funzione di b12 fu deciso di utilizzare il
modello alternativo:
y
1x1 2 x 2 3 x 3 12 /(1 2)
x1 x 2
x1 x 2
i cui coefficienti appaiono meno incerti:
Coefficiente Deviazione standard
1
49.179
0.763
2
83.539
0.763
3
20.984
0.555
12/(1+2)
-123.824
3.335
La Figura 5-145 mostra come il secondo modello sia più regolare proprio nella zona di interesse.
Figura 5-145 – Linee di isorisposta per i due modelli (quello cubico speciale a sinistra)
179
5.12 - IL CASO DI MOLTI FATTORI
A volte il numero dei possibili fattori é molto elevato. É il caso di esperimenti collegati a problemi
di produzione, a simulazioni, alla robustezza di metodi analitici.
Quando il numero di fattori è minore o eguale a 20 si ricorre allo screening mediante disegni di
Plackett-Burman. Quando il numero dei fattori è superiore è possibile utilizzare:
a) Disegni supersaturi
b) Screening a gruppi (Group screening)
c) Biforcazione sequenziale.
In generale queste strategie si basano sull’ipotesi che il numero dei fattori rilevanti sia molto
piccolo (<10%) e che gli effetti di interazione siano trascurabili.
L’ipotesi che il numero dei fattori rilevanti sia piccolo è frequentemente accettabile. Essa è nota
come scarsezza di effetti (effect sparsity).
La Figura 5-146 rappresenta simbolicamente la situazione ipotizzata.
Figura 5-146 – Rappresentazione simbolica dell’opotesi alla base dei metodi per lo studio
di molti fattori
5.12.1 – Matrici supersature
Le matrici supersature (supersaturated design o oversaturated design) permettono lo studio di k
fattori con N<k esperimenti.
180
Ovviamente vi é un certo rischio nell’utilizzo di questi disegni in confronto a disegni con (molti) più
esperimenti. Tuttavia i disegni supersaturi sono molto utili nella investigazione preliminare di
sistemi complessi. Non devono essere utilizzati come disegni finali.
F.E. Satterthwaite (Random balance experimentation. Technometrics 1, 111-137, 1959. fu il primo a
proporre disegni insaturi, i “random balance designs”, ma le matrici sperimentali proposte non
erano di grande efficacia.
In seguito i disegni supersaturi furono studiati sistematicamente, generando matrici sperimentali
secondo determinati criteri.
5.12.1.1 - Criteri per la scelta di matrici supersature ottime
Criterio di Booth-Cox
Booth e Cox (Booth, K.H.V., Cox, D.R., 1962. Some systematic supersaturated designs.
Technometrics 4, 489–495.) furono i primi a sviluppare matrici supersature non casuali, ma
obbligate a soddisfare un criterio. Si definì la quantità :
dove k é il numero di fattori che é eguale al numero di colonne della matrice degli esperimenti, Ci
e Cj sono colonne della matrice sperimentale, Ci Cj é il loro prodotto scalare (il prodotto scalare di
due vettori a e b é aTb).
Il prodotto
é eguale a N2, quadrato del numero degli esperimenti, quando le due
colonne sono eguali, a 0 quando le due colonne sono ortogonali.
é il numero di combinazioni dei k fattori a due a due.
E(s2) é una misura della non-ortogonalità (se i due vettori sono ortogonali il loro prodotto é nullo).
Pertanto le matrici migliori sono quelle con E(s2) minimo.
Booth e Cox cercano matrici con in ogni colonna lo stesso numero di +1 e di -1, e con il minimo
E(s2), e tra queste eventualmente quella per la quale il massimo di s2 si ha il minor numero di
volte.
181
Criterio di Lin
Lin (Lin, D.K.J., 1993. A new class of supersaturated designs. Technometrics 35, 28–31) propose un
criterio basato sulla quantità sviluppando una nuova classe di disegni supersaturi basati sulla metà
di matrici di Hadamard.
Nel criterio di Lin si calcola la grandezza:
r= max |Ci Cj| / N
dove N é il numero degli esperimenti
r = 0 significa che tutte le colonne sono ortogonali. Il minimo della quantità r indica la matrice più
vicina alla ortogonalità. Se due matrici hanno lo stesso valore di r si preferirà quella per la quale il
numero di volte (nelle varie combinazioni di due colonne) in cui si avrà il minimo più volte.
Criteri di Wu
Wu (Wu, C. F. J. (1993). Construction of supersaturated designs through partially aliased
interactions. Biometrika, 80, 661-669) introdusse due nuovi criteri. Partendo da una matrice
iniziale con i k fattori da studiare e N esperimenti, si costruiscono le matrici X N,f con f<k fattori. Le
combinazioni sono
.
Nel criterio D di Wu si calcola:
Nel criterio A si calcola:
Una matrice é tanto più efficace quanto più Af é prossimo a 1 e quanto più é grande Df. Quando
una delle matrici di informazione
é singolare, Af é infinito e per il ocnfronto di matrici si potrà
applicare solamente il criterio D.
182
5.12.1.2 – Matrici sperimentali
Matrici di Booth-Cox
Sono 7 matrici che permettono lo studio dei seguenti casi:
N
12
12
12
18
18
18
24
k
16
20
24
24
30
36
30
La prima e la terza matrice di Booth-Cox sono:
La matrice di informazione corrispondente al primo disegno di Booth-Cox
12
0
0
0
0
0
12
0
0
0
0
0
12
0
0
0
0
0
12
0
0
0
0
0
12
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
183
0
0
0
0
0
0
0
0
0
0
-4
0
-4
-4
-4
4
4
-4
-4
-4
0
-4
-4
-4
-4
-4
4
0
-4
-4
-4
-4
4
-4
-4
0
0
0
0
0
0
-4
4
0
-4
-4
0
0
0
0
0
0
0
4
-4
4
-4
0
0
0
0
0
0
-4
-4
-4
0
4
0
0
0
0
0
0
-4
-4
-4
-4
-4
0
0
0
0
0
0
-4
-4
-4
-4
-4
12
0
0
0
0
0
-4
-4
-4
-4
-4
0
12
0
0
0
0
-4
0
4
4
0
0
0
12
0
0
0
4
4
4
-4
0
0
0
0
12
0
0
4
-4
0
0
-4
0
0
0
0
12
0
0
-4
4
-4
4
0
0
0
0
0
12
4
0
-4
4
4
-4
-4
4
4
0
4
12
4
4
4
4
-4
0
4
-4
-4
0
4
12
4
4
0
-4
4
4
0
4
-4
4
4
12
0
4
-4
4
-4
0
-4
4
4
4
0
12
4
-4
0
0
-4
4
4
4
0
4
4
12
é diagonale nei primi 11 elementi: se estraiamo il nimore con 12 righe e 11 colonne otteniamo una
matrice di Hadamard.
Il valore di E(s2) é 7.07, e si ha 67 volte s2 = 0 e 53 volte s2 = 16.
Matrici di Wu
Si basano su di una matrice di Hadamard che viene completata con le colonne di interazione Cij (i
cui elementi sono il prodotto delle colonne Ci e Cj).
Nel caso N = 12 k = 16; la matrice di Hadamard di partenza si genera ciclicamente dalla prima linea
e l’ultima linea é una linea di -1 (come nella regola magica delle matrici di Plackett-Burman, 5.3.1):
Per arrivare a 16 fattori occorre aggiungere cinque colonne, le colonne di interazione Dij, da
scegliere tra quelle con un certo valore di i e j ≠ i. Le colonne di interazione Dij, sono quelle di
matrici di Hadamard ottenute da quella originale per permutazione di righe. La scelta di queste
184
matrici é effettuata in modo da avere la minima correlazione tra le nuove colonne e le colonne
originali.
Wu propose per N = 12 e k = 16 la matrice:
Tutte le matrici di Wu hanno:
e per N = 12 e k = 16 é: E(s2) = 6.0
Matrici di Lin
Sono matrici che permettono di studiare N-2 fattori con N/2 esperimenti.
Per N=12, Lin parte dalla matrice di Hadamard:
185
Si sceglie una delle colonne, la branching column, per esempio l’ultima.
Si divide il gruppo di esperimenti in due gruppi, uno che ha +1 nella branching column, l’altro con 1 nella branching column.
Levando dalle due matrici la branching column si ottengono due matrici supersature che
permettono di studiare dieci fattori con sei esperimenti.
Seconde matrici di Lin
Furono proposte da Lin nel 1995. Si riporta solamente la matrice per lo studio di sedici fattori con
dodici esperimenti.
186
187
Disegni di Rafael Cela
Rafael Cela, professore di Chimica Analitica a Santiago di Compostela, ha sviluppato strategie di
ricerca di matrici supersature basate sulla ricerca dell’ottimo, il minimo di E(s 2) ma tenendo conto
anche degli altri criteri, mediante algoritmi genetici (4.8.8.7.6).
Le strategie di Cela permettono di ottenere ottime matrici anche in casi per i quali in precedenza
non erano state descritte matrici supersature.
Sotto é riportata come esempio solamente la matrice di Cela per dodici esperimenti e sedici
fattori.
5.12.1.3 – Un esempio
Qesto studio riguarda la precipitazione del mercuritiocianato di zinco. La variabile risposta é la
percentuale di zinco precipitato da una soluzione 0.1 molare, in varie condizioni. I fattori che
influiscono sulla precipitazione sono la concentrazione del tiocianato (tra 0.2 e 0.4 M), quella
(molto piccola) di ioni cobalto (che favoriscono la precipitazione), la temperatura di digestione, il
tempo di digestione, il filtro per la raccolta del precipitato, il tempo di essicazione, la temperatura
di essicazione, le concentrazioni di un certo numero di altri ioni (sodio, potassio, litio, solfati,
cloruri, nitrati,...).
Fu utilizzato un disegno di Wu. Si misurarono le quantità di zinco nel precipitato, espresse come
percentuale dello zinco inizialmente in soluzione, ottenendo:
99.283
98.729
99.95
97.93
188
99.149
98.615
99.262
97.944
99.835
99.832
98.714
98.055
La matrice di disegno non é ovviamente invertibile (come in tutti i disegni insaturi). L’analisi fu
effettuata mediante stepwise OLS e mediante algoritmi genetici. Step-OLS (F to-enter 4, F-toremove 2) sceglie tre fattori altamente significativi nelle prime colonne del disegno, e altri due al
limite della significatività. I fattori scelti erano la concentrazione del cobalto, quella del tiocianato
e il tempo di digestione.
I tre fattori altamente significativi sono quelli con indice 1, 7 e 4 nell’ordine. Questi fattori vengono
selezionati in tutti i dodici cicli di convalida leave-one-out, e sempre per primi. I fattori 3 e 12
vengono selezionati 5 e 8 volte su dodici. La deviazione standard residua sulla risposta é 0.0284,
compatibile con la accuratezza nella determinazione della risposta.
La tabella seguente riporta alcuni dettagli della regressione.
Fattore
Coefficiente Dev.standard Intervallo di fiducia 95%
1
1.22417
0.00212
0.00518
7
0.54222
0.00244
0.00598
4
-0.16111
0.00244
0.00598
3
0.01194
0.00323
0.00791
12
0.01917
0.00366
0.00897
0.00212
0.00518
Intercetta 98.02584
Oltre al disegno di Wu, che ha E(s2) = 6.0, sono stati utilizzati due disegni costruiti in modo
completamente casuale, il primo senza altri vincoli oltre a quello di non avere righe o colonne
eguali, il secondo con il vincolo di non avere meno di 5 o più di 7 valori +1 o +1 in una colonna. Il
disegno casuale guidato può essere effettuato anche con ulteriori vincoli, in modo da diminuire
E(s2).
I disegni sono riportati sotto. Il primo ha E(s2) = 11.25, il secondo ha E(s2) = 13.7. Vi é pertanto una
correlazione tra le colonne maggiore di quella nei disegni di Wu (e degli altri presentati sopra).
Tuttavia, nell’analisi dei dati, la Stepwise OLS con il primo disegno casuale seleziona solo i tre
fattori 1, 7 e 4. La deviazione standard residua sulla risposta é 0.0255.
189
Nel caso del secondo disegno casuale Step-OLS seleziona cinque fattori, i soliti tre 1, 7, 4 e i fattori
11 e 14. La deviazione standard residua sulla risposta é 0.0137.
La tabella seguente riporta alcuni dettagli della regressione.
Fattore
Coefficiente Dev.standard Intervallo di fiducia 95%
1
1.21328
0.00172
0.00422
7
0.54814
0.00332
0.00813
4
-0.16686
0.00332
0.00813
11
-0.01382
0.00302
0.00740
14
0.00675
0.00316
0.00773
0.00172
0.00422
Intercetta 98.04887
Sembra quindi che anche disegni casuali (ma con un minimo di controllo) possano essere utilizzati
per costruire matrici supersature non di altissima qualità ma in grado di dare risultati accettabili.
190
5.12.2 – Screening a gruppi
Questo metodo lavora sull’ipotesi che il numero dei fattori rilevanti o effettivi o influenti sia
piccolo relativamente al numero totale dei fattori e che i fattori agiscano tutti nella stessa
direzione (p.e. che passando dal livello -1 al livello +1 l’effetto dei fattori rilevanti sulla risposta sia
positivo).
Sia p la probabilità che un fattore sia effettivo. P.e. p = 0.1. La probabilità che un fattore non sia
efffettivo è q = 1- p (0.9) nell’esempio.
Si formano G gruppi di fattori. Se F è il numero di fattori totale ogni gruppo conterrà k fattori
(supponiamo che k sia intero). Nell’esempio in Figura 5-147 il numero totale dei fattori F è 20, il
numero dei gruppi è 5, ogni gruppo è costituito da k = 4 fattori.
Figura 5-147 – Screening a gruppi
Nell’esempio i due fattori effettivi possono essere ambedue in uno dei gruppi (Figura 5-147 B) o in
due gruppi diversi (Figura 5-147 C).
La probabilità che un gruppo sia effettivo (che contenga almeno un fattore effettivo) è:
p1 = 1 - qk
(qk è la probabilità che i k fattori nel gruppo non siano effettivi).
Nell’esempio p1 = 0.3439.
Ci attendiamo quindi la media dei gruppi effettivi, n, sia:
E(n)= G p1, nell’esempio 1.72 (quindi sarà più probabile che i due fattori effettivi siano in gruppi
diversi; la probabilità che siano nello stesso gruppo è del 28%).
Un fattore in un gruppo effettivo (gruppo che contiene almeno almeno un fattore effettivo) ha una
probabilità di essere effettivo:
Nell’esempio p’ è 0.2908.
191
Poiché tutti i fattori dei gruppi effettivi verrano testati successivamente (nel processo a due passi,
vedi oltre), il numero medio di questi fattori è E(n) k p’ (nell’esempio si riottiene 2 = p F).
I gruppi costituiscono i nuovi fattori. Quando un gruppo é a livello 1 tutti i suoi fattori sono a livello
1. Con le matrici di Plackett-Burman si studiano G fattori gruppo con G+1 esperimenti.
Nel “group screening” a due passi tutti i fattori dei gruppi effettivi vengono testati separatamente.
In media ci sono E(n) gruppi attivi, e pertanto i fattori testati nel secondo passo saranno in media
E(n) k, e richiederanno altrettanti esperimenti. Si ricava, per il numero medio di esperimenti:
E(r) = k G (1-qk) + G +1
e il costo relativo è dato da
La tabella seguente fornisce una guida per scegliere il numero dei gruppi in funzione della
probabilità che un fattore sia attivo, in modo che il costo relativo sia minimo.
p
0.01
0.02
0.03
0.04
0.05
0.06
0.07
0.08
0.09
0.10
0.12
0.13
0.15
0.20
0.25
0.30
Ottimo k
11
8
6
6
5
5
5
4
4
4
4
3
3
3
3
3
Costo relativo
20
27
33
38
43
47
50
53
56
59
65
67
72
82
91
99
1 - qk
0.10
0.15
0.17
0.22
0.23
0.27
0.30
0.28
0.31
0.34
0.40
0.34
0.39
0.49
0.58
0.66
Il procedimento descritto é il group screening a due passi. In alternativa, si possono utilizzare nel
primo passo meno gruppi più numerosi, e nel secondo passo dividere i gruppi attivi in gruppetti.
192
5.12.3 – Biforcazione sequenziale
La biforcazione sequenziale (Bettonvil, B., and J. P. C. Kleijnen. 1996. Searching for important
factors in simulation models with many factors: sequential bifurcation. European Journal of
Operational Research 96, 180-194) lavora mediante dicotomie dell’insieme dei fattori.
Il metodo, che si basa sulle stesse ipotesi del group screeningh, è efficiente.
Sia:
- y[k]: risposta con tutti i fattori a livello +1
- y[0]: risposta con tutti i fattori a livello-1
Sono i primi due esperimenti, punto 1 dell’esempio in Figura 5-148.
Se
y[0] = y[k]
non vi sono fattori influenti
altrimenti , punto 2 dell’esempio in Figura 5-148:
alcuni fattori sono influenti
si passa a y[j=k/2] : k/2 fattori (+) e k/2 fattori.
con y[j]: risposta quando i fattori da 1 a j sono a livello + 1 e i fattori da j+1 a 2 j (k per
l’esperimento al punto 3 dell’esempio in Figura 5-148) sono a livello -1
L’analisi del nuovo esperimento confrontato con i due primi esperimenti permette di stabilire se vi
sono fattori significativi nella prima metà o nella seconda o in ambedue. Il confronto, al punto 4
dell’esempio in Figura 5-148, indica che vi é almeno un fattore significativo nella prima metà e
almeno uno nella seconda metà.
La prima metà viene divisa in due parti, con j =9, 9 fattori (+) e 9 fattori (-). Il nuovo esperimento é
quello con j = 9 e fornisce y[9], punto 5 dell’esempio in Figura 5-148.
Il nuovo esperimento viene confrontato con i due esperimenti agli estremi della prima metà (0 e
18) , punto 6 dell’esempio. Poiché y(9) è quasi eguale a y(18), si deduce che i coefficienti dei fattori
da 10 a 18 sono nulli. Poiché y(9)>y(0), il fattore o i fattori significativi nella prima metà devono
essere ricercati tra i fattori 1 e 9.
L’intervallo 1-9 viene diviso in due parti, con j =5, 5 fattori (+) e 4 fattori (-). Il nuovo esperimento é
quello con j = 5 e fornisce y[5], punto 7 dell’esempio in Figura 5-148.
Il nuovo esperimento viene confrontato con i due esperimenti agli estremi del primo quarto (0 e
9), punto 8 dell’esempio. Poiché y(0) è quasi eguale a y(5), si deduce che i coefficienti dei fattori da
1 a 5 sono nulli. Poiché y(9)>y(5), il fattore o i fattori significativi nella prima metà devono essere
ricercati tra i fattori 6 e 9.
L’intervallo 5-9 viene diviso in due parti, con j =7. Il nuovo esperimento fornisce y[7], punto 9
dell’esempio in Figura 5-148.
193
Il nuovo esperimento viene confrontato con i due esperimenti agli estremi dell’ottavo (5 e 9),
punto 10 dell’esempio. Poiché y(5) è quasi eguale a y(7), si deduce che i coefficienti dei fattori da 6
a 7 sono nulli. Poiché y(9)>y(7), il fattore o i fattori significativi nella prima metà devono essere
ricercati tra i fattori 8 e 9.
-
Figura 5-148 – Un esempio di biforcazione sequenziale
Anche la seconda metà viene divisa in due parti, con j = 26, 9 fattori (+) e 9 fattori (-). Il nuovo
esperimento é quello con j = 26 e fornisce y[26], punto 13 dell’esempio in Figura 5-148.
Continuando attraverso i punti da 14 a 20 si identifica un secondo fattore influente.
In totale sono stati efettuati 11 esperimenti con 35 fattori e un costo relativo del 31%.
194
5.13 – IL CASO DI PIÚ RISPOSTE
Abbiamo già visto in 5.5.2.1 un esempio con due risposte, dove la sperimentazione aveva lo scopo
di trovare le condizioni in cui una delle due risposte aveva un valore elevato e l’altra un valore
basso.
Frequentemente la sperimentazione considera più risposte, il cui trattamento non può essere
effettuato come nell’esempio in 5.5.2.1.
5.13.1 – Funzioni di desiderabilità
La strategia più frequentemente utilizzata è quella delle funzioni di desiderabilità, che calcolano
una funzione delle risposte che diventa la risposta unica da massimizzare. Si tratta quindi di una
tecnica di ordinamento totale. La tecnica richiede una attenta valutazione della importanza che
hanno le risposte nel problema, e pertanto una approfondita conoscenza del problema: essa non è
assolutamente una tecnica automatica.
La “qualità” di un prodotto o di un processo che hanno caratteristiche di qualità multiple può
essere inaccettabile se anche solo una delle qualità prodotto. Le funzioni di desiderabilità
(desirability functions) considerano gli intervalli di accettabilità (di desiderabilità) delle singole
qualità e li combinano in una funzione globale. Per ciascuna risposta (qualità) Yi funzione dei
fattori si decide una funzione individuale di desiderabilità d i(Yi) che ha valore zero se la qualità ha
un valore totalmente inaccettabile, e un valore 1 se la qualità ha un valore ideale o totalmente
soddisfacente. Una funzione semplice collega valori intermedi di qualità con la desiderabilità.
La desiderabilità totale è la media geometrica delle desiderabilità individuali
dove k é il numero delle risposte. Basta che una delle desiderabilità abbia valore zero per avere
una desiderabilità totale nulla. I valori delle risposte che si usano per calcolare D sono quelli
ottenuti dalla relazione con i fattori.
Una classe di funzioni di desiderabilità fu proposta nel 1980 (G.Derringer e R. Suich, “Simultaneous
Optimization of Several respose Variables”, Journal of Quality Technology, 12, 214-219 (1980)).
L’esempio che segue ha la medesima fonte.
Siano Li, Ui, Ti, rispettivamente, i valori minimo, massimo e ideale (obbiettivo) che sono desiderati
per la risposta Yi.
La funzione individuale di desiderabilità può essere di tre tipi:
1) l’ideale è il meglio (“target is best”)
195
2) risposta massima
3) risposta minima.
Nel primo caso si ha:
Gli esponenti s,t sono in relazione a quanto importante è raggiungere il valore target. Per s e t pari
ad 1 la funzione aumenta linearmente da L a T e diminuisce linearmente da T a U. Se s (t) è minore
di 1 la funzione è convessa (Figura 5-149). Per s (t) maggiore di 1 la funzione è concava. Valori
grandi di s (t) indicano che è molto importante raggiungere il valore target.
Figura 5-149 – Forme di funzione di desiderabilità. In evidenza è il valore dell’esponente s
Se la risposta deve essere massima si ha:
e T é interpretato come valore abbastanza grande.
Se la risposta deve essere minima abbiamo:
196
e T indica un valore sufficientemente piccolo.
Dai valori di desiderabilità individuali viene ottenuta la desiderabilità totale. Spesso questa non
può essere utilizzata come variabile nella regressione con la matrice del modello. Occorre usare
modello appropriato per ogni risposta, o un modello unico, calcolare le risposte separatamente e
finalmente calcolare le desiderabilità parziali e totale.
L’esempio di Derringer e Suich riguarda lo sviluppo di una miscela per pneumatici. I fattori
controllabili sono tre, il contenuto in silice idrata, quello di silano e quello di zolfo. Le quattro
risposte da ottimizzare sono
Risposta
Indice di abrasione, Y1
Elasticità, Y2
Elongazione a rottura, Y3
Durezza, Y4
Intervallo desiderato
120 < Y1
1000 < Y2
400 < Y3 < 600
60 < Y4 < 75
Le prime risposte devono essere massimizzate. Per le ultime si ha il caso “target is best”. La Figura
5-150 mostra le funzioni di desiderabilità individuali.
Figura 5-150 – Funzioni di desiderabilità
Fu utilizzato un disegno composito centrale, e la tabella seguente elenca gli esperimenti e i valori
delle risposte ottenuti.
Esperimento
1
2
3
4
x1
-1.00
+1.00
-1.00
+1.00
x2
-1.00
-1.00
+1.00
+1.00
x3
-1.00
-1.00
-1.00
-1.00
197
Y1
102
120
117
198
Y2
900
860
800
2294
Y3
470
410
570
240
Y4
67.5
65.0
77.5
74.5
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
-1.00
+1.00
-1.00
+1.00
-1.63
+1.63
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
-1.00
-1.00
+1.00
+1.00
0.00
0.00
-1.63
+1.63
0.00
0.00
0.00
0.00
0.00
0.00
0.00
0.00
+1.00
+1.00
+1.00
+1.00
0.00
0.00
0.00
0.00
-1.63
+1.63
0.00
0.00
0.00
0.00
0.00
0.00
103
132
132
139
102
154
96
163
116
153
133
133
140
142
145
142
490
1289
1270
1090
770
1690
700
1540
2184
1784
1300
1300
1145
1090
1260
1344
640
270
410
380
590
260
520
380
520
290
380
380
430
430
390
390
62.5
67.0
78.0
70.0
76.0
70.0
63.0
75.0
65.0
71.0
70.0
68.5
68.0
68.0
69.0
70.0
Si calcolarono i coefficienti del modello:
Coefficienti
b0
b1
b2
b3
b12
b13
b23
b11
b22
b33
Y1
139.12
16.51
17.89
2.20
5.125
-7.875
-7.125
-4.02
-3.45
-1.57
Y2
1261.78
268.34
246.68
-102.68
69.375
-104.375
-94.125
-84.191
-125.59
199.60
Y3
400.40
-99.74
-31.41
-27.41
8.75
-1.25
-6.25
7.93
17.34
0.41
Y4
68.91
-1.41
4.32
0.21
-1.625
0.25
-0.125
1.56
0.06
-0.32
e i parametri di dispersione:
Risposta
Media
1
2
3
4
133
1255
418
70
% Varianza
spiegata
83.7
71.4
70.6
86.5
Dev.standard
9.6
245
58
1.6
La maggiore desiderabilità totale si ha per x1 = -0.1, x2= 0.16, x3 = -1 ed è 0.54. In questo punto:
Risposta
Desiderabilità
Y
1
0.334
137
2
1.000
1576
3
0.344
434
4
0.760
69
198
La Figura 5-151 mostra come varia la desiderabilità nel piano del secondo e del terzo fattore, con il
primo al valore 0.1.
Figura 5-151 – Superficie e isolinee per la desiderabilità totale
5.13.2 – Fronte di Pareto
Un secondo modo importante per trattare il caso di più risposte utilizza il fronte di Pareto, da
Vilfredo Pareto (1848 –1923) ingegnere, economista e politico. Il metodo è applicato soprattutto
quando si ottengono molte combinazioni, come quando si applicano gli algoritmi genetici e in
studi con simulazioni.
Siano X e Y due qualità di un prodotto. La situazione che produce la loro combinazione a in Figura
5-152 è dominata da altre possibili situazioni. c, d ed e dominano a in quanto sono superiori per
ambedue le qualità. b, c, d, e, f non sono dominate da altre possibilità: non esistono altre
possibilità che diano un maggior valore per ambedue le qualità. b, c, d, e, f costituiscono il fronte
di Pareto, un insieme di soluzioni che sono buone, e tra le quali possono esserne alcune preferibili,
c se si vuole un equilibrio tra le qualità, b se si vuole privilegiare la qualità Y.
199
Figura 5-152 – Fronte di Pareto
La Figura 5-153 mostra il fronte di Pareto ottenuto esplorando lo spazio del secondo e del terzo
fattore, con il primo al valore 0.1, per l’esperimento di Derringer e Suich, e riportando il prodotti di
due desiderabilità.
Figura 5-153 – Fronte di Pareto per l’esperimento di Derringer e Suich
Infine la Figura 5-154 illustra una applicazione all’analisi di modellamento di classe, con il
confronto di tre tecniche di modellamento applicate a sette differenti set di dati.
200
Figura 5-154 – Fronte di Pareto per il confronto di tre metodi di modellamento di classe
201
5.14 – FILOSOFIA DI TAGUCHI
Genichi Taguchi è uno dei grandi del disegno sperimentale, non tanto per i suoi disegni
sperimentali, spesso criticati con la dimostrazione della esistenza di disegni precedenti e migliori,
quanto per la filosofia del suo metodo.
Il metodo di Taguchi è fondamentale per l’industria, che produce manufatti che devono essere di
qualità.
Abbiamo visto, nel capitolo di Chemiometria, che:
Variabilità = Informazione
Non-variabilità = Qualità
La QUALITÀ é: Insieme delle proprietà e caratteristiche di un prodotto o di un servizio che
permette di soddisfare le necessità di un utilizzatore.
COQ (cost of quality) è il costo dell’ottenimento della qualità, che può essere decomposto in:.
La prevenzione riguarda tutto ciò che viene posto in atto per ottenere un prodotto di buona
qualità
I difetti interni sono i prodotti difettosi che sono rilevati durante il controllo.
I difetti esterni sono i prodotti difettosi venduti al cliente.
La situazione classica, ante Taguchi, è rappresentata in Figura 5-155. Il costo è dovuto
prevalentemente ai difetti interni, prodotti difettosi che devono essere scartati.
Una soluzione per migliorare può essere aumentare il controllo (Figura 5-156).
Saranno rilevati più difetti interni e meno prodotti difettosi arriveranno pertanto al mercato.
Un controllo più efficace scopre i prodotti difettosi, ma non diminuisce la percentuale di difetti:
questa strategia non migliora la qualità.
202
Figura 5-155 – Ripartizione classica del costo della qualità
Figura 5-156 – Ripartizione del costo della qualità aumentando il controllo
La via da seguire secondo Taguchi è quella di migliorare la prevenzione.
Il prodotto fabbricato è quello atteso e il controllo risulta quasi inutile (Figura 5-157).
Un maggiore investimento iniziale nella prevenzione permette di ottenere un prodotto affidabile.
Quale che sia la natura del prodotto che viene fabbricato, in primo luogo si deve pretendere che le
caratteristiche del prodotto corrispondano perfettamente alle specifiche.
203
Figura 5-157 – Ripartizione del costo della qualità aumentando la prevenzione
La Caratteristica di rendimento è la proprietà che caratterizza il prodotto studiato
Sia:
Valore misurato della caratteristica di rendimento: Y
Speranza matematica (media della popolazione): E(Y) =
Valore obbiettivo o valore nominale:
La situazione ideale è che la caratteristica di rendimento sia eguale al valore obbiettivo:
Y=
Ogni differenza fornisce un prodotto di caratteristiche inferiori.
La differenza tra il valore misurato e il valore nominale:
= Y-
determina la perdita.
L
Per la perdita (individuale) prodotta si ha:
A0
20
2 , con
A 0 : perdita per l’impresa se il prodotto è difettoso
0 : Limite di tolleranza dell’utilizzatore.
La varianza della differenza è la varianza di Y, somma di componenti che rappresentano:
- Variabilità della misura di Y
- Variabilità dovuta al processo di fabbricazione
- Variabilità dovuta all’utilizzo
- Variabilità dovuta all’intorno del prodotto fabbricato.
204
Il Principio di Taguchi é: Quanto più la caratteristica di rendimento è prossima al valore obbiettivo
tanto più il prodotto sarà considerato di maggior qualità.
La funzione di perdita (loss function) di Taguchi è:
L(Y) = K (Y-)2
Se si diminuisce la varianza di Y intorno al valore obbiettivo si avrà una funzione di perdita minima,
al meglio nulla. Taguchi sostiene che il cliente sarà soddisfatto solo se la caratteristica di
rendimento è eguale al valore nominale (entro la tolleranza del cliente). Ogni differenza produrrà
insoddisfazione.
Per diminuire l’insoddisfazione Taguchi propone che la fabbricazione sia centrata sul valore
obbiettivo e che il fabbricante scelga di avere una tolleranza inferiore a quella del cliente.
Se il valore medio della caratteristica è entro l’intervallo di tolleranza dell’utente 0 (Figura 5-158)
il numero dei difetti (area in verde) è elevato a causa della dispersione nella fabbricazione
(tolleranza del fabbricante)
Se il valore medio coincide con il valore nominale (Figura 5-159) la tolleranza del produttore non è
variata, ma si hanno meno errori (area in rosso a destra di 0 ).
Diminuendo la tolleranza del produttore (Figura 5-160) il numero dei difetti diventa trascurabile.
La perdita accettata dal fabbricante è inferiore a quella tollerabile per il cliente (Figura 5-161).
Figura 5-158 – Il valore medio della caratteristica é entro l’intervallo di tolleranza del cliente
205
Figura 5-159 – Il valore medio della caratteristica coincide con il valore nominale
Figura 5-160 – Il valore medio della caratteristica coincide con il valore nominale e la tolleranza del
produttore é diminuita
206
Figura 5-161 –La perdita nella strategia di Taguchi. A: perdita tollerabile per il cliente
B: perdita accettata dal fabbricante
Abbiamo visto che Taguchi non vuole semplicemente che il prodotto abbia caratteristica
all’interno della norma ma pretende che il valore medio coincida con il valore nominale.
Diminuendo inoltre la tolleranza del produttore il processo di costruzione sarà robusto, poco
sensibile alle condizioni di funzionamento.
Le cause principali di variabilità delle caratteristiche di rendimento di un prodotto sono:
- le imperfezioni di fabbricazione;
- il deterioramento;
- le condizioni di utilizzo.
Lo studio dei fattori relativi al processo di fabbricazione permetterà di trovare situazioni in cui la
caratteristica di rendimento è più stabile.
Consideriamo un piccolo circuito elettrico comprendente tra l’altro un resistore e un transistor,
che deve fornire una tensione di volts. La caratteristica di un transistor non è lineare.
Supponiamo di poter scegliere tra due transistor A e B.
207
Figura 5-162 –Caratteristica di un transistor
Sceglieremo il transistor B, che assicura una dispersione minore di A. La sua tensione V viene
portata al valore desiderato cambiando il resistore.
TAPPE PRINCIPALI DELLA CATENA DI SVILUPPO E PRODUZIONE DI UN PRODOTTO
Definizione: i tecnici sviluppano le specifiche del prodotto, incluse quelle dei materiali necessari
Concezione-Sviluppo: si disegna il procedimento che permetterà di fabbricare il prodotto
Produzione: si applica il procedimento sviluppato nella tappa precedente.
La tappa nella quale si utilizza il disegno sperimentale non è quella di produzione, ma quella dello
sviluppo del prodotto.
In questa tappa abbiamo due problemi:
- conoscere l’influenza dei fattori di processo sulla caratteristica di rendimento;
- conosce l’influenza dei fattori di processo sulla variabilità della caratteristica.
Dobbiamo pertanto sviluppare due modelli:
= f(x1,x2)
2 = f(x2,x3)
dove x1 è l’insieme dei fattori che influenzano solamente la caratteristica, x2 è l’insieme dei fattori
che influenzano sia la caratteristica che la sua variabilità, ed x3 è l’insieme dei fattori che
influenzano solamente la variabilità.
Per studiare questi fattori si utilizzano disegni sperimentali incrociati (molto simili a quelli visti
nello studio delle miscele).
208
Per lo sviluppo dei due modelli (caratteristica e sua varianza) si costruisce una matrice
sperimentale D (matrice dei parametri controllabili) che esplora il dominio sperimentale con n
condizioni sperimentali.
In ogni condizione l’esperimento è ripetuto m volte.
Queste m osservazioni (m per ciascuna delle n condizioni sperimentali) possono anche essere
ottenute costruendo per ogni esperimento della matrice D una seconda matrice sperimentale con
piccole variazioni controllate dei fattori intorno alle condizioni imposte per ogni esperimento.
Questa seconda matrice, d, è la matrice sperimentale di variabilità.
Figura 5-163 – Piano sperimentale incrociato
Il numero totale di esperimenti è n m e Taguchi raccomanda la utilizzazione di matrici fattoriali 3 k
o 3(k-r) per costruire le due matrici sperimentali.
Normalmente si utilizza un disegno frazionato, per diminuire il numero di esperimenti necessario,
ma così si perde la conoscenza delle interazioni che Taguchi ritiene poco importanti.
Una alternativa è una serie di disegni proposti da Taguchi, di cui sotto sono mostrati tre esempi,
L8, L12 e L18. Nelle tabelle il numero indica il livello del fattore.
209
A seconda del numero di fattori e del numer di livelli per fattori sono suggeriti i disegni:
210
Una alternativa ulteriore è la creazione di disegni random.
Supponiamo che il problema sia quello della produzione di caffè decaffeinato usando CO2
supercritica come solvente. Per ottimizzare l’efficienza di eliminazione della caffeina si esaminano
due differenti pressioni di CO2, 3 temperature, 3 rapporti CO2/caffè, 3 tempi di contatto, e due
procedimenti di pretostatura.
Un disegno fattoriale completo richiede 108 esperimenti. Il disegno di Taguchi consigliato è L18,
con 18 esperimenti. I disegni random danno buoni risultati solo se il numero dei fattori è >50
(salvo che siano guidati con qualche accorgimento, come abbiamo visto studiano i disegni
supersaturi). Pertanto la scelta è sul disegno L18.
Le matrici di Taguchi sono state sviluppate sotto l’ipotesi che le interazioni siano poco importanti.
Disegni alternativi sono stati sviluppati quando lo sperimentatore è a conoscenza del fatto che
alcune interazioni sono importanti.
Lo studio delle interazioni è facilitato da grafici, quale quello in Figura 5-164, che si riferisce alla
matrice L8.
Figura 5-164 – Grafico delle interazioni per L8
211
Per la matrice L8 abbiamo gli alias
Fattore
1
1
1
2
2
2
3
3
3
4
4
4
5
5
5
6
6
6
7
7
7
Interazione
2 3
4 5
6 7
1 3
4 6
5 7
1 2
4 7
5 6
1 5
2 6
3 7
1 4
2 7
3 6
1 7
2 4
3 5
1 6
2 5
3 4
Nella Figura 5-164 il fattore 1 è connesso (nodo e linea) a 2 e 3, a 4 e 5, a 6 e 7, i suoi alias. Il
fattore 2 è connesso a 1 e3, a 5 e 7, a 4 e 6, i suoi alias,e così via. L’insieme delle linee indica l’alias
del fattore 3 con l’interazione 5-6, del fattore 5 con l’interazione 3-6, del fattore 6 con l’interazione
3.5.
Per matrici sperimentali maggiori il grafico delle interazioni è più complesso e può essere di
difficile interpretazione.
La Figura 5-165 mostra il grafico delle interazioni per L16.
212
Figura 5-165 – Grafico delle interazioni per L16
213