Scopi della CHEMIOMETRIA 1) Estrazione delle informazioni dai dati (analisi dei dati) 2) Ottimizzazione delle procedure sperimentali (raccolta dei dati) conoscenza metodi statistici metodi tradizionali tempo e fatica Scopi dell’OTTIMIZZAZIONE ottenere la massima informazione con il minor numero di esperimenti costruire un modello matematico in modo da ottenere la migliore risposta come? 1. Identificare le variabili importanti (tramite Factorial o Fractional Design) 2. Costruzione del modello matematico (superfici di responso) Principio di Pareto: poche le variabili importanti molte le variabili triviali facctors and interactions Perché usare le variabili più importanti? size of the effetc J. M Juran, Managerial Breakthrough, 1964 La Regola 80/20: Si ha l’80% di miglioramento nelle prestazioni del processo cambiando il 20% delle variabili 3 possibilità di approccio al problema esaminare gli effetti variando una variabile per volta approccio a matrice: quanti più esperimenti possibile impiego di metodi statistici resa resa Esempio: Ipotetici risultati sulla resa di un esperimento condotto secondo l’approccio una-variabile-per-volta tmax = 130 min Tmax = 225 °C tempo (min) Primo set di esperimenti: temperatura mantenuta costante a 225 °C temperatura (°C) Secondo set di esperimenti: tempo di osservazione fissato a 130 min X1 se si varia una variabile per volta, solo una piccola parte dello spazio sperimentale viene esplorata… X2 X1 …al contrario, se si variano le due variabili contemporaneamente X2 Disegni Fattoriali Completi chiameremo... fattore variabile sperimentale livello numero di valori da assegnare ai fattori effetto variazione del fattore disegno fattoriale esame della distribuzione degli effetti nella variazione totale del responso k numero dei fattori n numero dei livelli considerati nk numero di esperimenti Disegni Fattoriali Completi n. b. : gli esperimenti sono condotti in ordine casuale Disegni Fattoriali Completi Esempio. Studiare l’influenza che la temperatura, il tempo di reazione e il catalizzatore (3 fattori) esercitano sulla resa (responso) di una reazione; si decide di utilizzare per ciascuna variabile 2 valori possibili (2 livelli): sono quindi richieste 8 prove sperimentali (23 = 8) Disegni Fattoriali Completi valori fattori T = temperatura (°C) K = tipo di catalizzatore (A o B) resa 40 (+) 20 (-) C = concentrazione (%) 160 (-) 180 (+) 160 (-) 180 (+) A (-) B (-) A (-) B (-) A (-) B (-) A (-) 60 52 72 83 54 45 68 B (-) 80 Disegni Fattoriali Completi rappresentazione geometrica dei risultati ottenuti 45 (+) 54 concentrazione (C) 40 20 80 68 52 (-) 60 72 (-) (+) 160 temperatura (T) (+) 83 180 (-) A B Effetto della Temperatura 45 (+) 54 concentrazione (C) 40 20 80 68 52 (-) 72 (-) (+) 160 temperatura (T) 180 (-) K 72 – 60 = 12 68 – 54 = 14 20 A 40 A 83 – 52 = 31 80 – 45 = 35 20 B 40 B La media di queste quattro differenze (+ 23) è detta effetto principale della (+) temperatura B 83 60 C A Effetto della Concentrazione 45 (+) 54 concentrazione (C) 40 20 68 52 (-) 72 (-) (+) temperatura (T) 180 (-) K 160 A 180 A 160 B 180 B La media di queste quattro differenze (-5) è detta effetto principale della (+) concentrazione B 83 60 160 54 – 60 = -6 68 – 72 = -4 45 – 52 = -7 80 – 83 = -3 80 T A Effetto del Catalizzatore 45 (+) 54 concentrazione (C) 40 20 80 72 (-) (+) 160 temperatura (T) (+) 83 60 180 C 160 20 180 20 160 40 180 40 La media di queste quattro differenze (1,5) è detta effetto principale del catalizzatore 68 52 (-) 52 – 60 = -8 83 – 72 = 11 45 – 54 = -9 80 – 68 = 12 T (-) A B Disegni Fattoriali Completi Effetto della temperatura = 72+68+83+80 4 Effetto della concentrazione = Effetto del catalizzatore = L’effetto principale di ciascuna variabile può anche essere calcolato come la differenza fra la media dei valori più alti (+) e la media dei valori più bassi (-) 60+54+52+45 4 54+68+45+80 4 52+83+45+80 4 60+72+52+83 4 60+72+54+68 N. B. a) sono state usate TUTTE le osservazioni per ottenere informazioni su ciascun effetto principale b) ciascun effetto è stato determinato con la precisione di differenze replicate quattro volte = 23 4 = -5 = 1,5 Interazione tra Due Fattori Considerando l’effetto della temperatura, il valore ottenuto è 23. Tuttavia risulta evidente che gli effetti maggiori sulla resa si hanno con il catalizzatore B. La variabile temperatura e catalizzatore non si comportano additivamente, per cui si può dire che interagiscano. Una misura di questa interazione è fornita dalla differenza fra la media dell’effetto di temperatura ottenuta in presenza del catalizzatore A e del catalizzatore B. Per convenzione, la metà della differenza è detta interazione temperatura-catalizzatore (T x K) catalizzatore medie eff. di temperatura (+) B 33 (-) A 13 differenza = 20 interazione T x K =20/2 = 10 Ricapitolando stima ± errore effetto media delle rese 64,25 ± 0,7 effetti principali Temperatura 23,0 ± 1,4 Concentrazione -5 ± 1,4 Catalizzatore 1,5 ± 1,4 interaz. a due fattori TxC 1,5 ± 1,4 TxK 10,0 ± 1,4 CxK 0,0 ± 1,4 interaz. a tre fattori TxCxK 0,5 ± 1,4 T C K Effetti principali TxC TxK Interazioni a due fattori CxK Interazioni a tre fattori TxCxK Vantaggi rispetto all’approccio un-fattore-per-volta: Viene osservato l’effetto di una fattore, mantenendo costanti i valori degli altri fattori: questo è l’approccio ritenuto più corretto dai più. Tuttavia, si ritiene necessario assumere che l’effetto sia lo stesso anche settando diversamente le altre variabili, cioè che le variabili agiscano additivamente sul responso (almeno nell’intervallo considerato). Comunque, anche quando le variabili agissero additivamente, l’approccio fattoriale darebbe risposte più precise. Se piuttosto le variabili non si comportano additivamente, l’approccio fattoriale, rispetto a quello un-fattore-per-volta, può individuare e dare una stima della misura di non additività Disegni Fattoriali Frazionari: 23-1 +++ -+- --+ +-- - + + - - - + - + + + 1 2 -++ 1 2 3 = -1*2 - - - + - + - + + + + - ++- +-+ 3 = 1*2 --- Diversi approcci a confronto: rappresentazioni geometriche 96 misure 15 misure pH pH tempo tempo conc. conc. efficace, ma troppe misure richieste una variabile alla volta: potrebbe richiedere molte misure, scarso lo spazio sperimentale esplorato a matrice: 15 misure centrale composito: poche misure, efficace ed esauriente, tutto lo spazio sperimentale viene esplorato Although these problem solving methods [statistical approach] have a long and succesful history in many areas of science, resistence to change is universal. We have heard people express their resistance to changing their problem solving approach in some of the following sayings: - «We’ll worry about the statistics after we’ve run the experiment». - «Let’s vary one thing at time so that we don’t get confused». - «I’ll include that factor in the next experiment». - It’s too early to use statistical methods». - «A statistical experiment would be too large». - «My data are too variable to use statistics». However, these reasons are precisely why statistical problem solving tools should be used…