Introduzione
 Data una funzione f che dipende da una o più variabili, si
vogliono trovare i valori delle variabili in corrispondenza dei
quali f assume valore massimo o minimo, e calcolare tale valore
 i due problemi sono equivalenti:

il massimo (minimo) di f è il minimo (massimo) di –f
 Classificazione degli estremi:
 estremo globale: è il punto in cui la funzione assume il valore più
alto (o più basso) in assoluto
 estremo locale: è il punto in cui la funzione assume il valore più alto
(o più basso) limitatamente ad un intorno dell’estremo (massimi e
minimi relativi)
 In genere si vogliono ricercare gli estremi locali di una funzione
 Ci sono due tipi di metodi di ricerca di massimi e minimi:
 metodi che non richiedono il calcolo delle derivate
 metodi che richiedono il calcolo delle derivate


nel caso multidimensionale la derivata è un gradiente
in genere questi metodi richiedono un numero maggiore di calcoli, ma
sono più efficaci
Intrappolamento (“bracketing”)
 Un minimo di una funzione f(x) si dice intrappolato se
esistono tre punti a,b,c con a<b<c tali che f(b)<f(a) e f(b)<f(c)
 in questo caso, se f(x) è continua, il minimo si troverà in un punto
dell’intervallo [a,c]
 nel caso di un massimo, devono esistere tre punti a,b,c con
a<b<c tali che f(b)>f(a) e f(b)>f(c)
y
f(a)
f(c)
f(b)
a
b
c
x
Metodo della sezione aurea (1)
 Si parte da un minimo inizialmente intrappolato
 Detti a,b,c i punti che intrappolano il minimo si ha:
abc
f (b)  f (a)  f (b)  f (c)
 Analogamente a quanto viene fatto nel metodo di bisezione, si cerca un
nuovo punto x, compreso tra a e b oppure tra b e c, che restringa l’intervallo
 Supponiamo di scegliere x tra b e c:
 se f(x)>f(b) il nuovo tripletto di punti sarà a,b,x
 se f(x)<f(b) il nuovo tripletto di punti sarà b,x,c
y
y
a
b
x
c
x
a
b
x
c
x
Metodo della sezione aurea (2)
 Il processo di intrappolamento viene arrestato quando la distanza c-a
è sufficientemente piccola
 se  è la precisione della macchina, si potrebbe pensare di fermare il
processo quando a=b(1- ) e c=b(1+ )
 in realtà conviene fermarsi prima per evitare troppi calcoli
 Se x=b è la posizione del minimo, in un intorno di x si ha:
f ( x)  f (b) 
1
2
f (b) x  b 
2
 Il secondo termine della somma deve essere trascurabile rispetto al
primo (di un fattore ):
2 f (b)
2 f (b)
1
2
f (b)x  b    f (b)  x  b 
 x b  b 
2
f (b)
b 2 f (b)
 Poiché il termine sotto radice è in genere dell’ordine dell’unità, è
sufficiente che la larghezza frazionaria dell’intervallo |x-b|/b sia
dell’ordine di ε1/2
 in questo modo si evita di effettuare troppe bisezioni
Metodo della sezione aurea (3)
 Quale è la strategia migliore per scegliere il nuovo punto x
in ogni iterazione?
 Poniamo:
W
ba
c b
 1W 
ca
ca
 Supponiamo che il punto x successivo si trovi tra b e c e
poniamo:
Z
x b
ca
 Se x si trova tra a e b si ragiona analogamente (in questo
caso sarà Z<0)
Z(c-a)
W(c-a)
a
(1-W)(c-a)
b
x
c
Metodo della sezione aurea (4)
 A seconda del valore di f(x) si sceglierà il nuovo tripletto di punti:
 se f(x)>f(b) i nuovi 3 punti da usare sono a,b,x

il nuovo intervallo [a,x] ha lunghezza (W+Z)(c-a)
 se f(x)<f(b) i nuovi 3 punti da usare sono b,x,c

il nuovo intervallo [b,c] ha lunghezza (1-W)(c-a)
 Conviene scegliere Z in maniera tale che, qualunque condizione si
verifichi, l’intervallo finale abbia sempre la stessa lunghezza:
W  Z  1 W  Z  1  2W
 Con questa scelta |b-a|=|x-c|:
b  a  W (c  a )
x  c  ( x  b)  (c  b)  Z (c  a)  (1  W )(c  a) 
( Z  1  W )(c  a )  W (c  a)
Z(c-a)
W(c-a)
a
W(c-a)
(1-W)(c-a)
b
x
c
Metodo della sezione aurea (5)
 Il punto x è il simmetrico di b nell’intervallo [a,c]
 il punto x si trova sempre all’interno del più lungo tra i segmenti [a,b] (se
Z<0) e [b,c] (se Z>0)
 Consideriamo i tripletti di punti a,b,c e b,x,c:
ba
W
ca
x b
Z c  a 
Z


c  b 1  W c  a  1  W
 Se gli intervalli vengono divisi sempre allo stesso modo, allora i due rapporti
devono essere uguali e quindi deve aversi:
Z
 W  Z  W 1  W 
1W
1  2W  W  W 2  W 2  3W  1  0  W 
Z(c-a)
W(c-a)
a
3 5
 0.38197
2
W(c-a)
(1-W)(c-a)
b
x
c
Metodo della sezione aurea (6)
 L’intrappolamento ottimale porta a tripletti di punti in cui il
punto centrale si trova ad una distanza frazionaria W=0,38197 da
uno dei due estremi e ad una distanza frazionaria 1-W=0,61803
dall’altro estremo (sezioni auree)
 Dato un tripletto di punti a,b,c, il punto successivo x in cui
calcolare il valore della funzione si trova alla distanza frazionaria
W=0.38197 dal punto di mezzo del tripletto, nel più lungo dei
due intervalli [a,b] o [b,c]
 Se gli intervalli del tripletto di partenza non rispettano i rapporti
aurei non è un problema
 la procedura iterativa converge rapidamente verso intervalli ottimali
 La dimensione dell’intervallo ottenuto alla n-esima iterazione è
pari a 0,61803 volte la dimensione dell’intervallo ottenuto alla (n1)-esima iterazione
 questo valore va confrontato con il valore di 0,5 del metodo di
bisezione per la ricerca degli zeri
Interpolazione parabolica (1)
 Se la funzione f(x) è abbastanza regolare, in un intorno del minimo
si può approssimare il suo grafico con quello di una parabola
 Sia x0 l’ascissa del minimo e sviluppiamo f(x) in serie di Taylor in un
intorno di x0:
f  x   f  x0  
1
2
f  x0  x  x0   
2
avendo sfruttato il fatto che f’(x0)=0
 In prossimità del minimo ha dunque senso approssimare il grafico
della funzione con quello di una parabola
 Una volta individuati 3 punti a,b,c che intrappolano il minimo di
f(x) consideriamo la parabola per i tre punti [a,f(a)], [b,f(b)] e
[c,f(c)]
 il minimo della parabola (che ne è anche il vertice) sarà usato come
approssimazione del minimo della funzione
Interpolazione parabolica (2)
 Scriviamo l’equazione della parabola che passa per i tre
punti [a,f(a)], [b,f(b)] e [c,f(c)] nella forma:
y  Ax  b   Bx  b   C
2
e determiniamo i parametri A, B e C:
 Aa  b 2  Ba  b   C  f a 

C  f b 
 Ac  b 2  Bc  b   C  f c 

 Aa  b 2  Ba  b   f a   f b 

C  f b 
 Ac  b 2  Bc  b   f c   f b 

 Restano da risolvere la prima e la terza equazione per
trovare i valori di A e B
Interpolazione parabolica (3)
 Riscrivendo in maniera opportuna le due equazioni e
sottraendo membro a membro si ha:
f a   f b 



A
a

b

B


a b

 Ac  b   B  f c   f b 

c b
B
f a   f b 

 A  a  b  a  b 2


 A  B  f c   f b 

c b
c  b 2
f c   f b  f a   f b 


c b
a b
1  f c   f b  f b   f a 
A


c a  c b
b  a 
Ac  a  
1  f c   f b  f a   f b 
 1
B




2
2

c  b 
a  b 
c  b a  b
ca
f c   f b  f b   f a 
B



2
2
c  b b  a  c  b 
b  a 
B
1  b  a  f c   f b  c  b  f b   f a  



c  b 
b  a 
ca 

Interpolazione parabolica (4)
 Cerchiamo adesso l’ascissa del minimo della parabola:
dy
B
 0  2 A x  b   B  0  x  b 
dx
2A
 Sostituendo i valori di A e B determinati prima si ha:
1  b  a  f c   f b  c  b  f b   f a  



c  b 
b  a 
ca 
B

x b
b
2  f c   f b  f b   f a  
2A


c a  c b
b  a 
1 b  a   f c   f b   c  b   f b   f a 
x b
2 b  a  f c   f b   c  b  f b   f a 
2
2
 L’interpolazione parabolica viene usata nel metodo di
Brent, in combinazione con la regola aurea
Metodo di Nelder e Mead (1)
 Il metodo di Nelder e Mead, noto come “downhill simplex method” o
“metodo dell’ameba”, permette di ricercare massimi e minimi di funzioni di
più variabili
 In tale metodo si utilizzano soltanto i valori della funzione, senza
calcolarne le derivate
 Definizione: si chiama “simplex” in uno spazio a N dimensioni la figura
geometrica definita da N+1 vertici e da tutte le linee che connettono tali
vertici
 nello spazio a 2 dimensioni un simplex è un triangolo
 nello spazio a 3 dimensioni un simplex è un tetraedro
 In generale ci interessano i simplex non degeneri, ossia i simplex che
racchiudono un volume N-dimensionale
 nello spazio a 2 dimensioni un triangolo è degenere se i suoi 3 vertici sono
collineari

in tal caso il triangolo degenera in un segmento e la sua superficie è nulla
 nello spazio a 3 dimensioni un tetraedro è degenere se i suoi 4 vertici sono
complanari

in tal caso il tetraedro degenera in un triangolo ed il suo volume è nullo
 in generale, nello spazio a N dimensioni un simplex è degenere se i suoi N+1
vertici sono contenuti in un iperpiano di dimensione N-1
Metodo di Nelder e Mead (2)
 Si sceglie un simplex di partenza individuato dagli N+1
punti P0,P1,...,PN
 in genere conviene fissare P0 e scegliere gli altri N punti in
modo che sia:
Pi  P0  ei
i  1...N
dove gli ei sono N vettori unitari linearmente indipendenti
e λ è una costante che può rappresentare una costante di
scala del problema in esame
 in principio si possono scegliere N valori di λi diversi
 Si procede in maniera iterativa:
 in ogni iterazione il simplex ottenuto nell’iterazione
precedente viene opportunamente modificato
Metodo di Nelder e Mead (3)
 Possibili operazioni:
 riflessione: il punto in cui f(x) ha il valore più alto viene
sostituito con il suo simmetrico rispetto alla faccia opposta
del simplex
 riflessione con espansione: il punto in cui f(x) ha il valore più
alto è sostituito con un punto simmetrico rispetto alla faccia
opposta del simplex, a distanza maggiore
 contrazione lungo una dimensione: il punto in cui f(x) ha il
valore più alto è sostituito con un punto lungo la
perpendicolare alla faccia opposta, a distanza minore
 contrazione lungo tutte le dimensioni verso il punto in cui
f(x) ha il valore più basso: gli altri N punti del simplex dove
f(x) ha il valore maggiore vengono spostati lungo la
congiungente con il punto in cui f(x) ha il valore più basso in
direzione di tale punto
Metodo di Nelder e Mead (4)
B
riflessione
riflessione con
espansione
A’
C
A
A’
C
B
A
f(A)>f(B)>f(C)
contrazione
in una
dimensione
B’
C
A’
B
A’
C
A
B
contrazione
lungo più
dimensioni
A
Metodo di Nelder e Mead (5)
Metodo di Nelder e Mead (6)
 La procedura iterativa sceglie di volta in volta quale è
l’operazione più opportuna da compiere sul simplex di
partenza
 La procedura termina quando la distanza percorsa in
una iterazione è più piccola di un valore di tolleranza
prefissato dall’utente
 tipicamente si sceglie una tolleranza pari alla precisione
della macchina
 A volte la procedura iterativa può essere terminata
erroneamente
 è sempre bene far ripartire l’algoritmo dal punto in cui è
stato individuato il minimo

se effettivamente il punto di partenza è un minimo, allora la
procedura iterativa restituirà ancora una volta tale punto
Esempio
 Consideriamo la funzione f(x,y)=(1-x)2+100(y-x2)2+1
 Tale funzione ha un minimo in (1,1) e f(1,1)=1
Scarica

Ricerca di minimi e massimi di funzioni