Università degli Studi di Siena Dipartimento di Ingegneria dell’Informazione e Scienze Matematiche DI Lecture Notes on COMPLEX DYNAMIC SYSTEMS MSc on Computer and Automation Engineering MSc in Ingegneria Gestionale MSc in Matematica Chiara Mocenni {[email protected]} http://www.dii.unisi.it/∼mocenni/compdynsys-teach.html A.A. 2013-2014 Indice Introduzione 1 1 I sistemi lineari 2 2 Mappe e Punti Fissi 2.1 La mappa logistica . . . . . . . . . . . . . . . . . . . . . . . . . 2.2 Mappe di Poincaré . . . . . . . . . . . . . . . . . . . . . . . . . 2.3 Stabilità lineare di orbite periodiche . . . . . . . . . . . . . . . . 5 6 8 9 3 Biforcazioni di Sistemi Dinamici 3.1 Biforcazione Nodo-Sella . . . . . . 3.2 Biforcazione Transcritica . . . . . . 3.3 Biforcazione Pitchfork Supercritica 3.4 Biforcazione Pitchfork Subcritica . 3.5 Biforcazione di Hopf . . . . . . . . 4 Flussi sul cerchio e simulazioni 4.1 Pendolo semplice . . . . . . . 4.2 Pendolo sovrasmorzato . . . . 4.3 Beat phenomenon . . . . . . . 4.4 Lucciole . . . . . . . . . . . . 5 Il modello di Lorenz . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 10 11 12 13 14 15 . . . . 18 18 21 22 24 32 6 Controllo del caos 42 6.1 Controllo di un processo caotico in continua evoluzione . . . . . 43 6.2 Targeting . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 44 6.3 Controllo del sistema di Lorenz . . . . . . . . . . . . . . . . . . 45 Bibliografia 54 i Introduzione Questo corso ha come obiettivo la presentazione delle basi metodologiche che hanno portato alla definizione e all’analisi dei sistemi dinamici complessi. Tali metodologie trovano il loro fondamento nell’insieme delle teorie matematiche che consentono di modellizzare e studiare i sistemi dinamici non lineari, come la teoria qualitativa delle equazioni differenziali, l’analisi della stabilià delle soluzioni di equilibrio, la teoria delle biforcazioni e la teoria del caos deterministico. La ricerca di tali strumenti è stata stimolata dall’esigenza di rappresentare, mediante modelli matematici, sistemi reali complessi che evolvono nel tempo, come il moto dei pianeti, le oscillazioni di un pendolo, il flusso delle correnti atmosferiche, lo scorrere più o meno regolare dell’acqua in un fiume, il numero di insetti che anno dopo anno popolano una certa regione, l’andamento giornaliero dei prezzi delle azioni nei mercati finanziari e cosı̀ via. Ciò che accomuna tali sistemi è la presenza di oscillazioni e fluttuazioni che lasciano intuire la presenza di fenomeni stocastici e irregolarità dovute a fattori esogeni. In realtà, si è visto che esistono una serie di sistemi dinamici descritti da equazioni deterministiche (cioè senza componenti esogene stocastiche) non lineari relativamente semplici che possono dar luogo a soluzioni estremamente irregolari e imprevedibili. Tale dinamica prende il nome di caos deterministico. L’apparente contraddizione contenuta nel termine caos deterministico nasce dal fatto che i modelli matematici di tipo deterministico vengono in genere associati all’idea di fenomeni regolari, prevedibili, che si ripetono nel tempo, mentre il termine caotico viene riferito a situazioni caratterizzate da assenza di regole e da imprevedibilità. Grazie all’insieme degli strumenti che consentono di descrivere e analizzare i sistemi dinamici complessi siamo in grado oggi di cogliere le caratteristiche principali che si trovano alla base dei fenomeni complessi che osserviamo ogni giorno nella natura e nella nostra vita. 1 Capitolo 1 I sistemi lineari Si consideri il sistema dinamico descritto dalla seguente equazione differenziale ordinaria: ẋ = f (x), x ∈ Rn , (1.1) è la derivata temporale dello stato x. Una soluzione di (1.1) è una dove ẋ = dx dt funzione x(x0 , t) a valori in Rn dipendente da t e condizione iniziale x(0) = x0 . Possiamo interpretare la parte destra di (1.1) come un flusso φt : U → Rn , U ⊆ Rn , dove φt (x) = φ(x, t) è una funzione smooth, che soddisfa la (1.1), definita per ogni x in U e t in qualche intervallo I = (a, b) ⊆ R. Se il sistema è lineare e autonomo, cioè non dipende esplicitamente dal tempo t, f (x) = Ax, dove A è una matrice a coefficienti costanti. In questo caso la soluzione della (1.1) è x(x0 , t) = etA x0 , (1.2) dove etA è la matrice definita come segue: etA = [I + tA + tn t2 2 A + · · · + An + . . . ]. 2! n! (1.3) Una soluzione generale x(t) della (1.1) può essere ottenuta comme combinazione di n soluzioni indipendenti {x1 (t), . . . , xn (t)}: x(t) = n X cj xj (t), j=1 dove le n costanti incognite possono essere calcolate dalle condizioni iniziali. Se A ha n autovettori linearmente indipendenti v j , j = 1, . . . , n, allora possiamo utilizzare come base dello spazio delle soluzioni le funzioni xj (t) = eλj t v j , 2 3 dove λj è l’autovalore associato all’autovettore v j . Per una coppia di autovalori complessi λ̄j = αj ±iβj con autovettori v R ±iv I , possiamo prendere come coppia di soluzioni reali indipendenti ad essi associate xj = eαj t (v R cos(βt) − v I sin(βt)), xj+1 = eαj t (v R cos(βt) + v I sin(βt)). Denotiamo con X(t) = [x1 (t), . . . , xn (t)] la matrice fondamentale delle soluzioni che ha le n soluzioni nelle colonne. Le colonne xj (t), j = 1, . . . , n di X(t) formano una base dello spazio delle soluzioni della (1.1), e inoltre etA = X(t)X(0)−1 . Nel caso in cui gli autovalori abbiano molteplicità maggiore di uno, è possibile trovare una trasformazione invertibile che diagonalizza A o almeno permette di scriverla in forma normale di Jordan. L’equazione (1.1) diventa allora ẏ = Jy, dove J = T −1 AT e x = T y e le colonne sono gli autovettori generalizzati di A. L’esponenziale di A diventa allora etA = T etJ T −1 , dove gli esponenziali sono calcolati per le tre matrici 2 x 2 in forma di Jordan: λt λ1 0 e 1 0 tA A= e = ; 0 λ2 0 eλ2 t α −β tA αt cos(βt) −sin(βt) A= e =e ; β α sin(βt) cos(βt) λ 0 1 0 A= etA = eλt . 1 λ t 1 4 Consideriamo ora il caso in cui n = 2 a A= c e b . d Il determinante della equazione caratteristica è λ2 − τ λ + ∆ = 0, dove τ = traccia(A) = a + d; ∆ = det(A) = ad − bc. Abbiamo λ1,2 = τ± √ τ 2 − 4∆ , 2 ∆ = λ1 λ2 , τ = λ1 + λ2 . Questo permette di classificare la stabilità delle soluzioni per ogni combinazione degli autovalori e di visualizzare questa classificazione nel piano (∆, τ ) come segue: • ∆ < 0: gli autovalori hanno segno opposto. Il punto di equilibrio x = 0 è un punto di sella, cioè il sistema è asintoticamente instabile; • ∆ > 0: gli autovalori hanno lo stesso segno o sono complessi coniugati. Il punto di equilibrio è un nodo se τ 2 −4∆ > 0 e una spirale se τ 2 −4∆ < 0. La parabola τ 2 − 4∆ = 0 è il caso limite in cui si trovano le stelle e i nodi degeneri. La stabilità dei nodi e delle spirali è determinata da τ : se τ < 0 tutti e due gli autovalori hanno parte reale negativa, quindi il punto di equilibrio è asintoticamente stabile; se invece τ > 0 si hanno nodi e spirali instabili. I centri (soluzioni marginalmente stabili) si trovano nell’asse τ = 0; • ∆ = 0: c’è almeno un autovalore nullo, ciò significa che l’origine non è un punto di equilibrio isolato (stabilità marginale): esiste almeno una linea di punti di equilibrio o addirittura un piano di punti di equilibrio (per τ = 0). Esempio: Studiare il sistema ẋ = x + y; ẏ = 4x − 2y, (x0 , y0 ) = (2, −3). Capitolo 2 Mappe e Punti Fissi Una mappa è descritta da una equazione del tipo xn+1 = f (xn ), (2.1) dove f è una funzione continua con derivata continua, f : R → R. Vengono chiamate mappe le equazioni alle differenze, le iterazioni, e in generale le equazioni in cui il tempo è discreto. Definizione. x∗ si dice punto fisso per la mappa (2.1) se: f (x∗ ) = x∗ . (2.2) Per la (2.2), se per qualche n accade che xn = x∗ , allora xn+1 = f (xn ) = f (x∗ ) = x∗ , cioè l’orbita di (2.1) rimane uguale a x∗ per tutte le iterazioni successive. Per studiare la stabilità di x∗ si considera un’orbita vicina xn = x∗ + ηn e si analizza il fatto che essa sia attratta o respinta da x∗ stessa, cioè si si va a vedere se la perturbazione ηn cresce o si riduce. Sostituendo nella (2.1) otteniamo: x∗ + ηn+1 = xn+1 = f (x∗ + ηn ) = f (x∗ ) + f 0 (x∗ )ηn + O(ηn2 ). (2.3) Poichè f (x∗ ) = x∗ , l’equazione (6.19) diventa ηn+1 = f 0 (x∗ )ηn + O(ηn2 ). (2.4) Se trascuriamo i termini in η 2 otteniamo una equazione lineare in η con autovalore, detto anche in questo caso moltiplicatore, λ = f 0 (x∗ ). La soluzione della mappa lineare si trova iterando a partire da un valore iniziale η0 : ηn = λn η0 . (2.5) Si distinguono tre casi: 5 2.1. LA MAPPA LOGISTICA 6 i) |λ| = |f 0 (x∗ )| < 1. In questo caso ηn → 0 per n → ∞ e il punto fisso è linearmente stabile. ii) |λ| = |f 0 (x∗ )| > 1. In questo caso ηn → ∞ per n → ∞ e il punto fisso è linearmente instabile. iii) |λ| = |f 0 (x∗ )| = 1. In questo caso il punto fisso è marginalmente stabile e la sua stabilità è determinata dai termini non lineari. 2.1 La mappa logistica Esempio. Determinare la stabilità dei punti fissi della mappa logistica: xn+1 = f (xn ) = rxn (1 − xn ). (2.6) Assumiamo x ≥ 0. I punti fissi della mappa corrispondono alle intersezioni del grafico della funzione f (xn ) con la bisettrice del piano (xn , xn+1 ), cioè soluzioni tali che xn , xn+1 . Nel caso della mappa2.6 i punti fissi sono: x∗1 = 0 e x∗2 = 1 − 1/r. x∗1 è un punto fisso per ogni valore di r, mentre x∗2 lo è solo per r ≥ 1. Poiché la mappa è non lineare, la stabilità delle soluzioni di equilibrio (punti fissi), può essere analizzata effettuando una linearizzazione intorno ai punti fissi. Tale stabilità dipende dunque, localmente, dal moltiplicatore f 0 (x∗ ) = r − 2rx∗ . • x∗1 = 0. Poichè f 0 (x∗1 ) = r, l’origine è stabile per r < 1 ed instabile per r > 1. • x∗2 . f 0 (x∗2 ) = 2 − r, quindi x∗2 è stabile per −1 < (2 − r) < 1, cioè per 1 < r < 3, e instabile per r > 3. • Per r > 3 entrambi i punti fissi sono instabili. • Per r = 3 f 0 (x∗2 ) = −1, cioè r raggiunge un valore critico (per il quale la stabilità della soluzione di equilibrio del sistema linearizzato è marginalmente stabile) superato il quale il punto x∗2 perde la sua stabilità e le traiettorie del sistema cominciano ad oscillare indefinitamente tra due valori. 2.1. LA MAPPA LOGISTICA 7 Questo tipo di perdita di stabilità prende il nome di biforcazione flip. Quello che succede al sistema quando avviene una biforcazione flip è che un ciclo di periodo T perde la sua stabilità dando luogo ad un ciclo di periodo 2T . Per capire questo fatto osserviamo che un ciclo di periodo 2T è un ciclo di periodo T per la seconda iterata della mappa f : f 2 (x) = f (f (x)). Poichè in questo caso f (x) è un polinomio quadratico, f 2 (x) è un polinomio di quarto grado che piò avere fino a 4 intersezioni con la bisettrice. La biforcazione flip può manifestarsi in ogni tipo di mappe. Il ciclo di periodo 2 rimane stabile per 3 < r < 3.449. Oltre questo valore anch’esso perde la propria stabilità dando luogo ad un nuovo ciclo di periodo 4T . Per comprendere questo fenomeno basta analizzare la quarta iterata della mappa f (x) o la seconda iterata della mappa f 2 (x). Questo meccanismo si ripete per valori sempre crescenti di r, fino a che per r > 3.57 si osserva un comportamento aperiodico denominato caos deterministico. E’ interessante osservare che la mappa logistica ha la seguente proprietà: limn→∞ rn − rn−1 = 4.669, rn+1 − rn cioè esiste una costante universale δ = 4.669 chiamata costante di Feigenbaum che fissa il rapporto che lega valori consecutivi della costante di biforcazione. Il diagramma di biforcazione della mappa logistica è mostrato nella seguente figura: Figura 2.1: Diagramma di biforcazione della mappa logistica. 2.2. MAPPE DI POINCARÉ 2.2 8 Mappe di Poincaré Una classe molto importante di mappe è rappresentata dalle mappe di Poincaré. Sia S una superficie di dimensione n − 1 trasversale al flusso definito da ẋ = f (x). Sia inoltre xk la k − esima intersezione del flusso con la superficie S. Si definisce mappa di Poincaré la mappa seguente: xk+1 = P (xk ), dove P : S → S rappresenta la successione delle intersezioni successive del flusso con S (vedi figura 2.2). Figura 2.2: Mappa di Poincaré (source: Scholarpedia). Per definizione, se x∗ è un punto fisso della mappa di Poincaré, allora P (x∗ ) = x∗ . Ciò significa che la traiettoria del sistema è una curva chiusa. Le mappe di Poincaré riducono il problema dell’esistenza di una curva chiusa per un sistema dinamico all’esistenza di un punto fisso per una mappa di dimensione inferiore. Si consideri ad esempio il sistema ṙ = r(1 − r2 ); θ̇ = 1. Se prendiamo S uguale all’asse x positiva, il primo ritorno R r1 sudr S avviene R 2π dopo t = 2π. La mappa di Poincaré r1 = P (r0 ) è definita da r0 r(1−r2 ) = 0 dt = 2π. 2.3. STABILITÀ LINEARE DI ORBITE PERIODICHE 2.3 9 Stabilità lineare di orbite periodiche Sia ẋ = f (x) un sistema dinamico con un’orbita chiusa. Ci poniamo la domanda se questa orbita sia stabile, ovvero se il punto fisso x∗ della mappa di Poincaré sia stabile. Si applica una perturbazione infinitesima v0 ad x∗ tale che x∗ + v0 sia in S. Dopo il primo ritorno si ha che: x∗ + v1 = P (x∗ + v0 ) = P (x∗ ) + [DP (x∗ )] v0 + O(||v0 ||2 ), dove DP (x∗ ) è la matrice della mappa di Poincaré linearizzata intorno a x∗ . Allora la stabilità del punto fisso x∗ si esprime in base agli autovalori λj di DP (x∗ ). L’orbita chiusa è stabile sse |λj | < 1, ∀j = 1, . . . , n − 1. Gli autovalori λj prendono anche il nome di Moltiplicatori di Floquet. Si consideri l’esempio precedente ṙ = r(1 − r2 ); θ̇ = 1. Sappiamo che esiste un ciclo limite r∗ = 1. Sia r = 1 + η con η infinitesimo. Allora ṙ = η̇ = (1 + η)(1 − (1 + η)2 ). Se trascuriamo i termini non lineari, otteniamo η̇ = −2η, cioè η(t) = η0 e−2t . Dopo 2π, η1 = e−4π η0 e e−4π è il moltiplicatore di Floquet. Poiché |e−4π | < 1 si deduce che il ciclo limite r∗ = 1 è stabile. Capitolo 3 Biforcazioni di Sistemi Dinamici Un punto di equilibrio di un sistema dinamico di ordine n è detto iperbolico se tutti gli autovalori del sistema linearizzato intorno al punto di equilibrio si trovano fuori dall’asse immaginario. L’importante teorema di Hartman-Grobman stabilisce che il phase portrait (cioè il diagramma di tutte le traiettorie del sistema dinamico nello spazio delle fasi) vicino ad un punto iperbolico è topologicamente equivalente al phase portrait del sistema linearizzato. Topologicamente equivalente significa che esiste un omeomorfismo (cioè una deformazione continua con inversa continua) che trasforma un phase portrait locale nell’altro, mappa traiettorie in traiettorie e mantiene la direzione temporale. In particolare, le proprietà di stabilità del punto di equilibrio sono completamente caratterizzate da quella della soluzione del sistema linearizzato. Un phase portrait viene detto strutturalmente stabile se la sua topologia non può essere modificata da una perturbazione arbitrariamente piccola del campo vettoriale. Se analizziamo le proprietà di un sistema dinamico in funzione dei parametri che compaiono nelle equazioni, può accadere che vi siano dei cambiamenti nella struttura qualitativa delle soluzioni per qualche valore dei parametri. Questi cambiamenti vengono chiamati biforcazioni e i parametri che danno loro luogo prendono il nome di valori di biforcazione. Definizione 1. Dato il sistema dinamico ẋ = fµ (x), x ∈ Rn , µ ∈ Rk , (3.1) un valore µ0 di (3.1) per cui il flusso definito dal sistema (3.1) non è strutturalmente stabile è un valore di biforcazione di µ. Definizione 2. Il luogo dei punti nel piano (µ, x) degli insiemi invarianti di (3.1) si chiama diagramma di biforcazione. 10 3.1. BIFORCAZIONE NODO-SELLA 11 Di seguito vengono elencati i tipi più comuni di biforcazioni locali in termini della loro forma normale. La forma normale di una biforcazione è una rappresentazione prototipale di tutte le biforcazioni di quel tipo. Per chiarezza esaminiamo sistemi di ordine 1. Nelle equazioni che seguono r è un parametro che può essere positivo, negativo o nullo. 3.1 Biforcazione Nodo-Sella ẋ = r + x2 . (3.2) 20 15 10 5 0 −5 −10 −15 −6 −4 −2 0 2 4 Figura 3.1: Biforcazione Nodo-Sella. r0 = 0. 6 3.2. BIFORCAZIONE TRANSCRITICA 12 Figura 3.2: Diagramma di biforcazione: biforcazione nodo-sella. 3.2 Biforcazione Transcritica ẋ = rx − x2 . (3.3) 2 1.5 1 0.5 0 −0.5 −1 −1.5 −2 −2.5 −3 −3 −2 −1 0 1 2 3 Figura 3.3: Biforcazione Transcritica. r0 = 0. 3.3. BIFORCAZIONE PITCHFORK SUPERCRITICA 13 Figura 3.4: Diagramma di biforcazione: biforcazione transcritica. 3.3 Biforcazione Pitchfork Supercritica ẋ = rx − x3 . 3.4 Biforcazione Pitchfork Subcritica ẋ = rx + x3 . 3.5 (3.4) (3.5) Biforcazione di Hopf In sistemi di ordine almeno 2 si incontra anche un altro tipo di biforcazione: la Biforcazione di Hopf. Supponiamo che il sistema linearizzato abbia una coppia di autovalori complessi coniugati per il valore critico µ0 = 0 del parametro µ: λ = µ + iω, λ̄ = µ − iω 3.5. BIFORCAZIONE DI HOPF 14 3 2 1 0 −1 −2 −3 −2 −1.5 −1 −0.5 0 0.5 1 1.5 2 Figura 3.5: Biforcazione Pitchfork Supercritica. r0 = 0, α = −1, ω = 1, a = −1, b = 0. Figura 3.6: Diagramma di biforcazione: biforcazione pitchfork supercritica. La forma normale della biforcazione di Hopf è la seguente: ẋ = µx − ωy + (−x − by)(x2 + y 2 ) + O(|x|5 , |y|5 ), ẏ = ωx + µy + (bx − y)(x2 + y 2 ) + O(|x|5 , |y|5 ). (3.6) 3.5. BIFORCAZIONE DI HOPF 15 3 2 1 0 −1 −2 −3 −2 −1.5 −1 −0.5 0 0.5 1 1.5 2 Figura 3.7: Biforcazione Pitchfork Subcritica. r0 = 0. Figura 3.8: Diagramma di biforcazione: biforcazione pitchfork subcritica. L’equazione (3.6) in coordinate polari (x = rcos(θ), y = rsin(θ)) diventa: ṙ = µr − r3 + O(|r|5 ), θ̇ = ω + br2 + O(|r|4 ). (3.7) 3.5. BIFORCAZIONE DI HOPF 16 x ’ = mu x − omega y + ( − x − b y) (x2 + y2) y ’ = omega x + mu y + (b x − y) (x2 + y2) mu = − 1 omega = 1 b=1 3 2 y 1 0 −1 −2 −3 −3 −2 −1 0 x 1 2 3 Figura 3.9: Biforcazione di Hopf Supercritica. µ < 0. x ’ = mu x − omega y + ( − x − b y) (x2 + y2) y ’ = omega x + mu y + (b x − y) (x2 + y2) mu = 0 omega = 1 b=1 3 2 y 1 0 −1 −2 −3 −3 −2 −1 0 x 1 2 3 Figura 3.10: Biforcazione di Hopf Supercritica. µ = 0. 3.5. BIFORCAZIONE DI HOPF 17 x ’ = mu x − omega y + ( − x − b y) (x2 + y2) y ’ = omega x + mu y + (b x − y) (x2 + y2) mu = 1 omega = 1 b=1 3 2 y 1 0 −1 −2 −3 −3 −2 −1 0 x 1 2 3 Figura 3.11: Biforcazione di Hopf Supercritica. µ > 0. Figura 3.12: Diagramma di biforcazione: biforcazione di Hopf supercritica. Figura 3.13: Diagramma di biforcazione: biforcazione di Hopf subcritica. Capitolo 4 Flussi sul cerchio e simulazioni In questo capitolo viene descritta la la dinamica di sistemi oscillanti, quali il pendolo semplice ed il pendolo sovrasmorzato. Si introduce inoltre il concetto di sincronizzazione di sistemi dinamici. 4.1 Pendolo semplice Si consideri il sistema pendolo governato dalle seguenti equazioni dinamiche: θ̇ = ω ω̇ = −sin(θ) − Dω Con θ si rappresenta la posizione angolare del pendolo e con ω si intende la velocità angolare dello stesso (in realtà è la velocità angolare del centro di massa del sistema fisico pendolo). Il parametro D è la costante di proporzionalità relativa all’attrito viscoso del sistema, infatti la componente Dω dipende dalla velocità angolare del pendolo. Si considerino due casi distinti da analizzare nel piano delle fasi. Il primo in cui D = 0 e il secondo in cui D 6= 0 (ma positivo). Il piano delle fasi è caratterizzato da un campo vettoriale periodico di periodo 2π. Questo significa che si possono considerare due punti di equilibrio adiacenti per descrivere il comportamento del piano delle fasi. Caso 1: D = 0. Si consideri solo una finestra del piano delle fasi compresa fra i punti (θ,ω)=(−π,0) e (2π,0), riportata in Figura 4.1. In questo spazio vi sono quattro punti di equilibrio. Il primo, di coordinate x0 =(θ,ω)=(−π,0), è un punto di equilibrio instabile perchè non è nè un attrattore nè Lyapunov stabile (Re(λ) > 0). Il secondo punto, di coordinate x1 =(θ,ω)=(0,0), è un punto di equilirio marginalmente stabile (Re(λ) = 0), in quanto per condizioni iniziali 18 4.1. PENDOLO SEMPLICE 19 nell’intorno di x1 , le traiettorie tendono a formare un centro in x1 . Quindi il punto x1 è stabile ma non attrattivo (oscillatore armonico). Il terzo punto, di coordinate x2 =(θ,ω)=(π,0), è un punto di equilibrio instabile (è un punto di sella) perchè per una condizione iniziale nell’intorno della posizione di equilibrio x2 , la traiettoria associata diverge dal punto di equilibrio. Dato che il sistema non è smorzato (D = 0), una condizione iniziale nell’intorno della posizione di equilibrio instabile fa si che la traiettoria ad essa associata, per t → ∞, tenda a raggiungere la posizione di equilibrio instabile adiacente, oppure a portare il sistema in oscillazione nell’intorno della posizione di equilibrio stabile pi vicina (dipende dalla velocità iniziale). Fisicamente, considerando un filo inestensibile a cui è collegata una massa, libero di ruotare attorno ad un fulcro, portando il pendolo in posizione di equilibrio instabile e perturbando la sua posizione iniziale (velocità non nulla), esso tenderà ad allontanarsi dal punto di equilibrio instabile e continuerà ad oscillare per t → ∞. Il quarto punto, di coordinate x3 =(2π,0) è un punto di equilibrio con caratteristiche uguali al secondo punto. θ ’ =ω ω ’ = − sin(θ) − D ω 4 D=0 t tendente a −inf 3 2 ω 1 0 −1 P.to instabile (sella) −2 −3 P.to L.−stabile (centro) Centro −4 −3 −2 −1 0 1 2 3 4 5 6 θ Figura 4.1: Piano delle fasi del pendolo: D = 0. Caso 2: D 6= 0. Si sceglie D = 0.25 per la simulazione. In riferimento 4.1. PENDOLO SEMPLICE 20 alla Figura 4.1, il piano delle fasi risultante è diverso dal precedente per ciò che riguarda i punti di equilibrio stabili. Infatti considerando una condizione iniziale nell’intorno di un punto di equilibrio instabile, la traiettoria associata converge verso il punto di equilibrio stabile adiacente formando una spirale (λ ∈ C). In altri termini, la velocità del pendolo diminuisce gradualmente per t → ∞ e la posizione angolare si assesta nell’intorno della posizione di equilibrio stabile, al contrario di quanto accade per D = 0, caso in cui il pendolo oscilla sempre con la stessa ampiezza (oscillatore armonico). I punti di equilibrio stabili sono anche attrattori perchè le traiettorie con condizione iniziale nell’intorno dei punti di equilibrio stabili convergono ad essi per t → ∞. Aumentando il parametro D si nota che diminuisce il tempo con cui una traiettoria giunge nel punto di equilibrio stabile, partendo da un intorno di esso, per t → ∞ e con movimento a spirale. θ ’ =ω ω ’ = − sin(θ) − D ω 4 D = 0.25 t tendente a −inf P.to instabile (sella) Spirale 3 2 ω 1 0 −1 −2 −3 −4 P.to L.−stabile e attrattore (spirale) −3 −2 −1 0 1 2 3 4 5 6 θ Figura 4.2: Piano delle fasi del pendolo: D = 0.25. 4.2. PENDOLO SOVRASMORZATO 4.2 21 Pendolo sovrasmorzato In questa sezione si analizza un sistema oscillante al variare dei parametri caratteristici, mettendo in luce la perdita di uniformità dinamica del sistema stesso, cioè il moto del sistema non è più simmetrico. Descrizione del modello Si consideri il modello del pendolo fisico descritto dalla seguente equazione differenziale del secondo ordine: mL2 θ̈ + bθ̇ + mgLsin(θ) = Γ (4.1) in cui ogni parametro è positivo. In particolare m è la massa del pendolo, L è la lunghezza dello stesso, b è il coefficiente di attrito viscoso del sistema e Γ è una coppia costante positiva. Per inserire il modello nell’interfaccia di pplane7 si può riscrivere l’equazione differenziale del secondo ordine come sistema di equazioni del primo ordine come segue: θ̇ = ω ω̇ = − b F gsin(θ) − ω + L mL2 mL2 A questo punto si considera il caso in cui il pendolo sia sovrasmorzato imponendo b grande e il modello (4.1) diventa il seguente: Γ b θ̇ = sin(θ) mgL mgL dove τ= mgL Γ t; γ = b mgL Quindi si ottiene: θ0 = γ − sin(θ) dove θ0 = ∂θ ∂τ Simulazione Gli angoli sono misurati in senso antiorario. La posizione di equilibrio instabile vale π e quella stabile vale 0. Si analizzano i piani delle fasi risultanti al variare di γ che rappresenta il rapporto fra la coppia esterna applicata e la massima 4.3. BEAT PHENOMENON 22 coppia gravitazionale. Caso 1: γ → 1+ . Il piano delle fasi è mostrato in Figura 4.3.a. Sono visibili anche le nullclines, le quali non si intersecano mai, dati i parametri associati al modello (4.1), ma sono molto vicine ad ogni periodo della sinusoide in arancione (θ̇ = 0). Non esistono punti di equilibrio (F non viene mai annichilita), pertanto per ogni condizione iniziale il pendolo ruota per t → ∞. Il moto del pendolo è più rapido in discesa, partendo da una condizione iniziale pari a π per raggiungere 2π, piuttosto che in salita, partendo da 0 verso π (ω >> 0). Infatti in discesa agiscono sul pendolo sia la coppia F che la coppia gravitazionale, mentre in salita l’energia fornita dalla coppia F viene in parte persa con l’azione opponente della coppia gravitazionale e dell’attrito viscoso (supposto elevato). La Figura 4.3.b mostra una soluzione particolare del piano delle fasi in funzione del tempo. In particolare con b = 5 e γ → 1+ . Caso 2: γ > 1. Più è elevato il rapporto γ e più le nullclines si distanziano. Non esistono punti di equilibrio. In questo caso il tempo di salita e il tempo di discesa sono pressochè uguali, in quanto la coppia F è cosı̀ elevata da rendere quasi trascurabili i termini relativi alla forza peso e all’attrito viscoso. Caso 3: γ = 1. Appare un punto di equilibrio in posizione θ = π/2. In Figura 4.4 è rappresentato il piano delle fasi con γ = 1. Le nullclines si intersecano ad ogni periodo della sinusoide ed è evidenziato in rosso il punto di equilibrio (nodal skin) periodico. Caso 4: γ < 1. In questo caso i punti di equilibrio sono due e sono tanto più distanti quanto γ → 0. Il primo è uno spiral skin e il secondo è una sella. Il piano delle fasi è mostrato in Figura 4.5. Conclusioni. Si nota come al variare del rapporto γ si possa osservare un sistema oscillante non uniforme. Partendo da γ = 0 (caso non contemplato in quanto il sistema si riduce ad un oscillatore con due punti di equilibrio di cui il minore è stabile, vedi il Capitolo 1), per γ → 1.5 si osserva come i due punti di equilibrio si concentrino in uno solo (per γ = 1) per poi svanire completamente. L’analisi qui presentata può essere fatta anche considerando un campo vettoriale sul cerchio, considerando un sistema oscillante non uniforme semplice (di primo grado) e considerando il flusso sul cerchio, piuttosto che su di una retta. 4.3 Beat phenomenon In questo esempio si mostra un primo esempio di sincronizzazione fra sistemi. 4.3. BEAT PHENOMENON 23 Descrizione del modello Nei sistemi oscillanti con due variabili indipendenti è interessante capire quando le due variabili assumono lo stesso valore. Si consideri l’esempio riportato nel libro di testo, in cui vi sono due corridori che partono insieme su un circuito circolare. Il primo impiega T1 secondi per compiere un giro, mentre il secondo impiega T2 > T1 secondi (è più lento). Bisogna capire quando il primo corridore sorpassa il secondo. Dato che la velocità dei due corridori è costante, i sistemi che li rappresentano sono descritti dalle equazioni: θ̇i = ωi dove i = 1, 2 sono i due corridori e ωi = 2π/Ti è la pulsazione naturale dei due sistemi. Definendo la differenza di fase φ = θ1 − θ2 , si vuole capire quando essa vale 2π, cioè quando il primo corridore, al tempo t, ha compiuto un giro in più rispetto al secondo corridore. Quindi φ̇ = θ̇1 − θ̇1 = ω1 − ω2 = 2π In questo caso θ1 è in fase con θ2 ogni T = T1 T2 2π = ω1 − ω2 T1 − T2 Simulazione Per la simulazione di questo sistema si utilizza un codice Matlab creato appositamente. Il sistema viene riscritto utilizzando il sistema di riferimento in coordinate polari: x cos(ωt) = y sin(ωt) Si associa ad ogni corridore un sistema in coordinate polari. Per la simulazione si sceglie la seguente configurazione: • ω1 = 2; • ω2 = 1; Ciò significa che il primo corridore doppierà il secondo ogni Tlap = 2π = 2π ω1 − ω2 4.4. LUCCIOLE 24 La condizione iniziale è (x1,2 , y1,2 ) = (0, 0). Si considera uno spazio temporale di quattro periodi e si tracciano le curve φx = x1 − x2 e φy = y1 − y2 dei due sistemi. Come mostrato in Figura 4.6, il primo corridore doppierà il secondo ogni volta che (φx , φy ) = (0, 0), cioè ogni volta che i due grafici si intersecano contemporaneamente sulla retta y = 0. 4.4 Lucciole In questa sezione si analizza un secondo esempio di sincronizzazione tra sistemi. Descrizione del modello In correlazione con l’esempio precedente, vi è il fenomeno naturale della luce periodica emessa dalle lucciole. La differenza sostanziale è che in questo caso, oltre al fatto che la luce emessa dalla lucciola è fortemente collegata alla presenza di uno stimolo esterno, la differenza di fase tra l’emissione di luce e lo stimolo non aumenta linearmente. Di seguito si fa una traduzione di alcune parti del libro di testo per una migliore comprensione . Modello. Supponendo che θ(t) sia la fase con cui la lucciola si illumina, dove θ = 0 corrisponde al momento in cui viene emessa la luce, e che in assenza di stimoli esterni la lucciola emette luce a frequenza ω, si può scrivere: Θ̇ = Ω dove Θ è un generico stimolo periodico. La risposta della lucciola può essere modellata come segue: se lo stimolo è avanti nel ciclo, allora si assume che la lucciola aumenti la frequenza di emissione per sincronizzarsi; se la lucciola emette luce a una frequenza maggiore dello stimolo, allora tenterà di diminuire la sua frequenza. Un modello semplice è il seguente: θ̇ = ω + Asin(Θ − θ) in cui A > 0. Per esempio, se Θ è avanti rispetto a θ (0 < Θ − θ < π) allora la lucciola aumenta la frequenza di emissione di luce (θ̇ > ω). Il parametro A è una misura dell’abilità della lucciola di modificare la sua frequenza istantanea (resetting strength). Analisi. Si consideri la differenza di fase φ: φ̇ = Θ̇ − θ̇ = Ω − ω − Asin(φ) 4.4. LUCCIOLE 25 In questa forma è un oscillatore non uniforme. Come per il pendolo, si introducono due parametri che rendono il sistema adimensionale: τ = At; µ = Ω−ω A Allora φ0 = µ − sin(φ) dove φ0 = ∂φ/∂τ . Simulazione A questo punto si simula il modello con pplane7 al variare del parametro µ. Caso 1: µ = 0. Come mostra la Figura 4.7, le traiettorie tendono a zero per t → ∞ (in verde). Infatti φ = 0 è un punto di equilibrio in cui si concentrano tutte le traiettorie con condizione iniziale nell’intorno di zero. Invece φ = π/2 è un punto di equilibrio instabile, in quanto le traiettorie tendono a divergere per t → ∞ (in rosso). Caso 2: 0 < µ < 1. I punti di equilibrio si avvicinano, ma mantengono le stesse caratteristiche di stabilità, come mostra la Figura 4.8. Le nullclines del sistema lucciola-stimolo si allontanano fra loro. In realtà il fatto che il punto di equilibrio stabile φ∗ > 0 significa che la lucciola e lo stimolo esterno hanno la stessa frequenza ma sono sfasati (phase-locked ). Caso 3: µ = 1. In Figura 4.9 si nota come le traiettorie convergano all’unico punto di equilibrio se hanno condizione iniziale minore di esso e divergano se hanno condizione iniziale maggiore dello stesso. Il punto di equilibrio è mezzostabile. Caso 4: µ > 1. In questo caso le traiettorie divergono per t → ∞ per qualunque condizione iniziale (Figura4.10. Non esistono punti di equilibrio e le nullclines del sistema lucciola-stimolo non si intersecano mai. L’emissione di luce della lucciola non sarà mai in fase con l’emissione di luce esterna. Questo è dovuto al fatto che lo stimolo esterno ha una frequenza elevata e il sistema lucciola non riesce ad agganciarsi in fase ad esso. 4.4. LUCCIOLE 26 θ ’ =ω ω ’ = − g/L sin(θ) − b/(m L2) ω + F/(m L2) b=5 m=1 F = 10 g = 9.81 L=1 2 3 4 4 3 2 ω 1 0 −1 −2 −3 −4 −5 −4 −3 −2 −1 0 θ 1 5 (a) Piano delle fasi θ ’ =ω ω ’ = − g/L sin(θ) − b/(m L2) ω + F/(m L2) b=5 m=1 F = 10 g = 9.81 L=1 18 θ 16 ω 14 Discesa (rapida) 12 θ and ω 10 Salita (lenta) 8 6 X: 16.15 Y: 6.337 X: 15.07 Y: 3.177 4 2 0 0 2 4 6 8 10 t 12 14 16 18 (b) Soluzione particolare in funzione del tempo Figura 4.3: Piano delle fasi con γ → 1+ 20 4.4. LUCCIOLE 27 θ ’ =ω ω ’ = − g/L sin(θ) − b/(m L2) ω + F/(m L2) b=5 m=1 F = 9.81 g = 9.81 L=1 4 3 2 ω 1 0 −1 −2 −3 −4 −10 −8 −6 −4 −2 0 θ 2 4 6 Figura 4.4: Piano delle fasi con γ = 1 8 10 4.4. LUCCIOLE 28 θ ’ =ω ω ’ = − g/L sin(θ) − b/(m L2) ω + F/(m L2) b=5 m = 1 g = 9.81 F=5 L=1 2 3 4 3 2 ω 1 0 −1 −2 −3 −4 −5 −4 −3 −2 −1 0 θ 1 Figura 4.5: Piano delle fasi con γ < 1 4 5 4.4. LUCCIOLE 29 2 1.5 1 C.I.=(0,0) φx , φy 0.5 (φ ,φ )=(0,0) (φ ,φ )=(0,0) x y x y 0 X: 6.293 Y: 0.009814 −0.5 −1 −1.5 0 5 10 15 t Figura 4.6: Beat phenomenon φ ’ = O − o − A sin(φ) O=1 A=1 o=1 4 Instabile 3 phi 2 1 0 Stabile −1 −2 −2 −1 0 1 2 t Figura 4.7: Lucciole: µ = 0 3 4 4.4. LUCCIOLE 30 φ ’ = O − o − A sin(φ) O=1 A=1 o = 0.5 4 Instabile 3 2 Stabile phi 1 0 −1 −2 −3 −4 −2 0 2 4 t 6 8 10 Figura 4.8: Lucciole: 0 < µ < 1 φ ’ = O − o − A sin(φ) O=2 A=1 o=1 4 Instabile 3 2 phi 1 Stabile 0 −1 −2 −3 −4 −2 0 2 4 t 6 Figura 4.9: Lucciole: µ = 0 8 10 4.4. LUCCIOLE 31 φ ’ = O − o − A sin(φ) O=3 A=1 o=1 4 3 2 phi 1 0 −1 −2 −3 −4 −2 0 2 4 t 6 Figura 4.10: Lucciole: µ > 1 8 10 Capitolo 5 Il modello di Lorenz In un articolo del 1963, Deterministic Nonperiodic Flow, Lorenz cita le equazioni di Saltzman (1962), derivate dall’analisi di un sistema composto da un fluido di profondità (altezza) uniforme, con differenti temperature tra la parte superiore e la parte inferiore, in particolare con una variazione di temperatura lineare. Successivamente Rayleigh scoprı̀ un punto critico per il quale le equazioni di Saltzman mostrano un moto convettivo, basato sul numero di Rayleigh. In questo capitolo si analizza il sistema di Lorenz a partire dal modello matematico. Modello matematico Lorenz definisce un set di tre equazioni dinamiche. In particolare x è proporzionale all’intensità del moto convettivo, y è proporzionale alla differenza di temperatura tra le correnti ascensionali e discensionali e z è proporzionale alla distorsione del profilo verticale di temperatura (dalla linearità). Il sistema tridimensionale è il seguente: ẋ = −σx + σy ẏ = −xz + rx − y ż = xy − bz dove, in questo caso, σ = 10 (numero di Prandtl ), r è il numero di Rayleigh e b = 8/3 è la largezza approssimativa della regione di lavoro. Di seguito si analizzano alcune peculiarità del sistema di Lorenz, con particolare attenzione alle biforcazioni del sistema al variare del numero di Rayleigh 1 . 1 Il modello della convezione del fluido è realistico per valori di r compresi fra 0 e 1. Per 32 33 Analisi con matcont per 0 ≤ r < 30 In questa sezione si analizza empiricamente il sistema di Lorenz al variare del parametro r, con σ e b fissati. Caso 1: 0 ≤ r < 1. Il punto di equilibrio stabile, di coordinate (x, y, z) = (0, 0, 0), è anche un attrattore globale. In Figura 5.1 si riportano tre simulazioni per r = 0; 0.5; 1 − ε. Per comodità viene rappresentata la variabile x(t) in funzione del tempo. 10 8 6 4 x 2 0 −2 0 < r <1 −4 −6 −8 −10 0 0.5 1 1.5 2 2.5 t 3 3.5 4 4.5 5 Figura 5.1: Caso 1: 0 ≤ r < 1 Caso 2: 1 < r < 24. Per r = 1 si verifica la prima biforcazione del sistema. In Figura 5.2 si può osservare come le traiettorie, per t → ∞, generate a partire da condizioni iniziali opposte in segno, si allontanino definitivamente dalla precedente soluzione di equilibrio stabile ((0, 0, 0)) e si distanzino fra loro al variare di r. L’incremento del parametro r comporta la perdita di stabilità della soluzione di equilibrio (0, 0, 0) e la generazione di due nuove soluzioni di equilibrio stabili e simmetriche nel diagramma di biforcazione. Risulta chiaro che la biforcazione è di tipo pitchfork. Nel caso riportato in Figura 5.3, in cui valori maggiori di r si modellano sistemi come spiking irregolare nei lasers, convezione in regioni toroidali, etc. 34 r = 22, le oscillazioni del sistema sono molto sostenute, ma comunque smorzate (spirale). Inoltre, osservando il transitorio di x(t), si nota la presenza di uno spike. Di seguito si comprende come mai vi sia questo fenomeno. 10 8 traiettoria sovrasmorzata 6 4 2 x r incrementa 0 −2 −4 r è circa 1 e le traiettorie sono stabili verso (0,0,0) −6 −8 −10 0 0.5 1 1.5 2 2.5 t 3 3.5 4 4.5 5 Figura 5.2: Caso 2: 1 < r < 24 Caso 3: 24 < r < 30. Per r = 24.7 si verifica la seconda biforcazione del sistema. In realtà, per la simmetria della biforcazione pitchfork, le biforcazioni sono due e sono simmetriche rispetto all’asse x = 0. Si nota che i due autovalori complessi e coniugati λ2 , λ3 hanno parte reale strettamente minore di zero per r = 24.7 − δ e assumono parte reale strettamente maggiore di zero per r = 24.7 + δ. In questo caso l’equilibrio è instabile e la biforcazione è di Hopf subcritica. Le traiettorie tridimensionali, come enuncia la teoria classica, dovrebbero allontanarsi definitivamente dagli autovettori instabili. In realtà nessuna traiettoria diverge, ma si nota che esse entrano in due regioni diverse senza un criterio intuitivo, con moto a spirale, senza mai stabilizzarsi nell’origine della spirale stessa. In riferimento alla Figura 5.5, si osserva il moto a spirale caotica in tridimensione. Il segnale è assolutamente aperiodico, rendendo impredicibile il comportamento del sistema per valori futuri del tempo, rispetto ad un tempo t0 generico. Da un sistema deterministico e totalmente predicibile si passa ad un sistema caotico impredicibile e, come mostra la Figura 5.4, molto sensibile alle condizioni iniziali, per un r fissato. Infatti per una piccolissima variazione (dell’ordine di 10−10 ) della condizione iniziale relativa 35 alla coordinata z si ottengono due risposte temporali differenti. In Figura 5.6 è rappresentato il diagramma di biforcazione del modello di Lorenz che riassume i tre casi analizzati. Altri casi notevoli Si consideri il caso in cui 144 < r < 166. In Figura 5.7 è rappresentata la risposta del sistema per r = 145. Si nota che le traiettorie tendono a stabilizzarsi su un’orbita periodica (per r crescente), ma tornano ad essere aperiodiche dopo un determinato intervallo di tempo. Questo fenomeno è chiamato caos intermittente e accade per una finestra di valori di r, tale per cui si verifica il period doubling. Se r è dentro questo range, il caos intermittente può eventualmente cessare, ma se r assume un valore prossimo all’ upper bound (r = 166.3), allora il fenomeno si verifica per ogni valore di t. Infatti per r crescente da 145 a 166 si nota che il periodo in cui domina il caos intermittente tende ad aumentare fino a dominare l’intera evoluzione temporale. Nel caso in cui r = 212 si osserva un secondo fenomeno di period doubling, ma con periodo raddoppiato rispetto alla finestra considerata in precedenza. La risposta dinamica del sistema segue una traiettoria stabile, ma in questo caso il caos non è di tipo intermittente, in quanto, per r crescente, la periodicità della soluzione x(t) è di esattamente un periodo per ogni intervallo temporale. In Figura 5.8 è rappresentata la realizzazione del sistema per r = 212. Conclusioni Dall’analisi proposta emergono alcune delle caratteristiche principali del sistema di Lorenz. Aperiodicità. Per un determinato valore del numero di Rayleigh si osserva il fenomeno dell’aperiodicità. E’ del tutto contro-intuitivo pensare che da un sistema lineare si riesca a generare un segnale aperiodico, non predicibile e apparentemente casuale (in un certo senso è anche non causale). Sensitività. Il sistema risulta sensibile alle condizioni iniziali per quanto riguarda la risposta aperiodica. Un fattore di differenza molto piccolo genera due segnali totalmente differenti dopo un tempo t. Dall’abstract dell’articolo di Lorenz del 1963: [... soluzioni nonperiodiche sono instabili rispetto a piccole perturbazioni, cosicchè condizioni iniziali di poco differenti possono evolvere in stati considerevolmente diversi...]. Biforcazioni. Al variare di r vi sono tre biforcazioni di cui due sono simmetri- 36 che, ma le traiettorie, per qualsiasi valore di r, non divergono verso l’infinito. Un sistema con questo comportamento si chiama dissipativo. Simmetria. Il sistema è invariante se si inverte il segno delle variabili di stato (tranne z). L’invarianza dell’asse z implica che tutte le traiettorie relative ad esso restano sullo stesso e si avvicinano all’origine. Un fenomeno di simmetria si osserva anche per le biforcazioni di Hopf, dal momento che si generano a partire dai due rami stabili della biforcazione pitchfork. 37 20 15 10 0 −5 −10 −15 −20 0 5 10 15 t 20 25 (a) x(t) 40 35 30 25 20 z x 5 15 10 5 0 0 5 10 15 20 x −20 −15 −10 0 −5 5 y (b) Plot tridimensionale Figura 5.3: Caso 2: r=22 10 15 20 30 38 differenziazione traiettorie si "gira" nella prima spirale 20 15 10 x 5 0 scambio −5 −10 −15 si "gira" nella seconda spirale −20 0 5 10 15 20 t 25 30 35 40 Figura 5.4: Risposte temporali per r = 27 e condizioni iniziali differenti per 10−10 40 35 30 z 25 20 15 20 10 15 5 10 5 0 20 15 10 5 0 0 −5 −10 −15 y Figura 5.5: Moto caotico a spirale −20 x 39 30 H 25 H r 20 15 10 5 BP 0 −10 −8 −6 −4 −2 0 x 2 4 6 Figura 5.6: Biforcazioni al variare del numero di Rayleigh 8 10 40 40 30 20 x 10 0 −10 −20 −30 −40 0 2 4 6 t 8 10 12 (a) x(t) 250 200 z 150 100 50 0 300 200 100 0 −100 150 50 100 0 y (b) Plot tridimensionale Figura 5.7: Risposta del sistema per r = 145 −50 −100 41 250 200 z 150 100 400 50 300 200 0 100 150 100 0 50 0 −50 −100 −100 x y (a) Plot tridimensionale 40 30 20 10 x 0 −10 −20 −30 −40 −50 0 2 4 6 8 10 t 12 14 (b) x(t) Figura 5.8: Risposta dinamica per r = 212 16 18 20 Capitolo 6 Controllo del caos Per completare la panoramica sul caos deterministico, si analizza il problema del controllo del caos. Si nota che al giorno d’oggi si utilizzano tecniche di controllo che derivano senza alterazioni dalla teoria classica del controllo. Introduzione Un sistema caotico è caratterizzato dalla dipendenza dalle condizioni iniziali. Due traiettorie che partono da punti molto vicini nello spazio divergono, ad esempio, esponenzialmente. Infatti, in un processo di identificazione di un sistema (black-box ), spesso non si riesce a distinguere esattamente se si identifica un sistema affetto da rumore oppure un sistema caotico. Un quantificatore della divergenza delle due traiettorie è l’esponente di Lyapunov, in particolare il suo massimo. Un secondo problema è la possibilità di sincronizzazione fra due sistemi caotici identici. Recenti studi dimostrano che effettivamente può avvenire la sincronizzazione, con importanti applicazioni come telecomunicazioni digitali non lineari (Pecora e Carrol, 1990). Il problema messo in luce in questo lavoro è la possibilità di stabilizzare un sistema caotico (di Lorenz) con un semplice regolatore PI (proporzionaleintegrale). Teoria del controllo Con la parola controllo si intende controllo in retroazione. Si consideri un sistema non lineare. Si hanno alcune variabili dipendenti dal tempo e si può pensare di controllarle, ossia di modificarne lo stato e la sua evoluzione, conoscendo la 42 6.1. CONTROLLO DI UN PROCESSO CAOTICO IN CONTINUA EVOLUZIONE 43 storia del sistema e il suo stato attuale. Il controllo può essere inteso in tre modi diversi, elencati di seguito: 1. Dato un sistema caotico in costante evoluzione, aumentare la sua performance media nel tempo, dove performance è un termine generico per definire una caratteristica particolare che si vuole ottenere dal sistema; 2. Dato un sistema caotico con una condizione iniziale associata, trascinare rapidamente la traiettoria rapidamente verso lo stato desiderato; 3. Dato un processo caotico in costante evoluzione, prevenire che diverga verso una regione non buona dello spazio delle soluzioni. L’esistenza di un’orbita complessa è molto rilevante per ottenere il target assegnato nel primo dei tre problemi. Per il secondo e il terzo target è più importante la sensibilità esponenziale alle condizioni iniziali. Per tutti i targets è da notare che il controllo può essere ottenuto soltanto con piccoli controlli, cioè con piccole variazioni dello stato attuale. L’interesse per il terzo target risiede nella possibilità di controllare e prevenire eventi catastrofici che si verificano nel momento in cui lo stato converge in una precisa zona dello spazio delle soluzioni. Ovviamente esiste un approccio diverso per ognuno dei tre targets. Nelle sezioni seguenti si tratta del primo e del secondo tipo di approccio rispettivamente per il primo e per il secondo target. 6.1 Controllo di un processo caotico in continua evoluzione Il punto chiave per questo problema è la presenza di un’ orbita complessa nel caos. Con questo si intende che esistono molte orbite topologicamente distinte all’interno di un set caotico invariante. Quindi vi sono tipicamente molte orbite periodiche instabili (UPO - Unstable periodic orbit) nascoste in un attrattore caotico. Infatti, per un attrattore iperbolico, il numero di UPOs con periodo minore o uguale di P incrementa esponenzialmente con P , #(P ) ∼ exp(hT P ) (6.1) dove hT è l’entropia topologica (Katok, 1980). Per risolvere il problema esiste l’approccio seguente (Ott et al. 1990a,b): 1. Esaminare le dinamiche non controllare del sistema e determinare alcune UPOs di periodo piccolo nascoste nell’attrattore; 6.2. TARGETING 44 2. Esaminare queste UPOs e trovare la caratteristica risultante dalla dinamica temporale di ogni UPO. Confrontare le caratteristiche delle UPOs e scegliere la migliore. 3. Formulare un algoritmo di controllo che stabilizzi la UPO selezionata in un intorno di essa. In sostanza si cerca di far convergere una traiettoria verso un’orbita propria del sistema e mantenere questo comportamento per tutta la durata del processo. Nel caso in cui una traiettoria tenti di divergere da quest’orbita, si cerca di intervenire tempestivamente per riportarla sull’orbita. La tempestività è importante perchè il sistema può essere controllato in maniera semplice solo in un intorno molto ristretto della UPO selezionata. Si pensi all’attrattore di Lorenz. Sostanzialmente esiste un’orbita in cui le traiettorie convergono e successivamente divergono e si spostano verso una seconda orbita, tentando di convergere, ma, per la naturale evoluzione del sistema non controllato di Lorenz, divergono anche da essa e si sposteranno verso la prima orbita, reiniziando il ciclo. Se si identificasse una regione Ω con l’approccio di Ott, si potrebbe pensare di stabilizzare la traiettoria nell’intorno di una delle due orbite caotiche. Data la natura del sistema non si può pensare di stabilizzare la traiettoria nell’origine, in quanto non si saprebbe come governare il sistema verso un punto che non è più di equilibrio (nel caso caotico). A questo punto diventerebbe un problema di inseguimento e non più di stabilizzazione, ma in realtà un sistema caotico non ha ingressi esterni (è autonomo di ed ha caos autonomo). Per identificare una UPO e le sue caratteristiche si considerano delle mappe ricavate sezionando con un piano un’orbita dell’attrattore e analizzando le serie temporali derivate. In questo modo si trasferisce il problema tridimensionale in un problema bidimensionale. Ovviamente la riduzione del problema ad un caso più semplice porta ad avere un’analisi semplificata. Nella fase in cui si analizzano le serie temporali vi è in gioco il fattore rumore. Come precedentemente illustrato è un fattore di non facile identificazione, soprattutto quando non si conosce il sistema da cui proviene l’attrattore strano. Per stabilizzare una UPO si utilizza la teoria del controllo lineare. Si considerano quindi approcci come la tecnica del pole placement oppure un regolatore generico PI, come descritto nell’esempio di questa relazione. 6.2 Targeting Per la seconda tipologia di controllo del caos si analizza il problema di direzionare l’orbita di un sistema caotico in una zona desiderata del piano delle fasi. 6.3. CONTROLLO DEL SISTEMA DI LORENZ 45 Alla base del targeting vi è l’idea che un sistema caotico è esponenzialmente sensibile a piccole perturbazioni. Una piccola perturbazione ha un largo effetto in un tempo relativamente piccolo. Se le perturbazioni sono rumori ignoti, allora il sistema diventa impredicibile. Ma se il rumore presente è relativamente piccolo, si possono tranquillamente inserire piccole perturbazioni per controllare il sistema. Una possibile strategia di controllo è il metodo forward-backward (Shinbrot et al., 1990), descritto di seguito. Si consideri una mappa bidimensionale con una direzione di contrazione (un esponente di Lyapunov negetivo) e una direzione di espansione (un esponente di Lyapunov positivo). Considerando uno scalare di controllo p, si può perturbare il punto di partenza verso un set di regioni nello spazio delle soluzioni, cioè si cerca di indirizzare il punto di partenza verso la regione desiderata. L’azione di controllo è manifestata nel sistema come perturbazione iniziale, cioè il controllo è attivo solo inizialmente (per t = 0). A questo punto si utilizza la conoscenza a priori del sistema, quindi la conoscenza del set di traiettorie che il punto potrebbe percorrere evolvendo in un tempo T. Simultaneamente si fa evolvere la regione a cui si punta indietro nel tempo T . Incrementando T , l’immagine del segmento di controllo iniziale (in avanti nel tempo) e l’immagine della regione puntata (indietro nel tempo) si espandono esponenzialmente in lunghezza. Nel momento in cui la preimmagine della regione puntata e l’immagine del segmento di intersecano, si identifica un valore del segmento iniziale p. Idealmente la traiettoria del punto iniziale tenderà a collidere con la regione puntata in un tempo 2T . In un sistema reale, affetto da rumore, si commette un errore anche molto piccolo quando si imposta il segmento iniziale: l’errore aumenta esponenzialmente nel tempo ed e è probabile che il controllo adottato non sia robusto. Questo sistema funzione per una dimensione del sistema non troppo elevata. Per sistemi di dimensione alta esiste il metodo di Kostelich (Kostelich et al., 1993). La prima applicazione del controllo formalizzato da Kostelich si ha nel 1985 da parte della NASA per il targeting di una sonda spaziale con la cometa di Giacobini-Zinner. 6.3 Controllo del sistema di Lorenz In questa sezione si analizza la possibilità di controllare alcuni punti instabili del sistema di Lorenz e stabilizzarli con la teoria del controllo lineare, in particolare con un regolatore proporzionale e integrale, utilizzando l’approccio di Ott (primo metodo). Si consideri il sistema seguente: ẋ = Ax + g(x) + u (6.2) 6.3. CONTROLLO DEL SISTEMA DI LORENZ 46 dove x ∈ Rn è il vettore di stato, u ∈ Rn è il comando da progettare, A ∈ Rn×n è una matrice costante e g(x) è una funzione non lineare continuamente differenziabile. Considerando xs un punto di equilibrio instabile del sistema, tale che Axs + g(xs ) = 0 (6.3) si può progettare un controllore u che stabilizzi la traiettoria verso xs . Il controllore u è un PI della forma Z t (6.4) u = λ[B(Kx + k (y − ys )dτ )] 0 1×n dove B ∈ R è un vettore costante di guadagni, K ∈ R1 timesn è il vettore di guadagni di retroazione proporzionale allo stato, k ∈ R è il guadagno integrale, y = Cx è l’uscita con una matrice costante C ∈ R1×n , ys = Cxs è l’osservazione del punto di equilibrio target xs , e λ ∈ {0, 1} è una variabile binaria di attivazione che vale 1 se il vettore di stato ad un certo tempo t è dentro la regione di controllo Ωxs di xs . Quindi il controllore u è attivo se e solo se la traiettoria del punto x(t) è dentro la regione ΩxS . Si riscrive il sistema come segue: Z t (6.5) ẋ = Ax + g(x) + λ B Kx + k (Cx − Cxs )dτ 0 Si consideri il sistema di Lorenz. Imponendo le condizioni per i punti di equilibrio (derivate prime uguali identificano tre punti di equilibrio dipen-p p p a zero), sip denti dai parametri: (− β(ρ − 1), − β(ρ − 1), (ρ−1)), (0, 0, 0) e β(ρ − 1), β(ρ − 1), (ρ− 1)). Riscrivendo il sistema nella forma 6.5, segue che l’errore di inseguimento è descritto dalla seguente formula: 0 0 0 ex 0 g(x) − g(xs ) = −zs 0 −xs ey + −ex ez = g 0 (xs )e + ḡ(e) (6.6) y s xs 0 ez ex ey La dinamica dell’ errore incrementale è descritto dalle seguenti equazioni di stato: ė1 = (à + λB̄ K̄)e1 + g̃(e1 ) (6.7) dove e1 = e q (6.8) 0 −ex ez ḡ(e) g̃(e1 ) = = ex ey 0 0 (6.9) 6.3. CONTROLLO DEL SISTEMA DI LORENZ 47 −σ σ 0 à = A + g 0 (xs ) = ρ − zs −1 −xs ys xs −β −σ σ 0 0 ρ − zs −1 −xs 0 Ā 0 à = = ys C 0 xs −β 0 c1 c2 c3 0 b1 B b2 B̄ = = b3 0 0 K̄ = k1 k2 k3 k (6.10) (6.11) (6.12) (6.13) Se la matrice à + B̄ K̄ è stabile in xs , allora si può affermare che il controllore stabilizza l’evoluzione del sistema verso il target (la 6.7 è asintoticamente stabip p le). Se la stessa matrice è stabile nel punto di equilibrio P1 =(− β(ρ − 1), − β(ρ − 1), (ρ− 1))), allora la 6.7 è asintoticamente stabile e il sistema di Lorenz può essere stabilizzato verso il punto P1 . Le stesse osservazioni valgono per p p di equilibrio P2 = (0, 0, 0) e P3 = ( β(ρ − 1), β(ρ − 1), (ρ − 1)). Ad esempio si può pensare di stabilizzare il sistema di Lorenz per σ = 16, ρ = 45.6 e β = 4, per i quali il sistema ha un comportamento caotico. Il sistema è stabilizzabile con il controllore PI verso il punto di equilibrio P3 perchè la matrice à + B̄ K̄ è stabile in xs ha autovalori a parte reale minore di zero, quindi è stabile (λ1 = −2.8, λ2 = −2.7, λ3 = −2.3, λ4 = −2.5). In questo caso le matrici del sistema di controllo sono le seguenti 1 B= 0 (6.14) 0 C = −1 1 0 (6.15) K = 10.70 −19.18 12.91 , k = 0.12 (6.16) In Figura 6.1 è riportato lo schema Simulink realizzato ad hoc per la simulazione. Le traiettorie delle tre variabili di stato tendono asintoticamente al punto di equilibrio P3 = (13.35, 13.35, 44.60) pertanto l’obiettivo proposto è stato raggiunto. Nelle Figure 6.2, 6.3 e 6.4 si mostrano le traiettorie temporali rispettivamente per x(t), y(t) e z(t). 6.3. CONTROLLO DEL SISTEMA DI LORENZ 48 Figura 6.1: Modello Simulink del sistema di Lorenz controllato con un PI 110 100 90 80 x 70 60 50 40 30 20 10 0 50 100 150 200 250 t 300 Figura 6.2: x(t) 350 400 450 500 6.3. CONTROLLO DEL SISTEMA DI LORENZ 49 20 15 y 10 5 0 −5 −10 0 50 100 150 200 250 x 300 Figura 6.3: y(t) 350 400 450 500 6.3. CONTROLLO DEL SISTEMA DI LORENZ 50 60 55 z 50 45 40 35 30 0 50 100 150 200 250 t 300 Figura 6.4: z(t) 350 400 450 500 Linee guida per l’analisi dei sistemi dinamici caotici Nel seguito vengono presentate alcune linee guida per effettuare l’analisi dei sistemi dinamici non lineari che mostrano comportamenti complessi, come ad esempio le dinamiche caotiche. 1. Soluzioni di equilibrio. In primo luogo è opportuno individuare le soluzioni di equilibrio del sistema dinamico. Queste soluzioni sono tali che: ẋ = 0, x ∈ Rn , x = (x1 , x2 , . . . , xn ). (6.17) In altre parole si tratta di risolvere il sistema: ẋ1 = 0 ẋ2 = 0 · · ẋn = 0. Ad esempio, nel caso del sistema di Lorenz, descritto dal sistema di equazioni ẋ = −σx + σy ẏ = −xz + rx − y ż = xy − bz, si hanno tre soluzioni di equilibrio ottenute risolvendo il sistema −σx + σy = 0 −xz + rx − y = 0 xy − bz = 0. 51 (6.18) 6.3. CONTROLLO DEL SISTEMA DI LORENZ 52 Le soluzioni sono: √ √ √ √ x∗1 = (0, 0, 0); x∗2,3 = (± b r − 1, ± b r − 1, r − 1). E’ evidente che le soluzioni x∗2,3 esistono solo per r ≥ 1. 2. Linearizzazione. Si studia il sistema linearizzato nell’intorno di ciascuno dei punti di equilibrio. In particolare, si calcolano gli autovalori della matrice Jacobiano J nel punto di equilibrio in questione allo scopo di studiare la stabilità della soluzione nulla del sistema linearizzato: η̇ = f 0 (x∗ )η, (6.19) dove η = x − x∗ e J(x∗ ) = f 0 (x∗ ). 3. Stabilità degli equilibri in funzione dei parametri. Nel caso in cui si abbiano alcuni autovalori a parte reale nulla (cioè tali che i corrispondenti punti di equilibrio sono non iperbolici) si devono effettuare alcune simulazioni variando le condizioni iniziali ed il parametro critico (cioè quello per cui si annulla la parte reale degli autovalori) alternativamente allo scopo di comprendere la dinamica del sistema. Le simulazioni possono essere fatte utilizzando una delle funzioni ODE di MATLAB, WINPP, MATCONT o qualunque software di integrazione. 4. Analisi di biforcazione. Si effettua un’analisi di biforcazione del sistema. A questo scopo si prende in considerazione una delle soluzioni di equilibrio stabili trovate precedentemente. Si pongono i valori di tutti i parametri corrispondenti ad una delle condizioni di stabilità e si eseguono delle simulazioni imponendo piccole variazioni del parametro individuato come critico. Eventualmente si può utilizzare un software di continuazione (ad esempio MATCONT). Nel caso del sistema di Lorenz si evidenzia quanto segue: - 0 ≤ r < 1. L’unica soluzione di equilibrio x∗1 è stabile asintoticamente. - 1 < r < 24. La soluzione x∗1 perde la propria stabilità attraverso una biforcazione pitchfork. Le due nuove soluzioni che nascono grazie alla stessa biforcazione x∗2,3 risultano stabili per questi valori dei parametri. - 24 < r < 30. Le due soluzioni x∗2,3 perdono stabilità attraverso una biforcazione di Hopf subcritica. Questa biforcazione non può essere facilmente detectata in quanto il ciclo limite che esiste prime della biforcazione è instabile. - r > 24.74 nessuna delle soluzioni di equilibrio esistenti è stabile. Si 6.3. CONTROLLO DEL SISTEMA DI LORENZ 53 osservi che per questo valore di biforcazione non si determina nessuna collisione di equilibri o cicli e tutte le soluzioni di equilibrio continuano ad esistere, come confermato dall’analisi effettuata al punto [1]. Bibliografia [1] Edward Ott Chaos in dynamical systems Cambridge University Press, 1993. [2] G. Jiang, G. Chen, W.K. Tang Stabilizing unstable equilibrium points of a class of chaotic systems using a state PI regulator (IEEE Trans. on Circuits and Systems, VOL. 49, NO. 12, 2002) [3] Steven H. Strogatz Nonlinear Dynamics and Chaos Westview, 1994. 54