Identificazione dei sistemi:
modelli lineari e non lineari
Dai Dati alla Conoscenza
Nell’area dell’automatica il processo di identificazione ha
come obiettivo la ricerca di modelli dinamici di un sistema
(equazioni differenziali o alle differenze) che descrivono le
interazioni tra variabili di ingresso e di uscita, a partire da
dati osservati di ingresso-uscita
Sistema:
oggetto (parte di realtà) in cui variabili di differente natura
(ingressi e disturbi) interagiscono e producono effetti
osservabili (uscite)
identificazione a scatola nera:
si hanno a disposizione solo i dati I/O
le leggi che regolano i fenomeni sono sconosciute o molto complesse
la struttura del modello viene descritta generalmente da equazioni
(differenziali o alle differenze) ingresso-uscita
i parametri del modello non sono interpretabili fisicamente
identificazione a scatola grigia:
si dispone di informazioni aggiuntive
alcune parti del sistema sono modellate secondo leggi fondamentali,
altre come una scatola nera
alcuni parametri del modello possono essere interpretati fisicamente
identificazione a scatola trasparente:
(modellistica)
il sistema si può decomporre in sottosistemi di cui si conoscono le
leggi fisiche ed i parametri (unione di più modelli)
Esempio di struttura Gray-Box
Supponiamo di voler identificare un modello per le
variazioni della temperatura di una stanza al variare
della tensione applicata ad una stufa elettrica
Le leggi fisiche da considerare coinvolgerebbero le
equazioni relative alla potenza della stufa, la
trasmissione del calore per conduzione e convezione,
ecc…
Un modello Black-Box tra tensione e temperatura non dà
risultati soddisfacenti ma…
…la fisica elementare ci dice che è la potenza
della stufa piuttosto che la tensione che causa
le variazioni di temperatura!!!
un modello tra il quadrato della tensione e la
temperatura potrebbe quindi migliorare
sensibilmente le prestazioni
T (t )  a1T (t  1)a2T (t  2)  
 anT (t  n)  b1v 2 (t  1)    bm v 2 (t  m)
Classificazione dei modelli in base agli obiettivi:
•Modelli interpretativi:
Razionalizzano le informazioni disponibili sul comportamento
di un sistema sostituendo i dati con il meccanismo che li ha
generati, non è richiesta la capacità di generare altri set di dati,
hanno quindi un range di validità limitato (econometria, ecologia,
fisica).
•Modelli predittivi:
Sono sviluppati per predire il comportamento futuro del sistema
(in genere vengono utilizzati per individuare azioni di controllo)
•Modelli per la stima dello stato:
Consentono la stima di variabili interne a partire da misure I/O
affette da rumore (monitoraggio di processi naturali o industriali)
•Modelli per la diagnosi:
consentono di individuare situazioni di funzionamento anomale
(guasti nei sensori o nei componenti del processo)
•Modelli per la simulazione:
sostituiscono il sistema consentendo di valutare le prestazioni di
politiche di controllo e di valutare l’effetto di operazioni pericolose
o costose
(la possibilità di un effettivo utilizzo dipende fortemente dalla
accuratezza del modello)
A cosa serve un modello?
• Verifica immediata di ipotesi e teorie
• Predizione del comportamento futuro di un sistema
• Realizzazione di esperimenti altrimenti impossibili
• Risparmio di tempo, attrezzature, denaro
• Maggiore elasticità di progettazione
• Migliore comprensione dei fenomeni
• Correlazione tra teoria e sperimentazione
• Maggiore chiarezza nella presentazione dei risultati
• I modelli costituiscono in ogni caso una: ‘rappresentazione
abbastanza buona di alcuni aspetti del sistema’ di cui devono
essere stabiliti i limiti di validità
• Il grado di accuratezza richiesto al modello dipende dalla sua
applicazione
• Il grado di accuratezza è limitato anche dal grado di complessità
tollerabile, dal tempo a disposizione per sviluppare il modello, dalle
informazioni contenute nei dati, dalle conoscenze a priori, dal grado di
nonlinearità, dalla possibilità di effettuare esperimenti, dal costo delle
misure, dalla precisione dei sensori, dal rumore di misura
Rasoio di Occam (1300): tra i modelli che descrivono lo stesso
fenomeno si deve scegliere il modello più semplice
Popper (1900): tra i modelli che rappresentano le osservazioni
disponibili si deve scegliere quello che consente di spiegare ‘as little
else is possible’ (most powerful unfalsified model)
dim. matematica: se il modello è ricavato da dati incerti,
all’aumentare della complessità del modello aumenta l’incertezza sui
suoi parametri
Ipotesi:
Sistema tempo invariante a parametri concentrati
Modelli lineari o non lineari?
Tutti i sistemi reali sono, in misura più o meno accentuata, non lineari
Se sono rispettate alcune condizioni :
- variazioni delle grandezze piccole rispetto al punto di lavoro nominale
- è sufficiente avere un modello approssimato del sistema
- è possibile ricorrere ad una approssimazione lineare del sistema, ricorrendo
eventualmente a modelli diversi nei diversi punti di lavoro
in questo caso:
la teoria è in grado di prevedere le prestazioni del modello
le procedure numeriche sono più semplici
il progetto di un eventuale sistema di controllo è facilitato
Qualora tali approssimazioni non siano lecite è necessario ricorrere a strutture non lineari
(Quale struttura?)
ingredienti
• dati sperimentali
• insieme di modelli candidati
(scelti utilizzando tutte le informazioni a priori disponibili: ordine del
sistema, dinamiche lente o veloci, stabilità, presenza di ritardi,
frequenza di campionamento, grado e tipo di non linearità)
• regola con la quale determinare il modello nella classe
dei candidati sfruttando le informazioni contenute nei dati
• criterio per la valutazione della qualità del modello
ottenuto
Le Fasi del Processo di Identificazione
Conoscenza A Priori
Progetto
degli
Esperimenti
Ottenimento ed
Preprocessamento
dei Dati Sperimentali
Selezione della
Struttura del
Modello
Selezione del
Criterio
Stima del Modello
Not OK
Validazione del Modello
OK
(L. Ljung, 1999)
Cause di fallimento
• la procedura numerica non ha trovato il modello migliore
tra i candidati secondo il criterio scelto
(minimi locali nelle procedure di ottimizzazione,
malcondizionamento)
• il criterio non è adeguato
• la classe dei modelli non è adeguata
• i dati non contengono abbastanza informazioni (pochi
esperimenti, troppo rumore)
Scelta delle variabili di ingresso
Si può fare in base a:
Conoscenze sulla fisica del processo
Conoscenze empiriche degli operatori
Indici di correlazione
Trial and error
Scelta dei dati ed esperimenti
Lo scopo degli esperimenti è quello di collezionare dati in
grado di rappresentare l’intera dinamica del sistema
I modelli ottenuti non possono fornire più informazioni di
quante non ne siano contenute nei dati!!!
Progetto degli Esperimenti
Selezione del tipo di ingressi con i quali si ecciterà il
sistema. Devono essere sufficientemente ricchi al fine di
sollecitare tutti i modi del sistema (persistenza
dell’eccitazione)
Solo i modi osservabili e controllabili del sistema possono
essere identificati
Tipi comuni di ingressi: rumore bianco, pseudo-random
binary sequence, treni di gradini/impulsi, sinusoidi, forme
tipiche relative al processo in esame
Scelta del tempo di campionamento
•
I segnali (di ingresso e di uscita di un processo) possono essere
pensati come la sovrapposizione di segnali elementari (sinusoidi).
• ‘L’insieme’ di tali sinusoidi costituisce lo ’spettro del segnale’’
(determinabile utilizzando opportuni strumenti: analizzatore di spettro).
onda quadra
spettro
Lo spettro del segnale di uscita di un sistema dipende dal
corrispondente spettro del segnale in ingresso e dalle ‘proprietà
filtranti’ del sistema
Tutti i sistemi reali possono generare in uscita segnali che non si
estendono oltre una certa frequenza massima (banda passante del
sistema)
Teorema del campionamento
Se si campiona un segnale a frequenza almeno doppia rispetto alla
massima frequenza contenuta nel segnale, è possibile ricostruire,
senza perdita di informazione in segnale originale
se il teorema non viene rispettato si può incorrere in problemi di
aliasing e non è possibile ricostruire il segnale originario
partendo dai dati campionati
Sinusoide
campionata
a diverse
frequenze
Non rispetta
il teorema
di Shannon
Lo spettro di un segnale campionato è costituito da repliche dello
spettro del segnale originario, che si ripetono a un intervallo di
frequenza costante e pari alla frequenza di campionamento.
Se non è rispettato il teorema di Shannon tali repliche si
sovrappongono (Aliasing) e non è possibile risalire, a seguito di una
operazione di filtraggio allo spettro del segnale originario.
Frequenza di campionamento
Spettro del segnale
Campionamento
Frequenza di campionamento
Spettro del segnale
Spettro del segnale campionato
Campionamento
Spettro del segnale campionato
Altri criteri per la scelta del tempo di campionamento
Il segnale campionato deve rappresentare la dinamica del sistema
T=0.01
100 campioni
T=0.1
10 campioni
T=0.05 =ts/6
20 campioni
Sistema di primo ordine
Polo: -10
Costante di tempo
1/10=0.1
Tempo di salita 3* 0.1
T=0.1
80 campioni
T=0.2 =ts/5
40 campioni
Sistema del secondo ordine
T=1
8 campioni
ts=1 sec
ta=5 sec
Sistema del quarto ordine
T=0.1 sec
T=1 sec
T=0.2 sec=ts/6
T=4 sec
Criteri generali :
ts/5 < T < ts/10
ta/10 < T < ta/50
T < della più piccola costante di tempo
f=1/T > 2* fmax
Se T è troppo piccolo:
• occorre manipolare un numero eccessivo di dati
senza migliorare l’informazione che contengono
• si rischia di campionare il rumore
• dati troppo simili tra loro creano problemi numerici agli algoritmi
• il tempo di elaborazione aumenta
•Il costo di acquisizione aumenta
Come è possibile verificare se è stato rispettato
il Teorema del Campionamento?
• Se si hanno dubbi sulla correttezza del campionamento, si può calcolare
lo spettro del segnale campionato:
Se questo mantiene valori elevati a tutte le frequenze (nel discreto le
frequenze vanno da zero a 0.5 volte la frequenza di campionamento) è
ragionevole supporre che sia stata scelta una frequenza di
campionamento troppo bassa.
Se la banda occupata dallo spettro è una frazione piccola
dell’intervallo a disposizione è stata utilizzata una frequenza di
campionamento inutilmente elevata.
Può essere opportuno in tale caso procedere ad un filtraggio digitale
dei dati. Ciò permette di risparmiare risorse e elimina rumore (di
misura) a frequenze elevate.
Adeguatezza del Tempo di Campionamento
6
6
5.5
5.5
5
5
4.5
4.5
4
4
3.5
3.5
3
20
40
60
80
100
120
140
160
180
200
3
5
10
15
20
25
30
35
40
45
50
60
180
160
50
140
120
40
100
30
80
60
20
40
10
20
0
0
100
200
300
400
500
600
Tc adeguato
700
800
900
1000
0
0
50
100
150
200
250
Tc troppo grande
300
350
Scarica

spettro del segnale