Università degli Studi di Cassino
Facoltà di Ingegneria
Lezioni del Corso di
Fondamenti di Metrologia Meccanica
06. La regressione
Università degli Studi di Cassino
• Regressione
Corso di Fondamenti di Metrologia Meccanica
Università degli Studi di Cassino
Corso di Fondamenti di Metrologia Meccanica
Metodo dei minimi quadrati
Se due popolazioni sono correlate tra loro e se il coefficiente di
correlazione r non vale esattamente ±1, certamente i dati yi non
sono esattamente una funzione lineare dei dati xi.
Tuttavia, se analizzando il diagramma di dispersione verifichiamo
un andamento di tipo lineare ed il valore di r è prossimo a ± 1, è
possibile determinare l'equazione di una retta che approssimi "nel
modo migliore" i dati assegnati.
25,0
y = 0,1599x + 4,0864
R2 = 0,9972
20,0
15,0
10,0
5,0
0,0
0,0
20,0
40,0
60,0
80,0
100,0
Università degli Studi di Cassino
Sia dato un insieme di n punti
x1, y1),...,(xn, yn) e sia
Y  A x  B
l’equazione della retta che si
vuole determinare.
Corso di Fondamenti di Metrologia Meccanica
numero
letture
x
y
1
0,0
3,8
2
10,0
5,6
3
20,0
7,6
4
30,0
9,3
5
40,0
10,6
6
50,0
12,1
7
60,0
13,4
8
70,0
14,9
9
80,0
16,6
10
90,0
18,7
11
100,0
20,3
Università degli Studi di Cassino
Corso di Fondamenti di Metrologia Meccanica
Una tecnica potrebbe consistere nel trovare i valori A e B per i
quali è minima la somma
[Y ( x )  y ]
i
i
Ma questo criterio è inadeguato in quanto, fissati due punti,
qualsiasi retta passante per il punto medio del segmento che
congiunge i due punti rende minima la quantità somma
Università degli Studi di Cassino
Corso di Fondamenti di Metrologia Meccanica
Si potrebbe allora minimizzare la somma dei valori assoluti
 Y (x )  y
i
i
ma anche questo criterio non è adeguato, in quanto, fissati 4 punti,
qualunque retta compresa tra le due rette r e s che uniscono i punti
a due a due soddisfa tale criterio.
Università degli Studi di Cassino
Corso di Fondamenti di Metrologia Meccanica
Il metodo dei minimi quadrati consiste nel trovare i valori A e B
per i quali è minima la somma degli scarti quadratici
2
[
Y
(
x
)

y
]
 i i
Questo criterio consente di
determinare un’unica retta di
regressione per ogni insieme
di dati.
Dal grafico si evince che
viene minimizzata la somma
dei quadrati delle distanze
verticali dei punti dalla retta
Università degli Studi di Cassino
Corso di Fondamenti di Metrologia Meccanica
Equazioni normali
• I coefficienti A e B dell'equazione della retta di regressione
sono le soluzioni del seguente sistema lineare di due equazioni
nelle incognite A e B, detto sistema delle equazioni normali:
• E’ possibile dimostrare che la soluzione del sistema esiste ed è
unica, purché i punti non siano tutti allineati verticalmente.
Università degli Studi di Cassino
Corso di Fondamenti di Metrologia Meccanica
Regressione polinomiale
In alcuni casi, la correlazione esistente fra due
variabili osservate non è di tipo lineare. E’ possibile
verificare ciò rappresentando semplicemente i punti su
di un diagramma.
Per trovare la funzione Y che approssima i dati è
possibile utilizzare come funzione approssimante un
polinomio di grado più elevato al primo. Nel caso più
semplice del polinomio di secondo grado si trova la
parabola dei minimi quadrati. In tal caso dati i punti
(x1, x12 , y1), ..., (xn, xn2 , yn) cerchiamo la parabola
Y=AX2+BX+C per cui è minima la quantità.
Università degli Studi di Cassino
Corso di Fondamenti di Metrologia Meccanica
Si può dimostrare che i coefficienti A, B, C della parabola si
trovano risolvendo il sistema delle equazioni normali:
Anche in tal caso è possibile dimostrare che la soluzione esiste ed
è unica, purché i punti non siano tutti allineati verticalmente.
Università degli Studi di Cassino
Corso di Fondamenti di Metrologia Meccanica
Qualora i dati sperimentali non presentino una correlazione di tipo
lineare è possibile ricondursi alla ricerca della retta di regressione
con un procedimento detto di linearizzazione dei dati che
consiste in un semplice cambiamento di variabile .
Se ad esempio se tra i dati assegnati intercorre una relazione tale
che y cresce proporzionalmente con una potenza di x, ovvero:
y  C  xA
prendendo i logaritmi naturali di entrambi i membri si ottiene:
ln y  ln C  A ln x
X  ln x
Y  ln y
B  ln C
Alla fine si ottiene:
Y  A x  B
Università degli Studi di Cassino
Corso di Fondamenti di Metrologia Meccanica
L’equazione così linearizzata esprime un legame lineare tra le
variabili X e Y e quindi la retta di regressione cercata è quella
relativa ai dati:
(X1, Y1)= (ln x1, ln y1);
…
(Xn, Yn)= (ln xn, ln yn);
e può essere ricavata dall'equazione della curva approssimante
y =C xA
con
C=eB
dove A e B sono i coefficienti della retta di regressione
linearizzata.
Università degli Studi di Cassino
Corso di Fondamenti di Metrologia Meccanica
Scarica

Regressione - Università degli Studi di Cassino