Università degli Studi di Cassino Facoltà di Ingegneria Lezioni del Corso di Fondamenti di Metrologia Meccanica 06. La regressione Università degli Studi di Cassino • Regressione Corso di Fondamenti di Metrologia Meccanica Università degli Studi di Cassino Corso di Fondamenti di Metrologia Meccanica Metodo dei minimi quadrati Se due popolazioni sono correlate tra loro e se il coefficiente di correlazione r non vale esattamente ±1, certamente i dati yi non sono esattamente una funzione lineare dei dati xi. Tuttavia, se analizzando il diagramma di dispersione verifichiamo un andamento di tipo lineare ed il valore di r è prossimo a ± 1, è possibile determinare l'equazione di una retta che approssimi "nel modo migliore" i dati assegnati. 25,0 y = 0,1599x + 4,0864 R2 = 0,9972 20,0 15,0 10,0 5,0 0,0 0,0 20,0 40,0 60,0 80,0 100,0 Università degli Studi di Cassino Sia dato un insieme di n punti x1, y1),...,(xn, yn) e sia Y A x B l’equazione della retta che si vuole determinare. Corso di Fondamenti di Metrologia Meccanica numero letture x y 1 0,0 3,8 2 10,0 5,6 3 20,0 7,6 4 30,0 9,3 5 40,0 10,6 6 50,0 12,1 7 60,0 13,4 8 70,0 14,9 9 80,0 16,6 10 90,0 18,7 11 100,0 20,3 Università degli Studi di Cassino Corso di Fondamenti di Metrologia Meccanica Una tecnica potrebbe consistere nel trovare i valori A e B per i quali è minima la somma [Y ( x ) y ] i i Ma questo criterio è inadeguato in quanto, fissati due punti, qualsiasi retta passante per il punto medio del segmento che congiunge i due punti rende minima la quantità somma Università degli Studi di Cassino Corso di Fondamenti di Metrologia Meccanica Si potrebbe allora minimizzare la somma dei valori assoluti Y (x ) y i i ma anche questo criterio non è adeguato, in quanto, fissati 4 punti, qualunque retta compresa tra le due rette r e s che uniscono i punti a due a due soddisfa tale criterio. Università degli Studi di Cassino Corso di Fondamenti di Metrologia Meccanica Il metodo dei minimi quadrati consiste nel trovare i valori A e B per i quali è minima la somma degli scarti quadratici 2 [ Y ( x ) y ] i i Questo criterio consente di determinare un’unica retta di regressione per ogni insieme di dati. Dal grafico si evince che viene minimizzata la somma dei quadrati delle distanze verticali dei punti dalla retta Università degli Studi di Cassino Corso di Fondamenti di Metrologia Meccanica Equazioni normali • I coefficienti A e B dell'equazione della retta di regressione sono le soluzioni del seguente sistema lineare di due equazioni nelle incognite A e B, detto sistema delle equazioni normali: • E’ possibile dimostrare che la soluzione del sistema esiste ed è unica, purché i punti non siano tutti allineati verticalmente. Università degli Studi di Cassino Corso di Fondamenti di Metrologia Meccanica Regressione polinomiale In alcuni casi, la correlazione esistente fra due variabili osservate non è di tipo lineare. E’ possibile verificare ciò rappresentando semplicemente i punti su di un diagramma. Per trovare la funzione Y che approssima i dati è possibile utilizzare come funzione approssimante un polinomio di grado più elevato al primo. Nel caso più semplice del polinomio di secondo grado si trova la parabola dei minimi quadrati. In tal caso dati i punti (x1, x12 , y1), ..., (xn, xn2 , yn) cerchiamo la parabola Y=AX2+BX+C per cui è minima la quantità. Università degli Studi di Cassino Corso di Fondamenti di Metrologia Meccanica Si può dimostrare che i coefficienti A, B, C della parabola si trovano risolvendo il sistema delle equazioni normali: Anche in tal caso è possibile dimostrare che la soluzione esiste ed è unica, purché i punti non siano tutti allineati verticalmente. Università degli Studi di Cassino Corso di Fondamenti di Metrologia Meccanica Qualora i dati sperimentali non presentino una correlazione di tipo lineare è possibile ricondursi alla ricerca della retta di regressione con un procedimento detto di linearizzazione dei dati che consiste in un semplice cambiamento di variabile . Se ad esempio se tra i dati assegnati intercorre una relazione tale che y cresce proporzionalmente con una potenza di x, ovvero: y C xA prendendo i logaritmi naturali di entrambi i membri si ottiene: ln y ln C A ln x X ln x Y ln y B ln C Alla fine si ottiene: Y A x B Università degli Studi di Cassino Corso di Fondamenti di Metrologia Meccanica L’equazione così linearizzata esprime un legame lineare tra le variabili X e Y e quindi la retta di regressione cercata è quella relativa ai dati: (X1, Y1)= (ln x1, ln y1); … (Xn, Yn)= (ln xn, ln yn); e può essere ricavata dall'equazione della curva approssimante y =C xA con C=eB dove A e B sono i coefficienti della retta di regressione linearizzata. Università degli Studi di Cassino Corso di Fondamenti di Metrologia Meccanica