INTERPOLAZIONE MOD.10 CAP.1 G. Barbaro interpolazione1 In Statistica e in genere nelle scienze sperimentali, si studiano o si osservano “relazioni” fra grandezze G. Barbaro interpolazione1 Per esempio si può pensare allo studio della relazione fra reddito e risparmio di una popolazione oppure alla relazione tra altezza e peso dei militari, ecc. G. Barbaro interpolazione1 Di solito, i punti osservati si dispongono su un diagramma chiamato diagramma a dispersione: 1200 1000 RISPARMIO 800 600 400 200 0 0 500 1000 1500 2000 REDDITO G. Barbaro interpolazione1 2500 3000 3500 Partendo da queste coppie di dati (x, y), si vuole determinare la funzione y = f(x) che descrive il fenomeno G. Barbaro interpolazione1 Definizione: per interpolazione si intende la ricerca di una funzione matematica che approssima l’andamento di un insieme di punti. G. Barbaro interpolazione1 Per trovare la funzione si può procedere in due modi: 1)determinare la funzione che assuma esattamente i punti (x, y) osservati (interpolazione per punti noti, o interpolazione matematica); 2) determinare la funzione che si accosti il più possibile ai punti (x, y) osservati (interpolazione fra punti noti, o interpolazione statistica). G. Barbaro interpolazione1 TIPI DI INTERPOLAZIONE Interpolazione MATEMATICA Calcola una funzione che passa PER tutti i punti Interpolazione STATISTICA Calcola una funzione che passa FRA i punti G. Barbaro interpolazione1 A CHE COSA SERVE ? inserimento di uno o più dati in una serie che presenta dei vuoti (INTERPOLAZIONE in senso stretto). ESTRAPOLAZIONE (valutazione di valori esterni, vicini alla serie dei dati). PEREQUAZIONE (livellazione o “regolazione” dei dati di una serie non regolare attraverso la “sostituzione” al posto dei dati rilevati, di dati ottenuti dalla funzione matematica trovata). G. Barbaro interpolazione1 INTERPOLAZIONE MATEMATICA SI UTILIZZA QUANDO LA FUNZIONE Y=f(X) DEVE PASSARE PER TUTTI I PUNTI OSSERVATI. La scelta della funzione interpolante dipende dai casi, ma la funzione più usuale è quella espressa da un polinomio di grado pari a superiore a n-1 se i punti sono n: y= a0 + a1x + a2x2 +...+ an-1 xn-1 in cui, le “a” sono i parametri e sono in numero uguale ai punti attraverso i quali bisognerà interpolare. Per esempio, se i punti fossero 3, la funzione sarebbe: y=a0+a1x+a2x2 G. Barbaro interpolazione1 ESEMPIO Esempio: Un insegnante deve trasporre delle valutazioni degli scritti dell’esame di stato da punteggio grezzo, in formato percentuale, a punteggio finale, in 15esimi; vuole mantenere le seguenti corrispondenze: punteggio grezzo (x) punteggio finale (y) 0% 4 50% 10 100% 15 Si tratta di determinare l’equazione di una funzione di secondo grado y=a0+a1x+a2x2 in quanto i punti da interpolare sono 3: A(0;4), B(0,5;10), C(1;15). G. Barbaro interpolazione1 Si costruisce un sistema imponendo le condizioni di passaggio della funzione per i 3 punti: passaggio per A: 4=a0 passaggio per B: 10=a0 + 0,5²a2 + 0,5a1 passaggio per C: 15= a0 + 1²a2 + 1a1 Il sistema, risolto, da la seguente funzione: y=-2x²+13x+4 G. Barbaro interpolazione1 Il polinomio interpolatore le formule di Lagrange e di Newton Supponiamo di avere n punti sul piano cartesiano, (x1, y1), (x2, y2), ..., (xn, yn). Come si può fare per scrivere una funzione polinomiale y = P(x) che passi per tutti i punti dati? G. Barbaro interpolazione1 G. Barbaro interpolazione1 La formula generale di Lagrange, scritta per esteso, è la seguente: Equazione della curva polinomiale di grado (n-1), passante per i punti (x1, y1), (x2, y2), ..., (xn, yn) G. Barbaro interpolazione1 INTERPOLAZIONE STATISTICA Mentre nella interpolazione matematica la funzione interpolante deve passare per tutti i punti sperimentali, nell’interpolazione statistica la funzione passa attraverso i punti osservati. G. Barbaro interpolazione1 L’interpolazione statistica viene utilizzata quando il numero di punti sperimentali è elevato 6 5 Y 4 3 2 1 0 0 1 2 3 X G. Barbaro interpolazione1 4 5 6 E’ necessario che la funzione interpolante passi il più vicino possibile ai valori interpolati. Ci sono vari metodi per attuare ciò, ma il più usato è quello dei minimi quadrati G. Barbaro interpolazione1 Questo metodo consiste nel determinare i parametri della funzione interpolante prescelta in modo che sia minima la somma dei quadrati degli scostamenti dei punti dalla funzione La condizione di accostamento è dunque la seguente: n y i 1 yˆ i minima 2 i yi ŷ xi G. Barbaro interpolazione1 La funzione teorica può assumere differenti aspetti; alcuni dei più usati sono: RETTA PARABOLA FUNZIONE ESPONENZIALE IPERBOLE EQUILATERA G. Barbaro interpolazione1 CASO DELLA RETTA Ŷ = bx + a i parametri da determinare sono quindi a e b n f a, b yi bxi a minima 2 i 1 Questa è una funzione a due variabili di cui occorre trovare il minimo Si procede con la soluzione del sistema che pone le derivate parziali prime uguali a zero per la ricerca di eventuali punti critici: f 'b 2 bxi a yi xi 0 f 'a 2 bxi a yi 1 0 2 b xi a xi xi yi b xi na yi G. Barbaro interpolazione1 Utilizzando il metodo di Cramer si giunge alle soluzioni del sistema 2 yi xi xi yi xi a 2 2 n x ( x ) i i n x y x y i i i i b 2 ( x ) 2 n x i i G. Barbaro interpolazione1 E’ evidente che è difficile memorizzare le precedenti soluzioni. Esistono allora due procedimenti che è possibile seguire: 1° procedimento Si calcola il fattore b utilizzando la formula n x y x y i i i i b n x 2 ( x ) 2 i i Mentre il fattore a si può ricavare dalla seconda equazione del sistema a y b x y x G. Barbaro interpolazione1 Sono le medie delle X e delle Y ESEMPIO TOT. b X X Y XY x2 1 12 12 1 2 13,5 27 4 3 14,8 44,4 9 4 16,5 66 16 5 18,2 91 25 15 75 240,4 55 5 240,4 15 75 1,54 2 5 55 15 15 3 5 Y 75 15 5 a Y b X 15 1,54 3 10,38 G. Barbaro interpolazione1 2° Procedimento Con questo procedimento si procede al calcolo delle medie dei valori sperimentali di X e Y e successivamente si calcolano gli scarti dalla media x ' y ' ( xi X ) ( yi Y ) b (x X ) (x ') i i i 2 2 i a Y b X G. Barbaro interpolazione1 ESEMPIO X tot X = 15/5 =3 Y = 125/5 = 25 Y X' Y' X'2 X'Y' 1 10 -2 -15 30 4 2 17 -1 -8 8 1 3 26 0 1 0 0 4 32 1 7 7 1 5 40 2 15 30 4 15 125 0 0 75 10 ( x X ) ( y Y ) 75 i i b 7,5 2 10 (x X ) i a Y b X 25 7,5 3 2,5 G. Barbaro interpolazione1 PERTANTO LA RETTA INTERPOLATRICE HA EQUAZIONE Y = 2,5+ 7,5 X 45 40 35 30 25 20 15 10 5 0 0 1 2 3 G. Barbaro interpolazione1 4 5 6 INDICI DI ACCOSTAMENTO Per valutare la bontà dell’accostamento tra i dati sperimentali e la funzione ottenuta con i minimi quadrati si utilizzano alcuni indici Indice lineare: Indice quadratico yi yˆ I 1 yˆ i I 2 2 ( yi yˆ i ) n y ˆi n G. Barbaro interpolazione1 I valori degli indici devono essere molto piccoli inferiori a 0.1 CASO DELLA PARABOLA y ax bx c 2 n f a, b, c axi bxi c y i i 1 2 2 minima La condizione di accostamento è la seguente: Si tratta dunque di calcolare il minimo di una funzione a tre variabili [f(a,b,c)]. Si procede con la soluzione del sistema che pone le derivate parziali prime uguali a zero per la ricerca del punto critico (minimo relativo, in questo caso): f ' a 2 axi 2 bxi c y i xi 2 0 2 f 'b 2 axi bxi c y i xi 0 2 f ' 2 ax bxi c y i 1 0 c i G. Barbaro interpolazione1 a xi b xi c xi xi yi 3 2 a xi b xi c xi xi yi 2 a xi b xi nc yi 4 3 2 G. Barbaro interpolazione1 2 Esempio: Calcolare e rappresentare graficamente la parabola interpolante a minimi quadrati per i seguenti punti: x 1 2 4 6 8 12 y 9 5 4 5 6 10 Svolgimento: Conviene sviluppare i calcoli per le varie sommatorie in tabella (facilmente adattabile ad un foglio elettronico) come segue: G. Barbaro interpolazione1 x y x2 x3 x4 xy x2y y teorico 1 9 1 1 1 9 9 7,61 2 5 4 8 16 10 20 6,41 4 4 16 64 256 16 64 4,88 6 5 36 216 1296 30 180 4,5 8 6 64 512 4096 48 384 5,28 12 33 10 144 265 1728 2529 20736 26401 120 233 1440 2097 10,32 39 Si imposta e si risolve il seguente sistema 26.401a 2.529b 265c 2.097 2.529a 265b 33c 233 265a 33b 6c 39 ottenendo la seguente funzione y = 0,1448x² - 1,6363x + 9,1052 G. Barbaro interpolazione1 12 y = 0,1448x 2 - 1,6363x + 9,1052 10 8 6 4 y 2 y teorico 0 y teorico 0 2 4 6 8 G. Barbaro interpolazione1 10 12 14 REGRESSIONE E CORRELAZIONE Lo studio della regressione e della correlazione si occupa della ricerca del legame tra due variabili statistiche. Nel nostro corso si tratta della regressione e della correlazione lineare intendendo che viene ricercato tra le variabili statistiche un legame di tipo lineare Lo studio può esser condotto in due modi: o attraverso la regressione o attraverso la correlazione. G. Barbaro interpolazione1 REGRESSIONE Il termine regressione fu introdotto da Galton (1886) a seguito di uno studio sull’ereditarietà dei caratteri biologici di tipo quantitativo. In particolare Galton prese in esame due variabili costituite rispettivamente dalle altezze dei padri e dalle altezze dei figli. Egli rilevò che le altezze dei figli di padri molto alti erano mediamente inferiori a quelle dei padri, o più precisamente, regredivano verso la media generale delle altezze della popolazione Galton chiamò regressione tale tendenza G. Barbaro interpolazione1 In generale in statistica lo studio della regressione consiste nella determinazione di una funzione matematica che esprima la relazione tra due variabili Siano X e Y due variabili statistiche misure di due caratteri quantitativi di popolazione statistica (ex: X = Reddito e Y = Risparmio) La REGRESSIONE: studia come una variabile varia al variare dell’altra determina una funzione matematica che esprima come una variabile varia al variare dell’altra G. Barbaro interpolazione1 Si parla di regressione lineare se la funzione è di tipo lineare Utilizzando il metodo dei minimi quadrati si determinano due rette di regressione: La retta che esprime Y come funzione della X : y = b1 x + a1 E la retta che esprime la X come funzione della Y : x= b2 y + a2 b1, b2: coefficienti di regressione G. Barbaro interpolazione1 FORMULE PER IL CALCOLO n ( x x )( y y ) i i i 1 b 1 n 2 ( x x) i i 1 n ( x x )( y y ) i i i 1 b 2 n 2 ( y y) i i 1 G. Barbaro interpolazione1 a yb x 1 1 a 2 xb y 2 b1 E b2 HANNO SEMPRE LO STESSO SEGNO Se b1 e b2 sono positivi esiste un legame lineare diretto (all’aumentare di una variabile aumenta l’altra) Se b1 e b2 sono negativi esiste un legame lineare inverso (all’aumentare di una variabile diminuisce l’altra) Se 1 b 1 b 2 esiste un legame lineare perfetto (diretto o inverso in base al segno dei coefficienti) e le due rette sono coincidenti Se b1 = b2 =0 esiste indipendenza lineare( le due rette sono parallele agli assi cartesiani) G. Barbaro interpolazione1 CORRELAZIONE LINEARE La CORRELAZIONE studia quanto le variabili sono collegate fra di loro misurando l’intensità del legame di interdipendenza fra le due variabili Talvolta lo studio della correlazione precede quello della regressione in quanto una variabile viene confrontata con tante altre per vedere con quale risulti più connessa G. Barbaro interpolazione1 Nello studio della correlazione si procede al calcolo di un indice: r = Indice di Bravais-Pearson = Si usa il segno + se b1 e b2 sono positivi b1 b2 dove b1 e b2 sono i coefficienti di regressione IL coefficiente r ha un campo di variazione: Si usa il segno – se i coefficienti b1 e b2 sono negativi 1 r 1 G. Barbaro interpolazione1 Un altro modo per definire il coefficiente di Bravais –Pearson è quello di definirlo come rapporto tra la covarianza di x e y e il prodotto degli scarti quadratici medi di x e di y. r x xy y Dove : s.q.m. xy x x' y ' covarianza n ( x' ) n 2 G. Barbaro interpolazione1 y ( y' ) n 2 1 r 1 se r= -1 esiste una correlazione lineare perfetta negativa Le due rette sono sovrapposte(‘l’angolo tra le rette è nullo) se r= +1 esiste una correlazione lineare perfetta positiva Le due rette sono sovrapposte(‘l’angolo tra le rette è nullo) G. Barbaro interpolazione1 se r= 0 esiste INDIPENDENZA LINEARE fra le due variabili 1 r 0 0 r 1 G. Barbaro interpolazione1