INTERPOLAZIONE
G. Barbaro interpolazione1
In Statistica e in genere nelle scienze
sperimentali, si studiano o si osservano
“relazioni” fra grandezze
G. Barbaro interpolazione1
Per esempio si può pensare allo studio della
relazione fra reddito e risparmio di una
popolazione oppure alla relazione tra
altezza e peso dei militari, ecc.
G. Barbaro interpolazione1
Di solito, i punti osservati si dispongono
su un diagramma chiamato diagramma
a dispersione:
1200
1000
RISPARMIO

800
600
400
200
0
0
500
1000
1500
2000
REDDITO
G. Barbaro interpolazione1
2500
3000
3500
Partendo da queste coppie di dati (x, y), si
vuole determinare la funzione
y = f(x)
che descrive il fenomeno
G. Barbaro interpolazione1
Definizione:
per interpolazione si intende la ricerca di
una funzione matematica che
approssima l’andamento di un insieme
di punti.
G. Barbaro interpolazione1
Per trovare la funzione si può procedere in due
modi:
1)determinare la funzione che assuma
esattamente i punti (x, y) osservati
(interpolazione per punti noti, o interpolazione
matematica);
2) determinare la funzione che si accosti il più
possibile ai punti (x, y) osservati
(interpolazione fra punti noti, o interpolazione
statistica).
G. Barbaro interpolazione1
TIPI DI INTERPOLAZIONE
Interpolazione MATEMATICA
Calcola una funzione che
passa PER tutti i punti
Interpolazione STATISTICA
Calcola una funzione che passa FRA i punti
G. Barbaro interpolazione1
A CHE COSA SERVE ?
inserimento di uno o più dati in una serie
che presenta vuoti.
 ESTRAPOLAZIONE (valutazione di valori
esterni alla serie dei dati).
 PEREQUAZIONE (livellazione o
“regolazione” dei dati di una serie non
regolare attraverso la “sostituzione” al
posto dei dati rilevati, di dati ottenuti dalla
funzione matematica trovata).

G. Barbaro interpolazione1
INTERPOLAZIONE MATEMATICA

SI UTILIZZA QUANDO LA FUNZIONE Y=f(X) DEVE
PASSARE PER TUTTI I PUNTI OSSERVATI.

La scelta della funzione interpolante dipende dai casi,
ma la funzione più usuale è quella espressa da un
polinomio di grado pari a superiore a n-1 se i punti sono
n:
y= a0 + a1x + a2x2 +...+ an-1 xn-1


in cui, le “a” sono i parametri e sono in numero uguale ai
punti attraverso i quali bisognerà interpolare.

Per esempio, se i punti fossero 3, la funzione sarebbe:
y=a0+a1x+a2x2
G. Barbaro interpolazione1
ESEMPIO



Esempio:
Un insegnante deve trasporre delle valutazioni degli scritti
dell’esame di stato da punteggio grezzo, in formato
percentuale, a punteggio finale, in 15esimi; vuole
mantenere le seguenti corrispondenze:
punteggio grezzo (x)
punteggio finale (y)
0%
4
50%
10
100%
15
Si tratta di determinare l’equazione di una funzione di
secondo grado y=a0+a1x+a2x2 in quanto i punti da
interpolare sono 3: A(0;4), B(0,5;10), C(1;15).
G. Barbaro interpolazione1
Si costruisce un sistema imponendo le
condizioni di passaggio della funzione per
i 3 punti:
passaggio per A:
4=a0
passaggio per B:
10=a0 + 0,5²a2 + 0,5a1
passaggio per C: 15= a0 + 1²a2 + 1a1
 Il sistema, risolto, da la seguente funzione:
y=-2x²+13x+4

G. Barbaro interpolazione1
Il polinomio interpolatore
le formule di Lagrange e di Newton
Supponiamo di avere n punti sul piano cartesiano, (x1,
y1), (x2, y2), ..., (xn, yn).
Come si può fare per scrivere una funzione
polinomiale y = P(x) che passi per tutti i punti dati?
G. Barbaro interpolazione1
G. Barbaro interpolazione1
La formula generale di Lagrange, scritta per esteso, è la seguente:
Equazione della curva polinomiale di grado (n-1), passante per i punti (x1, y1),
(x2, y2), ..., (xn, yn)
G. Barbaro interpolazione1
INTERPOLAZIONE
STATISTICA

Mentre nella interpolazione matematica la
funzione interpolante deve passare per tutti i punti
sperimentali, nell’interpolazione statistica la
funzione passa attraverso i punti osservati.
G. Barbaro interpolazione1
L’interpolazione statistica viene utilizzata quando il numero di punti
sperimentali è elevato
6
5
Y
4
3
2
1
0
0
1
2
3
X
G. Barbaro interpolazione1
4
5
6

E’ necessario che la funzione interpolante
passi il più vicino possibile ai valori
interpolati.

Ci sono vari metodi per attuare ciò, ma il
più usato è quello dei minimi quadrati
G. Barbaro interpolazione1


Questo metodo consiste nel determinare i
parametri della funzione interpolante prescelta in
modo che sia minima la somma dei quadrati degli
scostamenti dei punti dalla funzione
La condizione di accostamento è dunque la
seguente:
n
 y
i 1
 yˆ i   minima
2
i
yi
ŷ
xi
G. Barbaro interpolazione1
La funzione teorica può assumere differenti
aspetti
RETTA
PARABOLA
FUNZIONE ESPONENZIALE
G. Barbaro interpolazione1
CASO DELLA RETTA
Ŷ = bx + a i parametri da determinare sono quindi a e b
n
f a, b     yi  bxi  a   minima
2
i 1
Questa è una funzione a due variabili di cui occorre trovare il minimo
Si procede con la soluzione del sistema che pone le
derivate parziali prime uguali a zero per la ricerca
di eventuali punti critici:
 f 'b  2 bxi  a  yi   xi  0

 f 'a  2 bxi  a  yi  1  0
2

b xi  a xi   xi yi


b xi  na   yi
G. Barbaro interpolazione1
Utilizzando il metodo di Cramer si giunge alle soluzioni del
sistema
2

yi   xi   xi yi   xi

a 
2
2
n
x

(
x
)

 i  i


n x y   x   y

i i
i
i
b


2  ( x ) 2
n
x


i
i

G. Barbaro interpolazione1
E’ evidente che è difficile memorizzare le precedenti soluzioni.
Esistono allora due procedimenti che è possibile seguire:
1° procedimento
Si calcola il fattore b utilizzando la formula
n x  y   x   y
i
i
i
i
b
n x 2  ( x ) 2
i
i
Mentre il fattore a si può ricavare dalla seconda equazione del sistema
a  y b x
y
x
G. Barbaro interpolazione1
Sono le medie delle
X e delle Y
ESEMPIO
TOT.
b
X 
X
Y
XY
x2
1
12
12
1
2
13,5
27
4
3
14,8
44,4
9
4
16,5
66
16
5
18,2
91
25
15
75
240,4
55
5  240,4  15  75
 1,54
2
5  55  15
15
3
5
Y 
75
 15
5
a  Y  b  X  15  1,54  3  10,38
G. Barbaro interpolazione1
2° Procedimento
Con questo procedimento si procede al calcolo delle medie dei valori
sperimentali di X e Y e successivamente si calcolano gli scarti dalla
media
b
 xi ' yi '
 (x ')
2
i

 ( xi  X )  ( yi  Y )
 (x  X )
i
a Y b X
G. Barbaro interpolazione1
2
ESEMPIO
X
tot
X
= 15/5 =3
Y = 125/5 = 25
Y
X'
Y'
X'2
X'Y'
1
10
-2
-15
30
4
2
17
-1
-8
8
1
3
26
0
1
0
0
4
32
1
7
7
1
5
40
2
15
30
4
15
125
0
0
75
10
 ( x  X )  ( y  Y ) 75
i
i
b

 7,5
2
10
(x  X )
i
a  Y  b  X  25  7,5  3  2,5
G. Barbaro interpolazione1
PERTANTO LA RETTA INTERPOLATRICE HA EQUAZIONE
Y = 2,5+ 7,5 X
45
40
35
30
25
20
15
10
5
0
0
1
2
3
G. Barbaro interpolazione1
4
5
6
INDICI DI ACCOSTAMENTO
Per valutare la bontà dell’accostamento tra i dati sperimentali e la
funzione ottenuta con i minimi quadrati si utilizzano alcuni indici
Indice lineare:
Indice quadratico
 yi  yˆ
I 
1
 yˆ i
I 
2
2
 ( yi  yˆ i )
n
y
 ˆi
n
G. Barbaro interpolazione1
I valori degli indici
devono essere molto
piccoli inferiori a 0.1
CASO DELLA PARABOLA
y  ax  bx  c
2
n

f a, b, c    axi  bxi  c  y i
i 1
2

2
 minima
La condizione di accostamento è la seguente:
Si tratta dunque di calcolare il minimo di una funzione a tre variabili [f(a,b,c)].
Si procede con la soluzione del sistema che pone le derivate parziali prime
uguali a zero per la ricerca del punto critico (minimo relativo, in questo caso):






 f ' a  2 axi 2  bxi  c  y i  xi 2  0


2
 f 'b  2 axi  bxi  c  y i  xi  0

2
f
'

2
ax
 bxi  c  y i  1  0


c
i

G. Barbaro interpolazione1
a xi  b xi  c xi   xi yi

3
2
a xi  b xi  c xi   xi yi

2
a xi  b xi  nc   yi
4
3
2
G. Barbaro interpolazione1
2
Esempio:
Calcolare e rappresentare graficamente la parabola interpolante a
minimi quadrati per i seguenti punti:
x
1
2
4
6
8
12
y
9
5
4
5
6
10
Svolgimento:
Conviene sviluppare i calcoli per le varie sommatorie in tabella
(facilmente adattabile ad un foglio elettronico) come segue:
G. Barbaro interpolazione1
x
y
x2
x3
x4
xy
x2y
y teorico
1
9
1
1
1
9
9
7,61
2
5
4
8
16
10
20
6,41
4
4
16
64
256
16
64
4,88
6
5
36
216
1296
30
180
4,5
8
6
64
512
4096
48
384
5,28
12
33
10
144
265
1728
2529
20736
26401
120
233
1440
2097
10,32
39
Si imposta e si risolve il
seguente sistema
26.401a  2.529b  265c  2.097

2.529a  265b  33c  233
265a  33b  6c  39

ottenendo la seguente funzione
y = 0,1448x² - 1,6363x + 9,1052
G. Barbaro interpolazione1
12
y = 0,1448x 2 - 1,6363x + 9,1052
10
8
6
4
y
2
y teorico
0
y teorico
0
2
4
6
8
G. Barbaro interpolazione1
10
12
14
REGRESSIONE E
CORRELAZIONE
In statistica spesso, nello studio delle relazioni tra
due variabili, si è interessati ad accertare come
varia una di queste in funzione dell’altra cioè ad
individuare una opportuna funzione che metta in
relazione le due variabili.
Questo studio si chiama REGRESSIONE
Per esempio potrebbe essere condotto uno studio
tra REDDITO E CONSUMI.
G. Barbaro interpolazione1
REDDITO*
CONSUMI*
10
2
15
2,3
18
2,1
20
2,5
22
2,6
25
2,5
30
3
* In migliaia di euro
La domanda è la seguente:
esiste un legame tra le due variabili statistiche?
E se esiste quanto è forte o debole questo legame?
G. Barbaro interpolazione1
Qualche studente potrebbe affermare che
REGRESSIONE ED INTERPOLAZIONE siano la
stessa cosa. In parte è vero.
Però mentre nell’interpolazione le due variabili
possono anche non essere di tipo
statistico(esempio anni, vendite) nella regressione
lo studio viene condotto su due variabili
statistiche.
La CORRELAZIONE invece studia LA FORZA
del legame tra le due variabili statistiche.
G. Barbaro interpolazione1
Lo studio della regressione e della correlazione si
occupa della ricerca del legame e della “misurazione”
di tale legame tra due variabili statistiche.
Nel nostro corso si tratta della regressione e della correlazione lineare
intendendo che viene ricercato tra le variabili statistiche un legame di tipo
lineare
Lo studio può esser condotto in due modi:
• attraverso la regressione ( si ricerca il legame tra le due variabili statistiche
esprimendolo attraverso una funzione matematica)
• attraverso la correlazione ricercando la forza o debolezza di tale legame con il
calcolo di un indice
G. Barbaro interpolazione1
REGRESSIONE
Il termine regressione fu introdotto da Galton (1822-1911) a seguito di uno
studio sull’ereditarietà dei caratteri biologici di tipo quantitativo.
In particolare Galton prese in esame due variabili costituite rispettivamente
dalle altezze dei padri e dalle altezze dei figli.
Egli rilevò che le altezze dei figli di padri molto alti erano mediamente inferiori
a quelle dei padri, o più precisamente, regredivano verso la media
generale delle altezze della popolazione
Galton chiamò regressione tale tendenza
G. Barbaro interpolazione1
In generale in statistica lo studio della regressione consiste nella determinazione
di una funzione matematica che esprima la relazione tra due variabili
Siano X e Y due variabili statistiche misure di due caratteri quantitativi di
popolazione statistica (ex: X = Reddito e Y = Spese)
La REGRESSIONE: studia come una variabile varia al variare
dell’altra
determina una funzione matematica che esprima come una
variabile varia al variare dell’altra
G. Barbaro interpolazione1
Si parla di regressione lineare se la funzione è di tipo lineare
Utilizzando il metodo dei minimi quadrati si determinano due rette di
regressione:
La retta che esprime Y come funzione della X :
y = b1 x + a1
E la retta che esprime la X come funzione della Y :
x= b2 y + a2
b1,
b2: coefficienti di regressione
G. Barbaro interpolazione1
FORMULE PER IL CALCOLO : 1° procedimento
n x  y   x   y
i i
i
i
b1 
n x 2  ( x ) 2
i
i
a1  y  b1  x
n x  y   x   y
i i
i
i
b2 
n y 2  ( y ) 2
i
i
a2  x  b2  y
y
x
Sono le medie
delle x e delle y
G. Barbaro interpolazione1
FORMULE PER IL CALCOLO: 2° procedimento
n
 ( x  x )( y  y )
i
i
i

1
b 
1
n
2
 ( x  x)
i
i 1
n
 ( x  x )( y  y )
i
i
i

1
b 
2
n
2
 ( y  y)
i
i 1
G. Barbaro interpolazione1
a  yb x
1
1
a
2
 xb y
2
b1 E b2 HANNO SEMPRE LO STESSO SEGNO
Se b1 e b2 sono positivi
esiste un legame lineare
diretto (all’aumentare di una
variabile aumenta l’altra)
Se b1 e b2 sono negativi
esiste un legame lineare inverso
(all’aumentare di una variabile
diminuisce l’altra)
Se
1
b 
1
b
2
esiste un legame lineare
perfetto (diretto o
inverso in base al segno
dei coefficienti) e le due
rette sono coincidenti
Se b1 = b2 =0 esiste indipendenza lineare(
le due rette sono parallele agli assi cartesiani)
G. Barbaro interpolazione1
CORRELAZIONE LINEARE
La CORRELAZIONE studia quanto le variabili sono collegate fra di loro
misurando l’intensità del legame di interdipendenza fra le due variabili
Talvolta lo studio della correlazione precede quello della regressione in
quanto una variabile viene confrontata con tante altre per vedere con
quale risulti più connessa
G. Barbaro interpolazione1
Nello studio della correlazione si procede al
calcolo di un indice:
r = Indice di Bravais-Pearson =
Si usa il segno +
se b1 e b2 sono
positivi
 b1  b2
dove b1 e b2 sono i coefficienti di regressione
IL coefficiente r ha un campo di variazione:
Si usa il segno –
se i coefficienti b1
e b2 sono
negativi
1 r  1
G. Barbaro interpolazione1
Un altro modo per definire il coefficiente di Bravais –Pearson è quello di
definirlo come rapporto tra la covarianza di x e y e il prodotto degli scarti
quadratici medi di x e di y.
r 


x
xy

y
Dove :

s.q.m.

yy
x


 x ' y'
n
 ( x' )
n
covarianza
2
G. Barbaro interpolazione1

y

 ( y' )
n
2
1 r 1
se r= -1 esiste una correlazione lineare perfetta negativa
Le due rette sono
sovrapposte(‘l’angolo
tra le rette è nullo)
se r= +1 esiste una correlazione lineare perfetta positiva
Le due rette sono
sovrapposte(‘l’angolo
tra le rette è nullo)
G. Barbaro interpolazione1
se r= 0 esiste INDIPENDENZA LINEARE fra le due variabili
1 r  0
0  r 1
G. Barbaro interpolazione1
Scarica

INTERPOLAZIONE MOD.10 CAP.1