RELAZIONI TRA 2
FENOMENI QUANTITATIVI
Es: 6 famiglie, ammontare della spesa annua (in
euro) per l’acquisto di due generi di largo
consumo: latte fresco e biscotti.
Famiglia
Spesa annua per
l’acquisto di latte
fresco (€)
Spesa annua per
l’acquisto di biscotti
(€)
A
105
65
B
190
130
C
80
160
D
120
90
E
240
220
F
60
50
M(x)=
132.5
M(y)=
119.2
• (i) rxy? (ii) commento (iii) diagramma di dispersione (iv)
concordanza tra rxy e diagramma di dispersione (v) Perché
rxy invece della retta di regressione?
n
Soluzione
rxy 
 (x  M
i 1
i
x
)( yi  M y )
n
1/ 2

2
2
  ( xi  M x )  ( yi  M y ) 
i 1
 i 1

n
(xi – Mx)
(yi – My)
(xi-Mx)×
(yi-My)
(xi-Mx)2
(yi-My)2
(105-132.5)
(65-119.2)
(105-132.5)
(65-119.2)
(105-132.5)2
(65-119.2)2
(190-132.5) (130-119.2)
(190-132.5)
(130-119.2)
(190-132.5)2
(130-119.2)2
Fami
glia
A
B
C
D
E
16187.5
rxy 
 0.73
1/ 2
23787.5  20520.8
F
Tot 0
.
0
16187.5
23787.5
20520.8
Diagramma di dispersione
Diagramma di dispersione in
termini di scostamenti dalla media
Analisi del diagramma di
dispersione
• Il punto C è un valore anomalo bivariato
• Se cancelliamo il punto C ci attendiamo
che il valore di rxy aumenti
• rxy senza il punto C è uguale a 0.963
CORRELAZIONE FRA DUE S.S.
• Esempio: X = numero di extracomunitari iscritti al
collocamento, Y = numero di discount
• Calcolare e commentare rXY tra le variabili
originarie, i NI a base fissa, le variazioni
percentuali a base fissa, i NI a base mobile, le
variazioni percentuali a base mobile
Anni
X
Y
1993
1994
72.644
85.993
600
1.300
1995
1996
1997
96.287
136.942
140.100
1.930
2.328
2.523
CORRELAZIONE FRA DUE S.S.
• Esempio: X = numero di extracomunitari iscritti al
collocamento, Y = numero di discount
• Calcolare e rXY tra le variabili originarie, i NI a
base fissa, le variazioni percentuali a base fissa, i
NI a base mobile, le variazioni percentuali a base
mobile
Anni
1993
1994
1995
1996
1997
X
Y
72.644
600
85.993
1.300tra i livelli
Correlazione
spuria  relazione
96.287
1.930
136.942
2.328
140.100
2.523
COV ( X , Y )
17.977.023,36
rxy 

 0,933
 x  y
(27.300,88  705,42)
Numero di
discount (Y)
Esempio di correlazione spuria
3000
2500
2000
1500
1000
500
0
60.000
•Numero di
extracomunitari
iscritti al
collocamento (X)
110.000
160.000
Numero di
discount (Y)
Esempio di correlazione spuria
•Numero di
extracomunitari
iscritti al
collocamento (X)
• Correlazione tra le variazioni annue?
Esempio di correlazione spuria
• Numero di
extracomunitari iscritti
al collocamento (X)
• Numero di discount (Y)
160000
3000
140000
2500
120000
2000
100000
80000
1500
60000
1000
40000
500
20000
0
1993
1994
1995
1996
1997
0
1993
1994
1995
• Correlazione tra le variazioni annue?
1996
1997
NI base mobile X (numero di
extracomunitari) e Y (numero di discount
Var %
X
Var % Y
Scost
media
X
Scost
media Y
Anni
n. i. base
mobile
n. i. base
mobile
1993
-
-
1994
118,38
216,67
18,38 116,67
-0,34
68,14
1995
111,97
148,46
11,97
48,46
-6,75
-0,07
1996
142,22
120,62
42,22
20,62
23,50
-27,91
1997
102,31
108,38
2,31
8,38 -16,41
-40,16
Media
118,72
148,53
18,72
Var
0,0217
0,1758 0,0217 0,1758
48,53
0,00
0,00
Cov(Nix,NIy)=0,000496
rxy(tra n. i. a base mobile) =-0,000496/(0,0217*0,1758)½ = -0,008
Scatter sugli scostamenti NI base mobile o var.
percentuali
80.00%
-0.34% 68.14%
II
60.00%
I
40.00%
20.00%
0.00%
-6.75% -0.07%
-20.00%
23.50% -27.91%
-40.00%
-16.41% -40.16%
III
-60.00%
-20.00% -15.00% -10.00% -5.00%
IV
0.00%
5.00%
10.00% 15.00% 20.00% 25.00% 30.00%
Osservazioni finali
• Non esiste relazione lineare tra le
variazioni annue di X e Y
• Si ottiene rxy = -0,008 anche
effettuando il calcolo sulle variazioni %
rispetto all’anno precedente (proprietà
di invarianza per trasformazioni lineari
crescenti)
Cenni alle analisi multivariate
• p fenomeni quantitativi
• Possiamo calcolare il coefficiente di
correlazione lineare e/o la covarianza per
ogni coppia di fenomeni
MATRICE DI COVARIANZA
(p.169)
• p variabili: X1, X2, X3,…, Xs, …, Xp
COV ( X 1 , X 2 )  COV ( X 1 , X P ) 
 VAR ( X 1 )
 COV ( X , X )

VAR
(
X
)

COV
(
X
,
X
)
2
1
2
2
P 

S 
p p 




COV ( X , X ) COV ( X , X )  VAR ( X ) 


P
1
P
2
P
MATRICE DI CORRELAZIONE
COV ( X , Y )
rxy 
VAR ( X ) VAR (Y )
 1 r12  r1 p 
r

1  r2 p
21

R 
p p  

 
r r  1 
 p1 p 2

ESEMPIO MATRICE DI
COVARIANZA
• X = età
• Y = anzianità di servizio
• Z = stipendio mensile (in euro)
X
S
Y
Z
X Y
118 73
62
Z
4.218
1.736
276.000
S
X
Y
Z
X Y
118 73
62
Z
4.218
1.736
276.000
MATRICE DI CORRELAZIONE
73
rxy 
 0,8535
118  62
X
Y
Z
X
R
Y
Z
1
0,8535 0,7391
1
0,4197
1
La diapositiva che segue
contiene un esercizio da
risolvere
Es. X= tasso di indebitamento delle famiglie, in
percentuale, (X) e del fabbisogno di energia elettrica, in migliaia di
megawatt, (Y) in Italia nel periodo 1998– 2002
anni
X
Y
1998
27,8
279
1999
31,1
286
2000
32,6
299
2001
32,6
305
2002
35,1
311
LA REGRESSIONE
LINEARE
LA REGRESSIONE LINEARE
•
•
•
Esiste una relazione (lineare) tra X e Y?
In caso affermativo:
Come varia una variabile (dipendente)
in funzione dell’altra (esplicativa)?
• Per convenzione:
Y = variabile dipendente
X = variabile esplicativa
Esempi
• Relazione tra comportamenti di
acquisto e caratteristiche dei
consumatori
• Relazione tra numero di esami
sostenuti nei primi due anni di corso e
voto alla maturità
• Relazione tra prezzo di vendita e
quantità venduta di un bene
Motivi che spingono ad adottare
modelli di regressione lineare
• Semplicità  facilità di interpretazione dei
parametri
• yi = a + bxi + ei
i = 1, …, n
dove:
• a + bxi rappresenta una retta:
• a = ordinata all’origine  intercetta
• b = coeff. angolare  coeff. di
regressione
• ei è un termine di errore (accidentale)
Motivi che spingono ad adottare
modelli di regressione lineare
• Effettiva linearità  molte relazioni sono
molto vicine alla linearità
• Trasformazioni  la relazione è lineare
dopo aver trasformato opportunamente la
dipendente e/o l’esplicativa
• Es. y = a bx
• log y = log a + (log b) x
• y’ = a’ + b’ x
Motivi che spingono ad adottare
modelli di regressione lineare
• Limitatezza dell’intervallo
Motivi che spingono ad adottare
modelli di regressione lineare
• Ragioni di teoria statistica: lo studio delle
funzioni lineari nei parametri ha una
trattazione più agevole
Diagramma di dispersione
8
7
Y = vendite
6
5
4
3
2
1
0
0
10
20
30
40
X = N. dipendenti
• Come variano le vendite in funzione del numero di
dipendenti?
MODELLO DI REGRESSIONE
• yi = a + bxi + ei
i = 1, …, n
dove:
• a + bxi rappresenta una retta:
• a = ordinata all’origine  intercetta
• b = coeff. angolare  coeff. di
regressione
• ei è un termine di errore (accidentale)
RETTA DI REGRESSIONE
yˆ i  a  bxi
•
i = 1, …, n
ŷ i
= valore teorico (valore stimato)
di yi  funzione lineare di
i = 1, …, n
Residui
ei  y i  yˆ i
Fatturato in milioni di € (Y)
Come si calcolano i parametri a e b?
7,0
6,0
5,0
4,0
3,0
2,0
1,0
0,0
0
5
10
15
20
N. dipendenti (X)
25
30
35
Come si calcolano i parametri a e b?
• METODO DEI MINIMI QUADRATI
n
n
e  (y
i 1
2
i
i 1
 yˆ i )  min
2
i
Le incognite sono i parametri della retta
yˆ i  a  bxi
Visualizzazione grafica dei residui
(ei)
Come si calcolano i parametri a e b?
• METODO DEI MINIMI QUADRATI
n
n
e  (y
2
i
i 1
n
i 1
n
e  ( y
2
i
i 1
i
 e
a
i
 a  bxi )  min
2
i 1
n
n
i 1
 yˆ i )  min
2
2
i
0
 e
i 1
b
2
i
0
Come si calcolano i parametri a e b?
• METODO DEI MINIMI QUADRATI
n
 e
i 1
2
i
a
n

  ( yi  a  bxi )
2
i 1
a
n
 2 ( yi  a  bxi )( 1)  0
i 1
n
e
i 1
i
0
Come si calcolano i parametri a e b?
• METODO DEI MINIMI QUADRATI
n
 e
2
i
i 1
b
n

  ( yi  a  bxi )
2
i 1
b
n
 2 ( yi  a  bxi )(  xi )  0
i 1
n
e x
i 1
i i
0
Sistema di equazioni normali
n
e
i 1
i
0
n
xe
i 1
i i
n
( y
i
i 1
0
n
( y
i
 a  bxi )  0
 a  bxi )xi  0
i 1
2 equazioni e 2 incognite (a e b)
Dalla prima equazione
n
( y
i 1
i
 a  bxi )  0
n
na   ( yi  bxi )
i 1
a  y  bx
Sostituendo il valore trovato di a
a

y

b
x
nella seconda equazione
n
( y
i
 a  bxi )xi  0
i 1
n
[ y
i
 ( y  bx )  bxi ]xi  0
i 1
n
b
 ( x  x )( y
i
i 1
i
 y)
n
(x  x)
i 1
i
2
Espressioni alternative per a e b
a

2
yi  xi   xi  xi
2
2
n x i  (  x i )
yi
n x i y i   x i  y i
b
2
2
n x i  (  x i )
ESEMPIO (7 supermercati) rxy=0,96
N. dipendenti
(X)
Fatturato
in milioni di € (Y)
A
B
10
18
1,9
3,1
C
D
E
20
8
30
3,2
1,5
6,2
F
G
12
14
2,8
2,3
Me
die
16
3
Calcolo di a e b
xi2
yi2
xi
yi
A
10
1,9
100
3,61
19
B
18
3,1
324
9,61
55,8
C
20
3,2
400
10,24
64
D
8
1,5



E
30
6,2



F
12
2,8



G
14
2,3



Tot.
112
21
2128
77,28
402,6
a

2
yi  xi   xi  xi
2
2
n x i  (  x i )
xiyi
yi
21  2.128  112  402,6
403,2
a

 0,17
2
2.352
7  2.128  112
Calcolo di a e b
xi2
yi2
xi
yi
xiyi
A
10
1,9
100
3,61
19
B
18
3,1
324
9,61
55,8
C
20
3,2
400
10,24
64
D
8
1,5



E
30
6,2



F
12
2,8



G
14
2,3



Tot.
112
21
2128
77,28
402,6
n x i y i   x i  y i
b
2
2
n x i  (  x i )
7  402,6  112  21 466,2
b

 0,198
2
2.352
7  2.128  112
Fatturato in milioni di € (Y)
Scatter con retta di regressione
7,0
6,0
y = 0,198x - 0,17
5,0
4,0
3,0
2,0
1,0
0,0
0
5
10
15
20
N. dipendenti (X)
25
30
35
Interpretazione dei parametri
ESEMPIO (7 supermercati)
• a = –0,17  fatturato teorico quando
N. di dipendenti = 0
• b = 0,198  incremento medio nel
fatturato quando il numero di
dipendenti aumenta di 1 unità
Interpretazione di b
• b= indica l’entità
della variazione
teorica della
variabile
dipendente in
corrispondenza di
un incremento
unitario della
variabile
esplicativa
Interpretazione di b
• a+bx
• a+b(x+1)
• Qual è la differenza tra i due precedenti
valori teorici(prima e dopo l’incremento
unitario)?
• a+b(x+1)-(a+bx)=b
Sistema di equazioni normali
n
e
i 1
i
0
n
xe
i 1
i i
n
( y
i
i 1
0
n
( y
i
 a  bxi )  0
 a  bxi )xi  0
i 1
Analizziamo le implicazioni dei
due precedenti vincoli
Proprietà delle stime dei minimi
quadrati
• Proprietà 1:
n
n
e  ( y
i
i 1
i
i 1
n
n
n
i 1
i 1
i 1
 a  bxi )   ( yi  yˆ i ) 0   yi   yˆ i
• Proprietà 2
y  yˆ  (a  bx )
• La retta di regressione passa sempre
per il punto di coordinate
x y
Proprietà delle stime dei minimi
quadrati
• Proprietà 3:
n
x (y
i
i 1
n
i
 yˆ i )   xi ei  0
i 1
Calcolo dei valori teorici e dei residui
yi=-0,17+0,198xi
Valori teorici
Resi
dui
xi ×residuoi
xi
yi
A
10
1,9
-0,17+0,198*10=1,81
0,09
0,89
B
18
3,1
-0,17+0,198*18=3,40
-0,30
-5,34
C
20
3,2
-0,17+0,198*20= 3,79
-0,59
-11,86
D
8
1,5
1,41
0,09
0,69
E
30
6,2
5,78
0,43
12,75
F
12
2,8
2,21
0,59
7,11
G
14
2,3
2,60
-0,30
-4,25
To 112
t.
21
21
n
n
 y   yˆ
i 1
i
i 1
i
0
n
e
i 1
i
0
0
n
xe
i 1
i i
0
Regressione in termini di
scostamenti
Dato che la sommatoria degli
scostamenti dalla media è zero
2
y
x
 i  i   xi  xi yi
a
2
2
n x i  (  x i )
• Si ottiene che a=0
a  y  bx
Modi alternativi di esprimere b
• Dato che
n x i y i   x i  y i
b
n x i2  (  x i ) 2
• Si ricava
y
COV ( X ,Y )
b
 r xy
VAR ( X )
x
ESEMPIO (7 supermercati):
r xy  0,961   6,928  y  1,428
x
y
1,428
COV ( X ,Y )
b
 r xy
b  0,961
 0,198
VAR ( X )
x
6,928
My 3
M x  16
a  M y  bM x
a  3  0,198  16  0,17
Es. n. 5.
7 famiglie
A
B
C
D
E
F
G
Spesa per
manifestazio
ni culturali (Z)
200
420
250
70
180
300
100
Reddito mensile
del capofamiglia
(x 1000 Euro)
(Y)
1,9
4,0
2,5
1,6
2,2
2,8
1,5
• Costruire il
diagramma di
dispersione
• Calcolare e
commentare rYZ
• Sulla base dei
risultati ottenuti si
dica se è
ragionevole
adattare una retta
di regressione; in
questo caso quale
sarebbe la
dipendente e quale
sarebbe
l’esplicativa?
Spesa per manifestazioni culturali (Z)
Diagramma di dispersione
450
400
350
300
250
200
150
100
50
0
1
1,5
2
2,5
3
3,5
4
4,5
Reditto mensile del capofamiglia (x 1000 Euro) (Y)
• rxy=0,97; il grafico mostra la forte relazione lineare diretta tra
le 2 variabili. Il reddito mensile è utile per prevedere la spesa
per manifestazioni culturali
Spesa per manifestazioni culturali
(Z)
Diagramma di dispersione con retta
di regressione
500
Z = 134,65Y - 100,24
450
400
350
300
250
200
150
100
50
0
1
1,5
2
2,5
3
3,5
4
Reditto mensile del capofamiglia (x 1000 Euro) (Y)
4,5
Scomposizione di yi
8
y7i
ei
yi  y
Y = vendite
6
ŷ5i
b( xi  x )
4
y3
xi  x
2
1
0
0
10
x
20
xi
X = N. dipendenti
30
4
BONTA’ DI ADATTAMENTO
• Occorre analizzare i residui
ei  ( yi  yˆ i )
DEVIANZA RESIDUA
n
n
i 1
i 1
DEV ( E )   ( yi  yˆ i ) 2   ei2
• L’adattamento è buono quando DEV(E) è
“piccola”
• Problemi:
• DEV(E) cresce all’aumentare del numero di
osservazioni (n)
• DEV(E) dipende dall’unità di misura e
dall’ordine di grandezza di Y
In qualsiasi modello di regressione con o senza
intercetta è valida la relazione che segue
n
y
i 1
2
i
n
n
  yˆ i   ei
i 1
2
2
i 1
•Questa relazione sfrutta la terza proprietà
delle stime dei minimi quadrati (vincolo della
derivata parziale rispetto a b posta uguale a 0)
n
 x (y
i 1
i
i
 yˆ i )  0
Dimostrazione
yi  a  bxi  ei
y i  ( yˆi  ei )
2
yi  yˆ i  ei
2
n
y
i 1
n
y
i 1
n
2
i
n
2
i
  ( yˆ i  ei )
2
i 1
n
n
  yˆ i   ei  2 yˆ i ei
2
i 1
2
i 1
i 1
n
L’ultimo termine è zero dato che  xi ei  0
i 1
n
e
i 1
i
0
Esempio supermercati (continua)
yi=-0,17+0,198xi
A
10
1,9
1,81
0,09
0,89
3.61
3.279
0.008
B
18
3,1
3,40
-0,30
-5,34
9.61
11.536
0.088
C
20
3,2
3,79
-0,59
-11,86
10.24
14.386
0.351
D
8
1,5
1,41
0,09
0,69
2.25
2.000
0.007
E
30
6,2
5,78
0,43
12,75
38.44
33.351
0.181
F
12
2,8
2,21
0,59
7,11
7.84
4.871
0.351
G
14
2,3
2,60
-0,30
-4,25
5.29
6.779
0.092
112
21
21
77.28
76.201
1.079
n
n
i 1
i 1
2
0
n
2
ˆ
 yi   yi   ei
2
0
Xi
×residuoi
i 1
77.28=76.201+1.079
(Valori
teorici)2
residui2
yi
Tot.
Valori Resid
teorici ui
yi2
xi
n
n
n
i 1
i 1
2
2
ˆ
 yi   yi   ei
2
i 1
Indice di bontà di adattamento nei modelli di
regressione senza intercetta
n

 yˆ
i 1
n
y
i 1
n
2
i
 1
2
i
e
i 1
n
i
y
i 1
2
2
i
Varia nell’intervallo [0 1]
BONTA’ DI ADATTAMENTO
• Retta di regressione:
yˆ i  a  bxi
DEVIANZA TOTALE
n
DEV (Y )   ( y i  M y )
2
i 1
DEVIANZA DI
REGRESSIONE
n
DEVIANZA RESIDUA
n
n
i 1
i 1
DEV ( E )   ( yi  yˆ i ) 2   ei2
2
ˆ
ˆ
DEV (Y )   ( yi  M y )
i 1
Scomposizione della devianza di Y
(modelli di regressione con
intercetta)
DEV (Y )  DEV (Yˆ )  DEV ( E )
• Questa relazione sfrutta le Proprietà 1 e
3 delle stime dei minimi quadrati
• Proprietà 1
n
n
 y   yˆ
i 1
i
i 1
n
i
  ei  0
i 1
• Proprietà 3
n
 x (y
i 1
i
i
 yˆ i )  0
Dimostrazione
n
DEV (Y )   ( yi  y ) 2
i 1
n
  ( yi  yˆ i  yˆ i  y ) 2
i 1
n
n
n
i 1
i 1
i 1
2
2
ˆ
ˆ
  ( yi  y )   ( yi  yi )  2 ( yˆ i  y )( yi  yˆ i )
n
 DEV (Yˆ )  DEV ( E )  2 ( yˆ i  y )ei
i 1
n
n
i 1
i 1
 DEV (Yˆ )  DEV ( E )  2 yˆ i ei  2 y  ei
Indice di determinazione lineare
(R2)
DEV (Yˆ )
DEV ( E )

 1
DEV (Y )
DEV (Y )
• =1
se
• =0
se
2
ˆ
(
y

y
)
 i i 0
 ( yˆ i  M y )  0
2
Esempio 7 supermercati (continua)
yˆ1  - 0,17  0,198 *10 Calcolo
xi
yi
A
10
1,9
B
18
3,1
C
20
3,2
D
8
1,5
E
30
6,2
F
12
2,8
G
14
2,3
Tot.
112
21
DevTOT=DevREGR+DevRES
14,28 = 13,201 + 1,079
di R2 (δ)
e i2
ŷ i
( yˆ i  M y )2
1,81 0.008
3,394 0.088
3,79 0.351
1,414 0.007
1,416
0,155
5,77 0.181
2,206 0.351
2,602 0.092


21
1,079

0,624

• DEV(Y) =
7(1,428)2
=14,28
My = 3

13,201
13,201
1,079
 1
 0,924
14,28
14,28
Relazione tra indice di
determinazione δ e coefficiente di
correlazione lineare rxy
• δ = rxy2
• Nell’esempio precedente

13,201
1,079
 1
 0,924
14,28
14,28
 = (0,9615)2 = 0,924
DEV (Yˆ )
rxy   DEV (Y ) 
Relazione tra δ e
n
n

 ( yˆ
i 1
n
i
 y)
 ( yi  y )
2

2
(
a

bx

(
a

b
x
))

i
i 1
n
( y
2
i 1
i 1
i
 y)
2
n

b2  ( xi  x ) 2
i 1
n
2
(
y

y
)
 i
var( X )
b
var( Y )
2
i 1
2
cov( X , Y ) var( X )


2
var( X ) var( Y )
2
cov( X , Y )


var( X ) var( Y )
2
rxy
Esempio 7 supermercati (continua).
Diagnostiche sui residui
Residui
A
10
0,09
B
18
-0,30
C
20
-0,59
D
8
0,09
E
30
0,43
F
12
0,59
G
14
-0,30
Tot.
112
1
Residui
xi
0.5
0
-0.5 0
10
20
30
-1
N. dipendenti
0
• Modello soddisfacente: distribuzione
casuale dei residui → componente erratica
40
ESTRAPOLAZIONE
• Si tenta di valutare in maniera attendibile il
valore che assumerà la variabile dipendente
in corrispondenza di un valore noto della
variabile esplicativa.
• CONDIZIONI
– Validità della retta di regressione ( prossimo ad
1)
– valore noto della variabile esplicativa non lontano
dai valori utilizzati nel calcolo della retta
ESEMPIO (Es. 4.14 Eserciziario)
•Y = contenuto nell’aria di un inquinante (microgrammi
per m3)
•X = numero di imprese manifatturiere con più di 20
addetti
Città
A
Y
13
X
91
B
C
D
E
12
17
56
29
453
254
412
334
F
G
H
35
49
27
428
341
125
Retta di
regressione di Y in
funzione di X
Bontà di
adattamento
Diagramma di
dispersione
Dalle formule (o calcolatrice o
Excel)
• a = 15,31
• b = 0,0474
• Interpretazione
DEV (Y )  1853,5
DEV (Yˆ )  295,2
295,2

 0,159
1853,5
• oppure
rxy  0,339
  (0,339) 2  0,159
Adattamento scadente
Scatter (x,y) con retta di regressione
Contenuto inquinante (Y)
60
50
40
30
20
10
0
0
100
200
300
400
N. imprese manifatturiere (X)
500
600
Esercizio: giocatori titolari d’una squadra di pallavolo:
la seguente tabella riporta il numero di punti segnati in
attacco ed il numero di punti segnati a muro in una
partita.
Giocatore
Punti segnati in attacco
Punti segnati a muro
A
14
4
B
10
3
C
4
1
D
15
1
E
18
2
F
9
5
•Calcolare rxy e commentarlo
•Diagramma di dispersione.
•Si confrontino le informazioni traibili dal diagr. di
dispersione con il valore prima calcolato di rxy. C’è accordo
tra le due analisi? A quale causa possono essere imputate
le differenze riscontrate?
L’INTERPOLAZIONE DI
UNA
SERIE STORICA
ESEMPIO
Anni
t
% di persone il cui pasto principale è il
pranzo
1993
1994
1
2
69,3
69,4
1995
1996
3
4
66,9
65,6
1997
1998
5
6
64,1
63,3
1999
2000
7
8
61,6
59,2
Esempio: Percentuale di persone il cui
pasto principale è il pranzo
75
%
70
65
60
55
0
2
4
6
8
10
t
Obiettivo: stima del trend con una funzione (retta)
Regressione in cui:

• Variabile dipendente: fenomeno di cui si
stima il trend (Y)
• Variabile esplicativa: tempo  successione
convenzionale:
t = 1;
t = 2; …
t=T
Tempi
1
Valori di Y
y1
…
t
…
…
yt
…
T
yT
yˆ t  a  bt
Funzione interpolante lineare:
yˆ t  a  bt
• Stima parametri: metodo dei minimi
quadrati
• Interpretazione parametri
Stima parametri: metodo dei
minimi quadrati
yˆ i  a  bxi
a
yˆ t  a  bt a 

2
yi  xi   xi  xi
2
2
n x i  (  x i )
yi
 yt  t   t  tyt
2
T  t  ( t )
2
2
Stima parametri: metodo dei
minimi quadrati
yˆ i  a  bxi
yˆ t  a  bt
b
n xi yi   xi  yi
n x  ( xi )
2
i
2
T  t  yt   t   yt
b
2
2
T  t  ( t )
Interpretazione parametri
• a = valore teorico del fenomeno per t=0
(tempo precedente al primo
considerato)  l’intercetta ha sempre
un significato operativo
• b = variazione teorica media da un
tempo al successivo
ESEMPIO
Anni
t
% di persone il cui pasto principale è il
pranzo
1993
1994
1
2
69,3
69,4
1995
1996
3
4
66,9
65,6
1997
1998
5
6
64,1
63,3
1999
2000
7
8
61,6
59,2
• a = 71,46
Funzione interpolante:
Interpretazione
b = –1,45
yˆt  71,46  1,45t
Bontà di adattamento:
rxy  0,988
  (0,988)  0,977
2
• Previsione di valori futuri
yˆt  a  bt per t  T  1, T  2, 
• Esempio: % stimata di persone il cui
pasto principale è il pranzo nel 2001 (t=9):
yˆ t  71,46  1,45  9  58,41%
Condizioni per la validità della
proiezione
•  elevato
• Mantenimento nel futuro delle
condizioni che hanno determinato
l’andamento passato  funz.
interpolante lineare: variazioni di
ammontare costante b
Significato della proiezione
• I valori futuri stimati per estrapolazione
dovranno essere correttamente intesi
come valutazioni non di ciò che
accadrà, ma di ciò che dovrebbe
accadere, qualora si manifestassero
anche in futuro le condizioni che hanno
determinato la precedente evoluzione
del fenomeno.
Esempio (Es. 4.24 eserciziario)
• Y = concentrazione di anidride carbonica nell'aria, in
parti per milione, al Polo Sud dal 1981 al 1995:
anni
1981
1983
1985
Y
325
327
329
1987
1989
1991
332
335
338
1993
1995
340
343
• Grafico della serie storica.
• Calcolo dei parametri della
funzione interpolante
lineare
• Bontà di adattamento
• Valore previsto della
concentrazione di anidride
carbonica nel 2005
concentrazione C02 (Y)
Grafico della serie storica.
344
342
340
338
336
334
332
330
328
326
324
1980
1985
1990
anni
1995
2000
Scelta della scala
anni
1981
biennale
annuale
1
1
1983
1985
1987
1989
2
3
3
5
4
7
5
9
1991
1993
1995
6
11
7
13
8
15
Y
325
327
329
332
335
338
340
343
Calcolo dei parametri della funzione
interpolante lineare
• Scala dei tempi biennale  t = 1, 2, 3,
4, 5, 6, 7, 8
yˆ t  321,786  2,631t
• Scala dei tempi annuale  t = 1, 3, 5,
7, 9, 11, 13, 15
yˆ t  323,101  1,3155t
Interpretazione
Relazione tra le due intercette
anni
1981
1983
1985
1987
1989
1991
1993
1995
• Scala biennale  321,786 = valore
teorico al 1979
yˆ t  321,786  2,631t
• Scala annuale  323,101 =
valore teorico al tempo t = 1980
yˆ t  323,101  1,3155t
Relazione tra le due intercette
• 321,786= valore teorico1979= valore
teorico1980- variazione teorica da un anno
al successivo
• variazione teorica da un anno al
successivo = coeff. angolare della
regressione su scala annuale
• 321,786=323,101-1,3155
Bontà di adattamento
• In entrambi i casi:
 = 0,996
 Adattamento quasi perfetto
Previsione al 2005
anni
1981
biennale
annuale
1
1
1983
1985
1987
2
3
3
5
4
7
1989
1991
1993
5
9
6
11
7
13
1995
8
15
…
…
…
2005
13
25
• Scala biennale (t = 13)
yˆ t  321,786  2,631  13  356
• Scala annuale (t = 25)
yˆ t  323,101  1,3155  25  356
Significato e limiti della
previsione
Esercizio: idrocarburi estratti
(in milioni di tonnellate)
n. 13 (integrativi)
Serie storica delle quantità estratte
di idrocarburi dal 1986 al 1998
Anno
1986
Idrocarburi
estratti
15,4
1988
1990
18,3
18,3
1992
18,6
1994
19,8
1996
19,7
1998
19,1
• Adottando un’opportuna
scala dei tempi si
calcolino i parametri della
funzione interpolante
lineare della quantità di
idrocarburi in funzione del
tempo
• Significato e bontà di
adattamento
• Si stimino gli idrocarburi
estratti nel 2004 e si dica
se tale stima può ritenersi
attendibile
Scarica

Document