RELAZIONI TRA 2 FENOMENI QUANTITATIVI Es: 6 famiglie, ammontare della spesa annua (in euro) per l’acquisto di due generi di largo consumo: latte fresco e biscotti. Famiglia Spesa annua per l’acquisto di latte fresco (€) Spesa annua per l’acquisto di biscotti (€) A 105 65 B 190 130 C 80 160 D 120 90 E 240 220 F 60 50 M(x)= 132.5 M(y)= 119.2 • (i) rxy? (ii) commento (iii) diagramma di dispersione (iv) concordanza tra rxy e diagramma di dispersione (v) Perché rxy invece della retta di regressione? n Soluzione rxy (x M i 1 i x )( yi M y ) n 1/ 2 2 2 ( xi M x ) ( yi M y ) i 1 i 1 n (xi – Mx) (yi – My) (xi-Mx)× (yi-My) (xi-Mx)2 (yi-My)2 (105-132.5) (65-119.2) (105-132.5) (65-119.2) (105-132.5)2 (65-119.2)2 (190-132.5) (130-119.2) (190-132.5) (130-119.2) (190-132.5)2 (130-119.2)2 Fami glia A B C D E 16187.5 rxy 0.73 1/ 2 23787.5 20520.8 F Tot 0 . 0 16187.5 23787.5 20520.8 Diagramma di dispersione Diagramma di dispersione in termini di scostamenti dalla media Analisi del diagramma di dispersione • Il punto C è un valore anomalo bivariato • Se cancelliamo il punto C ci attendiamo che il valore di rxy aumenti • rxy senza il punto C è uguale a 0.963 CORRELAZIONE FRA DUE S.S. • Esempio: X = numero di extracomunitari iscritti al collocamento, Y = numero di discount • Calcolare e commentare rXY tra le variabili originarie, i NI a base fissa, le variazioni percentuali a base fissa, i NI a base mobile, le variazioni percentuali a base mobile Anni X Y 1993 1994 72.644 85.993 600 1.300 1995 1996 1997 96.287 136.942 140.100 1.930 2.328 2.523 CORRELAZIONE FRA DUE S.S. • Esempio: X = numero di extracomunitari iscritti al collocamento, Y = numero di discount • Calcolare e rXY tra le variabili originarie, i NI a base fissa, le variazioni percentuali a base fissa, i NI a base mobile, le variazioni percentuali a base mobile Anni 1993 1994 1995 1996 1997 X Y 72.644 600 85.993 1.300tra i livelli Correlazione spuria relazione 96.287 1.930 136.942 2.328 140.100 2.523 COV ( X , Y ) 17.977.023,36 rxy 0,933 x y (27.300,88 705,42) Numero di discount (Y) Esempio di correlazione spuria 3000 2500 2000 1500 1000 500 0 60.000 •Numero di extracomunitari iscritti al collocamento (X) 110.000 160.000 Numero di discount (Y) Esempio di correlazione spuria •Numero di extracomunitari iscritti al collocamento (X) • Correlazione tra le variazioni annue? Esempio di correlazione spuria • Numero di extracomunitari iscritti al collocamento (X) • Numero di discount (Y) 160000 3000 140000 2500 120000 2000 100000 80000 1500 60000 1000 40000 500 20000 0 1993 1994 1995 1996 1997 0 1993 1994 1995 • Correlazione tra le variazioni annue? 1996 1997 NI base mobile X (numero di extracomunitari) e Y (numero di discount Var % X Var % Y Scost media X Scost media Y Anni n. i. base mobile n. i. base mobile 1993 - - 1994 118,38 216,67 18,38 116,67 -0,34 68,14 1995 111,97 148,46 11,97 48,46 -6,75 -0,07 1996 142,22 120,62 42,22 20,62 23,50 -27,91 1997 102,31 108,38 2,31 8,38 -16,41 -40,16 Media 118,72 148,53 18,72 Var 0,0217 0,1758 0,0217 0,1758 48,53 0,00 0,00 Cov(Nix,NIy)=0,000496 rxy(tra n. i. a base mobile) =-0,000496/(0,0217*0,1758)½ = -0,008 Scatter sugli scostamenti NI base mobile o var. percentuali 80.00% -0.34% 68.14% II 60.00% I 40.00% 20.00% 0.00% -6.75% -0.07% -20.00% 23.50% -27.91% -40.00% -16.41% -40.16% III -60.00% -20.00% -15.00% -10.00% -5.00% IV 0.00% 5.00% 10.00% 15.00% 20.00% 25.00% 30.00% Osservazioni finali • Non esiste relazione lineare tra le variazioni annue di X e Y • Si ottiene rxy = -0,008 anche effettuando il calcolo sulle variazioni % rispetto all’anno precedente (proprietà di invarianza per trasformazioni lineari crescenti) Cenni alle analisi multivariate • p fenomeni quantitativi • Possiamo calcolare il coefficiente di correlazione lineare e/o la covarianza per ogni coppia di fenomeni MATRICE DI COVARIANZA (p.169) • p variabili: X1, X2, X3,…, Xs, …, Xp COV ( X 1 , X 2 ) COV ( X 1 , X P ) VAR ( X 1 ) COV ( X , X ) VAR ( X ) COV ( X , X ) 2 1 2 2 P S p p COV ( X , X ) COV ( X , X ) VAR ( X ) P 1 P 2 P MATRICE DI CORRELAZIONE COV ( X , Y ) rxy VAR ( X ) VAR (Y ) 1 r12 r1 p r 1 r2 p 21 R p p r r 1 p1 p 2 ESEMPIO MATRICE DI COVARIANZA • X = età • Y = anzianità di servizio • Z = stipendio mensile (in euro) X S Y Z X Y 118 73 62 Z 4.218 1.736 276.000 S X Y Z X Y 118 73 62 Z 4.218 1.736 276.000 MATRICE DI CORRELAZIONE 73 rxy 0,8535 118 62 X Y Z X R Y Z 1 0,8535 0,7391 1 0,4197 1 La diapositiva che segue contiene un esercizio da risolvere Es. X= tasso di indebitamento delle famiglie, in percentuale, (X) e del fabbisogno di energia elettrica, in migliaia di megawatt, (Y) in Italia nel periodo 1998– 2002 anni X Y 1998 27,8 279 1999 31,1 286 2000 32,6 299 2001 32,6 305 2002 35,1 311 LA REGRESSIONE LINEARE LA REGRESSIONE LINEARE • • • Esiste una relazione (lineare) tra X e Y? In caso affermativo: Come varia una variabile (dipendente) in funzione dell’altra (esplicativa)? • Per convenzione: Y = variabile dipendente X = variabile esplicativa Esempi • Relazione tra comportamenti di acquisto e caratteristiche dei consumatori • Relazione tra numero di esami sostenuti nei primi due anni di corso e voto alla maturità • Relazione tra prezzo di vendita e quantità venduta di un bene Motivi che spingono ad adottare modelli di regressione lineare • Semplicità facilità di interpretazione dei parametri • yi = a + bxi + ei i = 1, …, n dove: • a + bxi rappresenta una retta: • a = ordinata all’origine intercetta • b = coeff. angolare coeff. di regressione • ei è un termine di errore (accidentale) Motivi che spingono ad adottare modelli di regressione lineare • Effettiva linearità molte relazioni sono molto vicine alla linearità • Trasformazioni la relazione è lineare dopo aver trasformato opportunamente la dipendente e/o l’esplicativa • Es. y = a bx • log y = log a + (log b) x • y’ = a’ + b’ x Motivi che spingono ad adottare modelli di regressione lineare • Limitatezza dell’intervallo Motivi che spingono ad adottare modelli di regressione lineare • Ragioni di teoria statistica: lo studio delle funzioni lineari nei parametri ha una trattazione più agevole Diagramma di dispersione 8 7 Y = vendite 6 5 4 3 2 1 0 0 10 20 30 40 X = N. dipendenti • Come variano le vendite in funzione del numero di dipendenti? MODELLO DI REGRESSIONE • yi = a + bxi + ei i = 1, …, n dove: • a + bxi rappresenta una retta: • a = ordinata all’origine intercetta • b = coeff. angolare coeff. di regressione • ei è un termine di errore (accidentale) RETTA DI REGRESSIONE yˆ i a bxi • i = 1, …, n ŷ i = valore teorico (valore stimato) di yi funzione lineare di i = 1, …, n Residui ei y i yˆ i Fatturato in milioni di € (Y) Come si calcolano i parametri a e b? 7,0 6,0 5,0 4,0 3,0 2,0 1,0 0,0 0 5 10 15 20 N. dipendenti (X) 25 30 35 Come si calcolano i parametri a e b? • METODO DEI MINIMI QUADRATI n n e (y i 1 2 i i 1 yˆ i ) min 2 i Le incognite sono i parametri della retta yˆ i a bxi Visualizzazione grafica dei residui (ei) Come si calcolano i parametri a e b? • METODO DEI MINIMI QUADRATI n n e (y 2 i i 1 n i 1 n e ( y 2 i i 1 i e a i a bxi ) min 2 i 1 n n i 1 yˆ i ) min 2 2 i 0 e i 1 b 2 i 0 Come si calcolano i parametri a e b? • METODO DEI MINIMI QUADRATI n e i 1 2 i a n ( yi a bxi ) 2 i 1 a n 2 ( yi a bxi )( 1) 0 i 1 n e i 1 i 0 Come si calcolano i parametri a e b? • METODO DEI MINIMI QUADRATI n e 2 i i 1 b n ( yi a bxi ) 2 i 1 b n 2 ( yi a bxi )( xi ) 0 i 1 n e x i 1 i i 0 Sistema di equazioni normali n e i 1 i 0 n xe i 1 i i n ( y i i 1 0 n ( y i a bxi ) 0 a bxi )xi 0 i 1 2 equazioni e 2 incognite (a e b) Dalla prima equazione n ( y i 1 i a bxi ) 0 n na ( yi bxi ) i 1 a y bx Sostituendo il valore trovato di a a y b x nella seconda equazione n ( y i a bxi )xi 0 i 1 n [ y i ( y bx ) bxi ]xi 0 i 1 n b ( x x )( y i i 1 i y) n (x x) i 1 i 2 Espressioni alternative per a e b a 2 yi xi xi xi 2 2 n x i ( x i ) yi n x i y i x i y i b 2 2 n x i ( x i ) ESEMPIO (7 supermercati) rxy=0,96 N. dipendenti (X) Fatturato in milioni di € (Y) A B 10 18 1,9 3,1 C D E 20 8 30 3,2 1,5 6,2 F G 12 14 2,8 2,3 Me die 16 3 Calcolo di a e b xi2 yi2 xi yi A 10 1,9 100 3,61 19 B 18 3,1 324 9,61 55,8 C 20 3,2 400 10,24 64 D 8 1,5 E 30 6,2 F 12 2,8 G 14 2,3 Tot. 112 21 2128 77,28 402,6 a 2 yi xi xi xi 2 2 n x i ( x i ) xiyi yi 21 2.128 112 402,6 403,2 a 0,17 2 2.352 7 2.128 112 Calcolo di a e b xi2 yi2 xi yi xiyi A 10 1,9 100 3,61 19 B 18 3,1 324 9,61 55,8 C 20 3,2 400 10,24 64 D 8 1,5 E 30 6,2 F 12 2,8 G 14 2,3 Tot. 112 21 2128 77,28 402,6 n x i y i x i y i b 2 2 n x i ( x i ) 7 402,6 112 21 466,2 b 0,198 2 2.352 7 2.128 112 Fatturato in milioni di € (Y) Scatter con retta di regressione 7,0 6,0 y = 0,198x - 0,17 5,0 4,0 3,0 2,0 1,0 0,0 0 5 10 15 20 N. dipendenti (X) 25 30 35 Interpretazione dei parametri ESEMPIO (7 supermercati) • a = –0,17 fatturato teorico quando N. di dipendenti = 0 • b = 0,198 incremento medio nel fatturato quando il numero di dipendenti aumenta di 1 unità Interpretazione di b • b= indica l’entità della variazione teorica della variabile dipendente in corrispondenza di un incremento unitario della variabile esplicativa Interpretazione di b • a+bx • a+b(x+1) • Qual è la differenza tra i due precedenti valori teorici(prima e dopo l’incremento unitario)? • a+b(x+1)-(a+bx)=b Sistema di equazioni normali n e i 1 i 0 n xe i 1 i i n ( y i i 1 0 n ( y i a bxi ) 0 a bxi )xi 0 i 1 Analizziamo le implicazioni dei due precedenti vincoli Proprietà delle stime dei minimi quadrati • Proprietà 1: n n e ( y i i 1 i i 1 n n n i 1 i 1 i 1 a bxi ) ( yi yˆ i ) 0 yi yˆ i • Proprietà 2 y yˆ (a bx ) • La retta di regressione passa sempre per il punto di coordinate x y Proprietà delle stime dei minimi quadrati • Proprietà 3: n x (y i i 1 n i yˆ i ) xi ei 0 i 1 Calcolo dei valori teorici e dei residui yi=-0,17+0,198xi Valori teorici Resi dui xi ×residuoi xi yi A 10 1,9 -0,17+0,198*10=1,81 0,09 0,89 B 18 3,1 -0,17+0,198*18=3,40 -0,30 -5,34 C 20 3,2 -0,17+0,198*20= 3,79 -0,59 -11,86 D 8 1,5 1,41 0,09 0,69 E 30 6,2 5,78 0,43 12,75 F 12 2,8 2,21 0,59 7,11 G 14 2,3 2,60 -0,30 -4,25 To 112 t. 21 21 n n y yˆ i 1 i i 1 i 0 n e i 1 i 0 0 n xe i 1 i i 0 Regressione in termini di scostamenti Dato che la sommatoria degli scostamenti dalla media è zero 2 y x i i xi xi yi a 2 2 n x i ( x i ) • Si ottiene che a=0 a y bx Modi alternativi di esprimere b • Dato che n x i y i x i y i b n x i2 ( x i ) 2 • Si ricava y COV ( X ,Y ) b r xy VAR ( X ) x ESEMPIO (7 supermercati): r xy 0,961 6,928 y 1,428 x y 1,428 COV ( X ,Y ) b r xy b 0,961 0,198 VAR ( X ) x 6,928 My 3 M x 16 a M y bM x a 3 0,198 16 0,17 Es. n. 5. 7 famiglie A B C D E F G Spesa per manifestazio ni culturali (Z) 200 420 250 70 180 300 100 Reddito mensile del capofamiglia (x 1000 Euro) (Y) 1,9 4,0 2,5 1,6 2,2 2,8 1,5 • Costruire il diagramma di dispersione • Calcolare e commentare rYZ • Sulla base dei risultati ottenuti si dica se è ragionevole adattare una retta di regressione; in questo caso quale sarebbe la dipendente e quale sarebbe l’esplicativa? Spesa per manifestazioni culturali (Z) Diagramma di dispersione 450 400 350 300 250 200 150 100 50 0 1 1,5 2 2,5 3 3,5 4 4,5 Reditto mensile del capofamiglia (x 1000 Euro) (Y) • rxy=0,97; il grafico mostra la forte relazione lineare diretta tra le 2 variabili. Il reddito mensile è utile per prevedere la spesa per manifestazioni culturali Spesa per manifestazioni culturali (Z) Diagramma di dispersione con retta di regressione 500 Z = 134,65Y - 100,24 450 400 350 300 250 200 150 100 50 0 1 1,5 2 2,5 3 3,5 4 Reditto mensile del capofamiglia (x 1000 Euro) (Y) 4,5 Scomposizione di yi 8 y7i ei yi y Y = vendite 6 ŷ5i b( xi x ) 4 y3 xi x 2 1 0 0 10 x 20 xi X = N. dipendenti 30 4 BONTA’ DI ADATTAMENTO • Occorre analizzare i residui ei ( yi yˆ i ) DEVIANZA RESIDUA n n i 1 i 1 DEV ( E ) ( yi yˆ i ) 2 ei2 • L’adattamento è buono quando DEV(E) è “piccola” • Problemi: • DEV(E) cresce all’aumentare del numero di osservazioni (n) • DEV(E) dipende dall’unità di misura e dall’ordine di grandezza di Y In qualsiasi modello di regressione con o senza intercetta è valida la relazione che segue n y i 1 2 i n n yˆ i ei i 1 2 2 i 1 •Questa relazione sfrutta la terza proprietà delle stime dei minimi quadrati (vincolo della derivata parziale rispetto a b posta uguale a 0) n x (y i 1 i i yˆ i ) 0 Dimostrazione yi a bxi ei y i ( yˆi ei ) 2 yi yˆ i ei 2 n y i 1 n y i 1 n 2 i n 2 i ( yˆ i ei ) 2 i 1 n n yˆ i ei 2 yˆ i ei 2 i 1 2 i 1 i 1 n L’ultimo termine è zero dato che xi ei 0 i 1 n e i 1 i 0 Esempio supermercati (continua) yi=-0,17+0,198xi A 10 1,9 1,81 0,09 0,89 3.61 3.279 0.008 B 18 3,1 3,40 -0,30 -5,34 9.61 11.536 0.088 C 20 3,2 3,79 -0,59 -11,86 10.24 14.386 0.351 D 8 1,5 1,41 0,09 0,69 2.25 2.000 0.007 E 30 6,2 5,78 0,43 12,75 38.44 33.351 0.181 F 12 2,8 2,21 0,59 7,11 7.84 4.871 0.351 G 14 2,3 2,60 -0,30 -4,25 5.29 6.779 0.092 112 21 21 77.28 76.201 1.079 n n i 1 i 1 2 0 n 2 ˆ yi yi ei 2 0 Xi ×residuoi i 1 77.28=76.201+1.079 (Valori teorici)2 residui2 yi Tot. Valori Resid teorici ui yi2 xi n n n i 1 i 1 2 2 ˆ yi yi ei 2 i 1 Indice di bontà di adattamento nei modelli di regressione senza intercetta n yˆ i 1 n y i 1 n 2 i 1 2 i e i 1 n i y i 1 2 2 i Varia nell’intervallo [0 1] BONTA’ DI ADATTAMENTO • Retta di regressione: yˆ i a bxi DEVIANZA TOTALE n DEV (Y ) ( y i M y ) 2 i 1 DEVIANZA DI REGRESSIONE n DEVIANZA RESIDUA n n i 1 i 1 DEV ( E ) ( yi yˆ i ) 2 ei2 2 ˆ ˆ DEV (Y ) ( yi M y ) i 1 Scomposizione della devianza di Y (modelli di regressione con intercetta) DEV (Y ) DEV (Yˆ ) DEV ( E ) • Questa relazione sfrutta le Proprietà 1 e 3 delle stime dei minimi quadrati • Proprietà 1 n n y yˆ i 1 i i 1 n i ei 0 i 1 • Proprietà 3 n x (y i 1 i i yˆ i ) 0 Dimostrazione n DEV (Y ) ( yi y ) 2 i 1 n ( yi yˆ i yˆ i y ) 2 i 1 n n n i 1 i 1 i 1 2 2 ˆ ˆ ( yi y ) ( yi yi ) 2 ( yˆ i y )( yi yˆ i ) n DEV (Yˆ ) DEV ( E ) 2 ( yˆ i y )ei i 1 n n i 1 i 1 DEV (Yˆ ) DEV ( E ) 2 yˆ i ei 2 y ei Indice di determinazione lineare (R2) DEV (Yˆ ) DEV ( E ) 1 DEV (Y ) DEV (Y ) • =1 se • =0 se 2 ˆ ( y y ) i i 0 ( yˆ i M y ) 0 2 Esempio 7 supermercati (continua) yˆ1 - 0,17 0,198 *10 Calcolo xi yi A 10 1,9 B 18 3,1 C 20 3,2 D 8 1,5 E 30 6,2 F 12 2,8 G 14 2,3 Tot. 112 21 DevTOT=DevREGR+DevRES 14,28 = 13,201 + 1,079 di R2 (δ) e i2 ŷ i ( yˆ i M y )2 1,81 0.008 3,394 0.088 3,79 0.351 1,414 0.007 1,416 0,155 5,77 0.181 2,206 0.351 2,602 0.092 21 1,079 0,624 • DEV(Y) = 7(1,428)2 =14,28 My = 3 13,201 13,201 1,079 1 0,924 14,28 14,28 Relazione tra indice di determinazione δ e coefficiente di correlazione lineare rxy • δ = rxy2 • Nell’esempio precedente 13,201 1,079 1 0,924 14,28 14,28 = (0,9615)2 = 0,924 DEV (Yˆ ) rxy DEV (Y ) Relazione tra δ e n n ( yˆ i 1 n i y) ( yi y ) 2 2 ( a bx ( a b x )) i i 1 n ( y 2 i 1 i 1 i y) 2 n b2 ( xi x ) 2 i 1 n 2 ( y y ) i var( X ) b var( Y ) 2 i 1 2 cov( X , Y ) var( X ) 2 var( X ) var( Y ) 2 cov( X , Y ) var( X ) var( Y ) 2 rxy Esempio 7 supermercati (continua). Diagnostiche sui residui Residui A 10 0,09 B 18 -0,30 C 20 -0,59 D 8 0,09 E 30 0,43 F 12 0,59 G 14 -0,30 Tot. 112 1 Residui xi 0.5 0 -0.5 0 10 20 30 -1 N. dipendenti 0 • Modello soddisfacente: distribuzione casuale dei residui → componente erratica 40 ESTRAPOLAZIONE • Si tenta di valutare in maniera attendibile il valore che assumerà la variabile dipendente in corrispondenza di un valore noto della variabile esplicativa. • CONDIZIONI – Validità della retta di regressione ( prossimo ad 1) – valore noto della variabile esplicativa non lontano dai valori utilizzati nel calcolo della retta ESEMPIO (Es. 4.14 Eserciziario) •Y = contenuto nell’aria di un inquinante (microgrammi per m3) •X = numero di imprese manifatturiere con più di 20 addetti Città A Y 13 X 91 B C D E 12 17 56 29 453 254 412 334 F G H 35 49 27 428 341 125 Retta di regressione di Y in funzione di X Bontà di adattamento Diagramma di dispersione Dalle formule (o calcolatrice o Excel) • a = 15,31 • b = 0,0474 • Interpretazione DEV (Y ) 1853,5 DEV (Yˆ ) 295,2 295,2 0,159 1853,5 • oppure rxy 0,339 (0,339) 2 0,159 Adattamento scadente Scatter (x,y) con retta di regressione Contenuto inquinante (Y) 60 50 40 30 20 10 0 0 100 200 300 400 N. imprese manifatturiere (X) 500 600 Esercizio: giocatori titolari d’una squadra di pallavolo: la seguente tabella riporta il numero di punti segnati in attacco ed il numero di punti segnati a muro in una partita. Giocatore Punti segnati in attacco Punti segnati a muro A 14 4 B 10 3 C 4 1 D 15 1 E 18 2 F 9 5 •Calcolare rxy e commentarlo •Diagramma di dispersione. •Si confrontino le informazioni traibili dal diagr. di dispersione con il valore prima calcolato di rxy. C’è accordo tra le due analisi? A quale causa possono essere imputate le differenze riscontrate? L’INTERPOLAZIONE DI UNA SERIE STORICA ESEMPIO Anni t % di persone il cui pasto principale è il pranzo 1993 1994 1 2 69,3 69,4 1995 1996 3 4 66,9 65,6 1997 1998 5 6 64,1 63,3 1999 2000 7 8 61,6 59,2 Esempio: Percentuale di persone il cui pasto principale è il pranzo 75 % 70 65 60 55 0 2 4 6 8 10 t Obiettivo: stima del trend con una funzione (retta) Regressione in cui: • Variabile dipendente: fenomeno di cui si stima il trend (Y) • Variabile esplicativa: tempo successione convenzionale: t = 1; t = 2; … t=T Tempi 1 Valori di Y y1 … t … … yt … T yT yˆ t a bt Funzione interpolante lineare: yˆ t a bt • Stima parametri: metodo dei minimi quadrati • Interpretazione parametri Stima parametri: metodo dei minimi quadrati yˆ i a bxi a yˆ t a bt a 2 yi xi xi xi 2 2 n x i ( x i ) yi yt t t tyt 2 T t ( t ) 2 2 Stima parametri: metodo dei minimi quadrati yˆ i a bxi yˆ t a bt b n xi yi xi yi n x ( xi ) 2 i 2 T t yt t yt b 2 2 T t ( t ) Interpretazione parametri • a = valore teorico del fenomeno per t=0 (tempo precedente al primo considerato) l’intercetta ha sempre un significato operativo • b = variazione teorica media da un tempo al successivo ESEMPIO Anni t % di persone il cui pasto principale è il pranzo 1993 1994 1 2 69,3 69,4 1995 1996 3 4 66,9 65,6 1997 1998 5 6 64,1 63,3 1999 2000 7 8 61,6 59,2 • a = 71,46 Funzione interpolante: Interpretazione b = –1,45 yˆt 71,46 1,45t Bontà di adattamento: rxy 0,988 (0,988) 0,977 2 • Previsione di valori futuri yˆt a bt per t T 1, T 2, • Esempio: % stimata di persone il cui pasto principale è il pranzo nel 2001 (t=9): yˆ t 71,46 1,45 9 58,41% Condizioni per la validità della proiezione • elevato • Mantenimento nel futuro delle condizioni che hanno determinato l’andamento passato funz. interpolante lineare: variazioni di ammontare costante b Significato della proiezione • I valori futuri stimati per estrapolazione dovranno essere correttamente intesi come valutazioni non di ciò che accadrà, ma di ciò che dovrebbe accadere, qualora si manifestassero anche in futuro le condizioni che hanno determinato la precedente evoluzione del fenomeno. Esempio (Es. 4.24 eserciziario) • Y = concentrazione di anidride carbonica nell'aria, in parti per milione, al Polo Sud dal 1981 al 1995: anni 1981 1983 1985 Y 325 327 329 1987 1989 1991 332 335 338 1993 1995 340 343 • Grafico della serie storica. • Calcolo dei parametri della funzione interpolante lineare • Bontà di adattamento • Valore previsto della concentrazione di anidride carbonica nel 2005 concentrazione C02 (Y) Grafico della serie storica. 344 342 340 338 336 334 332 330 328 326 324 1980 1985 1990 anni 1995 2000 Scelta della scala anni 1981 biennale annuale 1 1 1983 1985 1987 1989 2 3 3 5 4 7 5 9 1991 1993 1995 6 11 7 13 8 15 Y 325 327 329 332 335 338 340 343 Calcolo dei parametri della funzione interpolante lineare • Scala dei tempi biennale t = 1, 2, 3, 4, 5, 6, 7, 8 yˆ t 321,786 2,631t • Scala dei tempi annuale t = 1, 3, 5, 7, 9, 11, 13, 15 yˆ t 323,101 1,3155t Interpretazione Relazione tra le due intercette anni 1981 1983 1985 1987 1989 1991 1993 1995 • Scala biennale 321,786 = valore teorico al 1979 yˆ t 321,786 2,631t • Scala annuale 323,101 = valore teorico al tempo t = 1980 yˆ t 323,101 1,3155t Relazione tra le due intercette • 321,786= valore teorico1979= valore teorico1980- variazione teorica da un anno al successivo • variazione teorica da un anno al successivo = coeff. angolare della regressione su scala annuale • 321,786=323,101-1,3155 Bontà di adattamento • In entrambi i casi: = 0,996 Adattamento quasi perfetto Previsione al 2005 anni 1981 biennale annuale 1 1 1983 1985 1987 2 3 3 5 4 7 1989 1991 1993 5 9 6 11 7 13 1995 8 15 … … … 2005 13 25 • Scala biennale (t = 13) yˆ t 321,786 2,631 13 356 • Scala annuale (t = 25) yˆ t 323,101 1,3155 25 356 Significato e limiti della previsione Esercizio: idrocarburi estratti (in milioni di tonnellate) n. 13 (integrativi) Serie storica delle quantità estratte di idrocarburi dal 1986 al 1998 Anno 1986 Idrocarburi estratti 15,4 1988 1990 18,3 18,3 1992 18,6 1994 19,8 1996 19,7 1998 19,1 • Adottando un’opportuna scala dei tempi si calcolino i parametri della funzione interpolante lineare della quantità di idrocarburi in funzione del tempo • Significato e bontà di adattamento • Si stimino gli idrocarburi estratti nel 2004 e si dica se tale stima può ritenersi attendibile