Corso di Laurea in Statistica Matematica e Trattamento Informatico dei Dati Anno Accademico 2003-2004 Prova Finale “Analisi delle serie storiche e applicazioni” Relatori: Dott. Fabio Rapallo Prof. Mauro Gasparini Correlatore: Dott. Emanuela Sasso Candidato: Daniele Rampoldi Prova Finale Processi Stocastici e Serie Storiche Per Serie Storica o Serie Temporale intendiamo una successione di osservazioni ordinate logicamente secondo una variabile t, che solitamente rappresenta il tempo. Un Processo Stocastico Xt è una famiglia di variabili casuali descritte da un parametro t appartenente ad un insieme T . Prova Finale Processi Stocastici e Serie Storiche Una Serie Storica è una parte finita di una singola realizzazione del processo. Dato un processo X t , esistono infinite possibili realizzazioni, tra le quali noi osserviamo unicamente la successione dei risultati campionari chiamata realizzazione o traiettoria del processo. x1,..., xN , Prova Finale Correlazione e indipendenza Una prima distinzione tra i differenti processi stocastici riguarda l’indipendenza o meno delle variabili casuali che lo compongono. La quasi totalità dei processi normalmente considerati è a componenti correlate, quindi non indipendenti. Una importante eccezione è il processo definito “White Noise” di valor medio nullo e varianza costante a2 , che indicheremo: At ~ WN 0, 2 a Prova Finale Stazionarietà e Autocovarianza Un’altra distinzione può essere fatta considerando il comportamento della famiglia di variabili casuali rispetto alla variabile temporale. Un processo Xt è stazionario in senso stretto se la distribuzione multivariata delle variabili casuali X t ,..., X t non è funzione di t1 ,..., tk , 1 k per ogni k 1 . È stazionario in senso debole se valgono le seguenti condizioni: (1) E X t , t (3) (2) E X t 2 , t 2 E X t X s s t , t , s Prova Finale La funzione di autocorrelazione L’autocovarianza, come covarianza fra X t e X t k misura il segno e la forza del legame lineare esistente fra X t e X t k al variare di k . In analogia con il coefficiente di correlazione si introduce quindi la funzione di autocorrelazione, definita come il coefficiente di correlazione lineare fra le variabili casuali X t e X t k , al variare di k . Cov X t , X t k X t X t k , per k 0,1,2,... Var X t Var X t k k E Prova Finale Prova Finale Processi invertibili e periodici X t è invertibile se esiste una funzione lineare h e un processo WN At tale che, per ogni t, si possa scrivere: Un processo stocastico X t h X t 1 , X t 2 ,... At L’invertibilità è quindi la possibilità di esprimere un processo tramite le variabili casuali del “passato”. Prova Finale Il Teorema di Wold Ogni processo stocastico stazionario X t di valor medio può essere decomposto in due differenti processi stocastici, stazionari e fra loro mutuamente incorrelati, e Vt , detti, rispettivamente, componente non deterministica deterministica Zt Z t e componente Vt , le quali hanno le seguenti rappresentazioni: Vt j cos j t j sin j t j 1 Z t At 1 At 1 2 At 2 ... , con 2j , dove At ~ WN 0, a2 , mentre , sono successioni di variabili casuali tali j j che E j E j 0; Cov j , j 0, per ogni i, j , e j è una successione di numeri reali tali che 0 j , per ogni j . Prova Finale Modelli ARMA – Processo MA Il Teorema di Wold introduce il modello lineare Z t . Per la condizione posta sui j , possiamo considerarli trascurabili da un certo punto in poi. Poniamo quindi: j , per j 1,..., q j 0, per j q 1, q 2,... e consideriamo quindi il processo stocastico Media Mobile di ordine q, denotato Z t ~ MAq , e definito da: Z t At 1 At 1 ... q At q Un processo MAq è sempre stazionario. Prova Finale Modelli ARMA Se è noto Z t si possono calcolare univocamente le autocovarianze. In generale non è vero il contrario. Se consideriamo i processi MAq invertibili, esiste però corrispondenza biunivoca fra parametri del modello e funzione di autocovarianza. Prova Finale Modelli ARMA – Processo AR Un processo Z t ~ MAq ,se invertibile, si può scrivere come: Z t 1Z t 1 ... p Z t p At Tale struttura viene chiamata Auto Regressiva (ovvero su se Z t 1 ,..., Z t p ). stessa ad un perchè Z al tempo t tempo precedente paragonabile ad una regressione della variabile (ovvero Z t ) (AR) Prova Finale Modelli ARMA I modelli AR rispondono al tentativo di spiegare il presente in funzione del passato, fino ad una certa “distanza” p. I modelli MA rispondono al tentativo di spiegare il presente come la risultante di una successione di impulsi casuali, statisticamente riassunti nel WN At . Prova Finale Modelli ARMA Consideriamo quindi il processo stocastico Auto Regressivo di ordine p e Media Mobile q, indicato con Zt ~ ARMA p, q e definito dalla relazione: Z t 1Z t 1 ... p Z t p At 1 At 1 ... q At q . Prova Finale Modelli ARIMA L’introduzione dei modelli ARMA, stazionari ed invertibili, ci permette di individuare il processo a partire dalla serie secondo criteri statisticamente efficienti. I modelli ARIMA nascono dal tentativo di generalizzare i risultati ottenuti sui modelli ARMA. Box e Jenkins proposero una procedura iterativa per la costruzione di un modello ARIMA. Prova Finale Procedura iterativa di Box e Jenkins Analisi Preliminari Passo di data Proc Gplot Identificazione del modello ARIMA Proc Arima Statement Identify Stima dei parametri Verifica del modello stimato Proc Arima Statement Estimate Proc Arima Statement Forecast Utilizzazione del modello Rifiuto Accettazione Prova Finale Produzione mensile di elettricità in Australia Prova Finale Produzione mensile di elettricità in Australia Con trasformazione log ARMA(0,1) stagionale Prova Finale Produzione mensile di elettricità in Australia Prova Finale Produzione mensile di elettricità in Australia Prova Finale Prezzo del petrolio al barile Spot Oil Price: West Texas Intermediate Prova Finale Prezzo del petrolio al barile Con trasformazione log ARMA(0,1) Prova Finale Prezzo del petrolio al barile