STATISTICA ECONOMICA A.A. 2012/2013 APPUNTI DELLE LEZIONI PROF. UFFICIALE DEL CORSO: ANTONIO GAMBINI. PROFESSORI: ENRICO DI BELLA & LUCA PERSICO 1 LEZIONE 1 18/09/2012 INTRODUZIONE AL CORSO Statistica economica. C‟è qualcuno di statistica del turismo? Ci siamo già visti ieri, alcune cose quelli di turismo le sentiranno una seconda volta. Voi di statistica economica crederete di avere infiltrati di statistica del turismo, invece è il contrario. Statistica economica è parzialmente contenuta in statistica del turismo. In quest‟aula siete studenti di due corsi: statistica economica e statistica del turismo, per il turismo, non ricordo la dizione corretta. Il fatto è questo: statistica economica è un corso che esiste da tanti anni, è l‟ultimo anno che esiste così com‟è, in futuro si chiamerà statistica economica e sociale. Il corso che vedrete quest‟anno è un corso in evoluzione, se non siete intenzionati a darlo venite a parlarci. Il corso di statistica del turismo esiste una sola volta a Genova. Inizia e finisce quest‟anno. Il corso di statistica del turismo era da 9 crediti. Gli studenti da 9 crediti hanno anche l‟incontro di lunedì, con voi solamente il martedì e il giovedì. Il corso di statistica economica è formalmente contenuto all‟interno di statistica del turismo. Il corso di statistica economica è un corso da 6 crediti, 48 ore di lezione frontale. È un corso che va a focalizzare l‟attenzione su quella parte di statistica che si occupa della misurazione degli aggregati economici o delle grandezze economiche. Questa è la declaratoria del corso: “Il corso di statistica economica ha l‟obiettivo di indirizzare gli studenti verso la comprensione, la conoscenza non superficiale dei comportamenti e dei soggetti economici. Ricorrendo alla definizione e misurazione degli aggregati economici e tracciando i metodi analitici sulla base di applicazioni concrete, fornisce le basi per l‟analisi uni variata e multivariata dei dati economici. Vengono inoltre approfonditi i concetti di inferenza statistica introdotti durante il corso propedeutico di Statistica 1 e vengono introdotte le tecniche di base del campionamento statistico”. Di che cosa parleremo? Anzitutto immaginate già che il corso si chiami statistica economico e sociale. Studia aspetti relativi alla misurazione di fenomeni economici e sociali: la ricchezza di un paese misurata attraverso il PIL, la produzione industriale, la disoccupazione, gli indici dei prezzi al consumo, alla produzione. Quali sono gli enti ufficiali produttori di dati e statistiche, dove voi potete trovare i dati relativi alle grandezze dell‟Italia e di un paese. La statistica economica e la statistica sociale studiano l‟analisi di fenomeni macroeconomici. È una statistica che ha l‟obiettivo di aiutare il decisore pubblico, o comunque anche il cittadino, a capire quale sia la condizione economico e socio economica del paese. 2 È diversa da statistica 1, anche se ci sono strumenti che noi andremo ad utilizzare che sono stati introdotti nel corso propedeutico di statistica 1. Il percorso che ci attende è questo: - Fonti statistiche ufficiali. Sono quelle fonti di informazioni di dati che ufficialmente vengono utilizzate per conoscere la dimensione dei fenomeni economici e sociali. Che differenza c‟è tra dati prodotti dall‟Istat o dati prodotti dalla Caritas e università? Sono uguali oppure no? C‟è una certificazione col quale il dato è stato raccolto e pubblicato o no? Questi gli aspetti principali che riguardano le fonti statistiche ufficiali. Ci focalizzeremo poi su Istat ed Eurostat. L’Istat è l‟Istituto nazionale di Statistica, principale fonte di dati statistici ufficiali, certificati secondo una serie di criteri e di logiche. L‟Eurostat è un ufficio statistico che di per sé non produce dati (ne parleremo non così diffusamente come vorrei ma abbastanza), Ufficio statistico CE ha un ruolo di coordinamento sulla produzione di statistiche di paesi Europei (paesi dell‟UE) o candidati (anche Turchia). L‟Eurostat non è un produttore di dati ma è un coordinatore di modalità di raccolta dati. Esempio, entriamo sulla tipologia di dati. Come possiamo definire un disoccupato? Una persona che non ha lavoro. Non è vero, ci sono persone che non hanno lavoro perché non sono interessate al momento ad andare al lavoro. Alcuni di voi lavoreranno altri no, preferiscono studiare a tempo pieno. Chi studia a tempo pieno non è un disoccupato, ha scelto di non avere. È disoccupata una persona che non si trova bene nel suo posto o ha ricevuto molestie? No. È una persona che sta cambiando lavoro È possibile aprire una finestra temporale tra la fine del primo contratto lavorativo e l‟inizio del secondo oltre la quale definisco la persona disoccupata o meno. Se l‟Italia va a definire i disoccupati come le persone che non hanno attività lavorativa e vorrebbero averla, e questa attività lavorativa non l‟hanno trovata negli ultimi 6 mesi, un altro paese, la Finlandia, definisse 9 mesi, non avremmo la possibilità di confrontare i dati. Si aprono problemi e questioni di comparabilità dei dati, necessario risolverle. L‟ente preposto è l‟Eurostat. È quell‟ente che stabilisce con quali criteri i dati vadano raccolti e in che modo vadano definiti i vari fenomeni. Non è un ente dittatoriale che impone dall‟alto le scelte. C‟è un collegio, che include l‟Istat ed altri enti, che stabilisce quali siano questi problemi. - Dopo aver affrontato i primi temi riguardo le fonti statistiche ufficiali, e avere iniziato a guardare alcuni dei principali aggregati, andremo a vedere che sorge necessario, per la pubblica amministrazione, per il governo ed enti locali, utilizzare indici ed indicatori, delle misure di sintesi che permettano di capire questi grossi aggregati di dati. Io posso darvi il numero dei disoccupati in Italia, ma spesso si preferisce lavorare col tasso di disoccupazione. Il tasso, può essere definito come un indicatore, (vedremo la differenza tra indici ed indicatori) che sintetizza la direzione, si dice indicatore anche perché indica una direzione, un verso verso il quale si tende nell‟evoluzoine dei fenomeni. In 3 - - particolare andremo a guardare: indici di prezzi e produzioni. Ne vedremo anche altri molto brevemente. A me interessa che per voi sia chiara la logica nella costruzione di indici. Si potrebbe parlare di indici e indicatori per dieci corsi da nove crediti! Si tratta di vedere come sono costruiti, cosa c‟è dentro e interpretazione. Ma sarebbe qualcosa di estremamente meccanico. Successivamente focalizziamo l‟attenzione sull‟evoluzione storica dei fenomeni economici. Non faremo storia economica. Guarderemo le principali metodologie statistiche per analizzare il comportamento dei fenomeni economici nel tempo. Qualcosa avete già visto in statistica 1, guardando l‟andamento delle vendite nel tempo. Parleremo di serie storica, fenomeni che vengono misurati nel tempo. Una serie storica, è una misurazione ripetuta nel tempo ad intervalli regolari (ogni anno, trimestre, mese, settimana, ora, secondo e millesecondo) di un certo fenomeno. Possiamo vedere la produzione industriale mensile, trimestrale, quadrimestrale, semestrale, annuale. La serie storica fa riferimento ad un medesimo fenomeno definito nello stesso modo, sennò si perde la confrontabilità, ad istanti regolari. Serie annuale sempre annuale, semestrale sempre dati semestrali. All‟interno di questo insieme parleremo di trend (tendenza generale di un fenomeno nel tempo) o cicli e stagionalità. Un ciclo economico è un andamento della serie storica, che alterna fasi espansive e restrittive senza avere una particolare regolarità. Periodi di grossa crescita economica. Ora siamo in fase di recessione, poi costrizione del fenomeno, PIL che si usa per misurare la ricchezza nel paese che va a ridursi, per poi crescere nuovamente. Questo è un ciclo. Si differenzia dalla stagionalità, perché è legata ad una ciclicità precisa. La successione delle stagioni è qualcosa che si compie ogni anno. C‟è una periodicità, più corretto, che si propone con regolarità: d‟estate la produzione industriale cala perché le fabbriche chiudono, o a Natale le vendite aumentano perché ci sono le festività. Di inverno la produzione agricola diminuisce nell‟emisfero boreale e aumenta nell‟australe. Si parla di stagionalità e non di ciclicità per questa ragione. Questo perché la stagionalità è legata a componenti cicliche. La stagionalità sarà necessario eliminarla, è una componente di disturbo, parleremo di metodi di destagionalizzazione, eliminazione della componente stagionale periodica. I metodi più utilizzati per analizzare le serie storiche sono: i metodi delle medie mobili, i processi stocastici e i modelli lineari, parleremo di retta o parabola di regressione, trend lineari o trend parabolico, e la procedura di Box e Jekins, dedicheremo a quella parte un bel po‟ di lezioni. Successivamente altre metodologie statistiche. In particolare l‟analisi statistica multivariata. In statistica 1 avete visto la descrittiva mono dimensionale, bi dimensionale e il piano di regressione. Quello che si studia nella statistica multivariata è la relazione tra tante variabili allo stesso tempo. Non si studia tanto la dipendenza di un fenomeno tra gli altri, quanto piuttosto la correlazione che esiste tra vari fenomeni. La produzione industriale dipende dal 4 - PIL? I consumi dipendono dalla ricchezza o è la ricchezza che determina i consumi? Ci sono situazioni in cui le triangolazioni tra variabili dipendenti e indipendenti sono tutt‟altro che chiare. Negli esercizi che vi davamo a statistica 1, la variabile dipendente si distingueva bene dalla variabile indipendente. Il peso in dipendenza della statura. Tendenzialmente le persone più alte sono anche più pesanti. È vero che esiste una correlazione, e qui forse si potrebbe pensare che il peso è in funzione della statura, ma quando un ragazzo cresce aumenta anche il suo peso, è la crescita che determina l‟incremento di peso, non è che una persona ingrassando aumenti anche di statura. È evidente la variabile dipendente dalla variabile indipendente In questi casi non è sempre ovvio. Adesso sarebbe opportuno svolgere questa parte in aula informatica. Riuscire a fare applicazioni di analisi multi variata sulla carta è impossibile. Allo stesso modo vedere la metodologia senza fare applicazioni pratiche è come leggere il regolamento del calcio e pensare di essere bravi come Ronaldo. Forse organizziamo due gruppi, due classi, vedremo. Questa parte dovrebbe essere svolta, dobbiamo ancora decidere come coordinarci, da Luca Persico. Il corso ufficialmente è del professor Gambini che in questo momento non sta bene e ci ha chiesto se riusciamo ad aiutarlo. Già che ci mettiamo mano è meglio che abbiano interlocutori unici, me e Persico. In linea di principio io sarò in aula lunedì con turismo, martedì con tutti, giovedì ci sarà Persico. Il Giovedì e Venerdì io sarò a Bolzano perché ho un corso su, non mi troverete mai di giovedì e venerdì. Il mio ricevimento è il martedì alle 16.30. Alla fine di questa lezione, se avete bisogno, venite. Riprendendo il discorso sui dati e fonti statistiche ufficiali, ad eccezione di questa settimana e della prossima ci sono io. Quando parleremo di fonti statistiche ufficiali dell‟Istat ed Eurostat parleremo delle modalità attraverso le quali questi enti producono dati. La produzione di dati ufficiali può avvenire in due forme: o attraverso una attività censuaria (l‟anno scorso c‟è stato il 15 censimento popolazione e abitazioni) o attraverso indagini campionarie. Anziché intervistare tutti gli italiani intervisto un sottoinsieme di italiani campionato secondo certi criteri. Campionamento su uso del tempo, c‟è una indagine dell‟Istat che si chiama uso del tempo, come gli italiani passano il tempo, e andassi a prendere i 14enni romani probabilmente si penserebbe che gli italiani starassero solo davanti alla Play Station a giocare a Fifa o poco altro. È opportuno che un campione sia costruito in maniera tale da essere una immagine della popolazione. Se in Italia abbiamo 55% di donne, il campione dovrebbe contenere 55% di donne e, l‟altra parte, un 45% di uomini. Se la popolazione si ripartisce tra Nord Centro Sud con numerosità differenti, un po‟ le prendo nel nord, centro e sud Italia. Se la popolazione vive un po‟ in città e un po‟ al di fuori dei centri urbani è opportuno che la proporzione all‟interno delle unità campionate tra persone in città e fuori sia rispettata. Questa è una logica di 5 campionamento stratificato. In questa parte del corso, penso sia discussa da Persico, vedrete le principali metodologie di campionamento. Il campionamento richiede una componente inferenziale. Nel momento in cui non ho la intera popolazione ma un sottoinsieme di essa, siamo soggetti ad una forma di variabilità, detta variabilità campionaria. Posso prendere una qualsiasi tra le file dei banchi e vedere se siete bravi studenti. Vi faccio test di statistica 1 e guardo il risultato che ottengo. Posso seguire due strade. Do test a tutti voi, faccio censimento, o solo ad una fila tra queste. Se lo dessi solo alla prima o alla seconda otterrei risultati comunque differenti, magari simili, ma è difficile che le risposte siano identiche. Il fatto di rilevare un‟informazione su campioni anziché su popolazione, determina una componente detta variabilità campionaria. Ogni campione fornirà risultati differenti. Se facessi il test su di voi più volte dovrei ottenere sempre lo stesso risultato. Stessa statura mille volte? Otterrei gli stessi risultati. Se prendessi 1000 campioni diversi? Tutte le unità sui campioni sono diverse, le stature diverse. Entra in gioco la variabilità campionaria, che è l‟ oggetto di inferenza statistica. Tutti voi avete visto un minimo di inferenza statistica a statistica 1. Qualche cosa avreste dovuto vederla. Riprendiamo i pochi punti visti e li portiamo avanti, non di tantissimo. Il posto più opportuno per sviluppare quegli argomenti è il corso di statistica 2 che ormai nella triennale non esiste più, è nel corso EIF primo anno per chi di voi continuerà. Il corso di Statistica 2 verrà tenuto dal professor Lagazio, nuova acquisizione della nostra facoltà, persona assolutamente in gamba. Il programma in linea di massima è questo, di carne al fuoco ce n‟è. Libri di testo. Ho fatto richiesta per la pagina di Aulaweb, colpa mia che l‟ho chiesta tardi, a breve sarà disponibile. Su aula web troverete molto materiale, devo organizzarlo, sistematizzarlo, e decidere con che ordine presentarvi gli argomenti. Ho già un buon 60-70% di materiale che è studiabile sulle slides in Power Point. Per la parte prima del programma, cioè fonti statistiche ufficiali, Istat ed Eurostat, farete riferimento in maniera pressoché esclusiva al materiale su aula web, non esiste libro di testo su queste cose. Sul punto 2, serie storiche economiche, troverete slides su aula web, più che sufficienti per la preparazione, ma comunque suggerisco un testo, prevalentemente a coloro che non seguiranno il corso o tutte le lezioni. È questo, Di Fonzo T. e Lisi F Serie storiche economiche. Analisi statistiche e Applicazioni, Carocci editore . Sarebbero da studiare 1-2-3-5-6-9. L‟acquisto non è così fondamentale. Ci sono tanti libri suggeriti, vi suggerisco io quelli da acquistare. Costa 20 euro, non è una cifra folle, se siete abituati coi libri di diritto, siamo su livelli più bassi, per quanto riguarda la parte relativa alla statistica multivariata, ci saranno sicuramente slide sulle quali sta lavorando il professor Persico, non so se e quante verranno caricate su aula web. A livello di libro suggeriamo questo, libretto qua, Di Bella E. Persico L. costa sei euro, è una sostituzione della parte terza del libro di statistica descrittiva che avete già acquistato per statistica 1. È una sostituzione abbastanza significativa perché, dei 6 6 capitoli è stato aggiunto un capitolo complessivamente, totalmente, che non c‟era prima, l‟ultimo, e riscritti: l‟analisi fattoriale e dei cluster, recuperiamolo. La parte di inferenza statistica, potete studiarla tranquillamente su questo libro che dovete già avere. C‟era un capitolo guardato in maniera superficiale in statistica 1, il capitolo 8, l‟Inferenza Statistica. Non lo andrete ad esaurire. In statistica 2 studierete anche il capitolo 9. Suggerirei di non venderlo sino al superamento di statistica 2 e anche oltre, per econometria potrebbe essere utile. L‟ultimo libro, utilizzato per la parte relativa al campionamento statistico, è “Il campionamento statistico per la ricerca sociale e di mercato”, non costa tanto, sono 15 euro. È di Gambini: da studiare i capitoli 2-3-4. Non l‟uno perché è sostanzialmente un riassunto del capitolo 8 del libro verde. Potete usarlo come ripasso, ma meglio il capitolo 8. Ricordo, nessun acquisto è obbligatorio. Sembra che, solo perché il fatto che siano nostri vi suggeriamo di acquistarli, ma solo per via dei contenuti, abbiamo meglio da fare che scrivere su quella roba li. Visto che è ancora bello io andrei ancora al mare anziché scrivere quella roba li. Ultima cosa. Esercizi. Si aprirà un problema di esercizi risolti sul campionamento. Li potete trovare sulla parte terza del libro degli esercizi disponibili in PDF da acquistare sul sito della Giappichelli. Abbiamo trovato un accordo. Compro il file in PDF e costa 4-5 euro, una cifra molto modesta. Gambini ha sempre insistito sul cercare di ridurre il più possibile il costo dei libri rinunciando ai diritti d‟autore e tutto il resto. I libri di statistica non vi saranno mai risultati particolarmente costosi, anche se si tratta sempre di soldi. Ancora qualcosa. Propedeuticità. La nostra direzione, anche per il futuro, è quella di eliminare la propedeuticità di statistica 1 con statistica economica. Conseguentemente se non avete dato statistica 1 non potete registrare statistica economica. Dato che una buona parte non richiede prerequisiti di statistica 1, potete venire a dare l‟esame. Vi facciamo un foglietto, siete pochi rispetto ai numeri di statistica 1, e quindi vi possiamo gestire bene anche con foglietti, annotazioni eccetera. Non fatevi problemi. Venite però segnalatecelo. Vi segniamo il voto e ve lo registriamo dopo che avete passato statistica 1. Questo non lo facciamo per statistica 1 rispetto a matematica generale, sennò ci sarebbero maree di foglietti e la propedeuticità è abbastanza forte. Il corso si concluderà nella prima decina di dicembre. Voi sapete che adesso i corsi di sei crediti fanno 4 ore a settimana anziché farne 6 e finire prima. ho concordato con Persico di fare un pre appello attorno al 20 dicembre, al giovedì e dovremmo avere anche un‟aula. Vedremo, visto che siete in così tanti, se c‟è qualche altra aula disponibile. Il preappello preclude la possibilità di dare il primo appello. Chi da il preappello non può fare il primo appello. In linea di massima se voi date il preappello il 20 non penserete che io col panettone in mano mi metta a correggere i vostri compiti. I risultati o tra natale e capodanno o dopo, verosimilmente a ridosso del primo appello. 7 Non avreste tempo di decidere s ridarlo o no, vi potete ovviamente ritirare. Solamente chi consegna non può dare il primo appello. L‟obiettivo del corso è sterminarvi entro gennaio. Avere qualche coda entro l‟anno, ma in linea di massima di esaurirla. Rimane qualcuno che lavorava, non è riuscito a studiare, eccetera. Mi aspetto che lo passiate non dico alla prima. Non pensate che sia così selettivo come statistica 1. L‟esame. Come funziona l‟esame? Ci saranno due esercizi e due domande teoriche. I due esercizi uno sulla mia parte relativa alle serie storiche e uno su inferenza/campionamento di Persico. Domande teoriche saranno una sulla mia parte, se andate su AW scorso anno trovate la lista di possibili domande teoriche, di argomenti, magari qualche piccolo cambiamento ci può anche essere , sulla mia parte e sulla parte di Persico inclusa anche la analisi multivariata, soggetta solamente a domande di tipo teorico. Esercizi solamente su serie storiche e campionamento/inferenza. Il resto domande con risposta aperta. Non è previsto orale a meno che non mi chiediate di individuare una parte di programma specificamente per la parte orale, però diventano belle parti da sapere. L‟orale ha l‟obiettivo di migliorare uno due punti i voti dello scritto, non di più, l‟esame è già ampio. Potrebbero essere domande orali su multi variata o campionamento, domande su argomenti abbastanza elitari, di qualità. Se volete fare giuste proporzioni, è come se parassimo di variabili aleatorie continue (uniforme rettangolare) e non gli assiomi di Kolmogorov. Non ci sono domande relative al programma di statistica 1. Nel giro di un anno vorrei che i risultati venissero registrati. Non esiste il rifiuto nella speranza di migliorare. Se prendo 18 e rifiuto, rifiuto. Per oggi basta così, abbiamo parlato delle cose principali. La prossima volta iniziamo con le fonti statistiche ufficiali. Non c‟è ancora aula web comunque poi le metterò. 8 LEZIONE 2 20/09/2012 LE FONTI STATISTICHE UFFICIALI: INTRODUZIONE Martedì prox NO lezione. Cominciamo a parlare di questa statistica un po‟ particolare, è una statistica che si ricollega maggiormente alla parola statistica. Se pensate la parola statistica contiene all‟interno la parola stato. C‟è chi ritiene che non sia la parola stato contenuta in statistica, ma sia la parola stat (tedesco) che vuol dire città. C‟è anche chi pensa che l‟origine della parola statistica sia legata a stadera, parola latina per bilancia. In ogni caso la parola statistica fa riferimento alle dimensioni di uno stato, di una città. La statistica vista in statistica 1 è una statistica di sintesi. Che legame c‟è tra la statistica di statistica 1 e quella che vediamo ora? Sono molto collegate. La statistica è la scienza che misura le grandezze. La statistica ufficiale misura le grandezze degli stati. Misura i principali fenomeni che descrivono la ricchezza di un paese: ricchezza (PIL, PIL pro capite) superficie, chilometri di autostrade, di ferrovie, teu movimentati nei porti, la quantità di ovini, di suini, bovini allevati ogni anno in un paese, quantità di produzione agricola, la percentuale di superficie paese destinata alla produzione agricola, il numero di posti barca, numero occupati disoccupati, laureati, giovani, anziani, il numero di ricoveri all‟ospedale. Sono tutte grandezze che non fanno riferimento al micro, fanno riferimento al macro. La statistica ufficiale che include la statistica economica e la statistica sociale, e una parte che fa riferimento alla demografia (studio della popolazione), tutte queste statistiche studiano gli aggregati macro economici, o comunque i fenomeni collegati al sistema paese, o anche l‟intero pianeta. Possiamo parlare di transazioni finanziarie internazionali, povertà e fame nel mondo, sono tutte statistiche che fanno riferimento ad un paese città nazione continente o pianeta. Di fronte a moli di dati così rilevanti (pensate a tutti i pensionati INPS), diventa importante operare delle sintesi. Se abbiamo le dichiarazioni dei redditi degli italiani e vogliamo andare a sintetizzare dobbiamo vedere reddito medio dichiarato dagli italiani, redditi sopra di 300000 euro, e la percentuale di persone al di sotto di soglia di povertà assoluta o relativa. Recentemente si è discusso, se seguite il dibattito politico nazionale, se sia opportuno o meno introdurre la patrimoniale, imposta sui patrimoni. Una considerazione è che solo 10 mila persone in Italia hanno dichiarato reddito superiore a 300 mila euro. Vale la pena aprire un capitolo sulla patrimoniale in Italia? La Fornero dice che con l‟IMU loro pensano di aver ottenuto il risultato più vicino alla patrimoniale. Questo cosa c‟entra con la statistica? C‟entra perché il governo, amministrazioni locali e cittadini per poter valutare le politiche economiche e azioni della PA devono o avere dati per decidere. Vale la pena di introdurre la patrimoniale? La % di persone sotto la soglia di povertà è aumentata o no? Quanto è aumentata la discriminazione economica 9 all‟interno del paese? Sono valutazioni che si fanno a partire da dei dati. Questi dati o fonti di informazioni sono i dati della statistica ufficiale. Cominciamo parlando di Fonti Statistiche Ufficiali. Tutti voi avrete dato istituzioni di diritto privato e pubblico. Quando l‟ho fatto io tra le primissime lezioni si parlava di fonti del diritto, dove c‟erano tutte le leggi dai regolamenti alla Costituzione. Perché abbiamo sempre bisogno di sistemi di riferimento dai quali tutto discende. Le fonti statistiche perché sono chiamate fonti? Sono una origine di informazione, non solo: di conoscenza per poter prendere delle decisioni. Se prendo un dizionario qualsiasi, vediamo che le fonti statistiche sono il principio da cui qualcosa emana o proviene direttamente (Devoto 1971). Ecco che le fonti che forniscono l‟informazione statistica sono un principio. Abbiamo bisogno di informazione statistica per prendere coscientemente delle decisioni. Il comune di Genova apre l‟asilo nido in Via della Maddalena. È scelta corretta? Devo conoscere i possibili fruitori del servizio. Oppure tra 15 anni si pensa che la popolazione anziana sia di più, di quanto crescerà la popolazione anziana tra 15 anni a Genova? Gli ultra 65 anni sono il 25% a Genova, tra 15 anni il 33%, 1/3 della popolazione a Genova sarà ultra 65 anni. Questo ha diverse implicazioni. Bisogna prevedere servizi per anziani. Tra 35–40 anni, queste persone moriranno, avremo vuoti cittadini rispetto a vari aspetti. Varie caratteristiche: tante case rimarranno vuote. Al contempo abbiamo i flussi migratori. Ora abbiamo 40 mila stranieri regolari a Genova a fronte di una popolazione di 600 mila abitanti. Tra 15 anni saranno 140 mila. Questi migrati, tendenzialmente giovani, porteranno con sé aspetti di natalità, aspetti di malattie ed esigenze sanitarie relative alla maternità, molto meno frequenti nella popolazione di cittadinanza italiana attuale, sono considerazioni fatte sulla base di numeri e proiezioni demografiche cittadine. I dati rappresentano l‟informazione statistica delle decisioni pubbliche per queste ragioni. ci devono aiutare a capire le esigenze opportune da soddisfare, capire come soddisfarle e dove andarle a soddisfare. Per esempio nel 1990 la maggior parte degli stranieri a Genova risiedeva in Portoria, adesso la popolazione straniera si sta diffondendo su tutto il territorio, alcune etnie si concentrano maggiormente in alcuni quartieri, esempio Sampierdarena. Quali sono le esigenze degli stranieri e fornire risposte adeguate. Tanti latino americani a Sampiedarena? Personale che sappia parlare spagnolo. Zone con più comunità slave qualcuno che conosca la lingua slava, magari uno straniero che abbia acquisito la cittadinanza italiana. Avere la conoscenza dei dati permette di prendere decisioni opportune. Permette di misurare i fenomeni e vedere come si evolvono nel tempo. Se decidiamo di attuare politiche per la famiglia o natalità a Genova bisogna aspettare a dire poco 9 mesi, ma ragionare su un periodo più lungo. Monitorare le nascite nel tempo e vedere se le politiche a favore della natalità, attuate in città, favorendo asili nido e l‟inserimento scuole materne, se queste operazioni, politiche, hanno dato dei risultati. Come facciamo a misurare i risultati? Con i, confrontando la situazione prima e dopo la cura, 10 e tenendo conto del legame che questi fenomeni possono avere con altri fenomeni, come per esempio i cicli economici. Noi abbiamo bisogno di queste informazioni perché il decisore pubblico ne ha bisogno e il cittadino deve conoscere il proprio paese. Si sta sviluppando a livello internazionale un dibattito sugli open data, dati liberi, è considerata nuova forma di democrazia partecipativa. Io voglio essere in grado di sapere le informazioni attraverso le quali la mia amministrazione locale e nazionale prende le decisioni. È come ricevere busta paga senza sapere quanto c‟è dentro: stipendio lordo, trattenute. Conoscere è una forma di democrazia, è quasi trasparenza. Si sta aprendo il dibattito sulla questione della Polverini in Lazio. Nascondere i dati è sempre una fonte di dubbio, nascondere i bilanci dei partiti è fonte di dubbio. È diritto del cittadino sapere, avere informazioni per sapere come gli amministratori pubblici hanno agito. Piano piano si sta andando sempre di più verso una logica di diffusione libera dei dati. Problemi importanti. Ma chi produce questi dati? Un discorso è se l‟ISTAT pubblica dati sulla disoccupazione, sono quelli che usa il governo.. Altro discorso i dati che pubblica la cgil, i sindacati, può essere che l‟indagine dei sindacati sia fatta meglio e più accurata. Ma abbiamo due indagini che forniscono risultati differenti. La domanda che ci si viene a chiedere è quale delle due fonti è attendibile? Con quali strumenti i dati sono nati? L‟obiettivo di questa parte del corso è fare un po‟ di chiarezza su quelle che sono le fonti statistiche ufficiali. Non vuol dire che le fonti statistiche non ufficiali operino male e i dati siano sbagliati. Questo no. Vedremo che ci sono enti preposti alla produzione dei dati e la loro disseminazione e diffusione di questi dati è quella che maggiormente viene utilizzata per prendere decisioni di tipo economico politico e sociale. Queste fonti che producono informazione statistica, questi enti che producono dati che rappresentano informazione, possono essere suddivisi in tre grosse aree, o meglio secondo tre criteri: 1. Natura dell‟ente; 2. Scopo della Rilevazione; 3. Territorialità Natura dell’ente. La prima classificazione, forse la più importante perché riguarda l‟aspetto giuridico dell‟ente produttore, la seconda è più importante sulla tipologia di costruzione e raccolta dell‟ente, la prima è basata sulla natura giuridico amministrativa della fonte. Distinguiamo tra enti istituzionali, pubblici o erogatori di servizio pubblico, enti privati ed enti di natura scientifica. Quelli che ci interessano di più sono i primi tre, gli enti di natura scientifica producono dati ma particolari. Le fonti istituzionali sono gli enti produttori di dati che per loro natura devono produrre dati, per loro statuto devono produrre dati che esistono perché producano dati, sono stati assunti per produrre dati, questa informazione. 11 La regina in tutto questo contesto è l’ISTAT. L‟Istituto Nazionale di Statistica è il principale produttore di informazione statistica in Italia. Vedremo sulla base di quali principi e criteri produce dati, ha vincoli precisi che deve rispettare. Altri enti producono dati: i ministeri, le regioni, le province autonome, comuni prefetture. La provincia, molte andranno a morire, ha come produzione statistica rilevante tutto ciò che riguarda l‟attività scolastica. Comuni e regioni hanno tutti, a parte i comuni più piccoli, un ufficio statistico. Durante il corso verrà a parlare una persona del comune di Genova su come verranno rilevati i prezzi. Vedremo prezzi alla produzione, al consumo. I comuni hanno il compito di rilevare i prezzi per conto dell‟Istat. Poi trasmettono con un software i prezzi rilevati. L‟Istat macina i dati e costruisce l‟indice dei prezzi al consumo, alla produzione eccetera. La regione anche produce dati, ad esempio l‟annuario statistico regionale. È necessario avere un senso della misura dei fenomeni. Il mercato nautico è in crisi. Perché? Perché me lo dice il mio vicino che vende imbarcazioni al porto di Lavagna, o perché può avere ragione, o perché ho dati che mi dicono quante imbarcazioni sono state vendute o non necessariamente immatricolate? Esistono delle strutture, è una impalcatura complessa a livello nazionale, che hanno per loro natura l‟obbligo di rilevare dati per finalità informative e statistiche. Poi abbiamo le “fonti pubbliche. Sono le strutture prevalentemente pubbliche ad esclusione delle amministrazioni e l‟Istat. Questi enti, solitamente, producono dati nello svolgimento della loro attività quotidiana. L‟INPS è l‟esempio più semplice, istituto nazionale di previdenza sociale, è l‟ente che eroga le pensioni. Incamera contributi pensionistici ed eroga pensioni. Non come obbligo istituzionale produrre statistiche sulle pensioni, eppure ha in pancia tanti dati. Numero di pensionati in vita, contributi, età dei pensioni, le pensioni di anzianità, le pensioni di invalidità, le pensioni irreversibili. Nello svolgere la sua attività l‟INPS può produrre studi che analizzano i pensionati italiani. Qual è la differenza tra questa produzione di dati e quella dell‟Istat? Istat conduce indagini con fine di condurre indagini e con finalità conoscitive, vuole conoscere degli aspetti del paese. L‟Inps svolge un‟altra attività e utilizza dati che produce nel suo processo quotidiano di attività ed elabora statistiche che aiutano a prendere decisioni. I dati che sono prodotti in questo modo sono detti process produced, prodotti attraverso la produzione del processo. Sono anche dati amministrativi, che sono anche più ampi, non includono solo questi. Insieme all‟Inps possiamo inserire la BDI. Ha un ufficio studi eccellente con profili scientifici strepitosi, ci sono persone estremamente qualificate. La BDI non ha la finalità di produrre statistiche sul mercato finanziario e sul credito a Genova, in Liguria ed in Italia. Lo fa perché è importante nello svolgere la sua attività sapere cosa sta succedendo, monitorare gli importi finanziati a breve medio e lungo periodo. Valutare i tassi di interesse applicati sui mutui. Sono cose di interesse dell‟attività quotidiana. 12 Ci sono altri enti, li citati, a base pubblica, con tutt‟altra finalità rispetto alla produzione dei dati ma che li producono, conservano, producono informazione statistica perché serve a loro o al paese. Poi abbiamo le fonti private. Sono enti che non hanno un carattere pubblico dal punto di vista giuridico, ma sono enti privati: Caritas, ferrovie dello stato, poste, sindacati. Ci sono tantissimi enti che producono indagini. La Confindustria. A loro interessa analizzare un aspetto particolare. Immaginiamo che la Caritas voglia studiare la situazione della popolazione straniera e regolare in Italia. Non ha un obbligo istituzionale per farlo. L‟ente assistenziale ha la finalità di assistere le persone che sono in difficoltà. Nel fare ciò può ritenere opportuno fare studi specifici per conoscere il fenomeno, per agire meglio, o per sensibilizzare rispetto ad un certo fenomeno. A differenza delle fonti statistiche istituzionali, non ha obbligo di produzione statistica. A differenza delle fonti pubbliche non hanno nessuna (o parziale) produzione di dati attraverso il processo, sono generalmente enti che producono studi che rappresentano informazione statistica ma studi spot, saltuari su alcuni aspetti. Infine gli enti scientifici: producono statistiche su vari aspetti, hanno un carattere di produzione simile a quella degli enti privati. Pensiamo alle università che producono statistiche sugli immatricolati, sarebbero dati di natura amministrativa, process produced, poi altri enti scientifici con non finalità assistenziali ma di ricerca che producono statistiche. Su questi non torneremo più, era giusto per completare. Ritornando indietro. Abbiamo fonti istituzionali tra le quali primeggia l‟Istat, fonti pubbliche come la BDI, fonti private come i sindacati e la Caritas, fonti scientifiche come l‟Università e il CNR. Altro criterio per distinguere le fonti statistiche è lo Scopo della rilevazione. Perché raccogliamo i dati? Alcuni enti raccolgono dati per finalità puramente statistica, con la finalità conoscitiva, per esempio la Caritas può fare indagine sugli immigrati clandestini in Italia, finalità puramente conoscitiva, anche in questo caso rientra nel primo punto: fonti di origine statistica, materiale che è stato raccolto con l‟intento di conoscere alcuni aspetti della vita sociale. Invece, sono i dati process produced, ci sono moltissimi documenti predisposti dalle amministrazioni sia pubbliche che private, ma anche dagli enti di ricerca, per scopi che non riguardano la produzione statistica, quanto piuttosto la loro attività. Per esempio l‟Inps ha i dati dei pensionati. Comune di Genova ha l‟anagrafe. L‟università ha gli studenti iscritti. Dati che provengono da origine statistica sono rilevati per finalità conoscitive. I dati amministrativi sono dati che esistono per altre finalità di gestione quotidiana dell‟attività dell‟ente ma non per finalità di tipo statistico. Già che questi sono disponibili si reputa opportuno analizzarli per produrre informazione statistica. Possiamo fare quindi una distinzione ulteriore all‟interno delle fonti di origine statistica. Possiamo distinguere: a) Le rilevazioni amministrative (dati amministrativi, dati che certe strutture hanno in pancia perché devono svolgere attività ordinarie) 13 b) Censimenti c) Indagini campionarie Le rilevazioni amministrative. Guardiamole un secondo, poi abbiamo una presentazione specifica su quelle. Le rilevazioni amministrative non sono solamente dati prodotti dagli enti pubblici o privati. Anche il comune di Genova possiede dati di carattere amministrativo. Le due classificazioni viste prima, quella in base alla natura giuridica dell‟ente (istituzionale pubblico privato e di ricerca) e tra le due tipologie di rilevazione (per finalità statistiche ed amministrative) non sono esclusive, non ci sono abbinamenti precisi, possono intralciarsi. Le rilevazioni amministrative nel caso del comune di Genova sono per esempio i dati di tipo anagrafico. Il comune deve tenere un‟anagrafe dei residenti. Da qui capiamo quanti sono i residenti a Genova come numero, quanti sono per nazionalità, per fascia d‟età, per età, per genere. Possiamo anche conoscere il loro indirizzo, nel rispetto della normativa sulla privacy. Se lo conoscessimo è semplice sapere quanti sono i residenti per ciascun municipio, ex circoscrizione o per ciascun quartiere. Per ciascun quartiere posso sapere i residenti per nazionalità e fascia d‟età. Quanti studenti ci sono in una scuola: quanti al liceo scientifico, classico, tecnico, eccetera. Questi dati esistono perché le scuole devono svolgere il loro compito di informazione. Il comune deve gestire la anagrafe dei residenti. Al tempo stesso ci sono altre attività che vengono svolte (registro delle imprese). Finito il corso di formazione volete aprire una azienda la iscrivete nel registro delle imprese attive, in cui ci sono una serie di dati: nome azienda, azionisti, capitale sociale, forma societaria, tutte le cose viste in diritto commerciale. Il PRA. Se comprate una macchina, moto o motorino, o qualsiasi cosa di due quattro ruote soggetta di immatricolazione è iscritto nel PRA. È interessante da utilizzare. Noi possiamo sapere quanti sono i mezzi circolanti per cilindrata, per tipologia inquinante, euro zero, uno, due tre eccetera. Auto elettriche, ibride eccetera. Oppure sapere gli autoarticolati che sono immatricolati in Italia versus quelli in Francia, età media del parco vetture. Poi abbiamo le liste elettorali. Esempi di dati amministrativi usati per finalità di tipo statistico. In questo corso non ne parleremo, in futuro mi piacerebbe. Ci sono aspetti molto rilevanti sulla privacy. Qualche anno fa, 5-6 anni fa, forse non eravate neanche in università, era venuta fuori una polemica perché l‟agenzia delle entrate aveva pubblicato sul suo sito le dichiarazione dei redditi degli italiani. Tutto bloccato entro dieci minuti, tutto ritirato, evidentemente ci sono problemi di privacy non indifferenti: ognuno guardava il vicino quanto guadagnava eccetera. Perché poi siamo un paese di pettegoli! È evidente che sono dati sensibili. Non tutti i dati possono essere trattati allo stesso modo. Anche i dati sanitari non possono essere trattati allo stesso modo, magari un soggetto non ha piacere che si sappia che ha un tumore. Perché deve essere diffuso in internet? 14 Di altra natura problema aperto in Inghilterra tre quattro anni fa. Proposta del primo ministro o della giustizia, pubblicare su internet tutti coloro che sono stati accusati di pedofilia, così i genitori poterono vedere se c‟erano pedofili vicino a casa, o vicino alla scuola dei figli. Questa proposta è caduta in nome della privacy. La pubblicità dei dati è soggetta ad aspetti di privacy. Abbiamo parlato di dati di natura amministrativa, li ritroveremo. Adesso vediamo i dati di origine statistica raccolti per finalità esplicitamente informative. Accenneremo i censimenti e indagini campionarie. Censimenti in maniera diffusa con una presentazione ad hoc, forse dopo questa, sui dati di tipo campionario ne parleremo ampliamente in seguito. Questa è una panoramica. Cosa è un censimento? C‟è stato l‟anno scorso, 15esimo censimento della popolazione e delle abitazioni. È una indagine esaustiva su tutte le unità che compongono la popolazione. Il censimento più famoso, non è l‟unico esistente adesso, è il Censimento della Popolazione e delle Abitazioni. Ha come obiettivo il conteggio degli italiani presenti sul territorio ad una certa data, anzi di tutti coloro che sono residenti in Italia, il conteggio di tutte le abitazioni. Sembrerà strano ma non è così sicuro che le abitazioni presenti sono quelle che sono al catasto, molte abitazioni non sono regolari. Il censimento delle popolazioni e abitazioni è così definito dall‟Istat: è l‟insieme delle operazioni di progettazione, raccolta, analisi e diffusione dei dati di carattere demografico, culturale economico e sociale di tutti gli abitanti del paese. Non quindi cittadini italiani. È una indagine esaustiva. L‟obiettivo è cercare di raggiungere tutti gli italiani, tutte le unità statistiche del territorio. La cadenza è decennale, ogni dieci anni viene fatto questo lavoro, è un lavoro estremamente costoso, richiede molto tempo di analisi e vuole determinare non solo l‟entità numerica ma anche la struttura della popolazione di un paese. Avete aiutato i genitori a compilare il questionario? Compilazioni online. Ricordate le domande, c‟erano due forme: una lunga e una breve. La forma breve aveva meno domande della forma lunga. La forma lunga, che aveva più domande, vedremo perché ce ne erano due, chiedeva che tipologia di riscaldamento hai, come è fatto il palazzo, domande sulle abitazioni, sull‟origine, attività lavorativa, se la casa è utilizzata anche come luogo del lavoro eccetera. Non semplicemente il conteggio delle teste, ma qualcosa di più complesso. Esistono tanti altri censimenti. Nel 2010 è stato fatto censimento generale dell‟agricoltura, attraverso il quale si vuol sapere quanti maiali ci sono in Italia: ovini bovini suini, caprini, quante aziende agricole operano, per quale superficie operano, in quale terreno, per capire qual è l‟attività agricola, dove per agricola si intende anche l‟attività pastorizia del paese. Ritorno a quanto dicevo all‟inizio. Questa è statistica macro economica, guarda i grossi aggregati, non il singolo soggetto, ma guarda all‟insieme nazionale di un certo fenomeno. 15 Censimento generale dell‟industria e dei servizi, dovevano farlo l‟anno scorso ma non è ancora partito. Adesso è in corso il Censimento delle associazioni no profit, quante sono cosa fanno eccetera. Diversa dal censimento è l’indagine campionaria. Il censimento (indagine censuaria) è estremamente costoso; indagine campionaria = campionamento. Col censimento bisogna raggiungere tutti i 60 milioni di italiani, tutti i nuclei familiari. Solamente a Genova per un anno hanno lavorato 350 persone, comune di Genova, non provincia, ha un costo non indifferente. Si parlava di saltare il censimento e non farlo. La multa dell‟UE era talmente alta che conveniva fare il censimento. è un obbligo comunitario, è stato un censimento coordinato a livello europeo. Ci sono inoltre tantissime difficoltà nell‟analizzare i dati: questionari, metterli in forma informatica, analizzarli. È un processo che richiede 3-5 anni per essere concluso. A Gennaio primi dati definitivi sul censimento, a Roma sono un po‟ indietro. I primissimi risultati ad un anno dalla fine del censimento, e poi le analisi conclusive si avranno dopo due- tre anni la fine del censimento. c‟è un calendario che dovrebbe essere rispettato. Ci sono situazioni in cui non vale la pena mettere su tutto il cinema. Se voglio sapere le abitudini degli italiani nelle vacanze, quanti andranno all‟estero, quanti in albergo, quanti rimarranno a casa, non devo per forza fare un censimento e raggiungere tutti gli italiani uno per uno e chiedere a questi cosa intendono fare. È più semplice utilizzare un campione. Sono caratterizzate dal fatto che solo una parte delle unità componenti la popolazione viene selezionata ed indagata. Esempio molto semplice. Vi voglio chiedere se il corso vi sta piacendo. Posso prendere ognuno di voi e chiedervi: ti piace questa lezione? Diventa snervante per voi. In fin dei conti su 50, se ho chiesto a 49 persone, quanto serve sapere l‟informazione della 50esima persona. Se ne ho 49, non posso prenderne 48? Esiste una soglia al di sopra della quale il costo di rilevazione dell‟opinione della persona o del dato è superiore al beneficio che ho nel raccogliere il dato. Su 50, 15 di voi sono il 30%. 15 su 50 mi danno informazione buona se il corso è bello brutto, se piaccia o meno, se sembri antipatico o simpatico. È una informazione che vale sul momento. Poi ci saranno altre lezioni, poi altre lezioni, poi viene Persico, l‟informazione raccolta ha validità limitata. Avrebbe senso condurre una indagine campionaria per informazione che vale poco tempo? Una indagine sulla forza lavoro, che cerca di capire quanti e perché sono occupati, non ha senso a livello censuario. Meglio fare indagine su poche unità, ben fatta, secondo alcuni criteri che vedremo, costa di meno. Condurre indagine campionaria ha un costo eccessivo rispetto al beneficio che trarrei dall‟indagine pienamente censuaria, molto meglio la campionaria. Questo espediente, diminuendo l‟onere della rilevazione, consente di destinare maggiore attenzione a tutte le attività connesse al miglioramento e al controllo della qualità dei dati raccolti. 16 Se voi avete 2000 questionari, avete tempo di contattare le persone con più calma, preparare meglio le domande, le risposte, e verificare meglio la correttezza e la qualità della risposta. Se avete centomila risposta il tempo che potete dedicare a ciascuna persona è di meno. Selezionare solo un campione implica una minore attendibilità delle misure osservate in quanto stime dei parametri di interesse. Vero. Visto a statistica 1. Se chiedessi solo ad alcuni di voi se il corso è bello, potrei avere una valutazione sbagliata. Sono sfortunato e potrei beccare persone che non mi sopportano, potrei beccare persone molto contente. O è realistico credere che se a un 50% non piace e l‟altro 50% piace,il campione è frutto del caso se è ben fatto, se non è distorto, avrà il 50% di persone a cui piace e 50 a cui non piace. Il campione auspicalmente dovrebbe rispettare la composizione della popolazione. Anche se non ho la percezione assoluta dello studio censuario, lo studio campionario è comunque soddisfacente. Avrò l‟errore dovuto al fatto di avere il campione anziché la popolazione, ma in linea di massima questo errore dovrebbe essere nullo. È chiaro che a seconda di quali unità vengono inserite nel campione prescelto, i risultati riferiti alla popolazione complessiva varieranno. Cosa significa? Se prendo campioni di 5 da voi quanti ne posso prendere? Tanti: i primi 5 del primo banco, dell‟ultimo banco, a caso e così via. Ogni campione è composto da unità differenti. Ogni unità da una valutazione diversa. Se il campione è ben fatto, le risposte saranno più o meno simili tra loro e ruoteranno attorno al vero valore della popolazione che a me interessa stimare, proprietà della correttezza dello stimatore. Le indagini sui campioni della popolazione rientra nell‟attività Istat da circa un ventennio. Quella sulle forze lavoro realizzata nel settembre del 1952 è stata l‟unica ad indagine diretta con interviste personali. Terza classificazione. La territorialità. I dati statistici possono essere suddivisi in base alla territorialità dell‟ente che produce il dato. Possiamo distinguere tra enti a) Internazionali sovranazionali. Non sono legati direttamente ad un paese. Per esempio l‟ufficio statistico delle nazioni unite; la banca mondiale; la FAO, l‟Eurostat, anche se sappiamo che non è un produttore di dati; il FMI, sono tutti enti sovranazionali o internazionali. b) Nazionali. Istat. Bureau census è un analogo dell‟Istat per gli USA è un ente nazionale, è referenziale su un paese. L‟analogo dell‟Istat di Francia Germania e Inghilterra sono fonti statistiche nazionali, non internazionali. Nazionali estere. c) Locali. Regione comune, camera di commercio, fanno riferimento alla territorialità dell‟ente che produce il dato. Tutto questo meccanismo è coordinato attraverso il SISTAN. È un sistema che non produce dati, ma ha lo scopo di coordinare l‟attività di produzione statistica ufficiale italiana. È un network di enti (ogni pallino del logo dovrebbe essere un ente) collegati in questa rete. 17 È stato istituito nel 1989 e connette in un‟unica rete tutte le componenti disperse nelle amministrazioni con l‟obiettivo di acquisire nuovi e maggiori conoscenze per influire sui processi decisionali della PA (vedi sito Sistan) e con quello ulteriore di ridurre le molestie verso il pubblico e le imprese che ha raggiunto livelli eccessivi. (aveva ai tempi, forse ora un po‟ meno). Esempio. Qualche tempo fa ero in banca, ci hanno fermato guardia di finanza, carabinieri e guardia costiera, uno dice, coordinatevi! Lo stesso discorso può avvenire per le rilevazioni statistiche. Se c‟è una rilevazione dei prezzi, la deve fare un ente solo bene, anziché tanti male. Il Sistan ha l‟obiettivo di coordinare all‟interno del Programma Statistico Nazionale, l‟attività di rilevamento dei dati su tutto il territorio nazionale. Stabilisce, grazie al programma statistico nazionale, chi rileva cosa e che cosa c‟è da rilevare. Al centro del Sistan, (quel pallino al centro del quadrato) si trova l‟Istat. Non è al vertice del Sistan, non è una cupola, non è il capo del Sistan, ma è il centro di coordinamento di ricerca, consulenza formazione e garanzia metodologica e si trasforma in una azienda in grado di fornire servizi al pubblico. Se il comune di Genova non sa come fare qualcosa, chiama l‟Istat e l‟Istat gli dà la risposta. Se la camera di commercio di Genova deve rilevare dei dati e non sa come fare, chiama l‟Istat e l‟Istat lo risolve. L‟Istat è un aggregatore, responsabile di riferimento principale per tutti gli enti che fanno attività di rilevamento dei dati. L‟Istat non è il capo del Sistan. Chi fa parte del Sistan? - Istat - Uffici di statistica centrali e periferici delle amministrazioni centrali e delle amministrazioni ed enti autonomi (amministrazioni centrali es. ministeri); - Gli uffici delle regioni e delle province autonome; - Delle province; - Dei comuni; - Delle ASL; - Degli uffici delle camere di commercio; - Gli uffici di statistica comunque denominati di amministrazioni od enti pubblici; - Uffici di statistica di soggetti privati che svolgono funzioni di interesse pubblico. Chi svolge le funzioni di ufficio statistico nei comuni? La anagrafe. Di solito, nei comuni piccoli, Bargagli per intenderci, non c‟è l‟ufficio statistico, la anagrafe gestisce anche gli aspetti statistici. Tutta questa struttura lavora secondo delle finalità che sono esplicitate nel programma statistico nazionale: definisce le rilevazioni che devono essere fatte in Italia. L‟Istat non può smettere di fare la rilevazione sulle forze lavoro, perché è nel programma statistico nazionale, c‟è l‟obbligo, è una legge e deve essere rispettata. È li che si parla di cosa deve fare l‟ISTAT, è li che si dice chi deve fare che cosa e con quali criteri. Il programma statistico nazionale parte dal presupposto di fornire 18 un servizio pubblico per la circolazione delle informazioni con la tutela del segreto statistico (privacy). Il Sistan creando una rete di collegamento, vuole riportare la statistica la dove si formano le decisioni, ma il pluralismo delle fonti deve essere coordinato con gli atti di indirizzo e coordinamento. Che significa? Che se a Genova i prezzi sono rilevati in un modo, deve essere così fatto anche a Matera. Non possiamo rilevare le cose in modo differente, diamoci un coordinamento con stessi tempi e modalità. Si decide di mandare i prezzi all‟Istat l‟ultimo del mese? Lo facciamo tutti. Il programma statistico nazionale afferma che la produzione deve essere orientata all‟utente, il quale deve avervi ampio accesso. I dati devono essere usati in maniera coordinata, organizzati in serie temporali e forniti tempestivamente, devono essere imparziali, coordinati con l‟Eurostat, standardizzati ed integrati per l‟interconnessione dei sistemi informativi. Il Sistan non produce dati, è un network, sopra il quale si appoggia il Programma Statistico Nazionale che non produce dati, perché è una legge, in quanto tale ha come obiettivo dare un indirizzo, indicare gli enti che rilevano i dati e quali dati devono rilevare. Se vogliamo fare statistiche sui lacetti fucsia delle scarpe lo possiamo fare ma o lometto nel programma o lo faccio per i fatti miei. Se c‟è scritto sul programma statistico nazionale di fare indagine sui laccetti fucsia delle scarpe non si può non farlo. Esiste il programma Statistico Regionale, della Regione Liguria, in approvazione in questi giorni. Definisce cose simili nell‟ambito regionale. Concludiamo con alcuni piccoli aspetti normativi veloci. Dove è la statistica nei documenti ufficiali? Qual è il corpus normativo che ruota attorno alla statistica? A livello europeo: - nel TFUE al 338. Fatto salvo l‟articolo 5 del protocollo dello statuto del SEBC e della BCE il parlamento europeo e il consiglio, deliberando secondo la procedura legislativa ordinaria, adottano misure per l‟elaborazione di statistiche laddove necessario per lo svolgimento delle attività dell‟unione; - la elaborazione delle statistiche dell‟unione presenta caratteri della imparzialità, affidabilità, obiettività, ed indipendenza scientifica dell‟efficienza economica, e della riservatezza statistica. Essa non comporta oneri eccessivi per gli operatori economici. A livello nazionale, la Costituzione tratta della statistica e del trattamento dei dati all‟articolo 117.r: pesi, misure, determinazione del tempo, coordinamento uni formativo statistico ed informatico dei dati dell‟amministrazione statale, sono di legislazione esclusiva dello stato. A livello locale esistono tutta una serie di leggi, e in particolare sulla base del parere della conferenza permanente per il rapporto tra stato regioni e province, vengono definiti: 19 - il ruolo degli uffici di statistica; il programma statistico regionale e le modalità del suo inserimento totale o parziale nel programma statistico nazionale; le rilevazioni statistiche di interessi regionali; compiti uffici statistica; le organizzazioni degli uffici di statistica delle regioni; criteri e modalità per l‟interscambio dei dati. Tutto questo è inserito in un documento di diverse pagine, non vi consiglio di scaricare, vi dico solo che esiste, è il Codice della Statistica Ufficiale lo trovate sul Sistan, raccoglie tutte le leggi che riguardano l‟ambito statistico, e non sono poche. La prossima volta, giovedì prossimo, andremo ad approfondire alcuni di questi temi e direi il censimento. 20 LEZIONE 3 27/09/2012 LE FONTI STATISTICHE UFFICIALI II: L‟ISTAT E L‟EUROSTAT Da Giovedì inizierete con Luca Persico. Ritorniamo a ciò che abbiamo detto la volta scorsa, un aspetto fondamentale nel campo del governo di un paese, nella gestione degli enti locali e la conoscenza dei cittadini devono avere del loro paese è rappresentata dalle fonti statistiche, dai dati statistici. Ci siamo soffermati sulle fonti statistiche ufficiali, quelle fonti statistiche che seguono una particolare procedura nella loro produzione. In particolare, le statistiche ufficiali nascono all‟interno del Programma statistico nazionale il cui cuore è l‟Istat ma viene scritto e gestito assieme agli altri enti che fanno parte del Sistan, sistema statistico nazionale. Per statistiche ufficiali intendiamo quelle statistiche che nascono all‟interno del programma statistico nazionale. Questo per quel che concerne l‟Italia. In maniera simile possiamo identificare fonti statistiche ufficiali per altri paesi europei, principali paesi del mondo occidentale e non solo, e gli enti internazionali. Una cosa che andremo a vedere, non so ancora se la prossima lezione o la successiva, sono i criteri ai quali si attengono gli enti nella produzione dei dati, criteri che non devono essere seguiti dagli enti che non sono indicati nel Sistat. Vediamo due particolari strutture, di particolare interesse: Istat ed Eurostat. Non andremo molto nel dettaglio. Inviterei di andare nel sito Istat per vedere l‟abbondanza di informazione di dati che sono disponibili. L‟ISTAT. È il principale produttore italiano di statistica ufficiale in Italia. Abbiamo visto che non è l‟unico, ma il principale. È il cuore del Sistan, è stato istituito per le finalità di conoscenza statistica, è un ente pubblico, anzi è una fonte istituzionale, è una fonte di informazione statistica che esiste per produrre dati, non nella sua attività quotidiana. Non è un ente che può fare altro come può fare l‟Inps, l‟Istat ha come scopo della sua esistenza la produzione di dati ed informazioni statistiche. L‟attività che svolge è sviluppata nell‟ambito del programma statistico nazionale. Al di fuori del programma statistico nazionale può decidere di fare anche altro ma in particolare si attiene a quello. Ha altri obiettivi: divulgazione della statistica e conoscenza statistica, formazione e supporto agli uffici del Sistan che hanno bisogno di consulenze statistiche. L‟Istat è piuttosto recente, è del 1926. Prima, tutta la produzione statistica, era gestita all‟interno del Ministero dell‟Agricoltura. Ci sono pubblicazioni statistiche precedenti all‟Istat: popolazione (il censimento è stato fatto anche prima del 1926), forza lavoro, superficie agricola coltivata, coltivata come, quanti ovini, caprini, bovini. L‟informazione statistica ufficiale prima era all‟interno del Ministero dell‟ agricoltura. 21 Nel 1926 Mussolini decise che era importante, per avere un forte governo sul territorio, conoscere i dati, conoscere il paese. Interessante sarebbe vedere un documentario prodotto dalla RAI per i 150 anni dell‟unità. In questo documentario si parla della storia della statistica. La storia siamo noi ha fatto una puntata dedicata alla statistica. Se abbiamo tempo, se riusciamo martedì potremmo provare a vederlo. Mussolini ha chiamato a dirigere l‟Istat Corrado Gini, quello che ha inventato l‟indice di Gini: di concentrazione, di dispersione. Inizialmente si chiamava Istituto Centrale di Statistica. Successivamente, nel 1989, l‟anno in cui è stato istituito il Sistan, abbiamo questo incrocio di informazioni con le slides viste la volta scorsa, viene istituito il Sistan e viene organizzato l‟Istat, cambiato come nome in Istituto Nazionale di Statistica. L‟Istat nasce per produrre informazione, per produrre dati, per statuto la realizzazione di indagini, studi e analisi è finalizzata alla produzione di statistica ufficiale e a soddisfare il bisogno informativo espresso dalla collettività. Le rilevazioni di pubblico interesse sono stabilite dal Programma statistico nazionale, il documento che regola l‟attività di produzione statistica. L‟Istat svolge sia attività di tipo censuario, censimenti, sia attività di tipo campionario. In realtà prima le attività di tipo campionario erano piuttosto poche, prevalentemente indagini sulle forze lavoro. Poi cresciute sempre di più per una serie di vantaggi che rappresenta l‟indagine campionaria rispetto all‟indagine censuale. Il censimento più celebre è quello sulle popolazione e abitazioni, ha raggiunto la 15 edizione. Nel 2001 il censimento ha riguardato 57 milioni di cittadini, nel 2011 il conteggio definitivo attorno ai 60 milioni di individui e 23-24 milioni di famiglie. In Italia i censimenti sono partiti immediatamente, ne riparleremo. Ogni qualvolta nasce un nuovo paese, nazione, la prima cosa che si fa è contare le persone. Lo abbiamo fatto con l‟Unità di Italia, gli Stati Uniti nel 1776 quando c‟è stata la costituzione degli Stati Uniti, succede ogni volta che i paesi si dividono, uniscono, organizzano per avere una popolazione legale di riferimento a fini elettivi. Con il Regno di Italia, per fare un esempio, si è reso necessario fare le prime elezioni, come nel 1776 negli Usa. Quanti rappresentanti doveva mandare la Sicilia, la Campania o qualsiasi altra regione, città al parlamento? Il problema ce lo poniamo oggi come allora. Questo è un elemento, il numero di abitanti residenti, quindi la popolazione legale, sono il risultato dell‟indagine campionaria. Su questo ne riparleremo prossimamente. Abbiamo già accennato al censimento dell’agricoltura, eseguito nel 1960, in realtà c‟erano anche altri dati, ufficialmente il censimento dell‟agricoltura nasce nel 196‟. È stato eseguito nella sesta volta nel biennio 2010-2011. Qual è l‟obiettivo? Censire le aziende con almeno un ettaro di SAU (superficie agricola utilizzata) o che soddisfano alcune condizioni particolari. Poi altri censimenti. Adesso è in corso il censimento per le organizzazioni no profit. Anche un altro censimento, il censimento dell’industria e dei servizi, non si sa se 22 andrà avanti oppure no. È il principale strumento per capire la struttura economica del paese. Inizialmente nel 1911, prima dell‟Istat, sempre a cura del Ministero dell‟agricoltura, si aveva il censimento degli opifici e delle imprese industriali. Nel corso degli anni ha cambiato nomi attenendosi alla differente struttura del paese: censimento dell‟industria e del commercio (1951), dell‟industria e dei servizi (1981). Di solito si faceva in contemporanea col censimento delle popolazioni e abitazioni. Bisogna vedere se verrà fatto. Attualmente i registri delle imprese e gli archivi amministrativi potrebbero rendere superflua la condizione di uno studio censuario. Le attività dell’Istat. Oltre alle indagini censuarie, possono essere indagini di tipo campionario con cadenza differenziata. Possiamo avere cadenza mensile, trimestrale, semestrale, annuale, sino ad arrivare a cadenze quinquennali. A seconda dell‟indagine si trovano cadenze differenti. Per esempio. Ci sono indagini multi scopo sulle famiglie italiane; indagini che analizzano più aspetti contemporaneamente e già che telefonano o raggiungono la persona, vanno a rivelare vari aspetti della vita quotidiana o delle scelte di vita delle persone. Indagini su : - Vita quotidiana - Viaggi e vacanze - Condizioni di salute e ricorso ai servizi sanitari - Sicurezza dei cittadini - Uso del tempo - Cittadini e tempo libero Sono tutte indagini di tipo campionario. Sottoposte solamente ad un sottoinsieme della popolazione, costruito in maniera tale da essere rappresentativo della popolazione totale. Tutti questi aspetti li approfondiremo nel prosieguo. Ci sono tante altre indagini, alcune sono molto importanti, altre un po‟ meno. tra le più importanti: - Indagine continua sulle forze di lavoro (cosa significa continua? Fatta continuamente, non c‟è un punto di riferimento ma è molto fluida, le varie fasi temporali si sovrappongono, non è mensile, è quasi giornaliera); - Sui consumi delle famiglie. (Le famiglie campionate ricevono un libretto di una ventina di pagine. Su ogni libretto la famiglia deve andare ad indicare quanto ha speso giorno per giorno nei differenti alimenti: pane carne acqua, succhi di frutta, ricariche del telefonino. Ci sono un po‟ di pagine, in cui il capo famigila segna le spese fatte per il periodo di una settimana, poi è ridato all‟Istat che ha il profilo del consumo settimanale della famiglia); - Indagine dei prezzi al consumo (i prezzi, su questo mi piacerebbe invitare qualcuno del comune di Genova per parlarne, vengono rilevati dal comune. Alcune persone come lavoro rilevano i prezzi su alcuni beni particolari: una certa tipologia di pane, carne. Questo avviene mensilmente. I prezzi vengono poi 23 - trasmessi da tutti i comuni d‟Italia all‟Istat, li consolida li pesa per la numerosità delle popolazioni residenti per tutti i comuni e, alla fine, produce un indice sintetico di prezzo, solitamente si utilizza l‟indice NIC). Ogni tanto sentirete dire che l‟Istat ha cambiato il paniere. Come si misura l‟inflazione? Identifico paniere standard e vedo quanto costa il paniere nel tempo. Posso vedere anche come il costo di questo paniere cambi tra differenti regioni, comuni, si parla di rilevazione di prezzi al consumo come indagine mensile, campionaria, perché i punti vendita sono campionati, non è un censimento dei punti vendita ma un campionamento, basata su un paniere di beni ben precisi. Se a Genova prendo il pane all‟olio e a Milano il pane all‟acqua non c‟è confrontabili di prezzo; Sui percorsi di studio e di lavoro dei diplomati; Inserimento professionale dei laureati; Cause di morte; (soprattutto infantile): Degli istituti di cura Ce ne sono tante altre effettuate con una regolarità o con meno regolarità. Sul sito Istat vediamo che presenta varie aree tematiche molto interessanti da approfondire. Dopo il censimento vedremo le fonti statistiche ufficiali per la statistica economica. Per le fonti internazionali o sovranazionali, che avevamo accennato l‟altra volta, vi avevo già detto di stare attenti a distinguere le fonti statistiche internazionali dalle nazionali estere. Il Bureau census americano piuttosto che l‟ufficio statistico della repubblica francese sono fonti statistiche nazionali estere. Sennò per il francese l‟Istat sarebbe fonte statistica internazionale; no, per il francese è una fonte statistica nazionale estera. Ricordiamo gli istituti nazionali di statistica, le banche centrali (FED banca tedesca) fonti statistiche nazionali estere. Le fonti sovranazionali riguardano tutti i dati che sono prodotti dagli enti sovranazionali, tipo l‟ONU, Ocse, fondo monetario internazionale, che avrete sentito nominare un po‟ di volte, e poi l‟Eurostat, dubito che molti l‟abbiate sentito nominare. L’Eurostat è l‟ufficio statistico della commissione europea, ha una funzione di direzione generale della commissione e coordinamento dell‟attività della statistica comunitaria. Se Genova rilevasse il prezzo del pane all‟olio e Milano all‟acqua ci sarebbero dei problemi perché non potremmo utilizzare una variazione di prezzo dei due beni come confronto, sono due beni differenti. Serve un ente, una struttura, che dica come dobbiamo rilevare i prezzi o far riferimento per rilevare un modo di rilevazione dei prezzi: principio di omogeneità nella rilevazione dei dati. A livello italiano c‟è il Sistan con al centro l‟Istat. A livello europeo c‟è l‟Eurostat. Se si presenta un problema di omogeneità della raccolta dei dati a livello nazionale lo si può presentare anche a livello internazionale, all‟interno dell‟UE. Se definiamo la disoccupazione in un certo modo deve essere così per tutti i paesi europei sennò perdiamo la confrontabilità del dato e dell‟informazione. 24 Nel 1953 è stato istituito l‟Ufficio Statistico della Ceca, ha preso subito il nome di Eurostat. È l‟ufficio statistico della commissione europea con l‟obiettivo di garantire e accrescere la comparabilità della produzione statistica dei differenti paesi UE. Si cerca di fare in modo che tutti i paesi e tutti gli istituti produttori di statistica ufficiali all‟interno di questi paesi producano dati e statistiche che siano tra loro confrontabili per le ragioni che abbiamo detto prima. L‟Eurostat non ha un ruolo di produzione dei dati, non produce dati. L‟Eurostat ha lo scopo di coordinare le attività di raccolta dati e di definire le statistiche e il modo in cui andare a produrle e calcolarle. L‟Eurostat non raccoglie dati di per sé; la raccolta dati è condotta dai singoli istituti nazionali. Ha il compito di assicurare che siano confrontabili ed armonizzati. L‟obiettivo a lungo periodo sarebbe quello di avere un sistema statistico europeo unico, cosa ancora molto lontana. Le attività dell’Eurostat non sono di produzione dati ma sono di pubblicazione. Ma ha iniziative che vengono fatte specificatamente a carattere europeo: indagini sulla forza lavoro europea o sul costo del lavoro europeo. Se per la vostra tesi di laurea che può essere di qualsiasi materia, cercate dati sull‟UE il vostro punto di partenza è il sito dell‟Eurostat. Dati su molte cose e indagini campionarie di particolare interesse: su forza lavoro, salute, redditi e condizioni economiche delle famiglie. Conduce queste indagini principalmente per interesse, ad uso della Commissione europea. La attività di disseminazione di dati, di analisi svolta dall‟Eurostat, deve supportare la commissione europea nel governo dell‟Unione. Altre indagini, altre attività sono i database, dati resi a disposizione della collettività e gli euro barometri: sondaggi di opinione sovranazionali, a livello aggregato europeo e non nazionale fatti periodicamente su persone al di sopra dei 15 anni. 25 IL CENSIMENTO DELLA POPOLAZIONE: TRA PASSATO E PRESENTE Il censimento è una delle attività più evidenti delle statistiche ufficiali. È quella che maggiormente si collega al concetto di statistica come misurazione delle grandezze relative allo stato, parola legata allo stato. Come al solito partiamo un pochino dalla parola. Censimento si compone di Censere e di Mentum, due parole latine, lo possiamo ricondurre ad un atto del contare, annoverare, stimare, principalmente una attività di conteggio. Nel momento in cui la concentrazione delle persone supera una certa soglia, bisogna contare, per vedere quanti siamo, se ci siamo tutti. Quando ci sono, non so se abbiate ancora le compagnie oceaniche del liceo quando si arriva ai bar a 27, quanti siamo? Ci dobbiamo contare. Il censimento della popolazione e delle abitazioni: è l‟insieme delle operazioni di progettazione, raccolta, analisi e diffusione di dati di carattere demografico, culturale economico e sociale di tutti gli abitanti del paese. Da subito, dall‟antichità, nei luoghi dove c‟era aggregazione di persone era necessario procedere al conteggio della popolazione presente. Una delle più vecchie, antiche citazioni di censimenti: - Attorno al 3500 avanti Cristo troviamo i conteggi in Mesopotamia; - 3000 avanti Cristo in Cina ed India; - 1400 a.C. Mosè conta gli israeliti. Non che abbia interesse particolare a citarlo, ma questo censimento citato non a caso nel libro dei Numeri della Bibbia conta e ci dà i risultati: Fate il censimenti di tutta la comunità degli Israeliti, secondo le loro famiglie, secondo il casato dei loro padri, contando i nomi di tutti i maschi, testa per testa, dall‟età di venti anni in su, quanti in Israele, possono andare in guerra…. Se andate avanti nella lettura trovate i risultati del censimento. Abbiamo le fondamenta del censimento come lo concepiamo noi seppure con alcune differenze. Tutta la comunità: carattere di universalità anche se parziale. Secondo le loro famiglie: raggruppati per famiglie. In fin dei conti anche noi quando facciamo il censimento abbiamo il foglio di famiglia. Ogni famiglia riceve il libretto del censimento e bisogna scrivere nome cognome data di nascita di famiglie residenti nella stessa abitazione. Secondo il casato dei padri. Contando il nome di tutti i maschi testa per testa. Non si contano le famiglie, ma le unità statistiche del censimento che è la persona. Non è proprio universale come lo intendiamo oggi. Dall’età di 20 anni in su, dai 20 anni in su 26 Quanti in Israele possano andare in guerra. Ecco che troviamo una delle ragioni per le quali nel 3500 e 3000 1400 a. C si fanno i censimenti, sono ragioni militari, vedremo che ce ne saranno anche altre. Il re, signore principe doveva sapere di quanti soldati doveva contare, quante persone potevano andare in guerra. Voleva sapere anche quanti di quelli si potevano ribellare. Se tu controlli un territorio e sai che ci sono 10 mila persone stanzi una forza militare ma con 100 mila altre. Le ragioni iniziali del censimento erano essenzialmente di tipo militare. Chi ha veramente portato il censimento a livelli stratosferici è stato l’Impero romano. Teniamo conto che per fare un censimento sono necessarie due cose: essere tanti in un’area delimitata, se siamo tanti e sparpagliati non c‟è concentrazione, siamo noi tre, gli altri lontani e sono pochi anche loro. Ma Cina India e Mesopotamia erano terre fertili, dove era concentrata la popolazione, dove si sono sviluppate le principali civiltà antiche. Ecco che è necessario sapere quanti fossero. Oltre avere la popolazione concentrata in piccole zone, bisognava anche avere una struttura statale o parastatale che consentisse di procedere a questo conteggio. Per il mondo occidentale, l‟unica struttura che si era veramente sviluppata a livello regionale importante era l‟Impero Romano. La Grecia era limitata a delle città, le famose città stato. L‟impero di Alessandro Magno era troppo breve per poter durare, per sviluppare una struttura statale e non strutturato per effettuare censimenti e poi si è sfaldato dopo la morte di Alessandro Magno, qualcosa c‟è stata coi persiani. A livello puramente occidentale la prima struttura statale che si è sviluppata è stata l‟impero romano. Si sono sbizzarriti i romani, hanno fatto una quantità enorme di censimenti. Quali erano le finalità? - Di tipo militare, quante unità dislocare sui diversi territori e province per poterlo controllare; - Tributarie: per la stima dei tributi dovuti in base a beni posseduti. Quante persone ci sono, quanti soldi devo incassare da ciascuna provincia. Se non so i contribuenti non riesco neanche a stimare il gettito fiscale. Chi è stato l‟imperatore che ha portato lo sviluppo del censimento è stato Ottaviano Augusto, in un periodo di pace e calma, ha iniziato, ha continuato e sviluppato questa regolare attività di censimenti. Ottaviano Augusto è a cavallo dell‟anno zero. I censimenti dell‟età augustea possono essere suddivisi in tre categorie: 1) Censimenti universali: fatti per conteggiare i cittadini militari. Se ricordate l‟esercito romano era fatto solo di romani, non anche di barbari. Almeno quasi sino alla fine dell‟impero. Tra le ragioni che vengono addotte oltre alle questioni economiche, per la caduta dell‟impero romano c‟è stata anche l‟introduzione di popoli barbari all‟interno dell‟impero; 27 2) Censimenti provinciali: per determinare la ricchezza e la tassazione del territorio, per sapere quanto si doveva prendere come gettito fiscale, rivediamo la seconda ragione vista prima, ragioni tributarie; 3) Censimenti di alleati: l‟impero romano aveva degli alleati, o degli stati tributari. È chiaro che per uno stato alleato dover dire quanto erano i propri residenti equivaleva a dire se facciamo una ribellione siamo tot. Con questa tipologia di censimenti l‟impero romano sapeva qual era la potenziale minaccia di ribellione in uno dei paesi alleati. Solitamente niente di questo era molto gradito, in particolare le ragioni tributarie e i censimenti di alleati. Solitamente ad ogni censimento corrispondeva una rivolta. L‟informazione statistica era troppo importante. I censimenti dell‟età Augustea, non pensate che ve lo chieda all‟esame, solo per vostra informazione, avevano una discreta regolarità, dal 30 avanti Cristo al 36 dopo Cristo: - 30 a.c. Egitto - 28 Universale per l‟esercito - 27 a.c. Gallia - 15 Egitto - 12 Gallia - 10 Sicilia - 8 Universale, dopo all‟incirca una generazione. - 2 - Egitto - 7 Cirenaica - 6 d.c. Siria e Giudea - 14 Universale - 16 Gallia - 36 Spagna Lusitania e Cappadocia Per avere sempre una informazione sull‟impero. Ne osservate uno in particolare? Siria e Giudea. Perché Gesù che era nazzareno è nato a Betlemme? Perché c‟era il censimento. Giuseppe e Maria stavano andando verso Gerusalemme per registrarsi per il censimento. Arriviamo al medioevo. Buco temporale notevole tra la caduta dell‟impero romano e il medio evo. Con la caduta dell‟impero romano, arrivano i barbari e non portano la struttura statale ben strutturata. Quella struttura statale dei romani viene a collassare, viene a mancare il concetto di stato, (lo stato moderno viene a svilupparsi da questo periodo in poi), di fatto viene a mancare la struttura che possa condurre lo studio censuario. Arriviamo a censimenti spot, sparpagliati, non contemporanei nei posti dove si va a formare maggiormente una identità statale. Nel 1886-7 Guglielmo il Conquistatore, l‟ultimo che ha conquistato l‟Inghilterra, preso possesso del suo regno, ha iniziato un 28 censimento preciso e puntuale per descrivere beni, persone e terre del suo regno, chiamato Domesday Book = Libro del giorno del giudizio. Non c‟era niente, neppure un pezzo di terra, un maiale, capra e pecora che potesse scappare a questo censimento, come nessuno scapperò al giorno del Giudizio. Censimento meticoloso per finalità puramente, esclusivamente fiscali. Ci sono stati altri censimenti di tipo meno interessante. Il ruolo più importante a livello di dati storici del periodo medioevale o tardo medioevale sono quelli raccolti dalla Chiesa, nel mondo occidentale dove la chiesa cattolica si è andata a diffondere maggiormente. Pur non essendo veri e propri censimenti la struttura della Chiesa è molto capillare è quanto più simile si possa ipotizzare essere una struttura statale a livello europeo. Avevamo i registri per ogni parrocchia dei: - Battezzati - Matrimoni - Defunti - Stati delle anime (parrocchiani vistati nelle case per la benedizione pasquale) - Fuochi (intesi come famiglie) Qualcosa del genere avrete sentito a Storia economica. Se vedete, in realtà, tutto ciò è stato reso obbligatorio a partire dal 1545-63 con il Concilio di Trento. I dati più interessanti e completi sono disponibili per lo più dal tardo XVI secolo in poi, fine „500. Nel 1600 peste in Europa che ha fatto stragi. Molto spesso ci sono dati di alcuni comuni prima del passaggio della peste e dei paesi vicini dopo la peste, si perde una visione di insieme. Due comuni, uno ha la popolazione prima della peste molto alta, uno dopo la peste ed è molto basso, non si costruisce la popolazione per un paese o regione in un certo anno con precisione. È un po‟ complicato. Finalmente le nazioni iniziano a formarsi, arriviamo allo stato moderno. Tra il 1700 e 1800 gli stati si formano in maniera più stabile: Francia, regni germanici, paesi scandinavi, Stati Uniti, sono paesi che si formano e consolidano come paesi, con strutture amministrative centralizzate Questi paesi, nel nord Europa, in particolare Svezia e Norvegia, effettuarono rilevazioni di carattere: - Periodiche - Simultanee - Nominative - Universali - Neutrali Arriviamo così al censimento moderno che ha queste 5 caratteristiche. 29 Periodiche? Bisogna dare una periodicità, regolarità, temporale all‟indagine censuaria. Noi facciamo censimento ogni dieci anni. Mussolini aveva provato ogni 5 anni ma poi scoppia la guerra e non li facciamo più. Simultanee. Abbiamo visto il problema: prima peste e dopo peste. È importante che il censimento venga condotto su un territorio nello stesso istante, con riferimento alla stessa data. Il censimento dell‟anno scorso aveva come data di riferimento mi pare il 16 ottobre. Sappiamo popolazione residente o soggiornante in Italia al 16 ottobre. Anche se viene compilato successivamente a quella data, i dati che si chiedono fanno riferimento a quella data in maniera tale che siano uguali per tutti . Nominative. Contate testa per testa, ogni singola persona. Rilevazione nominativa di ogni singola persona. Universali. Non voglio solo sapere chi ha più di vent‟anni. Voglio conoscere tutti gli italiani, anche i neonati, senza discriminazioni di genere. Se andiamo a vedere la frase che abbiamo visto sulla conta degli Israeliti solo maschi no, noi vogliamo anche le femmine, senza discriminazione di religione o altro. Neutrali C‟è stata una piccola discussione in ambito cittadino, senza che i rispondenti siano invogliati a mentire. Se devo rispondere al censimento, do informazioni vere e rimango fregato perché sono un evasore fiscale e mi beccano, do informazioni sbagliate anche al censimento. Se mi viene garantito che i miei risultati non vengono mai utilizzati per finalità fiscali, tributarie, allora sarò più invogliato a dire il vero. Se ricordate, il Secolo aveva scritto: coi dati del censimento il comune scoverà i furbetti dell‟IMU o una cosa del genere. Il comune non potrà mai avere accesso e sapere le informazioni che i cittadini danno all‟Istat. L‟Istat ha garantito e garantisce che i dati raccolti attraverso il censimento non verranno mai utilizzati per altra finalità se non quella dell‟Istat: conoscere gli italiani e le risposte. Non verranno mai utilizzati per incroci per esempio con la anagrafe tributaria. Potete essere d‟accordo o meno, è il punto fondamentale per la neutralità delle risposte nel censimento. Dev‟essere neutrale per far si che gli italiani non siano intenzionati a mentire, non abbiano vantaggi a mentire o svantaggi a dire il vero. Ci sono problemi che possono emergere che sono non banali. Quando si entra nella pratica di queste attività ci sono problemi di varia natura. Per esempio, a Genova è abbastanza facile che chi ora è Italiano sia nato in Italia, Genova è sempre stata in Italia. Chi rispondeva al censimento a Trieste è nato austriaco ma loro si sentono nati italiani. La cittadinanza dei genitori era italiana o straniera? Per forza straniera per forza, Trieste era del regno asburgico. Ci sono problemi pratici che complicano le rilevazioni dei dati. Censimenti moderni: 1749 Svezia 1769 Norvegia Spagna 1790 Stati Uniti, non 1776. 1776 è importante anche per un‟altra data. Chi ha pubblicato cosa? Adam Smith pubblica la ricchezza delle nazioni. Irlanda 30 Australia Olanda 1861 Regno d‟Italia appena formati, subito censimento per fare le elezioni. Censimenti in Italia, siamo stati non bravissimi per regolarità. Primo 31/12/1861, poi secondo dieci anni dopo 1871 e terzo 81, più che bravi. Poi mancano i soldi e non si è più fatto il censimento. Poi dopo vent‟anni altro censimento e si è andati avanti cambiando data dieci febbraio e dieci giugno. Successivamente siamo arrivati al periodo fascista. Mussolini ci tiene sotto controllo: meglio contare bene, anziché decennale quinquennale. Aveva una particolare sensibilità nei dati, lo aiutava a capire cosa fare e come farlo. Peccato che non usavano ancora i sondaggi elettorali, sennò sarebbe stato un utilizzatore frequente. Tra il sesto e settimo censimento nel 1926 abbiamo la Costituzione dell‟Istituto centrale di Statistica. Poi bravi ad eccezione del fatto che nel 1941 saltato per modelli bellici: dal 1951 al 2001 (9 ottobre, non il 16) regolarità decennale e 2011 quindicesimo censimento. Abbiamo visto che prima era per motivi militari. Motivi tributari, abbiamo visto che non si può più utilizzare perché il censimento per essere attendibile dev‟essere neutrale, non spinge i rispondenti a rispondere il falso. A cosa serve il censimento oggi? Per conoscere e per conoscerci. Dobbiamo capire quanti siamo, per definire la cosiddetta popolazione legale. Da qui a 10 anni Genova e la Liguria avranno lo stesso numero di deputati e sentori a meno che non vengano ridotti come numero. Il numero dei rappresentanti in parlamento è definito in base proporzionale al numero di residenti. Se tra 10 anni ulteriore calo della popolazione genovese potremmo avere meno rappresentanti in parlamento. Essendo di meno abbiamo diritto a meno posti. Questa è la popolazione legale, rilevata attraverso il censimento, non è basata su dati amministrativi. Col censimento si fanno operazioni di rettifica e pulizia della popolazione residente che risulta dalla anagrafe. La anagrafe non necessariamente è corretta. Ci sono persone che sono in anagrafe e non dovrebbero esserci e persone che non sono in anagrafe ma ci dovrebbero essere. Può essere fatto per fare il censimento delle abitazioni. Rilevate abitazioni che al catasto non sono presenti. . Dopo di che c‟è tutta una serie di domande relative a fenomeni che non possono essere rilevati in maniera amministrativa. La tipologia di riscaldamento utilizzata, come è fatta la costruzione in cui vivi, come è fatta la casa, la usi come ufficio, di quanti vani è composta? Con questo si analizza l‟evoluzione. Domande specifiche sugli immigrati, sugli immigrati di seconda generazione e così via. Il censimento adesso non ha più un senso militare né tributario ma ha un senso conoscitivo della struttura della popolazione. 31 Il censimento, abbiamo detto essere una indagine esaustiva della popolazione, raggiungiamo tutte le persone sul territorio e facciamo a queste persone domande relative ad una data specifica, simultaneità. Non tutti i paesi fanno così. In Francia si usa un sistema diverso che ha i suoi pregi e difetti: rolling Census o censimento rotante. È una soluzione sviluppatasi in Francia per sopperire alla carenza che loro hanno di database amministrativi. Non hanno archivi anagrafici a livello né locale né centrale. Cosa si fa? Anziché fare un unico censimento su tutto il territorio nazionale ogni 10 anni, si fa un censimento continuo, però su piccole aree, a rotazione anno dopo anno. È come se noi facessimo il censimento un anno a Uscio, un anno a Recco, poi a Moneglia, poi a Bargagli e così via. Non si fa il censimento contemporaneamente su tutti i comuni. Ogni anno un insieme di comuni viene censito, in realtà non è esattamente censito ma è una indagine campionaria, e ogni anno questi comuni cambiano, generando una ripartenza del ciclo. Si ri inizia con Uscio, Recco, Moneglia, Bargagli e così via. Si chiama rolling perché gira, ruota, rotola. Non viene fatto contemporaneamente ovunque. Poi ci sono zone in cui il censimento è fatto ogni anno. Se noi facciamo un rolling census di base quinquennale per Uscio lo vado a rilevare ogni 5 anni. Ci sono zone in cui il censimento in forma campionaria è fatto ogni anno (città grosse). Abbiamo dati che sono contemporaneamente rilevati o una volta ogni cinque anni, o una volta ogni anno, o una volta ogni tre anni. Si genera una specie di tabella di marcia in cui anno dopo anno le rilevazioni sono diverse. Non sono rilevazioni censuarie, non vengono rilevate tutte le unità che risiedono in un comune, ma vengono campionate. Questo è il Basso Reno, è una regione. Immaginate che sia la Liguria. Ci sono 4 città, comuni al di sopra di dieci mila abitanti. È una slide presa da una presentazione di una persona di una struttura di ricerca francese. In grigio ci sono i comuni al di sopra dei 10 mila abitanti coinvolti in ogni anno. Ogni anno vengono campionate all‟interno di questa città un certo numero di famiglie e vengono intervistati. Alcuni comuni intervistati nel 2004 alcuni nella tornata del 2005-2006-7-8. Finito il giro col 2008 si ricomincia. Gli intervistati nel 2004 saranno intervistati nel 2009, 2010, 2011,2012 e 2013. Si chiama rolling per questo motivo, si ruota. Vantaggi? Permette di avere dati continuamente aggiornati. Avendo questi dati rilevati ogni anno anche se parzialmente, vengono poi combinati e si aggiorna di poco, anno dopo anno, un dataset di rilevazioni con i nuovi dati. Nel 2009, i nuovi dati del 2009 che verranno presi sul rosa verranno sostituiti, anziché commune 2004 troverete commune 2009. Gli altri, 2005-6-7-8 entreranno nell‟‟analisi. Nel 2009 i dati censuari saranno aggiornati solamente in sostituzione con i dati del 2004. C‟è un aggiornamento progressivo dei dati utilizzando questo sistema. È un sistema un po‟ complicato. 32 Il rolling census è una soluzione sviluppatasi in Francia. Rappresenta una alternativa al modello classico del censimento attraverso la conduzione di un‟indagine campionaria cumulativa continua, (perché tengo i dati del 2005-6-7-8 e ci appiccico quelli del 2009, cumulativa perché conservo fino a quando non sostituisco con i nuovi dati), che copre l‟intero paese per un lungo periodo di tempo, in generale anni (per esempio li sono 5) piuttosto che un solo giorno o un breve periodo di rilevamento. Le indagini annuali possono essere condotte durante l‟intero corso dell‟anno o in un particolare mese o periodo di tempo. Più in generale il rolling census combina cicli annuali triennali quinquennali su campioni di popolazione a rotazione. Il metodo comporta rischi rispetto ai due fondamentali aspetti del censimento moderno: - Esaustività delle numerazioni degli individui e famiglie abitualmente dimoranti; - Simultaneità dei risultati Esaustività? Noi l‟avevamo chiamata nominatività e universalità, sostanzialmente universalità. Perché? Possiamo perdere una fetta di residenti che si sono stanziati in altri territori. Se sono nell‟anno rosa, quelli che nel frattempo si sono stanziati nei blu verdi gialli e arancioni li perdo. Se sono soggetto a un periodo di forte immigrazione io colgo l‟immigrazione dei comuni che vado a rilevare, cioè quelli rosa. L‟informazione è più aggiornata però di quella del censimento. col censimento lo faccio ogni 10 anni e il movimento demografico non lo osservo. Così accetto di andare a violare alcuni assunti di un censimento secondo gli standard internazionali, ma anziché avere una informazione aggiornata una volta ogni dieci anni, avrò una informazione con un leggero errore ma si aggiorna continuamente. Rispetto al primo requisito, con la soluzione francese non è possibile ottenere dati della popolazione legale, cioè residente in un comune ad una certa data. Rispetto al secondo requisito, (simultaneità dei risultati)vi è il rischio di diminuire la comparabilità dei dati nel tempo e nello spazio. Infatti con il rolling census diviene necessario accettare risultati costituiti da stime riferite a medie di periodi pluriennali. Devo accettare il fatto di mettere insieme le informazioni del 2009 con quelle del 2008 2007 2006 e 2005. I valori che io ottengo sono dei valori che vanno a cavallo su cinque anni, sono medie su dati che sono pluriennali. Ci vediamo martedì parlando di fonti statistiche ufficiali per la statistica economica. LEZIONE 4 02/10/2012 Finita lezione vedo di caricare le presentazione viste in questi giorni. Ho fatto alcune aggiunte qua e la. Se avete quelle dell‟anno scorso attenti alle differenze. Codice Italiano delle statistiche ufficiali. È in questo ambito che si muove la statistica economica e sociali. 33 Giovedì non c‟è Persico. Mentre lunedì c‟è lezione per quelli del turismo in aula teledidattica. Vi ho aggiunto questa piccola parte perché mancava. Questo è il materiale ufficiale del Sistan, non l‟ho fatto io non mi prendo meriti che non ho. A livello europeo è stato sviluppato un codice di statistiche ufficiali. È differente rispetto al codice della Statistica ufficiale. Perché è il codice italiano delle statistiche ufficiali. Mentre il codice delle statistiche ufficiali è una raccolta di leggi, il codice italiano delle statistiche ufficiali è un insieme di regole, di principi, ai quali si devono attenere gli enti produttori di statistiche ufficiali. Lo vedremo abbastanza brevemente, è un elenco con una piccola descrizione, le cose da dire non sono tantissime. . Il codice italiano delle statistiche ufficiali è del 2010, sufficientemente recente, concepito insieme al codice europeo. C‟è un tentativo di uniformare la produzione statistica ufficiale in tutta l‟Unione europea. Il codice italiano è l‟esito di un processo condiviso di analisi e consultazione che ha coinvolto i principali attori centrali e locali del Sistan. Ha come obiettivo fondamentale la promozione di una cultura comune di attualità a sostegno della quale sono indicati principi e parametri di valutazione degli assetti istituzionali dei processi e dei prodotti della statistica. Per il principio detto prima, che la conoscenza è una forma di democrazia. Dato che il dato statistico è una forma di conoscenza, fonte di informazione e conoscenza, diventa anche forma di democrazia mettere a disposizione questi dati, e che siano corretti. Quali sono le definizioni che possiamo dare di alcuni elementi chiave? Questa è una parte che mancava. Tanti discorsi, ma al definizione formale di statistica ufficiale non l‟avevamo data. La statistica ufficiale è la produzione statistica contenuta nel Programma statistico nazionale (l‟avevamo detto, è importante tenere presente che è produzione statistica tutto ciò che avviene qui) , nei programmi statistici regionali e, in generale, quella prodotta dal Sistan, intendendo tutti gli enti ed organismi pubblici di informazione indicati in quelle leggi. La statistica ufficiale è tutta la produzione statistica sviluppata secondo il programma statistico nazionale o regionali. Questa produzione statistica è quella che viene sviluppata dagli enti che sono indicati in quelle voci. Quali sono gli obiettivi del codice? Accrescere la fiducia nella indipendenza integrità e responsabilità dei produttori della statistica ufficiale, nonché rafforzare la credibilità e migliorare la qualità dei prodotti diffusi. La statistica ufficiale è incontestabile. Se dovete preparare una tesi triennale o specialistica e portate i valori del PIL proposti dall‟Istat o dall‟Eurostat non saranno mai contestati. Se portate dati o informazioni sviluppati da enti non ufficiali produttori di statistica, possono essere contestate queste informazioni: le famose battaglie sui numeri. 34 Quali sono i destinatari del codice? Il codice ha una doppia valenza. Ha dei destinatari che sono gli enti produttori di statistiche, gli enti e uffici di statistica del sistema statistico nazionale per la produzione delle per la produzione delle statistiche e statistiche ufficiali. Per sapere che esiste il codice, gli utenti sono tutti coloro che hanno accesso ai dati, con lo scopo di attestare l‟imparzialità delle autorità statistiche, nonché l‟obiettività, l‟affidabilità e l‟attendibilità delle statistiche da essi prodotti e diffuse. È il discorso di prima. Questo codice, è un elenco numerato, rappresenta i principi ai quali si ispirano i produttori di statistiche ufficiali. Obiettivo di sollevare una sensazione di sicurezza nei confronti delle statistiche ufficiali, si sa che sono prodotte con questo spirito. Sono importanti questi punti per i fornitori di dati ai fini di assicurare loro la giusta tutela della riservatezza. C‟è un punto, riservatezza: i dati raccolti per fini statistici non possono essere diffusi in forma non aggregata. Se date una informazione sulle vostre condizioni di salute o vi viene analizzata la vostra cartella clinica, vi deve essere garantito che i dati sulle vostre cartelle cliniche, dati reddituali, non vengano diffusi in nessun modo, se non in forma aggregata. Quanti sono i malati di sclerosi multipla, malati di tumore, di quanto sono cresciute le malattie della pelle, eccetera. Vediamo i 15 punti. Sono divisi in tre gruppi: contesto istituzionale, processi statistici e produzione statistica. Non mi aspetto che all‟esame li conosciate tutti, ma magari i principali. È possibile una domanda relativa al codice italiano della statistica ufficiale. È sufficiente che mi spiegate cosa è, ricordare le tre categorie e qualche punto che vi ha interessato. Non voglio che li sappiate a memoria come se fossero tabelline o dei pezzi dell‟Eneide. Contesto istituzionale. Quali sono i punti del codice che riguardano la struttura che esegue l‟indagine? I fattori istituzionali e organizzativi influiscono in modo rilevante sull‟efficienza e sulla credibilità della statistica ufficiale. Chi produce statistiche deve essere credibile. Se l‟Istat non fosse credibile, i suoi dati prodotti non sarebbero credibili. La credibilità è un aspetto importante. Gli aspetti da considerare sono: l‟indipendenza professionale. Se l‟Istat producesse dati su ordine del governo di passaggio e taroccasse i dati a seconda del governo ecco che non avrebbe alcuna credibilità, indipendenza professionale significa indipendenza da qualsiasi organismo politico: se il PIL è in calo lo è, non si può dire il falso. Mandato per la rilevazione dei dati. Ci deve essere un mandato che autorizzi la raccolta dei dati, adeguatezza delle risorse, impegno a favore della qualità, riservatezza statistica, imparzialità e obiettività, che sono i sei punti iniziali. Indipendenza professionale è uno dei più importanti. Il mandato per la raccolta dei dati è un mandato giuridico in base al quale vengono raccolte le informazioni. Ci deve essere una legge che sancisce che l‟ente deve raccogliere e produrre informazione statistica. Adeguatezza delle risorse: è importante sapere che un ente dedica risorse adeguate a differenti indagini. 35 Impegno in favore della qualità. Tutti i membri del sistema statistico nazionale si impegnano ad operare e collaborare conformemente ai principi fissati dalla dichiarazione sulla qualità del sistema statistico europeo. Altro punto importante è la riservatezza statistica. Assolutamente garantita la tutela di dati personali dei fornitori di dati: famiglia, imprese, amministrazione ed altri enti rispondenti, così come la riservatezza delle informazioni da esse fornite e l‟impiego di esse ai fini esclusivamente statistici. Sulla prima parte i più importanti sono l‟indipendenza professionale e l‟indipendenza statistica, anche l‟imparzialità e l‟obiettività. Questi i più significativi. Processi statistici. Questa parte, quattro punti, riguarda il processo di produzione, di definizione dell‟indagine. Non è la produzione del dato, è proprio il disegno della procedura attraverso la quale si vanno a raccogliere i dati. Gli orientamenti, le buone pratiche e gli standard nazionali e internazionali vanno pienamente rispettati nei processi utilizzati dalle autorità statistiche per organizzare rilevare elaborare e diffondere le statistiche ufficiali. Un‟efficiente gestione rafforza la credibilità delle statistiche. Gli aspetti rilevanti sono una solida metodologia, procedure statistiche appropriate, un onere non eccessivo sui rispondenti e l‟efficienza rispetto ai costi. Significa che l‟Istat, ma tutte le strutture del Sistan, devono procedere con le più aggiornate metodologie. Se ci sono nuove tecniche, devono cercare di utilizzare nuove tecniche, nuove metodologie. Non vediamo differenze tra tecnica, metodologia e metodo. Usiamoli come sinonimi. Solida metodologia: le statistiche di qualità devono fondarsi su una solida metodologia: ciò richiede, strumenti procedure e competenza adeguata. Procedure statistiche appropriate, onere non eccessivo sui rispondenti, non pesare troppo sugli intervistati facendo mille domande, ma cercando di avere questionari leggeri, efficienza rispetto ai costi: le risorse devono essere usate in maniera efficiente. Infine, come devono essere i dati che vengono pubblicati prodotti? La prima parte riguarda l‟istituzione, l‟ente che va a produrre dati. La seconda parte è il modo in cui produciamo dati e il terzo è il prodotto. Abbiamo l‟azienda, la macchina per fare i biscotti e i biscotti, le tre parti. La produzione statistica è il risultato del processo statistico. Le statistiche disponibili devono soddisfare le esigenze degli utenti. Rispettano le norme sulla qualità e rispondono ai bisogni delle istituzioni, amministrazioni pubbliche, istituti di ricerca delle imprese e del pubblico in generale. Aspetti importanti delle statistiche sono la pertinenza, accuratezza, attendibilità, tempestività, coerenza e comparabilità. Li rivedremo la settimana prossima. Una volta si credeva che una produzione statistica fosse adeguata, buona, quando era accurata, quando stimava in maniera corretta una certa quantità, ora gli aspetti sono più ampi. Pertinenti, devono avere un senso, non si fanno statistiche che non hanno senso. devono essere accurate e attendibili, rispecchiare la realtà. 36 Devono essere tempestive e puntuali, è inutile fare una indagine e pubblicare i dati del 1995 oggi. Devono essere tempestive, veloci, più aggiornate possibili. Coerenza e confrontabilità. Ragioni ovvie. I dati devono avere coerenza, i dati devono essere calcolati nello stesso modo coerentemente in modo da garantire confrontabilità nel tempo e nello spazio. Se misuro l‟inflazione secondo un certo criterio, questo criterio deve valere per tutta Italia, Europa, usando lo stesso criterio per molti anni così ho una confrontabità non solo spaziale ma anche temporale. Accessibiltà e chiarezza. Le statistiche ufficiali devono essere presentate in una forma chiara e comprensibile, devono essere diffuse in maniera conveniente e opportuna, ed essere disponibili ed accessibili con imparzialità, con i relativi metadati, e le necessarie istruzioni. Cosa sono i metadati? Piccoli documenti, abbastanza brevi ma qualche volta anche piuttosto lunghi, che descrivono come i dati sono stati raccolti, da chi sono stati raccolti, contengono anche delle definizioni, cosa si intende per disoccupato se si ha un indice di disoccupazione, è un testo che descrive la modalità di raccolta dei dati in maniera tale da garantire nello spazio e nel tempo, a persone di altri paesi o di altri tempi, di sapere come ciascun indice è stato calcolato, si chiamano metadati. Famosa terna: Micro macro e mega dati. Microdati sono le singole rilevazioni. Ciascun foglio di famiglia del censimento è il micro dato, la singola unità statistica. Macro dato aggregazione delle singole unità statistiche, quanti siamo, in Liguria a Genova, , gli stranieri a Genova, disoccupati a Genova, eccetera. I meta dati sono le descrizioni di questi dati. Che cosa sono, come sono stati calcolati in che periodo, se sono periodi differenti e così via. Tutto questo lo troverete su aula web spero da oggi pomeriggio. Ho aggiunto una piccola slide sul censimento, è inutile guardarla, è abbastanza breve. 37 LE FONTI STATISTICHE UFFICIALI DELLE STATISTICHE ECONOMICHE E SOCIALI Ci focalizziamo sulle fonti delle statistiche ufficiali in ambito economico e sociale, in particolare ci soffermeremo su Istat ed Eurostat, sono le strutture che maggiormente vengono utilizzate. Una piccola premessa. Sappiamo che l‟Istat è principale ente produttore della statistica ufficiale in Italia. Lo sappiamo, l‟abbiamo definita, sappiamo come è stata costituita e perché, quali sono le indagini principali che fa, ma come pubblica i dati? I canali sono gli stessi sia per l‟Istat e per altri enti nazionali, nazionali esteri o internazionali di statistica. I canali sono sempre tre. Comunicati stampa brevi e frequenti relazioni di carattere anche mensile su alcuni fenomeni importanti. Ogni mese abbiamo le stime su disoccupazione, indice dei prezzi PIL eccetera, produzione industriale. Banche dati, dati che possono essere rianalizzati. Volumi e pubblicazioni annuali o studi monotematici di approfondimento. Gli stranieri a Genova. Un lavoro specifico sugli stranieri a Genova, per esempio. Inoltre, è importante che tutti i lavori delle statistiche pubblicate da enti che rientrano nel Sistan siano accompagnati dal curatore o dai curatori del volume. Se voi state cercando dei dati sul turismo, o sull‟economia della cultura, e non trovate quello che cercate, su queste pubblicazioni, o su questi siti, trovate sempre il nome di un riferimento al quale potete chiedere approfondimenti. Oltre a questi, è possibile che vengano distribuiti dei micro dati. Già citati prima. Sono i dati relativi alle singole rilevazioni. Se si fa uno studio sugli accessi ai musei genovesi, è possibile che non solo venga detto quanti accessi sono stati fatti a Genova, ma anche che siano disponibili dati con accessi per ciascun museo in ciascun mese dell‟anno. È un micro dato che non verrà pubblicato, non si può pubblicare sempre tutto quello che si raccoglie, ma se si fa uno studio di relazione tra i passeggeri sbarcati a Genova per le crociere e gli effetti sugli accessi ai musei genovesi ecco che dovete sapere mese per mese quanti sono stati gli sbarchi e l‟accesso ai musei genovesi. Correlazione tra i fenomeni, dipendenza del numero dei musei e croceristi e potete provare a sviluppare un modello. Ci sono situazioni in cui i dati non sono pubblicati e non sono disponibili. Si può alzare il telefono e chiedere: sono uno studente unige, tesi su questo, vorrei sapere se è possibile avere dati più dettagliati, micro dati, relativi a questi studi. Vi possono dire si, no, ci sono ma non potete averli perché coperti da privacy perché magari sono dati sanitari. Il problema principale che c‟è con la produzione statistica ufficiale è di tempestività. I dati devono essere tempestivi. Perché se pensiamo al censimento 2001 è stato completato il 21 luglio 2005, ci sono voluti quattro anni per completare tutta la procedura censuaria. Ci sono problemi di tempestività nella produzione statistica 38 ufficiale. Questa è la ragione per cui molto spesso vengono utilizzati questi documenti flash, comunicati stampa, di cui parlavamo prima, che anticipano studi più completi. Guardiamo il sito dell‟Istat. Se voi fate www.istat.it ottenete una pagina web fatta in questo modo. Ci siete mai andati sul sito Istat? Andateci a vederlo, anche se c‟è di meglio da fare. È molto cambiato rispetto alla versione di due anni fa. Chi ha la vecchia presentazione vedrà cambiamenti. È cambiato profondamente come interfaccia. La navigazione può avvenire su più livelli. A sinistra ultime notizie, che cosa è stato pubblicato: elenco amministrazioni pubbliche, occupati disoccupati mensili, codici comuni provincia e regioni, ci sono una serie di news, ultime novità di dati e produzione statistica dell‟Istat. Dopodiché c‟è questa parte centrale in cui vi viene dato un grafico in tempo reale sui dati di una qualche caratteristica, in questo caso dovrebbero essere gli occupati. Ci sono altre opzioni che possono essere scelte. Abbiamo un banner che da notizie chiave e una forma di navigazione che potrebbe sfuggire: prodotti strumenti informazione, statistiche per regione ed argomento. Il sito dell‟Istat è il primo riferimento per le statistiche ufficiali italiane. La home page contiene dati aggiornati sui temi di interesse economico e sociale. I grafici mostrano le serie storiche, rilevazione dello stesso fenomeno nel tempo ad intervalli di tempo equi spaziati. Notizie e menu che permettono di trovare le notizie per regione e argomento. Se volete produzione statistica dell‟Istat sulla Liguria, in alto a destra. Immaginiamo di prendere argomento. Strutture e competitività dell‟impresa, ambiente energia, popolazione, condizioni economiche delle famiglie, prezzo, lavoro, cliccate la sopra e si apre la pagina relativa all‟argomento con le ultime pubblicazioni relative all‟argomento e grafici interattivi sull‟argomento, in questo caso prezzi. Proviamo ad aprire conti economici trimestrali. Nel secondo trimestre 2012 il PIL cala dello 0,8% rispetto al trimestre precedente e del 2, 6% in un anno. Notizia in breve andiamo a leggere sull‟argomento. Clicco su conti economici trimestrali e si apre una pagina sul documento con una prima descrizione: nel secondo trimestre 2012… Ogni sezione racchiude novità e studi approfonditi sugli anni precedenti. Ad ogni analisi vengono associati vari documenti. Testo integrale (nella colonna al centro), serie storica, triangoli di revisione, scheda di revisione. No nel dettaglio per i triangoli di revisione. Sono tutti documenti che vanno associati ad un unico soggetto. Se guardate li in fondo, sono indicati numeri telefonici. Se volete avere informazioni aggiuntive trovate l‟e-mail e il numero di telefono per contattare la persona. Proviamo a guardare il testo integrale. Cosa è? È un documento fatto in questo modo. File pdf di un certo numero di pagine, sette pagine, con sei tavole, figure e grafici. Un glossario, cosa si intende per ciascun aggregato di dati, e nota metodologica per sapere come sono stati raccolti i dati e in che modo sono stati analizzati. Ciò risponde a criteri tempestività e trasparenza. Le notizie flash, una volta si chiamavano comunicazioni, dà l‟idea di fotografia veloce sull‟argomento. Non sono 39 lavori sistemici. Parlano dei conti economici trimestrali del secondo trimestre 2012 e ci dicono anche quando ci sarà prossima diffusione, 10 dicembre 2012, state sicuri che uscirà il nuovo documento, ci diranno andamento PIL a livello tendenziale e congiunturale. Poi ci sono tavole dati. Posso scaricare dati associati a documenti con struttura in excel di questo tipo. Differenti rispetto alle tavole dati sono le Banche dati Istat, ce ne sono parecchie, con tanti dati disponibili. I.stat offre un patrimonio informativo statistico completo ed omogeneo. I dati sono organizzati per temi, presentati in tavole multi dimensionali e corredati di un ampio apparato di meta dati, cioè di descrizione dei dati. Se voi andate a guardare sulla sinistra dati su censimento agricoltura, censimento popolazione e abitazioni, ambiente ed energia, salute e sanità, sono le stesse categorie viste nel menu per argomenti. Si può cliccare su uno di questi campi e si aprono le tabelle che si possono rielaborare differentemente. I metadati sono un insieme di informazioni che servono a capire come i dati resi disponibili siano stati raccolti e come debbano essere interpretati. Metadati PIL troviamo questa spiegazione. Poi vedremo presentazione specifica sul PIL. Il 19/10/11 l‟Istat ha rilasciato le nuove serie annuali di conti nazionali basate sulle versioni più aggiornate della classificazione dell‟attività economica nel tempo e dei prodotti per attività. Allo stesso tempo, come in altri paesi europei, le serie storiche dei conti nazionali sono state oggetto di una revisione straordinaria alla quale ha beneficiato di miglioramenti nei metodi e nelle fonti. Il PIL ai prezzi di mercato rappresenta il risultato finale dell‟attività di produzione dell‟unità produttrice residente. Deducendo dal PIL gli ammortamenti si ottiene il prodotto interno netto…. Spiega tutto come è stato calcolato, perché non ci siano dubbi su come è stato derivato. Ci sono anche altre banche dati. Per esempio possiamo avere dati su serie storiche sempre su argomenti, si perde un po‟ di confronto rispetto alle statistiche per argomenti: ambiente energia, popolazione famiglia, sanità, salute, giustizia, istruzione, cultura, eccetera. Se vogliamo avere dati nel tempo, questa risorsa può essere disponibile. Questi dati sono stati raccolti secondo i criteri del codice delle statistiche ufficiali. Anche altri dataset: statistiche per le politiche di sviluppo, sistemi di indicatori territoriali, Sistema Amministrativo Storico della Amministrazioni Territoriali (Sistat), l‟atlante statistico territoriale delle infrastrutture, l‟atlante statistico dei comuni . Tutti questi sono nel sito dell‟Istat, queste sono banche dati esclusivamente trasversali che includono più argomenti: economia, sociale, popolazione. Poi altri dataset puramente economici, per esempio Rivaluta, non è una banca dati, ma un servizio che permette di aggiornare secondo l‟inflazione per esempio gli assegni familiari. Se era stato stabilito che un marito desse 1.500 euro alla moglie nel 2006, quanto deve dare oggi secondo le rivalutazioni? Si usa questo sistema, ufficiale dell‟Istat, inattaccabile. 40 Coeweb statistiche del commercio estero. National Summary del FMI, una pagina riassuntiva contenente dati più significativi prodotti da Istat, BDI Ministero dell‟economia e delle finanze secondo gli standard richiesti dal FMI. E poi dati congiunturali sulle retribuzioni contrattuali. Ancora altri di ambito economico. Abbiamo il sistema informativo su agricoltura e zootecnia e il sistema di indagini sulle acque. Tutti dati che vengono prodotti dall‟Istat pubblicati e resi disponibili a tutti. Perché vi faccio questa carellata? Perché non ho la più pallida idea di che tesi voi farete per la vostra triennale. Può capitare che vi serva qualcuno di questi dati, almeno sapete che c‟è una fonte statistica ufficiale che produce questi dati. Se farete tesi di tipo economico, con un minimo di aspetto quantitativo, non proprio una tesi di diritto pura, se cercate dati li potete trovare qua, serie storica, ma anche Isat o I.stat è uno dei punti di rifermento più importanti sull‟Italia, poi vedremo cosa fa l‟Eurostat a livello europeo. Demo Istat per aspetti più demografici, come indirizzo dovrebbe essere demo.istat.it, che permette di sapere la popolazione residente per età sesso e stato civile a livello di comune, inclusi gli stranieri. Da anche le previsioni della popolazione, non a livello di comune ma a livello di provincia. Ci sono anche previsioni della popolazione sino al 2065 a livello italiano e a livello provinciale. Questo può essere interessante per chi vuole fare una indagine sul servizio sanitario nazionale e vuole capire la situazione demografica (anziani maschi femmine stranieri) di qui a dieci venticinque anni. Ci sono anche altre banche dati di tipo sociali. Abbiamo un dataset sulla coesione sociale, simile come struttura a I.stat, struttura simile, che raccoglie le statistiche relative agli aspetti di coesione sociale: biografia, lavoro, capitale umano, portatori di handicap (quanti portatori di handicap si sono iscritti nelle scuole), eccetera. Poi ci sono sistemi informativi su professioni, sulla giustizia, cultura, scuola università e lavoro, altro dataset molto importante è Health for All, si utilizza spessissimo, raccoglie dati non solo sulla salute, ma anche permette di sapere le cause di mortalità, quante sono le malattie croniche, infettive, quanto viene dedicato di bilancio alla spesa sanitaria di ciascun paese. L‟Italia aderisce a questo sistema internazionale di database sanitario, e poi dati sulla disabilità. Infine, ormai stanno morendo, se ne fanno molto di meno, le monografie, “Il valore della moneta in Italia dal 1961 al 2008”, sono studi che vengono fatti una volta ogni tanto. Questo è del 2009, difficilmente verrà riaggiornato se non tra parecchi anni. A quel punto le rivalutazioni vengono fatte usando Rivaluta. Non fate trarvi in inganno da questo prezzo: 20 euro. Tutti i documenti dell‟Istat sono assolutamente gratuiti, si possono scaricare in pdf. 20 euro costa la versione cartacea, allora è un discorso. Andate un po‟ a vedere il sito se ne avete voglia. È interessante capire quanti dati siano disponibili. Se uno ha bisogno di dati prova a vedere se trova quello che serve. 41 Voglio che vi rimanga nel cranio che sul sito di Istat ed Eurostat trovate vari dati sicuri, validati, incontestabili, sugli argomenti della vostra tesi di laurea. L‟EUROSTAT. Non ha un indirizzo www. Eurostat.it scrivete Eurostat su Google e lo trovate immediatamente. Ha varie sezioni. Selezionate statistics in alto a destra e quello che ottenete è questa pagina in cui avete le statistiche suddivise per tema o argomento. Avete statistiche generali e regionali, economia finanza, popolazione e condizioni sociali, industria commercio e servizi, agricoltura e pesca, commercio estero, trasporti, ambiente ed energia, scienza e tecnologia. Prendiamo economia e finanza, sezione più ampia. Seleziono HICP Indice dei prezzi al consumo armonizzati. Che cosa succede? Arriviamo ad una struttura simile a quella vista dell‟Istat. Trovo tabelle, database, e documenti sotto forma di news o flash, o documenti che sono annuari che ricoprono un intero anno. Gli indici dei prezzi fanno riferimento all‟inflazione. C‟è una piccola descrizione del fenomeno inflazione e cosa include l‟indice dei prezzi al consumo armonizzato, e seleziono principali tabelle. Si aprono dei documenti di questo tipo: IPC tutti beni: cibo alcol tabacco, vestiti, casa, salute, trasporto, comunicazione, ricreazione e cultura, educazione. Tutti gli item esclusi energia cibo alcol e tabacco. Questi dati sono rappresentati a livello mensile per tutti i paesi UE. Sono indici armonizzati. Il valore di base indice 2005 uguale 100. Su questi vedremo ulteriormente. Mi interessa che vi permette di avere una analisi storica e geografica dei valori. Confrontabilità temporale e spaziale. Spaziale per riga e temporale per colonna. Inoltre ha anche tre linguette: table, graph map. Vi permette anche di fare dei grafici se non siete in grado di farli con Excel. Per esempio, sono molto simili, ma abbiamo che la Bulgaria ha avuto dal 2005 al 2011 un aumento dei prezzi del 40%, Estionia 30% Grecia incremento 20% e altri paesi sono allineati. Abbiamo la zona euro, Belgio, Repubblica Ceca, Danimarca, eccetera. Si possono selezionare varie opzioni. Altra cosa carina da sfruttare ai fini della tesi è la rappresentazione su mappa. Vi colora diversamente i differenti paesi per intensità del fenomeno. Vediamo Italia, Svizzera, Germania, Francia, Olanda e Irlanda valore compreso tra 104 e 110. Turchia Bulgaria Ungheria e Romania hanno avuto una crescita dei prezzi nell‟ordine 30-56% dal 2005 a 2011 anche i Paesi Baltici e l‟Islanda. Questo come prima rappresentazione. È poi possibile avere una rappresentazione a livello regionale per i dati forniti a livello regionale. Questa è una rappresentazione naz2 mentre questa è una rappresentazione è naz1 dove naz sono le Unità statistiche territoriale di livello 1-2-3 (paesi, regioni, province); con l‟Eurostat non si arriva al naz 3, ci si ferma al due. In questo caso ho il trasporto marittimo secondo le naz2. Vengono escluse, sono grigie, dati non disponibili, i terreni che non hanno un porto. L‟Italia è abbastanza colorata tutta perché quasi tutte le regioni hanno un porto. Tutta la Costa azzurra, Costa brava, Lusitania, nord della Spagna, Francia e Inghilterra sono colorate come 42 coste perché evidentemente hanno i porti. Queste sono mappe che si possono ottenere con pochi clic e sono di aiuto per la lettura dei dati e della loro visualizzazione su cartina geografica, servizio totalmente gratuito. Anche qui abbiamo i meta dati che ci dicono come sono raccolti i dati. In questo caso la descrizione più complessa, ci sono a volte differenze tra i paesi che devono essere esplicitate. Poi ci sono una serie di database piuttosto importanti. Per esempio i dati mensili complessivi, abbiamo i pesi dei differenti paesi, ci sono tutta una serie di informazioni. I database hanno una struttura tabellare, abbiamo i paesi e anni. Come produce i dati l‟Eurostat? Esattamente come l‟Istat. Produce i documenti che si chiamano news releases ma di ambito europeo. Ad esempio l‟inflazione nell‟area euro è salita al 2,4%, invece l‟Unione Europea è stabile al 2,8%. Documenti che si assomigliano alle notizie flash dell‟Istat. Sono documenti brevi, di poche pagine, che vengono rilasciati in date ben stabilite. Disoccupazione gennaio 2011 giorno 1. Rilasciato… Scorrendo l‟elenco vedo ciò che è stato rilasciato e quello che non è ancora stato rilasciato. Se ci sono ritardi si indica delate e viene indicato quando verrà rilasciato. Questo per avere una informazione tempestiva, un supporto complessivo nelle decisioni. Poi ci sono dei documenti un pochino più approfonditi. In questo caso ci sono gli indici armonizzati dei prezzi al consumo, documenti un po‟ più lunghi, sette pagine, lo vedete scritto piccolino, documenti chiaramente gratuiti e disponibili. Se andate sul web Eurostat potete trovare queste news elencate. Sono documenti abbastanza scarni, vorrei vedere con voi un documento ufficiale, che descrivono gli avvenimenti di riferimento (importante). È importante sapere che la produzione statistica ufficiale non dà mai interpretazioni di quello che è successo. Si limita a dire che il Pil è cresciuto del 2,8%, in particolare la produzione industriale è cresciuta dell‟1,2% e l‟altro settore è cresciuto di più. La disoccupazione è diminuita. Nel dettaglio è diminuita tra i giovani. Non ci sono interpretazioni. Non spetta né a Istat né a Eurostat dare interpretazioni di ciò che è successo. Troverete descrizioni e confronti con ciò che è successo nel passato. Non troverete ami spiegazioni del perché è cresciuta inflazione, del perché siano scesi turisti o siano aumentati i malati di tumore. Ci saranno sempre confronti spaziali e temporali, non perché. Non spetta all‟Istat dare interpretazioni. Devono essere oggettive, ne abbiamo parlato prima. Nelle 15 regole c‟è la regola di oggettività. Le relazioni statistiche ufficiali sono puramente oggettive. Poi ci sono anche i libri e i tascabili (poketbooks). Documenti corposi su statistiche economiche europee e statistiche di prezzo europeo. 300-600 pagine pieni di tabelle e grafici di raffronto in cui si danno delle letture delle tabelle: dopo la caduta del muro di Berlino i prezzi in Russia sono aumentati di tot, si danno degli andamenti. Differenti i poketbooks, libretti di 200 pagine, di formato non standard, non di formato A4, sono la metà di un A4, che contengono aspetti chiave. Per esempio i 43 poketbook dei dati economici dell‟UE, valori chiave su business europeo, manuale sulle statistiche euro mediterranee. Hanno tutte logo Eurostat, commissione europea. Anche qua abbiamo dei documenti puramente metodologici per la ragione di solidità della metodologia. Ci sono dei lavori che dicono come deve essere condotta una indagine sulla povertà e la deprivazione materiale nei paesi europei. Se l‟Eurostat concorda con gli enti statistici nazionali di andare a fare una indagine sulla povertà, questo concordare significa realizzare assieme un manuale che detti le regole operative. Allora tutti i paesi aderenti all‟UE e che producono statistiche per l‟Eurostat e la CE si adeguano a queste direttive in maniera che i dati abbiano una perfetta confrontabilità, perché finiranno in un calderone unico, come le tabelle che abbiamo visto prima, paese ed anno. Se vado a vedere statistiche che l‟Eurostat produce, sono tutte statistiche che fanno riferimento ad ambiti europei. Non trovate grandi statistiche sulla giustizia, ma statistiche sull‟ economia (perché è un sistema unico), sulla popolazione. C‟è qualcosa su crimine e giustizia criminale. Però in linea di massima le dimensioni principali sono le dimensioni di competenza dell‟UE. Quindi grossi fenomeni, macro economici. Sono principalmente variabili di interesse macro economico. Ci vediamo martedì prossimo e parleremo dei dati amministrativi. LEZIONE 5 09/10/12 La prossima volta inizierà il professor Persico, le sue lezioni, e parlerà un pochino delle indagini, dei dati amministrativi che potete trovare all‟interno delle aziende e così via. Aggiornamenti. Spero che in settimana aula web sia attiva in maniera tale da caricare le presentazioni. Tutti i file che ora vedrete li caricherò e metterò su ancora file che non abbiamo visto ma utilizzeremo. Qualcuno sarà modificato, alcuni aggiunti. Sono enumerati in maniera sequenziale per l‟ordine di studio. Come vi avevo accennato, stiamo affrontando temi piuttosto discorsivi. Le domande che vi dovete attendere su questi argomenti sono di tipo teorico. Questa è la ragione per cui io non ipotizzo la prova orale aggiuntiva rispetto alla scritta. Le domande del compito saranno già in parte domande di carattere teorico. Facendo il punto della situazione, siamo partiti definendo il concetto di Statistica, che non avevamo affrontato in maniera così storica in statistica 1, l‟abbiamo guardato in una prospettiva piuttosto ampia, considerando il concetto di statistica e il concetto di probabilità. La statistica economica e la statistica sociale sono prevalentemente statistiche applicate, e la statistica del turismo, sono statistiche applicate a fenomeni differenti. La statistica economica è la statistica macroeconomica, la statistica delle macro aggregazioni economiche. La statistica sociale è la statistica demografica, della popolazione, delle abitazioni, dei modi, delle persone di vivere. Quando parlavamo delle indagini Istat dell‟uso del tempo oppure sui viaggi e vacanze li stavamo parlando di statistica sociale. 44 La statistica economica, come vedrete, si distingue molto da un‟altra disciplina, che si chiama econometria. Mentre la statistica economica ha l‟obiettivo di riassumere fenomeni macroeconomici e sociali, l‟econometria costruisce modelli interpretativi delle fenomenologie economiche. Per esempio, se vogliamo prenderla alla larga, l‟identità keynesiana è un modello macroeconomico/econometrico, le statistiche sulla disoccupazione, come misurare il PIL, l‟inflazione, l‟indice dei prezzi al consumo, la produzione industriale, l‟attività di misurazione dei fenomeni macroeconomici è tipica della statistica economica. Vedrete nel prosieguo dei vostri corsi l‟econometria come costruzione di modelli statistici. Introdotta la statistica economica e sociale in questo modo, ci siamo posti il problema delle produzioni statistiche degne di ufficialità, o degne di essere ritenute più attendibili rispetto ad altre, abbiamo parlato di statistiche ufficiali, con i 15 criteri del codice italiano della statistica ufficiale. Tra gli enti produttori di statistiche ufficiali abbiamo nominato l‟Istat e abbiamo guardato la sua produzione statistica e i modi in cui l‟Istat diffonde le statistiche ufficiali. L‟Istat rientra all‟interno di un sistema di produzione di statistica ufficiale che si chiama Sistan, dovrà anche rinnovare il sito web. Il Sistan è una rete di enti che producono statistiche ufficiali, secondo una legge: programma statistico nazionale. Abbiamo concluso guardando la produzione delle statistiche in ambito economico. Abbiamo guardato come sono fatti il sito di Istat ed Eurostat, essendo l‟Eurostat un non produttore di statistiche ufficiali, quanto più aggregatore di statistiche ufficiali. L‟Eurostat raccoglie in un unico contenitore le statistiche provenienti da tutti i paesi membri. La caratteristica importante di queste statistiche diffuse sul sito Eurostat è che sono tutte omogenee rispetto a modalità di raccolta e di misurazione. Per esempio l‟inflazione viene misurata nello stesso modo,tempi e sugli stessi oggetti. 45 FONTI STATISTICHE E AMMINISTRATIVE: ANALOGIE E DIFFERENZE Adesso parliamo della differenza tra fonti statistiche e fonti amministrative. Abbiamo detto che le statistiche ufficiali si dividono in: fonti statistiche, fonti di dati che nascono proprio per finalità di tipo conoscitivo, statistico. Sono indagini fatte per finalità statistiche, come per esempio il censimento, indagine sulla popolazione e tutte le analisi dell‟Istat. Diverse sono le fonti amministrative. Fonti di dati, di informazioni, che scaturiscono da un processo di elaborazione, di attività, di un ente. I dati dell‟Inps, Inail, i dati dell‟ACI, del registro automobilistico, dell‟anagrafe sono tutti dati che hanno origine amministrativa. Questi enti che ho nominato, non hanno come scopo prioritario quello della produzione statistica, ma hanno come finalità altri scopi rispetto a quello di pura produzione statistica. Tuttavia, raccolgono tutta una serie di dati che possono essere utili e importanti per successive lavorazioni. Un esempio classico di fonte amministrativa è l‟anagrafe. Poi abbiamo anche il PRA oppure il registro delle imprese. Quali sono le analogie e le differenze? Un piccolo ringraziamento alla dottoressa Militello, che è dell‟Istat, grazie alla quale ho recuperato alcune slides. Riprendiamo in mano il discorso su fonte statistica. È il caso in cui l‟informazione è tratta da annuari statistiche e da banche dati statistiche, per esempio il sito dell‟Istat, oppure raccolta mediante appositi questionari. In questo caso si parla di rilevazioni dirette. Sono eseguite dall‟Istat, o da altri enti del Sistan mediante una intervista diretta rivolta alle famiglie, istituzioni, enti, strutture alberghiere eccetera. Le fonti amministrative sono informazioni sulle unità statistiche raccolte dalle amministrazioni pubbliche per finalità proprie dell‟ente: dell‟Inps, del registro automobilistico, o derivanti da obblighi di legge. Esempio decessi, matrimoni, trasferimenti di residenza, denunce di reati, dati sulle strutture sanitarie, produzione scolastica. Queste lavorazioni sono indirette. Non fatte direttamente con finalità statistiche, ma l‟informazione statistica è rilevata indirettamente da questi archivi amministrativi. Le rilevazioni statistiche possono essere caratterizzate da: - Rilevazione completa, o universale, o totale: è estesa a tutte le unità dell‟universo o popolazione statistica, è la classica rilevazione che abbiamo anche chiamato censuaria. Tutti questi termini vanno bene per identificare una indagine esaustiva sull‟indagine della popolazione. Non mi attacco troppo ai termini, vanno bene tutte come definizioni. Abbiamo censimenti, matrimoni, decessi, trasferimenti di residenza; - Rilevazioni parziali. Riguardano una parte dell‟unità dell‟universo, definita specificamente da un ricercatore. Se stiamo facendo una indagine sui laureati, definisco come universo la popolazione degli italiani, ma come popolazione parziale, universo parziale quello dei laureati. Abbiamo il censimento intermedio dell‟industria e dei servizi. È un censimento, una rilevazione parziale. Sembra 46 - quasi una contraddizione. No, non lo è nel momento in cui prendo un universo, per esempio tutte le aziende e vado a fare una partizione di queste aziende e vado a seguire uno studio censuario su questa partizione; Rilevazione campionaria. È una indagine che indaga una popolazione, totale, o partizionata nel modo precedente, ma non in maniera esaustiva, ma campionaria, basata su un campione. Abbiamo discusso abbastanza lungamente sulla indagine campionaria e sulla indagine censuaria. Guardiamo un attimo il confronto tra le indagini totali e le indagini campionarie. L‟indagine paraziale può essere ricondotta, in linea di massima, ad una indagine campionaria anche se è un sottoinsieme dell‟universo di origine. Se vogliamo fare uno studio di tipo censuario, vogliamo raggiungere tutte le unità della popolazione di nostro interesse, andiamo incontro ad evidenti vantaggi e grossi svantaggi. Vantaggi. In primo luogo vediamo che con un censimento ho una ampia copertura del fenomeno di interesse, copriamo tutti i possibili valori. Se cerco di valutare le condizioni di vita degli italiani, con uno studio censuario, noi abbiamo una visione completa. Il risultato è una fotografia completa. Inoltre, se abbiamo un gran numero di unità statistiche, perché stiamo misurando su tutte le unità dell‟universo, stiamo eseguendo uno studio censuario, noi avremo informazioni di dettaglio per tutta la nazione, per ciascuna regione, provincia, comune sino ad arrivare alla singola sezione di censimento, che è una zona con superficie più o meno ampia a seconda della popolazione residente. A Genova nell‟ordine del 130. Le sezioni di censimento coincidono con pochi palazzi. Quali sono gli svantaggi di una indagine censuaria? - Con una indagine campionaria vedo tutte le unità statistiche. Ma a che prezzo? Devo raggiungere ciascuna unità statistica. Il costo di una indagine campionaria è estremamente elevato; - Tempi lunghi. Per raggiungere tante persone c‟è bisogno di molto lavoro e c‟è anche bisogno di tanto tempo per andare a convertire le risposte che sono state raccolte in forma cartacea, convertirle da forma cartacea a forma elettronica. - È possibile che ci siano errori. Se ho tantissimi questionari somministrati e un numero di personale ridotto, è chiaro che vado incontro a errori di compilazione del questionario che possono essere notevoli: mancate risposte, risposte errate, risposte multiple dove dovrebbe essercene una sola, non ho tutto il tempo necessario per fare verifiche sul singolo questionario; - Problemi di copertura. Possiamo avere unità statistiche che possono essere rilevate più volte o più frequentemente delle unità statistiche che non vengono rilevate affatto. Problemi di sotto copertura. Quando la lista non include alcune unità che effettivamente fanno parte della popolazione. Può accadere che ci siano movimenti di residenti che non vengono colti dagli archivi anagrafici, sui 47 - quali si basa inizialmente il censimento. Allora ci sono persone alle quali la scheda del censimento non viene consegnata. Questi sono i classici problemi di sottocopertura, corretti con una serie di tecniche che non andremo a vederema sono interessanti; Non si può pensare di avere quantità e qualità dell‟informazione allo stesso tempo. Se eseguo uno studio su tutta la popolazione, il numero di domande che andrò a fare inevitabilmente sarà ridotto. Non posso dedicare troppo tempo a ciascuna unità statistica per vedere qual è l‟informazione che mi può dare. Molto spesso, negli studi di tipo censuario, l‟indagine è poco approfondita, le informazioni raccolte sono poco approfondite. Diverso il discorso sulle indagini campionarie. Si può pensare che una indagine censuaria sia migliore di una indagine campionaria. Uno dice vado a prendere tutte le unità della popolazione, ho più unità rilevate rispetto a quelle che avrei utilizzando un campione. Questo non è in realtà vero. L‟indagine campionaria, essendo basata su un numero di osservazioni molto minore di quelle che si utilizzano per una indagine censuaria, consente all‟intervistatore di dare maggior cura all‟intervista. Dedico più tempo a ciascuna persona, la si può seguire meglio, con più accuratezza se ha capito il significato della domanda e, ad una seconda verifica dei questionari, si può ritornare facilmente dall‟unità statistica intervistata per integrazione. C‟è tanto lavoro nel censimento che la cura del dettaglio passa in secondo piano. Il censimento richiede tempi molto lunghi. L‟informazione censuaria è una informazione già vecchia quando viene diffusa. I dati del censimento, i primissimi sono usciti a marzo, i primi dati sul censimento usciranno nel marzo 2013, dopo un anno e mezzo dal giorno di riferimento del censimento del 2011. Da qui a un anno e mezzo cambieranno le cose e i dati censuari sono piuttosto vecchi, servono come grosso riferimento, come cartina torna sole di un certo fenomeno. Invece, una indagine campionaria, è veloce snella. Consente di raccogliere le informazioni che interessano anche in maniera approfondita e, in poco tempo, avere un riscontro sulle informazioni raccolte. Sono delle informazioni che permettono aggiornamento dei dati in tempo breve. Il costo è più contenuto rispetto all‟indagine campionaria. Un minor numero di unità statistiche da rilevare determina un minor costo complessivo dell‟indagine. Errori controllabili. Non ci sono grossi problemi di sovra-sotto copertura. In linea di principio, costruendo bene un campione, vedrete con Persico come costruire un campione, per esempio stratificato, è possibile ottenere campioni che sono buone immagini della popolazione di riferimento. Se il campione è una buona immagine della popolazione di riferimento, uso l‟informazione proveniente dal campione per l‟intera popolazione. Procedo con un processo di induzione o di inferenza. Induzione significa dal particolare al generale. 48 Gli errori sono più controllabili. Ho la possibilità di costruire, scegliere bene le unità statistiche da rilevare. Posso anche verificare, con maggior attenzione, la qualità dei dati raccolti. Più tempo nella verifica delle risposte sul questionario. La maggior frequenza è legata al fatto che avendo un costo minore, se l‟informazione mi è di interesse, ripeto l‟indagine ogni sei mesi, ogni tre mesi, o, come fa La7 quando presenta i sondaggi elettorali ogni settimana (come cambia l‟orientamento politico di settimana in settimana). Bisogna considerare che la variabilità di settimana in settimana di quei sondaggi elettorali può essere dovuta ad un fenomeno campionario. Non essere vere modifiche dell‟orientamento politico degli italiani, ma che ci siano differenze del 0,5% legate al caso delle unità del campione. L‟indagine campionaria, perché ha un costo limitato e un tempo di analisi veloce, si fa con maggior frequenza. Inoltre, con la maggior frequenza, è possibile costruire serie storiche. Torniamo ai sondaggi elettorali di La7. Se ogni settimana ho rilevazione sull‟orientamento politico degli italiani, posso fare un raffronto dell‟andamento di un partito rispetto a quest‟altro. Posso vedere se l‟orientamento rispetto al partito è salito, sceso o ha comportamenti particolari. Ci sono però degli svantaggi. Se non ci fossero svantaggi non avrebbe senso fare studi campionari - I valori che otteniamo sono stimati. Per stima, visto in statistica 1, intendiamo un valore che ipotizziamo essere plausibile per una ignota quantità all‟interno della popolazione. Se voglio sapere la percentuale di italiani che oggi voterebbe per un certo partito, posso prendere 2000 4000 italiani e chiedere per che partito vota oggi? Partito Pinco Pallino, 12,7% Non è detto che la popolazione italiana sarebbe orientata su quella percentuale ma in quell‟ordine. Con stima noi indichiamo un valore vicino ad una ignota quantità della popolazione. - Disaggregazione territoriale non articolata. Se facciamo un sondaggio elettorale su immaginiamo 4000 unità statistiche in tutta Italia, a Genova quanti volete che ce ne siano, visto che siamo 600 mila su 60 milioni? Ci saranno 5 persone che vengono intervistate a Genova. Non è neanche detto che Genova nei sondaggi elettorali venga considerata tutte le volte. Spesso si dice il 35% della popolazione italiana vive in città al di sopra dei 50.000 abitanti? Il 35% va intervistato in quelle città. Poi quali è tutto un altro paio di maniche È chiaro che non siamo più in grado di estendere una informazione campionaria diffusa su tutto il paese sino ad un livello comunale o di sezione di censimento. Se a Genova intervisto 5 persone sulle 2000 intervistate, l‟informazione specifica su Genova non è utilizzabile per una divisione territoriale. Disaggregazione territoriale non articolata significa questo. Se voi vedete, gli approfondimenti di Mannaymer a Porta a Porta o di altri sondaggisti politici, non vanno mai a guardare il profilo geografico dell‟elettorato quanto più sociologico, che è trasversale alle regioni. I laureati preferiscono Tizio; i disoccupati Caio. Coloro che hanno un diploma preferiscono quest‟altro. In linea di massima la 49 - - disaggregazione a livello territoriale non è molto articolata, proprio perché non si riesce ad arrivare ad un dettaglio articolato. Diversamente è possibile avere una disaggregazione a livello di variabili socio economiche demografiche trasversali all’intera nazione. Ho 2000 persone? 400 sono laureati. Su 400 ho una rappresentatività che ci consente di affermare qualche . Difficoltà di mantenere omogenei e confrontabili nel tempo gli aggregati. Questo è un discorso complesso. Se facciamo una indagine campionaria, è difficile riuscire a ripetere l‟indagine sotto le medesime condizioni. Se abbiamo una popolazione molto fluida, cambia molto, di volta in volta, il mio campione deve essere molto modificato. Conseguentemente succede che si perda confrontabilità ed omogeneità dei dati nel tempo. Questo si riesce ad ovviare usando dei campioni un po‟ particolari, chiamati Panels, si compongono di unità statistiche sulle quali si rilevano un insieme di fenomeni ripetutamente nel tempo. L‟auditel è un classico esempio di panels. Si compone di un campione di popolazione italiana, selezionato secondo rappresentatività geografica, di titolo di studio, anagrafica, di genere, viene rilevato sera dopo sera cosa guardano in televisione. È un panels, le stesse unità statistiche sono rilevate ripetutamente nel tempo. IL DATO. È il risultato di una misurazione sperimentale. L‟informazione raccolta mediante questionari e reperite da annuari statistici si chiama dato statistico. Se è acquisto per via amministrativa mediante la compilazione di appositi modelli che spesso sono cartacei si parla di dato amministrativo. Parliamo adesso di dati amministrativi, ritorneremo sui dati statistici per fare un po‟ di raffronto. Le indagini basate sui dati amministrativi. Le informazioni sono raccolte per finalità diverse da quella di produrre informazione statistica. Abbiamo i certificati di nascita, archivi Inps sui dipendenti e archivi giudiziari. La raccolta avviene mediante compilazione cartacea, andiamo verso l‟informatizzazione delle procedure. Se domani andate a fare il cambio di residenza, compilate il foglio di carta in cui scrivete dove andate ad abitare, chi avete lasciato nell‟abitazione in cui abitavate. Dovete dire chi è residente nell‟indirizzo di destinazione dove andate a vivere ora. I dati amministrativi sono raccolti su entità individuali. È importante avere in testa il concetto di unità statistica, per ogni analisi che dovrete fare. Un‟anagrafe deve essere gestita su base individuale, per esempio. La anagrafe demografica, del comune. Un registro di imprese deve avere come riferimento la ragione sociale, e la partita iva dell‟azienda. I dati amministrativi sono raccolti su entità individuali. Questo è un punto base, visto nel censimento, quando si parlava di contare le teste, una per una, degli israeliti. L‟unità statistica deve essere ben definita, tutte le misurazioni fanno riferimento ad una unità solamente. Se considerassimo le 50 aziende non in base alla partita IVA, ma in relazione all‟azionista di maggioranza e considerassimo il fatturato in base all‟azionista di maggioranza, avremmo dei pasticci. Le indagini basate sui dati amministrativi consentono azioni da parte delle amministrazioni che li gestiscono. Il fine statistico con cui si possono analizzare tali dati è rivolto alla produzione di indicatori sintetici: frequenze, medie, indici, a partire dalle informazioni disponibili. Per esempio prendo le aziende di un certo settore, codificate secondo la codifica a-teco, e andare a vedere per esempio quante sono le aziende nel settore trasporto marittimo fallite negli anni. Oppure qual è la redditività media del settore? La confronto a quella del settore trasportistico terrestre. Gli archivi amministrativi possono essere distinti in relazione al grado di centralizzazione e informatizzazione. Posso avere un unico archivio gestito a livello centrale-nazionale, è il caso dell‟archivio sulle denunce dei crimini; separati a livello locale (trasferimenti di residenza e anagrafi sociali). Non so se avrete letto il decreto sviluppo governo Monti. Pare che oltre al censimento annuale, vogliono anche un archivio centralizzato delle anagrafi. Le caratteristiche del sistema amministrativo si distinguono tra: - Archivio cartaceo - Archivio informatizzato In linea di massima la modalità di acquisizione dei dati amministrativi avviene in due modi differenti. Uso di dati individuali (detti anche micro dati) o uso di dati aggregati (o macro dati). L‟uso di dati individuali è abbastanza raro, ma non così raro. Per esempio, quando si dice che il numero di contratti di telefonia che Tim e Vodafone hanno attivato nel 2012 è tot, noi ci troviamo di fronte a dati amministrativi aggregati. 300 mila nuovi contratti è un dato amministrativo, perché alla Vodafone non interessa avere un archivio dei propri sottoscrittori, se non per avere nuovi contratti, definire nuovi profili e giustificare col mercato la propria espansione. 300 mila nuovi contratti? Dati aggregati diffusi con finalità di comunicazione ai mercati. Spesso sono quelli che interessano al mondo. La Apple ha ordinato dieci milioni di mini I-pad, notizia dell‟altro ieri. Significa che la Apple ha in programma vendere un certo numero di unità di questo prodotto. Diverso discorso riguarda i dati individuali. Sicuramente venite contattati dal vostro gestore telefonico: promozione, buono di 60 euro al mese se riattivate il telefono eccetera. Loro cosa fanno? Hanno un grosso elenco come se fosse in Excel, in cui c‟è nome cognome, telefono e codice fiscale, e quanto avete consumato in traffico voce, dati, sms, canoni eccetera. Utilizzando questi micro dati, questi dati che sono amministrativi, usati per fatturare i dati, la Vodafone o la Tim può decidere di attuare politiche differenziate di marketing. Può dire: se ha meno di 25 anni gli mandiamo la promozione x, se ha più di 65 anni gli mandiamo la promozione y, cose di questo tipo. 51 Si possono differenziare le politiche di marketing a seconda del profilo del consumatore. Il dato stesso può avere caratteristiche sia di uso di dato individuale, per finalità di marketing o altro, e uso di dati aggregati che possono essere anche gli stessi che in origine erano disaggregati, ma che vengono trasferiti in forma aggregata. Pubblicazioni Istat? Vi troverete di fronte a dati aggregati, in cui il livello di disaggregazione arriva al limite al livello comunale. A volte, per i dati demografici, voi potete sapere per ogni comune italiano quanti sono i residenti tra maschi femmine, celibi, nubili, vedovi, vedove per ogni età. Quello è il massimo livello di disaggregazione per i dati pubblicati dall‟Istat. Dopodiché: io vorrei elenco di tutti i residenti del comune di Crevari per qualche ragione. Perché volete aiutare il comune nel scegliere il servizio sociale più opportuno da attivare per il 2013. Potete provare a chiedere i dati al comune che può darveli o meno per ragioni di privacy. Fonti amministrative. Potenzialità e limiti. Se noi abbiamo dati interesssanti perché raccolgono informazione in sé, posso pensare di utilizzarli senza andare a disturbare ulteriormente la persona. Se volessi capire dove mettere il centro di ascolto per una comunità di sud americani, vado a vedere dove c‟è la più alta concentrazione di sud americani a Genova e predisporla con delle persone che parlino per esempio lo spagnolo; lo stesso per comunità rumene o albanesi. Di cosa ha bisogno la comunità a Genova? Bisogna andare a raggiungere le unità statistiche e intervistarle per capire loro esigenze, bisogni, che possono essere differenti tra comunità e rispetto alla comunità italiana. Ecco che ci troviamo di fronte a due casi. In un primo possiamo agire senza procedere a indagini campionarie costose lo steso. Oppure noi dai dati amministrativi non raccogliamo tutta l‟informazione di cui abbiamo bisogno e ci troviamo costretti a muoverci verso una indagine di tipo campionario. Le fonti amministrative hanno un ruolo importante per la costruzione delle liste della indagine campionaria. Se devo fare una indagine sulle necessità delle comunità straniere a Genova? Io creo un campione rappresentativo della popolazione straniera a Genova, quella regolare, la irregolare è più complesso. Mi prendo i dati anagrafe, vedo quanti stranieri ci sono, di che nazionalità, come si dividono in percentuale le varie nazionalità, e poi vado a condurre indagini campionarie avendo rispetto di questa proporzione. Se ho che il 35% dei residenti stranieri a Genova sono ecuadoriani? Il campione sarà composto per il 35% da ecuadoriani. Nazionalità meno rilevanti? Non valgono di meno, ma per rappresentatività rispetto alle nazionalità ci saranno meno unità nel campione. I dati amministrativi possono essere utilizzati per costruzioni di liste. La costruzione di lista rappresenta l‟elenco di unità statistiche che compongono la popolazione. Quelle unità che potenzialmente possono essere raggiunte attraverso l‟unità di campionamento. Le altre cose sono banali. Le fonti amministrative hanno dei limiti. 52 - - - - - - La raccolta dei dati amministrativi è progettata ed eseguita con fini diversi rispetto ai statistici. Possono esserci archivi amministrativi che non tengano contano di alcun archivio storico. Per esempio la Telecom potrebbe avere l‟archivio storico delle persone che sono state titolari di un contratto di telefonia con loro come no. Potrebbero avere la anagrafe di tutti coloro che hanno numero di telefono attivo e non disattivo; C‟è il cosiddetto muro che si muove. Ci sono dataset che tengono traccia dei vecchi dati sino ad un anno e mezzo prima. ogni giorno che passa vengono cancellati i dati del giorno di un anno e mezzo fa. C‟è una finestra temporale mobile di un anno e mezzo. Questo è un classico caso di società di logistica del fashion. Immaginate tutta attività di distribuzione di alcuni marchi, hanno magazzini che hanno informazioni su ricevimento, spedizione e stoccaggio, ma non tengono le informazioni per sempre. Tengono le informazioni sino ad un certo periodo. I dati hanno una dimensione non trascurabile, non ci sono molto spesso capacità di stoccaggio sufficienti a tenere le informazioni che si vorrebbe tenere. In alcuni casi le informazioni dopo un po‟ di tempo non sono interessanti Ci sarebbero situazioni dove sarebbe bello avere uno storico. Sarebbe bello avere fotografie della popolazione genovese al primo gennaio di ogni anno. Dopodiché ci sono errori di copertura, non tutti i dataset amministrativi corrispondono alle popolazioni di nostro interesse. Ci sono tanti datest che si rilevano incompleti rispetto agli scopi che ci prefiggiamo. È possibile che in anagrafe ci siano degli errori. Poniamo errori materiali, errori studiati da chi voleva essere escluso sfruttando delle incompletezze del sistema. È possibile che la popolazione residente e la anagrafe non siano perfettamente coincidenti. Il censimento è una delle occasioni attraverso le quali questi errori di anagrafe vengono corrette. Ci sono poi classificazioni non corrette dal punto di vista statistico. L‟ente ha interesse ad una certa tipologia di classificazione mentre la struttura statistica ha interesse ad altre classificazioni. È il caso degli animali. Ci sono alcuni allevamenti delle definizioni merceologiche che non hanno una perfetta coincidenza con le definizioni che magari dà l‟Istat La qualità dei dati non è necessariamente certificata. Il processo statistico che sta alla base della generazione dei dati non rispetta i 15 punti del codice italiano sulle statistiche ufficiali. Non ci sono procedure ben determinate. Vi sono spesso tempi di attesa molto lunghi per avere i dati amministrativi. La domanda che può nascere è perché usare fonti diverse? Perché non possiamo usare solo fonti statistiche o amministrative? Un pochino l‟abbiamo già detto. C‟è una mancata esaustività di ciascuna fonte nel cogliere il fenomeno oggetto di studio, a causa di errori nella rilevazione, anomalie e lacune o perché previsto dalla rilevazione stessa. 53 Immaginiamo, per esempio, di voler fare una indagine sulle categorie deboli a Genova. Quali sono le categorie deboli? Anziani, bambini, portatori di handicap e stranieri. Deboli perché? Sono nelle difficoltà di non riuscire a difendersi da soli o perché sono nelle difficoltà di non riuscire ad affermarsi con lo stesso grado di autorevolezza di persone più giovani o più abbienti. L‟archivio per esempio degli anziani, bambini e stranieri, immaginiamo di ricavarlo dalla anagrafe. Per i portatori di handicap non è così facile averlo come dataset, come informazione. Bisogna riuscire ad integrare più fonti amministrative in un unico dataset. Se immagino di andare in una associazione che assista una categoria di disabili e di trovare Marco Rossi. A Genova ce ne sono altri. Come faccio a vedere se è lo stesso che troviamo nella anagrafe? Devo riuscire ad integrare i dataset per formare una lista unica. La chiave di riferimento univoca per incrociare i dataset è il codice fiscale. Molto spesso col codice fiscale riusciamo ad incrociare in maniera univoca dataset di origine differenti. Se siamo di fronte a più fonti amministrative differenti, con l‟esigenza di confrontarle, succedono due operazioni distinte: integrazione dei database e armonizzazione. Obiettivo delle procedure di integrazione è quello di ottenere maggiore copertura statistica dei dati osservati, anche con riferimento a livello territoriale. Nel mercato del lavoro, se voglio ottenere occupati o disoccupati, posso avere più registri differenti che devono essere integrati assieme. Se ci troviamo di fronte al problema dell‟armonizzazione ci troviamo nella condizione di dover correggere o aggiustare i dati per ridurre o eliminare le differenze che determinano la non comparabilità. Problemi classici sono rilevazioni amministrative a base individuale confrontate con dati amministrativi a base familiare. Per esempio ho il reddito dei singoli individui e il consumo delle famiglie. Come incrocio le informazioni? Ci troviamo di fronte ad una armonizzazione. L‟unico modo è aggregare i dati che sono disaggregati. Se ho dati aggregati non possiamo disaggregarli a livello di singoli individui, ormai sono aggregati. L‟aggregazione è un processo senza ritorno. Se ci troviamo di fronte ad un dataset disaggregato e lo dobbiamo legare ad uno che è aggregato, l‟unica cosa da fare per armonizzarli è aggregare secondo un campo famiglia i dati a livello individuale e collegarli al dataset delle famiglie. Inizialmente, in origine, si pensava che la qualità dell‟informazione statistica fosse solamente la sua accuratezza, la sua vicinanza tra la stima e ciò che realmente stavamo cercando di stimare, conoscere. Una indagine, un dato statistico era appurato quando era vicino al vero valore della popolazione. Quanti sono i tossicodipendenti a Genova? Stima e valore reale dovevano essere vicini. Se la stima era totalmente sbagliata o lontana dal valore reale era inutile. Ci si è resi mano a mano conto, negli ultimi 50 anni che, per un dato di qualità, oltre alla accuratezza del secondo punto, vediamo la pertinenza, accuratezza, tempestività, accessibilità, comparabilità, completezza e coerenza. Vediamoli uno ad uno. 54 Pertinenza: è la capacità dell‟informazione statistica di soddisfare le esigenze degli utenti, deve essere valutata all‟interno del programma statistico. L‟indagine che stai facendo, è pertinente? È qualcosa che realmente serve o è qualcosa di inutile? Ponetevela sempre come domanda. Se domani presentate un vostro prodotto al cliente, gli state presentando qualcosa che è pertinente o non gliene frega niente? Può essere bellissimo il prodotto, ma se non è pertinente al suo business non gli interessa. Dovete cercare di convincerlo che quello che gli state vendendo gli deve interessare perché ha una serie di finalità. L‟informazione statistica è buona, è pertinente quando è utile. Potete al posto di pertinenza mettere utilità, ma dal punto di vista economico ha un altro significato. Di cosa ha bisogno l‟utente finale? Ritorniamo alle statistiche dell‟Eurostat. Vi ho detto che le statistiche sono di competenza della Commissione Europea. Sono pertinenti per la Commissione europea. Che l‟Italia vada a fare delle indagini sul turismo degli Afghani in Pakistan, interessantissimo ma non è pertinente. Accuratezza. Ne abbiamo parlato. Brevemente intendo la vicinanza tra la stima prodotta per un parametro e il vero valore ignoto dello stesso. L‟abbiamo chiamata anche correttezza o non distorsione, a statistica 1 parlando di stimatore. Uno stimatore è corretto quando, mediamente, il suo valore atteso è uguale all‟ignoto oggetto di stima. La stima differisce dal vero ignoto valore del parametro a causa di una serie di errori. Gli errori possono essere presenti in qualsiasi fase dell‟indagine. Oltre agli errori di statistica 1, errori campionari, si introducono gli errori cosiddetti non campionari. Di questo ne parlerete anche con Persico. Vi faccio un esempio semplice di errore campionario. Tra le varie metodologie di campionamento che vengono utilizzate nelle indagini di mercato, c‟è il campionamento per quote. C‟è una indagine della Kraft, che vuole produrre un nuovo formaggio spalmabile. Vediamo se va bene per la clientela. Intervisto 1000 persone. A Genova devono esserne intervistate 20. La società di marketing individua la persona di Genova o che opera in Liguria e dice: devi intervistare 20 persone: 14 donne e 6 maschi di queste fasce di età. Devi intervistare queste persone e poi fai come vuoi. Cosa succede? Questa persona che è sul territorio, in genere è uno studente universitario, o post universitario che individua queste 20 persone come la madre, la zia, la zia e la madre del ragazzo, magari anche la nonna, poi anche se stesso, l‟amica, il fratello del ragazzo eccetera. In linea di massima, le persone che rispondono fanno parte di un claster, di un gruppo di persone omogenee per caratteristiche sociali, economiche e demografiche. Si genera una distorsione: quelle persone non sono più rappresentative della popolazione ma di un particolare gruppo della popolazione. Questo è un classico esempio di errore non campionario, legato al fatto che il campione non è casuale. Tempestività. Il fatto che i risultati del censimento arrivino con un anno e mezzo di ritardo ci indispongono un pochino. Evidentemente, per tempestività intendiamo il 55 tempo che intercorre tra l‟istante e il periodo in cui intercorre l‟informazione statistica e il periodo in cui tale informazione è disponibile per l‟utenza. C‟è la necessità di dare un feedback rapido alle indagini che vengono fatte. Il mondo corre, è sempre più veloce. Anche l‟informazione statistica ufficiale deve essere tempestiva. È per questo che Istat ed Eurostat fanno quelle pubblicazioni veloci, i flash. Bisogna cercare di essere sempre sulla palla, se non in contemporanea bisogna riuscire anche ad anticiparlo. Non a caso si danno le stime sull‟andamento. Non solo si cerca di dire cosa è successo, ma dare una previsione su ciò che succederà per cercare di essere più che tempestivi con l‟informazione statistica. È chiaro che quanto più vogliamo essere tempestivi tanto più difficile è essere appurati. Se poi le informazioni sono vecchie a quel punto non diventano interessanti e non sono pertinenti. Non è interessante dopo 5 anni pubblicare uno studio sul turismo. Ormai il mondo è cambiato. L‟11/9 quando gli aerei hanno colpito le Torri Gemelle, li c‟è stato un punto di svolta in cui l‟informazione precedente potevi buttarla via, è cambiato tutto dopo quel momento. Accessibilità. Si riferisce alla facilità con cui gli utenti possono apprendere l‟esistenza dell‟informazione ed è anche per questo che batto molto sul sito Istat ed Eurostat e su dove voi trovate le informazioni. I dati devono essere accessibili e le persone devono sapere dove andarle a prendere. Dove? Per esempio sul sito Istat. Essere in grado di trasferire le informazioni nel proprio contesto lavorativo. Bisogna sapere quando verrà rilasciata l‟informazione. Ve l‟ho fatto vedere: in fondo alla pagina, sul documento vi si dice quando verrà rilasciato il prossimo bollettino trimestrale sull‟andamento dei prezzi della produzione industriale e così via. C‟è un calendario preciso delle pubblicazioni dei dati, sistema di distribuzione dell‟informazione: sito web, pubblicazioni cartacee, il costo dell‟indagine e la disponibilità ad informazioni aggiuntive per una corretta interpretazione dell‟informazione: glossario, note metodologiche, note integrative, cose viste la volta scorsa. Comparabilità. Indica che l‟informazione è confrontabile nello spazio e nel tempo. L‟abbiamo già detto. È importante che l‟informazione sia comparabile. Avere un dato che nel 2001 è diverso dal dato del 2002 e che è stato calcolato in maniera diversa nel 2003 non ci permette di costruire quella che viene definita serie storica. Allo stesso modo non ha senso geograficamente che ci sia differenza tra Genova e Mantova. Coerenza. Le statistiche derivanti da fonti diverse sono coerenti se basate su definizioni, classificazioni e metodologie standard, cioè se sono integrabili. Si lega alla comparabilità. Oltre alla confrontabilità è se tutto rientra in un insieme unico. Completezza. La capacità di fornire informazioni sugli aspetti indagati senza lacune od omissioni ingiustificate. Per esempio, fare una indagine sulla popolazione straniera, considerando solamente la popolazione regolare non soddisfa un elemento di completezza, va ad escludere tutta la componente irregolare. 56 In linea di massima, quando c‟è da condurre una indagine statistica, ci troviamo di fronte ad una fase preliminare che richiede la specificazione degli scopi della ricerca. Abbiamo esigenze conoscitive: vogliamo conoscere qualcosa relativamente ad un fenomeno. Quanti sono gli italiani, quali sono i profili degli immigrati e sapere quali sono i bisogni della popolazione straniera a Genova. Questa è la pertinenza del nostro dato e dell‟indagine che viene fatta. Qual è la coerenza del dato che otteniamo rispetto alle esigenze conoscitive che avevamo in origine. Non è facile. Ci sono situazioni in cui le esigenze conoscitive sono chiare, ma non è facile capire come individuarle. Come facciamo a misurare l‟integrazione della popolazione straniera a Genova? Non è facile. Poi abbiamo tutta una serie di metodologie, tecniche, strutture e fasi che si sviluppano nelle indagini che mi identificano l‟appuratezza della procedura: l‟assenza di errori, l‟utilizzo di una struttura di analisi corretta. Infine, tempestività accessibilità completezza coerenza compatibilità risultano relative alle conclusioni, all‟informazione che si deriva al termine di tutta l‟indagine. LEZIONE 6 16/10/2012 Volevo vedere le ultime slides che sono rimaste sulla presentazione. Spero che questa settimana si attivi aula web. Abbiamo visto la differenza tra rilevazioni dirette ed indirette. Cosa è una fonte amministrativa, eccetera. Queste cose le abbiamo già viste l‟altra volta. Il problema dell‟armonizzazione delle fonti. Tempestività, accessibilità, completezza, coerenza. Li abbiamo guardati uno ad uno in maniera abbastanza rapida. Abbiamo detto che nel processo di produzione di informazioni la pertinenza delle statistiche ufficiali riguarda le esigenze conoscitive, le indagini devono essere pertinenti, devono essere interessanti per le finalità che ci si pone. Accuratezza è il modo in cui viene condotta l‟intera indagine in modo tale da avere stime vicine a quello che realmente stiamo cercando di conoscere e stimare, è quello che abbiamo chiamato correttezza in statistica 1 nella parte finale. L‟informazione che deriva dal processo di produzione statistico (micro macro e meta dati) devono rispondere a logiche di tempestività, completezza, accessibilità, coerenza e comparabilità. Facciamo un paio di riflessioni, giusto anche per concludere un po‟ il discorso e vedere la differenza, facendo degli esempi, tra dati statistici ed amministrativi, così chiudiamo questo discorso. Un aspetto importante è la qualità del dato, molto spesso vengono usati dati che non rispondono a requisiti di qualità anche se vengono prodotti da istituzioni ed enti il cui nome sembrerebbe essere rassicurante. Ci sono svariati osservatori, sistemi integrati per il controllo di qualche cosa eccetera. Di fatto i dati che vengono prodotti non necessariamente rispondono a requisiti di qualità. È emerso, nella conclusione della lezione di ieri, (statistica del turismo, buona parte di voi non c‟era), che ci sono dati relativi a vari sistemi informativi territoriali o turistici. 57 In linea di principio, dati con cui vi troverete a lavorare possono essere di varie origini, ma non sono necessariamente fonti statistiche ufficiali per come le abbiamo definite noi. Noi ci stiamo soffermando volutamente su tutti gli enti di produzione statistiche rientrano all‟interno del Sistan. All‟interno del Sistan non rientra la BDI che produce dei dati secondo alcuni criteri, non consideriamo tutti quegli enti che producono dati non necessariamente all‟interno del Programma statistico nazionale e non necessariamente secondo un codice di qualità come abbiamo visto nelle lezioni scorse. Non per questo però i dati che vengono al di fuori del sistema statistico nazionale e del Sistan sono dati di bassa qualità. In linea di principio si può credere che tutti i dati che provengono dall‟Istat, dal sito dell‟Eurostat o dalla BDI siano dati di buona qualità. La qualità delle fonti informative è un problema che si affronta di frequente nelle analisi statistiche. La qualità dei risultati strettamente connessa alla qualità dei dati rispetto al livello di comprensività delle metodologie e tecniche di analisi statistica. La qualità dei dati è importante. Se i dati che voi avete a disposizione per la tesi di laurea non sono di qualità, le vostre conclusioni e affermazioni potranno essere sempre contestate. Se un istituto non esegue correttamente una analisi, ecco che tutte le considerazioni che farete su questa analisi sono deboli. A dato debole e di bassa qualità corrispondono inevitabilmente considerazioni di bassa qualità. Questa affermazione è ancora più vera negli studi territoriali, da questi scaturiscono proposte di politica a livello territoriale. Molto spesso il problema della qualità del dato è che non riusciamo ad avere un dettaglio territoriale molto elevato. I dati, alla fine per essere buoni, di buona qualità e prodotti secondo certe regole, devono avere la caratteristica di comparabilità. Il problema della comparabilità dei dati ha una importanza cruciale, sia perché si presenta con frequenza nella ricerca applicata, sia perché costituisce un fattore fortemente distorsivo nell‟analisi dei fenomeni. Possiamo avere due situazioni in cui abbiamo uno stesso fenomeno analizzato da due strutture differenti. Questi dati sono comparabili o no? Questi dati portano allo stesso risultato oppure no= Le famose battaglie di numeri. Non so se avete mai fatto caso. Quando c‟è uno sciopero, manifestazione, i sindacati o chi organizza la manifestazione dice una cifra, i giornali un‟altra e la questura un‟altra ancora. Il problema è capire dove stia la verità. È chiaro che nel momento in cui la qualità del dato è più attendibile ecco che dovrebbe esserci la verità. Cause e veridicità della fonte, soluzioni. Bisogna capire perché i risultati sono discordanti, nel caso degli scioperi perché ci sono alcune persone che hanno interesse a gonfiare il successo di una manifestazione, valutare la veridicità della fonte. Se in una piazza c‟è un milione di persone ma notoriamente ce ne possono stare al massimo 800mila non è vero, e poi si può trovare una soluzione che permetta di armonizzare, trovare un equilibrio tra le differenti fonti di dati. Le discordanze tra diverse fonti di dati possono essere legate a: 58 - diversa classificazione dei fenomeni. Per esempio definizioni differenti dei concetti di inflazione, disoccupazione, di disabilità eccetera; Modalità di rilevazione. Alcuni dati possono essere rilevati in mesi differenti. Se vado a rilevare i flussi turistici nei mesi di gennaio, aprile, luglio, settembre e un altro paese in altri mesi, non c‟è più confrontabilità legata alla modalità di rilevazione. Se i dati sono discordanti, più informazioni su un medesimo fenomeno, quale dobbiamo prendere come fonte? Quella che si avvicina di più all‟ufficialità della fonte. Questo criterio vale sempre. Voi vi fidate di più ad una persona affidabile o di uno che è un conta balle? Se la persona è più affidabile vi fidate di più di quella persona li. Nelle classiche beghe tra amici, alla fine si sentono varie versione e c‟è chi crede a qualcuno e quelli che credono ad altre persone. Lo stesso discorso per i dati, cercare di risalire alla ufficialità del dato, all‟ente che l‟ha prodotto secondo ciò che si avvicina di più al concetto di ufficialità, nel senso di appartenenza al Sistan. A parità di dati discordanti, date sempre prevalenza ai dati ufficiali. Se poi ci sono questioni non semplici da risolvere, queste soluzioni si provano caso per caso, non c‟è una regola universale, secondo quello che si ritiene essere più realistico e più logico. Non vi aspettate che i dati siano sempre gli stessi chiunque li raccolga. Se si mette mano alla realtà, si vede uno stesso fenomeno studiato da più enti differenti, i risultati possono essere anche molto differenti. Fonti informative. Forniscono i dati necessari al calcolo di indicatori per l‟analisi dei fenomeni e la lettura in chiave territoriale. Forniscono i dati necessari: lo vedremo, la disseminazione dei dati ufficiali avviene essenzialmente in forma impersonale. Se prendete un documento Istat o Eurostat, è molto difficile trovare interpretazione dei fenomeni. Troverete solamente che un certo fenomeno è variato in positivo o negativo rispetto all‟anno precedente, un settore è in crescita e l‟altro no. Non troverete mai nelle statistiche ufficiali valutazioni di merito, di giudizi, delle opinioni, non fanno parte della statistica ufficiale. Neutralità: l‟abbiamo visto l‟altra volta. La raccolta dei dati produce serie territoriali, sequenze di valori assoluti delle variabili nello stesso momento in vari ambiti territoriali, oppure anche in serie storiche. Avete per esempio il grado di invecchiamento della popolazione per area, oppure la serie storica: la sequenza di valori di un medesimo fenomeno ad intervalli regolari nel tempo, l‟abbiamo già accennato una volta. I meta dati li abbiamo già visti. Vediamo due esempi di indagine statistica e amministrativa. Le indagini statistiche sono tante, sono numerose. Se andiamo a guardare quelle prettamente ufficiali sono quelle che fa l‟Istat o la BDI. - Indagini multiscopo: di tipo campionario ed effettuate dall‟Istat, con finalità puramente statistica, finalità conoscitiva di produzione statistica. Le indagini multiscopo sono un nsieme di indagini condotte sulle famiglie da parte dell‟Istat, sono poco meno di una decina, e riguardano differenti aspetti che riguardano la 59 - - - - - società. Indagine sui consumi delle famiglie, sull‟impiego del tempo, viaggi e vacanze, sicurezza. Sono tutte indagini che vengono rilevate in maniera contemporanea. Chiamate multiscopo perché già che l‟Istat contatta le famiglie italiane, decide di chiedere una serie di informazioni. Anziché fare una indagine sul turismo, la fa anche su altri temi, per questo multi scopo. più finalità conoscitive Sui consumi Continua sulle forze di lavoro (FDL). Ne abbiamo parlato tempo fa. È una delle indagini dell‟Istat. È una indagine continua, praticamente avviene nel quotidiano. Rilevazione dei prezzi al consumo, cadenza mensile, per vedere l‟andamento delle operazioni in Italia con la rilevazione dei prezzi effettuati a livello comunale. I dati spediti a Roma e consolidati a livello italiano. Censimenti. Della popolazione, industria, agricoltura. Ora c‟è il censimento delle aziende no profit. Sono tutte queste indagini per finalità puramente statistiche, sarebbe a dire per finalità puramente conoscitive. Amministrative. Condotte utilizzando i dati di alcuni enti che non hanno come finalità prevalente quella di produrre statistiche, ma hanno archivi amministrativi e, usando i dati presenti negli archivi amministrativi, si riesce a estrapolare della informazioni di interesse sociale. Se prendo l‟ufficio anagrafe dei comuni di GE ho nati e morti, con magari qualche mancanza. Genero così non solo una misurazione di uno stock, il complesso dei residenti amministrativamente in Italia, ma costruisco anche una parte del flusso: nati meno morti rappresentano una variazione di stock, quindi un flusso. A questo si aggiunge poi l‟immigrazione ed emigrazione per ottenere il flusso complessivo della popolazione. Popolazione residente annuale. Questo punto l‟avevamo già discusso quando abbiamo presentato i servizi offerti dal sito dell‟Istat. Sul sito Istat trovate un sotto sito demo.istat.it , a sinistra posso selezionare, anno per anno, dal 2001 in poi, quanto erano i residenti in Italia al 31/12 dell‟anno. Inoltre, potete anche ricavare le proiezioni demografiche da qui al 2060. Questi dati vengnono costruiti incrociando le informazioni che vengono da tutti i comuni italiani con l‟ufficio di statistica e l‟ufficio anagrafe. Genova ha un ufficio di Statistica comunale separato dalla anagrafe, c‟è la direzione statistica, con tante finalità tra cui fare la rilevazione dei prezzi in tanti punti vendita a Genova. Nei paesi più piccoli no, l‟ufficio statistico coincide con l‟ufficio anagrafe. Sui trasferimenti di residenza, e si utilizzano i dati dell‟ufficio anagrafe. Archivio statistico dei trattamenti pensionistici, che utilizza come dati quelli dati dell‟INPS. Per le imprese c‟è un archivio, ASIA , archivio statistico delle imprese attive. È un archivio sulle società che operano in Italia suddivise per vari settori. Sempre dalle fonti Inps, utilizzando delle fonti aperte, è possibile avere un archivio dei lavoratori dipendenti. Se voglio sapere quanti sono i lavoratori a 60 Genova, posso vedere quanti stanno versando contributi previdenziali all‟Inps. Una volta c‟era anche l‟Inpdap. Archivio Statistico delle Imprese Attive, Asia. È una banca dati sulle imprese attive che contiene un insieme di informazioni sulla struttura produttiva italiana. Realizzato dall‟Istat, è stata obbligata dall‟Eurostat, in modo che a livello europeo fosse possibile costruire un archivio analogo. Ogni anno viene aggiornato. Come costruisco questo archivio e cosa contiene? Anzitutto prende dati da tanti enti. La camera di commercio, rientra nel Sistan, gestisce il registro delle imprese. Per aprire l‟impresa, qualcuno ve l‟avrà insegnato, dovrete aprire una posizione nel RDI, impresa attiva, indicare il campo di attività dell‟impresa, lo statuto, indicare la forma societaria, codice fiscale e attivare una casella di posta elettronica certificata. Le informazioni possono ance essere prese da Inps e Inail. Se sono una azienda faccio da sostituto di imposta, anche per i contributi previdenziali, devo pagare l‟ Inail per i miei dipendenti. Poi ho altre informazioni che possiamo prendere dall‟ Enel o altri enti simili produttori di energia elettrica. Poi posso prendere altri archivi, usando quelli per esempio della BDI, ABI. Infine, altre informazioni vengono prese anche altre informazioni dalle indagini statistiche dell‟Istat. Abbiamo visto in maniera abbastanza precisa la differenza tra fonti statistiche ed amministrative, indagini statistiche ed indagini amministrative. L‟indagine amministrativa può essere finalizzata alla costruzione di archivi, come l‟Asia, o può essere indirizzata a comprendere meglio i fenomeni lavorando non su indagini statistiche come quelle viste in slide, ma piuttosto usano dataset di questo tipo. Tenete presente che non sono elenchi esaustivi, solo esempi generali. 61 LE TECNICHE DI RILEVAZIONE DEI DATI Iniziamo ora ad avvicinarci un po‟ di più al concetto di indagine dal punto di vista operativo. Questo tema lo approfondiremo di più e meglio con Persico. Iniziamo a guardare oggi le modalità attraverso cui si possono rilevare i dati usando delle indagini statistiche. Qua ci sono le sei fasi che descrivono l‟indagine statistica. Le vedremo e approfondiremo uno per uno. Ci focalizzeremo in linea di massima, quasi esclusivamente sulla fase uno ed in particolare sulla modalità di rilevazione dei dati. Questo elenco non lo andremo ad esplorare punto per punto, ma solo il punto uno e un suo sottopunto. Come si compie una indagine statistica? Fase iniziale della progettazione. Uno dei primi errori classici che si fanno quando si conduce una indagine di tipo statistico è quello di partire a scrivere il questionario. Non funziona così. Bisogna definire bene quali sono gli obiettivi della ricerca. Ho una fase di progettazione, definisco bene gli aspetti del problema e si decide come operare. Successivamente avviene la fase di individuazione del campione da rilevare. Abbiamo messo un cappello all‟argomento. Voglio rilevare i dati. Come facciamo? Anzitutto dobbiamo dire qual è la popolazione di riferimento, la lista dalla quale noi possiamo campionare, come raggiungere le persone di questa popolazione? Elenco del telefono, ma abbiamo già detto che non copre la popolazione italiana (persone non hanno il telefono o non vogliono esserci). Rilevazione. Attività che consistono nel predisporre l‟attività effettiva di campionamento e le interviste. Dopodiché dobbiamo acquisire i dati, avremo una fase di preparazione dati. Dopo i dati devono essere analizzati e documento di pubblicazione dei dati col quale li diffondiamo. Iniziamo dal principio: - Progettazione. Richiede innanzitutto di definire bene un problema. Che cosa vogliamo fare? È facile dire sarebbe bello fare indagine sulla condizione degli immigrati clandestini a Genova. Cosa significa? Sono vivi o morti? No, anche altre cose: chi sono, da dove sono arrivati, perché sono a Genova, vogliono andare via o si fermano. Questa è una finalità descrittiva, primo problema. Secondo problema capire le esigenze che loro hanno, riescono ad accedere ai servizi di prima accoglienza, hanno bisogno di servizi che non riusciamo a dare, o se hanno paura di accedere a servizi per paura di essere denunciati. Non è facile, bisogna specificare bene il problema. Definire a priori che cosa si vuole fare, a cosa mi serve questa informazione, qual è la finalità della mia indagine? Io voglio offrire nuovi servizi alla popolazione clandestina per andarle incontro, sono fasce deboli. Come faccio a raggiungere queste persone? Se è clandestina non li trovo nell‟ elenco telefonico. Posso utilizzare una metodologia di campionamento, campionamento per ceto, vado a cercare i clandestini nei luoghi 62 - - - - in cui si aggregano. Ci sono bar frequentati da clandestini, centri culturali, anche il clandestino ha una vita sociale. È chiaro che io non posso brutalmente fare una intervista al clandestino come la farei al regolare, quello ha paura di essere denunciato. Questa fase di progettazione identifico la domanda di ricerca, il problema, il punto al quale si vuole arrivare. Poi obiettivi da raggiungere e andare a rilevare le informazioni che ci servono. Problema del campionamento. Molto collegato alla progettazione. Le liste di riferimento saranno a cascata derivanti dalla specificazione del problema e dalla definizione degli obiettivi. Poi abbiamo anche questioni di dimensione campionaria. Quante unità vado a campionare? 3500? 4000? 2000? Dipende da tante cose. Dipende se voglio fare una indagine ripetuta nel tempo, tante volte per vedere come si evolve, o una volta sola per capire come è una certa situazione. Scoppia una guerra nella penisola balcanica? Arrivano tanti immigrati che scappano dalla guerra. Situazione di emergenza. Mi interessa in quel momento sapere come è la situazione. Poi magari mi interessa non ripeterla subito. Posso dedicare un po‟ di risorse economiche ad una indagine spot piuttosto che pensare di suddividere la spesa negli anni, poco alla volta. Non immaginate le fasi assolutamente separate, sono molto concatenate. Dopo avviene la fase di rilevazione. Selezione degli intervistatori, sembra molto semplice, ma non lo è. A seconda del problema servono intervistatori differenti. Per la popolazione straniera è bene avere intervistatori che parlino lingue straniere, si aiuta l‟intervistato a rispondere. Poi organizzare bene il lavoro sul campo. Se penso di intervistare 100 persone alla Maddalena, 100 persone a Castelletto, 50 alla Foce, 80 ad Albaro, bisogna che ci sia una persona che pianifichi l‟attività, che verifichi quali persone hanno risposto e quali no. Programmi il ritorno sul campo di persone non trovate, che gestiscano tutta l‟indagine campionaria. Sono aspetti organizzativi piuttosto importanti. Dopodiche, una volta che gli intervistatori sono stati formati, è stato spiegato il questionario, difficoltà che possono emergere e ritornano coi questionari cartacei o informatici, dovranno andare a fare delle modifiche, registrazioni e correzioni, a seconda delle risposte date. È normale che su 4000 questionari ogni tanto qualcuno risulti incompleto. Perché c‟è un errore materiale dell‟intervistatore, magari mette due crocette dove ce ne è una e nessuna crocetta in altre domande, oppure può risultare che le risposte siano in contrasto tra di loro, le ragioni sono parecchie. Alla fine il risultato finale di una indagine campionaria è un foglio di Excel, ogni riga è un questionario ogni colonna è una risposta. Se intervistiamo 3500 persone e a ciascuna poniamo 10 domande, avremo un foglio di Excel con 3500 righe e 10 colonne, una per ogni domanda. Metteremo le risposte che sono state date. La prima persona intervistata a 35 anni. In corrispondenza della 63 domanda: la tua età? La risposta è 35. Alla domanda: che titolo di studio hai tra questi dieci, A-B-C-D, dovrai mettere una lettera. Il risultato finale di una operazione di campionamento a livello di dati grezzi, e questi sono i micro dati, è un file di Excel. Se l‟indagine è particolarmente grande, uso degli strumenti più sofisticati sennò Excel dà pienamente l‟idea della struttura di un insieme di micro dati. Ci siamo posti delle domande inizialmente. Voglio sapere quanti stranieri irregolari presenti a Genova risultano essere discriminati oppure sono pentiti di essere da noi. Queste lavorazioni sono compiute solo nella parte finale. Facciamo le analisi, incrocio i dati, uso tabelle, grafici, posso anche pensare di fare studi più sofisticati: regressioni, modelli econometrici, modelli sociali, fare modelli multivariati. Se stiamo facendo una indagine di marketing, vogliamo cercare di dividere i consumatori in gruppi uso tecniche di analisi dei gruppi (Klaster analysis). Alla fine, i dati raccolti con un bel costo, una indagine campionaria è costosa, dobbiamo predisporre un documento riassuntivo che permetta di condividere con terzi le informazioni che sono state ottenute. Al di là della statistica ufficiale, prodotta da Istat o BDI, queste considerazioni che stiamo dicendo sono compatibili con indagini private, indagini di aziende che vogliono conoscere meglio i loro clienti. Se l‟amministratore delegato ha deciso di fare una indagine, ha bisogno di prospetti che o documenti che permettano di acquisire l‟informazione in poche pagine. Torniamo alla Statistica, statistica come forma di sintesi, statistica come sistema per prendere le 3500 righe e colonne e ridurle in cinque - dieci pagine. Focalizziamoci sulla fase 1, PROGETTAZIONE, in particolare il secondo punto. Si precisano gli obiettivi definizioni e classificazioni. Cosa si intende per obiettivi? Cosa vogliamo ottenere, qual è la finalità conoscitiva dell‟indagine. Voglio sapere se il formaginno piace e venderà? Voglio sapere se se ha senso proporre un prodotto alternativo alla Nutella. La Plasmon aveva fatto la sua nutella, che molti chiamavano la nutella della Plasmon, fallimento commerciale. Ci sono comunque altre creme. La questione è capire la finalità del nostro studio. Dobbiamo dare delle definizioni, metterci d‟accordo sul gergo. Se parlo di capo famiglia che cosa intendiamo? Se faccio una indagine sul consumo o scelte di acquisto, chi deve rispondere? Questa fase si deve già definire nella fase di progettazione. Nella indagine di marketing, la persona che risponde al questionario è delegata agli acquisti. Molto speso la madre, piuttosto che i figli o piuttosto che il padre. Non è detto che si debba cercare la madre per forza di cose, può essere delegato qualcun altro agli acquisti. Classificazioni, d‟accordo sulla metodologia. Si scelgono le tecniche di indagine. Come si può intervistare una persona o una unità statistica di nostro interesse? Poi definisco il questionario, lo vedremo in un‟altra lezione. Ora ci focalizziamo, abbastanza brevemente, sulle tecniche di indagine. Le tecniche di indagine sono essenzialmente tre: 64 - - L’intervista diretta, faccia a faccia. La persona intervistata è intervistata dall‟intervistatore e compila il questionario. Questa è una procedura che avviene in forma cartacea, non sempre ma molto spesso. Poi: Intervista telefonica: persona contattata telefonicamente dall‟intervistatore. Auto compilazione. Sono diverse da una cosa che chiameremo autoselezione del campione, si chiarirà poi successivamente. In generale, l‟intervista, e quindi l‟intervista diretta e telefonica, l‟auto compilazione non è una intervista. L‟intervista prevede intervistatore o rilevatore e l‟intervistato, il rilevato, o comunque l‟unità statistica, persona o azienda. L‟intervista comporta un processo di interazione tra l‟ intervistatore e intervistato. Non è un rapporto alla pari, c‟è una asimmetria, non simmetria. L‟intervistatore fa domande all‟intervistato e si deve comportare secondo tutta una serie di regole che non. Come si somministra il questionario? Dipende. Può essere somministrato in vari modi. - Lunghezza del questionario. L‟anno scorso c‟è stato il censimento? Il censimento somministrato per via postale, poi auto compilazione. La persona si metteva li e chi aveva voglia in famiglia rispondeva riconsegnando il questionario in centri di raccolta comunali, oppure poteva portarlo alla posta che lo riceveva gratuitamente, o via internet ottenendo una ricevuta elettronica da stampare e conservare per evitare la multa perché c‟è l‟obbligo di rispondere al questionario. - Struttura del questionario. La tipologia di questionario deve essere tanto più libera quanto meno sappiamo del fenomeno. Se non sappiamo nulla di un certo fenomeno, possiamo procedere ad un sistema di intervista, chiamato intervista qualitativa. In linea di massima facciamo una chiacchierata con l‟intervistato su alcuni temi. Voglio capire quale sia una certa situazione nelle gang di ragazzini che vivono in zone deprivate delle città o delle grosse città. Piuttosto che fare questionari nelle bidonville piuttosto che nelle baraccopoli, è meglio intervistare opportunamente alcune persone. Questa forma di intervista è detta qualitativa. Se riesco ad avere una visione sempre più chiara del problema, uso forme più definite: questionario semi strutturato e strutturato. Strutturato? È, per esempio, il questionario del censimento. è perfettamente strutturato, presenta domande a scelta multipla sugli argomenti che vogliamo noi. Semi strutturato? considero qualcosa sul fenomeno ma non tutto il fenomeno del nostro interesse. Se voglio un questionario strutturato Queste domande devono coprire totalmente le opzioni possibili. Se non le conosco, non posso usare una forma completamente strutturata. Quali sono le principali criticità di Genova oggi? Posso pensare: disoccupazione, traffico, criminalità, servizi pubblici che non vanno bene. Ognuno potrebbe aggiungerne. In queste situazioni, su queste domande, si preferisce utilizzare o domande semi strutturate dove posso esprimere altro o si lascia la risposta aperta da parte del rispondente. Il 65 - rispondente può scrivere lui ciò che è più pertinente. Ciò genera problematiche. 3500 questionari e 3500 persone hanno risposto cose simili ma diverse, devo ricodificare per essere in grado di analizzare. Tipologia e approfondimento dei temi trattati. Se devo chiedere a voi che scuola avete fatto? Scientifico classico tecnico professionale? La rosa è di quei dieci istituti. Posso inserire la voce altri istituti per quelli residuali. La rosa è definita, se uno ha fatto una tipologia di liceo non ne ho fatto un‟altra. Se vi chiedessi l‟aggettivo che associate in maniera più forte con la parola statistica? A parte gli insulti, non è semplice. Adesso il 23 non c‟è lezione. È la giornata italiana della statistica. La mattina facciamo un intervento con le scuole superiori. Questionario? Che percezione hanno gli studenti delle superiori della statistica. Non è facile trovare il modo di raccogliere informazione. I liceali hanno questa percezione, prima di studiarla. Fare un questionario è molto complicato, come regola di vita, se dovete costruirlo, mai risposte aperte. Cosa ne pensa della situazione del porto di Genova? Mai aperta, complicato riuscire a ricodificare. A meno che non sia un campione molto ristretto. Nelle interviste non strutturate, qualitative, le persone che sono intervistate sono di solito poche, sono figure chiamate mediatori culturali. Se voglio caprie le dinamiche all‟interno di gang giovanili, posso parlare con persone specifiche, queste magari mi spiegano, diventa una specie di indagine giornalistica se vogliamo. Perde i connotati di analisi quantitativa e assume quelli di una analisi qualitativa. Se ho un grosso numero di risposte aperte, dovete ricodificarle per poterle analizzare, oppure riportarle tutte ma allora si perde del beneficio della sintesi che dà la scienza statistica. Se intervistate 3500 persone e 3 domande aperte? 10500 risposte aperte e bisogna trovare il modo di sintetizzare in poche categorie, non è per niente facile. Se voi, per la tesi pensate di sottoporre alle aziende un questionario di qualche tipo, cercate di fare scelta multipla, o scelta singola o numeriche. Quanti dipendenti avete, qual è il vostro fatturato? Avete uffici all‟estero? Si-No. Cercate di evitare il più possibile le domande a risposta aperta. La scelta della tecnica di somministrazione del questionario è legata all‟unità della rilevazione. Possiamo avere le imprese, le istituzioni, gli individui oppure le famiglie. È chiaro che a seconda dell‟unità di rilevazione cambia la tecnica di somministrazione del questionario. Per esempio, se voi andate a parlare con la camera di commercio o guardate anche su un database nel quale noi abbiamo l‟abbonamento in facoltà, potete trovare per gruppi di aziende le e-mail, e potete predisporre un questionario on line che può essere proposto alle aziende via e-mail. Si genera una e-mail. Buongiorno, mi chiamo Pinco Pallino, sto facendo una tesi in presso facoltà di economia, studio di, sarei grato se la sua azienda volesse rispondere a queste domande utili per tesi il cui relatore è Tezie. 66 Mail col link. Può cliccare e si apre una decina di pagine, poche domande per pagina e le persone possono rispondere. Voi andate sul sito e potete scaricare il file Excel con tutte le risposte con il questionario. Questo non potete farlo con le famiglie e le istituzioni. Le modalità di intervista. Quella che storicamente è più intervista è la modalità PAPI. Acronimo che si può indicare in due differenti modi: paper and pencil interview, intervista carta e penna, o paper assisted personal interview. In realtà quella che ritengo più aderente al vero è la carta e penna, paper and pencil. Pensate, se l‟avete visto, al questionario del censimento, domande e crocette. È il metodo base, è il modello base. Ci sono, ovviamente, vantaggi e svantaggi. Vantaggi? - Certezza dell’identità dei rispondenti. Non può succedere che faccio un questionario per l‟amministratore delegato e risponda la segretaria dell‟amministratore delegato. Se fatto via internet, non posso vedere chi mi sta rispondendo. Però, se vado in azienda col foglio e so che l‟amministratore delegato si chiama Pinco Pallino, so che è lui e l‟identità del rispondente è certa. - Possibilità di fornire chiarimenti. Se l‟intervistato ha dei dubbi, se le domande non sono poste in maniera chiara, nonostante tutta la fatica che si possa fare per realizzare il questionario, qualche domanda può non venire chiara, c‟è la necessità di dare chiarimenti all‟intervistato. - Possibilità di motivare gli intervistatori. Se voi mandate una e- mail, uno può dire ah, si si poi rispondo. Arrivano 50 mail, la vostra mail va in fondo e chi s‟è visto s‟è visto. Questi sistemi dicono tra tutti hanno risposto alcuni non altri. Rinnoviamo l‟invito? Rimando la mail solamente a quelli che non hanno risposto. Ogni mail ha un link diverso. Da un punto di vista cartaceo, se c‟è l‟amministratore delegato o chiunque che si trova davanti il tesista che dice, mi rispondi alle domande? Alla fine risponde, per toglierselo dai piedi. Se fatto r via internet: non l‟ho vista, non è arrivata, è andata nello spam, mille scuse possibili per non rispondere. Svantaggi? Se avete tante persone che girano per fare interviste - L’organizzazione complessa e costo elevato. - Effetto rilevatore. Essendoci tanti rilevatori può esserci il rilevatore che non ha voglia, magari mette lui le crocette al posto di chi dovrebbe rispondere, fatto gravissimo, ma magari non è capace a dare una spiegazione giusta a domande. Campionamento per quote a volte si usa. Se il rilevatore intervista: madre, sorella, madre del ragazzo/a, ecco che l‟effetto rilevatore si trasforma in una forma di errore, detto errore non campionario - Reticenza. Le persone possono anche non avere piacere di ricevere una persona con il questionario carta e penna a mettere le crocette. Se è una intervistaa casa devi fare le persone a casa, in ufficio devi farle entrare in ufficio e non ne hai voglia. 67 - - Possibile che ci sia incoerenza nelle risposte. C‟è un comportamento psicologico strano nelle persone che rispondono alle domande, specialmente quelle politiche ma non solo. Di solito le prime risposte hanno modalità di una valutazione differente rispetto alle ultime. A volte se la persona è arrabbiata col governo, sindaco e istituzioni, inizialmente ci va giù pesante. Cosa ne pensa dell‟operato del governo? Una schifezza. Dopo che il nervoso è passato, comincia a rispondere con un po‟ più di calma. È possibile allora che ci siano incoerenze nelle risposte Siete mai stati intervistati? La stessa domanda può essere posta più volte o in maniera leggermente diversa, per vedere se c‟è una corrispondenza tra la domanda posta precedentemente e la domanda posta dopo, per vedere se la persona stia dando giusta attenzione alle domande. . Se il questionario è lungo la persona si stufa, si annoia e risponde male. Cosa succede? Il questionario cartaceo è uguale per tutti. Se avete preso il questionario del censimento, a parte le due versioni, long e la short form, il questionario cartaceo è un questionario sempre uguale, stampato per tutti. Se anziché usare la carta uso il computer, posso mischiare le domande in modo che la prima domanda non sia mai sempre la stessa e l‟ultima domanda non sia sempre la stessa, in maniera tale da ridurre l‟effetto noia delle risposte. I questionari dovrebbero essere brevi. Una decina di domande, non più di tre - quattro minuti. L‟alternativa rispetto al Papi è il CATI, è quello in linea di massima più utilizzato nei sondaggi elettorali. Sondaggi dei telegiornali, dei programmi, sono in linea di massima condotti secondo questa metodologia, sembra una cosa stratosferica, ma è molto semplice. Una persona telefona, fa le domande, invece di immettere i dati sulla carta, scrive direttamente sul computer la risposta. Più veloce, più economico, l‟intervistatore telefona, meno invasivo per la persona, non si trova a dover accogliere l‟estraneo. Però, evidentemente, ha anche degli svantaggi. Non consente di dedicare molto tempo ad ogni intervistato. I sondaggi telefonici vengono condotti, ma costano un euro cinquanta ad intervista. A loro non interessa farle benissimo, ma averne tanti, prima rispondi meglio è. Il vantaggio? Non devo fare la ricodifica dalla versione cartacea a quella elettronica. Le domande di incrocio, quelle di verifica se la persona risponde a caso o no, in questo caso hanno il controllo automatico. Se io prima rispondo che il rosso mi piace tantissimo, e poi rispondo che non potrei mai indossare qualcosa di rosso, ecco che magari si accende la lampadina sul computer che dice questo sta rispondendo in maniera non coerente. Si può cercare di ovviare al problema somministrato altre domande. Usando il computer è anche possibile fare percorsi guidati in maniera più semplice. Lei è mai andato a comprare un mobile negli ultimi 12 mesi? No, salta la tre. Se si, dove, cosa hai 68 comprato, quanto hai speso? Queste interviste strutturate su più livelli sono invece molto più facili se il questionario non è cartaceo ma elettronico. È utile avere il questionario elettronico perché a quel punto è impossibile saltare le domande. Può succedere che sia fatto male dal punto di vista puramente tipografico e ci sia la domanda in altro a destra alla quale non risponde nessuno perché non la vede nessuno. Impossibilità ad usare tecniche di probing. Ci sono a volte esigenze per capire meglio il perché delle risposte, perché hai risposto questo? Cercano di capire meglio l‟ opinione e pensiero dei rispondenti. Se la persona l‟ho davanti a me posso dedicare più tempo alla persona. Con quello che mi è costato almeno portare l‟intervistatore sino a casa del Tizio almeno intervisto bene, non ci sto due minuti. È più il tragitto di andare da Genova Centro a Molassana che il tempo di intervista effettivo. Nelle interviste Papi si possono fare approfondimenti per comprendere meglio il pensiero delle persone. Questo di solito non è di grosso interesse per le interviste Cati, veloci e rapide. DIARIO o questionario auto compilato. Caro diario, oggi ho comprato 12 euro di albicocche, 14 di ciliegie e 1 automobile. Mi serve per tenere traccia nel tempo degli acquisti che faccio. Parlo di questo perché è l‟esempio più classico che si da di questionario auto compilato. C‟è un contatto iniziale con l‟intervistatore che spiega come funziona. Dopodiché, dopo che l‟intervistatore ha spiegato come funziona il questionario, l‟intervistatore se ne va a casa e non se ne sta una due settimane a casa dell‟intervistato giorno e notte, se ne va, e poi spetta all‟intervistato andare a rispondere alle varie domande o a compilare le differenti tabelle che ci sono. I dati sono più accurati. Se io vi chiedessi quanto avete speso esattamente ieri, avreste difficoltà. Ma se uno sa che per una settimana deve tenere gli scontrini e segnarsi quanto spende per ciascun giorno nelle differenti voci di spesa si organizza e non ha problemi di ricordo, NO effetto ricordo. Se uno si rende conto di aver dimenticato qualcosa ha il tempo di correggere. Ci sono però dei problemi. Se l‟Istat mi chiede di registrare per due, quattro settimane tutte le spese che faccio, non è proprio un divertimento, magari c‟è l‟effetto novità del primo giorno, poi però la sera uno è stanco, non ne ha voglia. Buona collaborazione da parte degli intervistati e dev‟essere poco evasiva come cosa, periodi di tempo limitati. Esempio quadernetto primo giorno del libretto degli acquisti anno 2008. È un quadernetto, un libretto, fascicolo con un po‟ di pagine colorate diversamente a seconda del giorno e a seconda della settimana. Vedete, per esempio, rilevazione sui consumi delle famiglie, libretto degli acquisti 2008, numero verde se avete dubbi e un po‟ di disegnini molto scenografici. Pane cereali; pane grissini cracker. Codice, 1-1 spesa in euro. Giorno per giorno, indicando la data, si mette quanto si spende per ciascuno di questi alimenti. Pane cereali, dolciumi. 69 Simile è l’indagine sull’uso del tempo. Cosa avete fatto nelle varie giornate. Tra le 7 e 7e10 mi sono svegliato, dopo dieci minuti lavato, svegliato mio figlio, preparato colazione, fatta colazione, lavato i piatti. È una noiosata, tenete conto che si deve ricodificare tutto. Cosa sta facendo? Indichi l‟attività che svolge ad intervalli di tempo dieci minuti. Cos‟altro sta facendo? Indichi l‟attività contemporanea più importante: ho ascoltato la radio, ho letto il quotidiano. Se voi fate una attività per più tempo, non dovete scrivere: ho lavorato, ho lavorato. Tirate la riga. Attenzione a non indicare più di una attività sullo stesso riquadro. Ricordi di distinguere la occupazione principale dal secondo lavoro, indicando lavoro principale-altro lavoro. Dove si trova o come si sta spostando. Dove sono? A casa mia, sto facendo colazione e svegliando mio figlio. A casa mia ma potevo anche essere in albergo. A piedi o mi sposto in autobus. Poi in ufficio, trattare una riga verticale o usare le virgolette. Non solo, poi voglio sapere se sei da solo, col padre, la madre, coi figli, col marito, con l‟amante. Tracciare la linea verticale per indicare che sono da solo o con altre persone. Con familiari meno di dieci anni, conviventi dieci anni e più, familiari non conviventi, altre persone che conosco. La collaborazione da parte del rispondente è necessaria e i motivi sono piuttosto ovvi. Vediamo che le attività di campionamento possono esprimersi attraverso due tipologie di errori. La rilevazione può essere soggetta ad un errore. Ogni campione è diverso dagli altri, se ad ogni campione corrispondono dati diversi, ci troviamo di fronte ad una fonte di variabilità che non è la variabilità naturale, ma la variabilità campionaria, di cui abbiamo già parlato a inizio del corso. Dal momento che ad ogni campione corrispondono valori diversi le stime sono diverse. Abbiamo la varianza degli stimatori. Questa sfera di errori, legati alle procedure casuali di selezione delle unità del campione è chiamata fase o parte di errore campionario, legato alle attività di campionamento. Tutti gli errori che derivano da fenomeni di rilevazione, crocette messe nelle caselle sbagliate, dati mancanti, input sbagliati dei dati, se copio un questionario che è stato compilato con carta e penna e lo copio sbagliato, non è un errore campionario, ma è un errore non campionario. Se faccio un errore nel sommare i dati, faccio per esempio reddito medio dei maschi e invece sto facendo reddito medio delle femmine, quello non è un errore campionario, ma materiale dovuto alla fase di elaborazione dei dati, è un errore non campionario anch‟esso. Lo stesso qualsiasi tipologia di errore che possa emergere nella fase di diffusione dei dati è un errore non campionario. Successivamente, andremo a vedere gli aspetti relativi alla costruzione del questionario e vedremo nel dettaglio i concetti di errore non campionario. 70 LEZIONE 7 30/10/12 Pre appello circa il 19 DICEMBRE INDICI ED INDICATORI STATISTICI Parte prima: Introduzione e primi esempi Visto che ci sono ancora dei problemi, abbiamo creato una cartella sull‟aulaweb dell‟anno scorso. Siamo arrivati ad una metà abbondante del percorso che volevamo fare assieme. Abbiamo parlato di fonte statistica ufficiale, dato ufficiale e amministrativo. Ora iniziamo a guardare i metodi di analisi e sintesi dei dati. Per fare questo, andremo ad analizzare gli indici e gli indicatori statistici, vedremo la differenza tra indice ed indicatore. Stamattina, mentre mi stavo preparando per venire qui, ho visto che sono stati pubblicati gli ultimi risultati sull‟ indice di disoccupazione in Germania. Cosa è un indice? Una misura che serve a riassumere il comportamento di un certo fenomeno. Dà l‟indicazione del fenomeno. Che differenza c‟è tra indice e indicatore? Cominciamo oggi a parlarne. Verso la fine del corso si parlerà di alcuni indici particolari: indici dei prezzi al consumo. Interverrà a dicembre, il primo o il secondo martedì, una unità del personale del comune, che vi spiegherà con gran dettaglio quali siano le procedure che il comune segue nella rilevazione dei prezzi. L‟inflazione, il tasso di inflazione a livello nazionale, è un aggregato delle variazioni di prezzo che si misurano a livello locale. Le strutture che sono delegate alla rilevazione dei prezzi sono gli uffici statistici comunali, secondo uno schema stabilito dal programma statistico nazionale nell‟ambito del Sistan. Statistica: l‟abbiamo già detto tante volte, non ha origine chiara e ben definita. Può essere legata a status, posizione attuale, lo stato delle cose, stadera bilancia in latino, stat città. Più in generale è ricondotta alla parola stato, perché misura queste grosse misure dello stato inteso come stato o come nazione. La parola statistica fa riferimento al numero residenti, numero di famiglie, numero di abitazioni, numero di ovini caprini bovini, fa riferimento anche a tutti i movimenti turistici in ingresso ed in uscita dal paese, le strutture alberghiere. Statistica, differentemente da quanto visto nella parte di inferenza in statistica 1, non rappresenta necessariamente l‟insieme di metodi e tecniche per analizzare i campioni, ma rappresenta un insieme di tecniche di sintesi di grandezze per il paese. È la definizione storica di statistica, è la vecchia statistica, quella istituzionale. C‟è chi l‟ha definita come l‟altra faccia della politica: la politica dovrebbe indicare come un paese andrebbe governato, la statistica dice come il paese viene governato, 71 quali sono i grandi numeri. Oggi la parola statistica non ha più significato di misurazione delle grandezze dello stato, l‟abbiamo già accennato, in realtà si parla di statistica con sondaggi di opinione, interessi sui farmaci, l‟analisi dei mercati finanziari, anche le previsioni del tempo. Se prendete un qualsiasi programma su internet che vi dia le previsioni del tempo vi danno: probabilità di pioggia 40%. Secondo me è abbastanza confuso. Pioverà il 40% della giornata o con la probabilità del 40% verrà a piovere? Non è chiaro cosa si intenda con probabilità di pioggia. Queste metodologie richiedono metodologie statistiche. La statistica, sembra strano dirsi, ma ormai, per molti versi, si trova ovunque, si trova in qualsiasi situazione in cui vi siano dei dati da analizzare. Per alcuni versi anche il trattamento informatico dei dati è statistica. Tutte le analisi dati sono statistica. Anche tutte le analisi fatte in azienda sono in realtà poi analisi di tipo statistico. In alcuni casi prendono nomi differenti. Non so se farete controllo di gestione: si parla di indici di bilancio e si ottengono delle percentuali, si dà un significato sottostante ad una metodologia statistica. La statistica è qualsiasi analisi dati. Qualsiasi tipologia di analisi dati rientra nella statistica. Però, noi abbiamo parlato nel corso di statistica economica come un corso di statistica ufficiale, anche se la statistica ufficiale richiede alcuni aspetti inferenziali. Non possiamo pensare che la statistica ufficiale sia solamente analisi censuaria, ci sono anche analisi campionarie. L‟obiettivo dell‟analisi della statistica economica e sociale è di ordine macro. Gli aggregati che si vanno a studiare sono solitamente macroeconomici. La produzione statistica ufficiale è quella che viene utilizzata per le grandi decisioni di politica economica ed economia monetaria. La statistica ufficiale serve per prendere decisioni. La statistica ha l‟obiettivo di aiutare un decisore: dirigente d‟azienda, revisore contabile o sia governatore BDI-BCE. Il grado di complessità dello strumento varia a seconda della complessità dei dati e della decisione. Calcolare gli indici di bilancio è semplice, CCN è una formula da seguire con le poste di bilancio. Non ci sono grandi analisi da fare, molto spesso non è considerata statistica se non l‟applicazione di una formula. È chiaro che una decisione di politica economica, decidere di alzare, introdurre l‟IMU, abbassare l‟IVA, sono analisi che richiedono simulazioni di scenario. Cosa succederebbe se facessimo questo o quest‟altro? Devo avere aggregati di dati sottostanti che ci permettano di prendere decisioni. Lo stesso avviene a livello locale. Ne abbiamo parlato tante volte: se si vogliono attuare particolari politiche sociali nell‟ambito di regione provincia e comune, bisogna avere alla mano un po‟ di numeri per evitare di andare a disperdere l‟attività e le risorse del comune in maniera tale da cercare di focalizzarle nei luoghi e verso le persone che effettivamente ne hanno bisogno. A nessuno verrebbe in mente di aprire una mega struttura di asilo nido nell‟entroterra ligure sperduto nei monti. Meglio farlo dove i bambini ci sono. Ci sono situazioni in cui il contesto nel quale prendere le decisioni non è chiaro. 72 La statistica ufficiale serve a fornire delle informazioni per i decisori. Abbiamo le decisioni come fine ultimo della statistica, e della statistica ufficiale. Attenzione: la statistica non si può sostituire al decisore. Il decisore (PDC, ministro dell‟economia, assessore comunale o regionale, direttore di una azienda ospedaliera, responsabile di un certo numero di asili nido) deve cercare di individuare la soluzione migliore sulla base degli elementi certi che ha a disposizione. Può trarli dalla propria esperienza ma anche dai database amministrativi di cui abbiamo parlato sino ad oggi. La statistica non ha uno scopo autoreferenziale di piacersi e produrre tabelle e dati, ma ha lo scopo di fornire le basi per prendere le decisioni. Ve lo dico già, in generale in Italia c‟è una particolare resistenza nei confronti del dato statistico, il dato statistico non mente. Ci sono modi per mentire con la statistica. Ma se i dati vengono raccolti e analizzati nel modo giusto non mentono. Se la politica ha o meno avuto successo i dati non mentono. C‟è una resistenza a livello italiano. La cultura italiana è di tipo umanistico letterario. Ci sono persone quasi orgogliose che in televisione dicono che non conoscono il teorema di Pitagora. Se una persona non sa chi ha scritto l‟Iliade o l‟Odissea è una vergogna. Non conoscere le basi della matematica, la differenza tra una stella e un pianeta, allora quello non è grave! Se avete velleità più scientifiche metteteci una croce su, la cultura italiana è prevalentemente umanistica. Tant‟è vero che la statistica viene sempre utilizzata poco, la sensibilità nei confronti del dato è scarsa. Diversamente dai paesi anglosassoni o del nord Europa, in cui le decisioni vengono fortemente effettuate sulla base dei dati. Ci sarebbe molto da dire su questo, ma non apriamo il capitolo. Guardiamo la complessità dell’informazione statistica. Il mondo corre sempre più veloce. Lo sentiamo dire spesso, l‟abbiamo già detto sulla questione della pertinenza e tempestività dell‟informazione statistica. Abbiamo visto le caratteristiche del dato statistico: accurato, pertinente e tempestivo. Avere oggi i dati di tre anni fa serve a poco. C‟è bisogno di avere informazioni sempre più tempestive. Non so se avete visto, credo che vi sia sfuggito, nel decreto sviluppo di Monti è stato deciso che l‟Italia userà il sistema rolling census francese. Le informazioni sono campionarie aggiornate ogni anno con rotazione quinquennale dei comuni che vengono campionati. Quel sistema verrà realisticamente adottato anche in Italia. Le decisioni devono essere prese sempre in tempo. Abbiamo un mondo che cambia velocemente. I dati che abbiamo rilevato non si riferiscono più alla popolazione di adesso. Trovate il dossier della Caritas che dice che in Italia 5.000.000 di immigrati regolari tra cui 2.000.000 nella CE. I dati li prendo oggi e tra sei mesi non valgono più. La produzione statistica ufficiale, anche l‟Istat, stanno introducendo nei loro dati anche un aspetto previsivo. Vanno a cercare di prevedere come sarà l‟inflazione, disoccupazione, prodotto interno lordo di qui a tra sei mesi in modo da dare al decisore pubblico la possibilità di prendere decisioni non a posteriori ma possibilmente ex ante, in modo tale da anticipare la tendenza e correggere la rotta. 73 Non possiamo permetterci di sbagliare nel prendere le decisioni. Possiamo permettercelo, tutto dipende dall‟effetto della nostra decisione. Se si tratta di aprire o meno un punto vendita possiamo ancora gestirlo. Decidere se uscire o meno dall‟euro, o prendere una azione piuttosto che un‟altra di politica economica, sono terreni minati con i mercati finanziari. Dall‟altro punto di vista abbiamo sempre più informazioni disponibile, abbiamo i database amministrativi. Bisogna: analizzare i dati raccolti, trasmettere l‟informazione contenuta dentro di essi e prendere le decisioni. Questo vale si a livello di statistica ufficiale che di statistica per le decisioni aziendali. Anche per decisioni di marketing o strategia d‟azienda è chiaro che questo deve essere fatto. Vediamo un esempio di come è cambiata la complessità dell‟informazione. Prendiamo le domande che erano presenti, il numero dei questi, che erano presenti nei questionari dei censimenti. Nel 1861, primo censimento italiano, avevamo 13 domande: 9 dati anagrafici, 1 famiglia alloggio, 2 istruzione, 1 occupazione. Col passare degli anni le domande sono aumentate. Se vedete la barra, l‟istogramma, il diagramma a barre è tanto più lungo quanto più lunghe sono le domande. I colori differenti fanno riferimento alle domande. I dati anagrafici fanno da padrone dei questionari sino al 1936 e il numero di domande è rimasto fluttuante tra il dieci e venti con sforamento delle venti nel 1921 e 1931. Tra quei due anni, nel 1926 abbiamo l‟istituzione dell‟Istat. Nel dopoguerra le domande sono cresciute moltissimo. Quello che poi è diventato interessante, è che in linea di principio le domande relative ai dati anagrafici sono rimaste le stesse se non addirittura sono diminuite. Potendosi avvalere di dataset amministrativi, negli anni ‟80 e ‟90 c‟è stato un minor bisogno di andare a rilevare direttamente questo fenomeno. Sono aumentate molto le domande relative a famiglia e alloggio. Da una domanda sino al 1936 a 8 a 19 sino a 22. Sono cresciute, anche se in modo meno forte, le domande relativamente all‟istruzione 3-3-5-4-4.L‟occupazione è diventa un po‟ più interessante dal punto di vista di indagine. Questionari del 2001 e 2011 sono aumentati moltissimo. Siamo partiti con 13 domande nel 1861 e, dopo 15 censimenti, siamo arrivati ad oltre settanta domande. È evidente che il bisogno informativo si è reso più stringente. Se hai bisogno di più informazioni rilevi più dati. Vediamo che il settore in cui sono cresciute di più le domande è l‟istruzione anche se l‟occupazione è cresciuta molto. Ci siamo stabilizzati dal secondo dopoguerra riguardo al numero di domande su famiglia e alloggio. Anche le domande sui dati anagrafici si sono rese abbastanza stabili ma sono aumentate per rilevare meglio la componente straniera della popolazione. Cosa è la comunicazione statistica? Da un lato ho dati, tabelle e grafici. Di solito vengono pubblicate sui libri, internet e li muoiono, se nessuno le va a prendere. Produrre statistiche ufficiali in senso stretto significa produrre tabelle. Le tabelle da sole non sono informazione. È come comprare un libro pensando di averlo già letto. È diverso. A me capita di trovare un articolo scientifico interessante, già il fatto di stamparlo, fotocopiarlo e pinzarlo mi dà l‟idea di averlo già letto, non è così. 74 Con questi dati cosa dobbiamo fare? Darli agli amministratori e dirigenti che devono prendere decisioni. Il lavoro dello statistico non è quello di produrre tabelle. Non è il lavoro che faccio io. Non c‟è un unico statistico che faccia tabelle. 36.03 Deve sforzarsi di riassumere i dati, gli aspetti essenziali delle tabelle, dati e grafici, e metterli a disposizione dei dirigenti che devono prendere le decisioni. Possono essere sia dirigenti pubblici sia dirigenti d‟azienda. Poi devono essere trasferiti ai giornalisti. Alla radio si danno informazioni a riguardo della popolazione straniera, si dice come sta andando il paese, come si fa a diffondere un documento nel modo più veloce? Su internet potenzialmente lo può vedere chiunque. Anche attaccare un poster per strada potenzialmente può vederlo chiunque. È chiaro che i giornalisti non riportano mai la tabella, ma quello che interessa sono i pochi valori del fenomeno. Lo stesso i cittadini. Conoscenza è democrazia. Poter avere i dati sui dati delle amministrazioni, sui bilanci di aziende, enti pubblici, sui bilanci dei partiti come vengono spesi i soldi è una forma di controllo sugli organi di governo dell‟amministrazione pubblica. Conoscenza dei dati come forma di democrazia. C‟è una tenenza generale, a livello globale, di rendere disponibili i dati come nuova forma di democrazia partecipativa. Dai dati sono fonte di informazione. Dai dati giudico l‟operato delle amministrazioni. È chiaro che non tutti riusciranno a capire cosa c‟è all‟interno dei dati. Se sono disponibili, un giornalista può tirare fuori informazioni interessanti e derivare giudizi sull‟operato dell‟amministrazione. Questa tipologia di diffusione dei dati in maniera gratuita è chiamata open data. Ci sono tantissimi siti che parlano di open data. Sul sito dell‟Inps trovate open data. C‟è un processo a livello globale di avvicinamento dei cittadini al dato. Sebbene ci sia, in modo particolare in Italia, questa riluttanza di fronte al dato, i dati sono oggettivi essi sono importati. Bisogna sintetizzare l‟informazione in pochi valori chiave per farlo costruisco indici e indicatori. Spesso i termini indici ed indicatori vengono usati come sinonimi, c‟è una differenza, anche se nel prosieguo li utilizzeremo come sinonimi. Indice viene dal latino index, qualsiasi cosa di utile ad indicare. Indicatore, indicator è ciò che indica. La parola indice, già utilizzata dal „700, siamo sempre li come periodo. La statistica ufficiale nasce nel „700, ha di fatto molti significati. Misura di sintesi delle proprietà di una distribuzione: reddito medio, tasso di disoccupazione, aspettative di vita. oppure può essere un numero puro non dipendente dall‟unità di misura dei dati: indice dei prezzi al consumo alla produzione, indice della produzione industriale. Questi li andremo a vedere nella fase conclusiva del corso. Il reddito medio è un indice di ricchezza. Qual è il reddito medio degli italiani? Ci fa capire come è la situazione. Posso anche dire qual è la percentuale di italiani che sono al di sotto di una soglia, che definiamo reddito di pura sussistenza. Aspettativa di vita? Gli anni che la persona nata in un certo anno può aspettarsi di vivere. Novant‟anni, un bimbo che nasce oggi ha aspettativa di vivere novant‟anni. Trentacinque anni invece per altri paesi più poveri. 75 Indicatore. Fa riferimento a qualcosa di più complesso. Un indice è un indicatore. In realtà indicatore è un elemento di un insieme di indici, è qualcosa di più complesso, è qualcosa di sistemico. È un sistema di indici che prende il nome di indicatori. Quando parlo di misure indirette di fenomeni complessi, abbiamo un indicatore. È uno strumento di valutazione complessa di un fenomeno a cui si riferisce un certo legame con un referente concettuale che fa parte di un modello di ricerca e di uno schema interpretativo. Un indicatore rappresenta una statistica. A volte si parla di statistica come anche come indicatore. Le statistiche sul commercio sono indicatori sul commercio, le statistiche sulla disoccupazione sono indici e indicatori sulla disoccupazione, e così via. Un indice diviene indicatore quando la sua definizione e misurazione è collegata ad un obiettivo definito. Vediamo degli esempi. Come misuro la povertà? Prendiamo l‟Africa. Posso misurarla in GDP (Gross Domestic Product). Posso fare il PIL procapite, PIL diviso per il numero degli abitanti. Oppure possiamo costruire un indice di povertà legato al grado di alfabetizzazione della popolazione, vedo qual è la percentuale di persone che sanno leggere o scrivere, oppure vedere l‟aspettativa di vita. Queste mappe colorate, o graduate per livelli dell‟indice, sono colorate dal più chiaro al più scuro. Il più scuro è il valore più basso. Bianco sono assenza di dati, marroncino chiaro valori piuttosto alti, Sud Africa, gradazione più scura per indicare un fenomeno più forte, intenso ma più basso. La povertà è più forte dove il reddito procapite è più basso. La povertà è più forte dove la percentuale di persone che sanno leggere e scrivere è più bassa, la povertà è più forte dove l‟aspettativa di vita è più bassa. Sono misure e indici che singolarmente presi vanno ad analizzare aspetti differenti di un fenomeno che possiamo collegare alla povertà. Non ci dicono la stessa cosa, l‟informazione non è la stessa. Sono collegati al medesimo fine, proviamo a ragionare in termini di povertà, ma non ci danno la stessa informazione perché le tre mappe sarebbero colorate allo stesso modo. L‟informazione di questi tre indici è differente. Quali sono le caratteristiche che dovrebbe avere un indice per essere chiamato indicatore? Esclusività. Dovrebbe essere non sostituibile con un altro indice per indicare lo stesso fenomeno sociale. Due indici che ci danno la medesima informazione? Posso vedere se c‟è un indice comune. Sensibilità. Dovrebbe essere in grado di esprimere l‟intero fenomeno osservato e registrare tutte le variazioni del fenomeno stesso. Ci deve essere un legame lineare rispetto a ciò che viene misurato. Univocità. Interpretabile in modo non ambiguo rispetto alle direzioni delle variazioni. Se abbiamo una variazione negativa del reddito procapite? Dobbiamo aspettarci che corrisponda una variazione positiva della povertà. Non dobbiamo avere indici che abbiano una variazione non lineare. Fedeltà. Dovrebbe imputare le variazione lungo il tempo a cambiamenti della realtà e non alla qualità della misurazione. È evidente, definito lo standard l‟indice non 76 dovrebbe essere soggetto a variazioni non imputabili ad altro che alla variazione del fenomeno sottostante. Sintesi. Dovrebbe essere la sintesi di aggregazione di osservazioni parziali. Finalizzazione dovrebbe essere correlato agli obiettivi dello studio. Esaustività descrivere tutte le dimensioni considerate. Significatività . Dovrebbe essere significativo relativamente alle unità territoriali considerate. Le tre entità che descrivono il concetto di indicatore sono : - Comunicazione. Un indice è inutile se non trasmette informazioni. Se è difficile non serve. Deve essere bello, chiaro che uno lo vede e capisce cosa sia. Deve consentire la conoscenza da parte del fruitore dell‟indicatore. - Semplificazione. Un indice che rende ancora più complessa la comprensione del fenomeno è inutile. Deve attuare una riduzione della complessità del fenomeno a vantaggio di una sua più facile comprensione. Ogni semplificazione, ogni sintesi dei dati porta ad una perdita di informazione. Quando abbiamo visto a statistica 1 la perdita di informazione, abbiamo parlato di perdite o misura del danno. Ogni sintesi porta ad una perdita di informazione. Tuttavia, in generale, è preferibile avere una modica perdita di informazione a vantaggio di una maggiore capacità comunicativa, e avere una maggiore informazione. - Quantificazione del fenomeno, per poter confrontare nel tempo l‟andamento di questo indice e confrontarlo anche nello spazio. Semplificare sempre? Ci sono due frasi, una assegnata ad Einstein: cercherò di rendere il discorso il più semplice possibile ma non oltre. Al di sotto di un certo livello di semplicità non posso andare sennò dico cose sbagliate. La seconda: non si può ammorbidire troppo il ghiaccio sennò si va ad ottenere acqua calda. Lo stesso per gli indici, giusto compromesso tra trasmissione e complessità delle informazioni raccolte. Per giocare a calcio, per esempio, possiamo dire che la terra è piatta. Per quello che dobbiamo fare, 150 metri di lunghezza del campo di calcio dire che la terra è piatta va benissimo. Se dobbiamo fare un viaggio aereo no. Da Parigi a NY non andate lungo il meridiano. Andate prima verso nord e poi si scende in giù. La rotta ortodromica è più corta della lossodromica. Gli indicatori possono non solo rappresentare un fenomeno, ma essere usati come criteri e metodi per arrivare ad una valutazione. Servono per prendere decisioni di politica e di gestione. Ecco che prima di decisioni, si va ad inserire una freccetta che si chiama valutazioni. Abbiamo la statistica ufficiale, da questa devo creare indicatori che permettano di effettuare valutazioni e al termine di esse prendo le decisioni. D‟altra parte, un singolo indicatore pur se collegato ad un particolare bisogno conoscitivo, non è significativo in quanto fornisce una informazione utile per descrivere fenomeni complessi. Ciascuno di essi assume significato solo se inserito ad una struttura più ampia finalizzata alla conoscenza dei fenomeni di interesse. 77 È il classico problema dei KPI (Key Performance Indicator). Forse li avete sentiti nominare in qualche altro corso. Si parla di deshboard di gestione aziendale. Dove per deshboard si intende un cruscotto con un foglio, fatto in Excel, in cui avete fatturato ultimo mese, ordini ricevuti nell‟ultimo mese, variazioni rispetto a ultimo mese, mese precedente, merci in magazzino. Variazioni in un unico foglio in cui ci sono indici ed indicatori in cui trovate i KPI. Si parla di sistemi concettuali. Adesso vedremo che si usa un sistema complesso di definizioni e concetti che andiamo ad elaborare. Modello concettuale. I fenomeni sono osservabili e misurabili dopo aver definito un modello concettuale di riferimento. Se volete misurare l‟inflazione, la disoccupazione, andamento economico. Cosa è? Variazione del PIL, variazione degli introiti fiscali, variazione degli occupati e disoccupati. Cosa voglio misurare? Bisogna definire una serie di concetti astratti che si chiamano costrutti. La definizione del modello concettuale è un momento complesso, richiede di identificare e definire questi costrutti logici che derivano da astrazioni, dati dalle teorie economiche. Se decido di analizzare il modello concettuale legato all‟andamento economico, dovrò riferirmi ad una serie di teorie economiche che mi fanno entrare nel modello gli indicatori delle quantità di interesse. Per esempio base monetaria e spesa pubblica. Ci metto dentro una teoria monetarista con la base monetaria ed una keynesiana con la spesa pubblica, per fare un esempio molto semplice. Facciamo un esempio molto semplice. Di benessere parleremo a lungo parlando di PIL e del benessere ecosostenibile. Cosa è il benessere sociale? ci sentiamo tutti bene? C‟è benessere sociale. non funziona così. All‟interno del benessere sociale definiamo dei costrutti, dei concetti astratti in modo tale che siano formulati e ipotizzati in maniera tale che siano fondati nel mondo empirico. Benessere è quando c‟è benessere economico, sanitario, alfabetizzazione, eccetera. Possano essere misurati empiricamente, cosa non facile. C‟è un benessere psicologico non facile da misurare empiricamente; riflettano la natura dei fenomeni considerati. In particolare dobbiamo dare una attenzione all‟identificazione del livello di omogeneità e dimensionalità del costrutto. Per esempio status sociale, è un esempio di costrutto. Lo staus sociale è qualcosa che è vago. Si compone, al suo interno, di una serie di variabili che possiamo chiamare variabili latenti. Ciascun costrutto è definito da uno o più aspetti generali rappresentati dalle variabili latenti che esprimono il concetto da misurare. Se volessimo identificare un costrutto status sociale, cosa descrive lo status sociale? L‟istruzione, professione e altre cose. Lo status sociale non è solo una questione reddituale. La variabile latente rappresenta l‟aspetto da rilevare per avere una visione complessa del costrutto. Ho il modello grosso, sottostanti i vari costrutti e all‟interno di ciascun costrutto le singole variabili latenti. Se volete pensare ad un albero, ho una cosa del genere. Ho il modello, al di sotto ho una serie di costrutti, per esempio quattro, e poi ciascun costrutto è definito dalla frangia di un tappeto, cioè dalle singole variabili latenti. Mettendo tutto insieme arriviamo al famoso modello. 78 L‟identificazione delle variabili latenti dev‟essere basata su premesse e presupposti sia teorici che empirici e richiede un lavoro raffinato. La definizione delle variabili può aumentare in modo significativo la potenza del costrutto sia a livello teorico che empirico. Cosa potremmo usare come indicatore per il grado di alfabetizzazione? Anni di scolarità o titolo di studio. Vediamo l‟insieme. Abbiamo il modello concettuale, la teoria. Il modello macroeconomico che spiega il benessere economico. Il modello concettuale che consente di definire il modello concettuale ed i costrutti ad esso connesso, benessere sociale. poi ho i concetti astratti che sono molto generali, detti anche costrutti. Sono le aree di indagine, detti domain che caratterizzano il fenomeno da studiare, per esempio lo status sociale. Poi le variabili che definiscono i costrutti, istruzione e condizione professionale. Se prendo la variabile istruzione, può essere misurata attraverso vari indicatori che possono essere per esempio il titolo di studio e gli anni di scolarità.. Avete il modello che è benessere sociale, tanti concetti astratti, tra cui lo status sociale che può essere misurato attraverso tante variabili, ciascuna variabile misurate attraverso un indicatore. Da livello elementare di indicatore sino a quello generale del costrutto. È qualcosa di complesso. Parliamo di un indice, che potrebbe essere chiamato indicatore. ISU (Indice dello Sviluppo Umano), esiste dal 1990 è usato per misurare lo sviluppo umano dei paesi. Anche noto come HDI, è stato utilizzato nel 1990 per il primo rapporto sullo sviluppo umano delle nazioni unite. Li vedete il rapporto 2011, non so se è già uscito quello del 2012. In tale rapporto lo sviluppo umano è definito come il processo di ampliamento delle scelte delle persone (cercate di ricondurvi al concetto di modello), sottolineando come le scelte e opzioni base di cui un essere umano deve poter disporre siano quelle di una siano vita lunga e sana, acquisizione di conoscenze, accesso ad un reddito sufficientemente elevato a consentire un dignitoso tenore di vita. Un paese è sviluppato non se è ricco, ma se chi vi abita può vivere a lungo, vivere con un reddito che consenta di avere un dignitoso status di vita e permetta studiare e avere un buon grado di conoscenza e non di ignoranza. Abbiamo definito il modello e i nostri costrutti. Il modello è il processo di ampliamento delle scelte delle persone che si sviluppa secondo queste tre dimensioni: vita lunga e sana (abbastanza vago), acquisizione di conoscenze, reddito elevato. Siamo a livello dei costrutti. Poi abbiamo le nostre variabili, possono essere di vario tipo. Il rapporto propone l‟adozione di un nuovo indicatore che tenga conto di tutte e tre le dimensioni dello sviluppo sopra individuate, speranza di vita istruzione e reddito. Cosa propone? Di utilizzare, per la vita lunga e sana la speranza di vita; capacità delle persone di formarsi l‟alfabetizzazione; per la ricchezza il logaritmo del prodotto interno lordo procapite, dando un‟importanza meno rilevante alla ricchezza. In questa ipotesi si pensa che l‟utilità marginale del reddito sia decrescente (in termini economici). 79 Ho il PIL reale di tutti i paesi, ne calcolo il logaritmo e da qui ho la variazione di 1000 euro che pesa di meno di una variazione di 100 euro. In proporzione 1000 su cento è 10 volte ma il logaritmo di 1000 diviso il logaritmo di 10 non è 10. Lo sapete come è fatta la funzione logaritmo? È fatta così. Qua abbiamo 1. Se avete il PIL pro capite, se questo è per esempio qua ho 1000 e qua 100, questa è un dieci volte. Il logaritmo è minore di dieci volte. Specifica che l‟utilità marginale del reddito risulta essere decrescente quanto più uno è ricco tanto meno ha bisogno di soldi aggiuntivi. Per chi è povero un euro è molto più importante rispetto a Berlusconi. L‟ISU calcola per ciascuna delle tre variabili un indice. Poi va a normalizzarli secondo i valori e il criterio che abbiamo visto nel corso di statistica 1 e li combina tutti assieme. Vediamo un esempio. Lo Zimbaue ha un valore 12, USA 41. Zimbaue 12 valore minimo, USA 41 valore massimo. Supponiamo che l‟Italia abbia 34. Come si fa a normalizzare un indice? Dovete ricordarlo da statistica 1. Prendo il rosso e il verde, differenza tra Italia e Zimbaue 34-12 diviso 41 meno 12. L‟Italia è al 75% del valore della variabile. Prendo l‟indice di speranza della vita italiana, l‟indice di alfabetizzazione dell‟Italia, l‟indice riguardo al PIL procapite dell‟Italia e faccio una media ponderata in cui ogni indice pesa uno, in realtà media aritmetica. Questa è stata una scelta molto discussa. Io prendo un indice di alfabetizzazione di tutti i paesi, la ricchezza di tutti i paesi, la speranza di vita di tutti i paesi. Poi trasformo questo in un indice che va da 0 a 1, da 0 a 100%. 0 se sono sfortunato e 1 se sono fortunato. Prendo i valori e calcolo la media aritmetica. La logica è che, condizioni di vita accettabili, vita lunga e sana e alfabetizzazione sono tre aspetti della dignità umana che hanno lo stesso peso, non ce ne è uno che sia il più importante, allora vengono messi sullo stesso piano. Poi si può dire: è più importante la vita lunga, è una opinione. Il problema della costruzione di questi indici di sintesi ricade qua. Se ho tanti indicatori come li combino in un unico indice? A volte non è semplice, ci sono gruppi di lavoro, si discute, si parla e si arriva ad un accordo. L‟indice ISU ha suscitato grande interesse tra i politici, gli operatori dello sviluppo, gli studiosi, la stampa e l‟opinione pubblica. In particolare ciò che ha colto particolare interesse è che sia una media non ponderata, tutti compreso uno, di un paese nella scala della speranza di vita. La risposta è che la somma dei tre indici non è preponderata perché tutte e tre le caratteristiche hanno lo stesso peso. Quello che risulta interessante, è che se noi prendiamo il 20% dei paesi più ricchi, scusate questo 20% della popolazione più ricca al mondo ha l‟87% del reddito mondiale. Se siamo 7 miliardi di persone al mondo, 1 miliardo e quattro messe assieme fanno l‟83% della ricchezza mondiale. Il quinto più povero della popolazione, 1 miliardo 400.000 ha reddito complessivo dell‟1, 4 rispetto a tutto il reddito mondiale. Queste misure di disuguaglianza economica, che voi avete un pochino visto utilizzando l‟indice di concentrazione del Gini, ricadono qua dentro. Perché Gini, italiano, primo presidente dell‟Istat aveva sviluppato l‟indice? Per misure di disuguaglianza sociale. 80 Posso ragionare in termini di misura dell‟indice del Gini a livello di concentrazione del reddito mondiale. Inoltre, se vado a fare una rappresentazione dell‟ISU a livello planetario e indico dove sono i posti con ISU più alto, trovo USA, Canada Francia Irlanda paesi Scandinavi e Islanda e poco altro nelle fasce più alte. Poi Spagna, Italia Germania eccetera, poi i posti Russia, Cina e così via, tutti gli altri paesi. Così ho costruito un indicatore di sintesi dei tre indice singoli: alfabetizzazione, reddito procapite (logaritmo del reddito procapite) eccetera. Un indice di questo tipo è interessante da studiare nella sua evoluzione temporale. Nel grafico c‟è la serie storica dell‟ISU di Zimbaue e Mozambico da 1970 a 2010, in realtà è stato calcolato retroattivamente, visto che è nato nel 1990. Lo Zimbawe è caratterizzato da un trend crescente per poi andare a diminuire fortemente. L‟indice del Mozambico va a crescere. Se voi avete un indice così fatto, ISU = I1+I2+I3 diviso tre, se ognuno di questi indici va da zero ad uno, l‟ISU non può che andare da zero a 1. Zero se tutti e tre gli indicatori valgono zero, e uno se tutti e tre valgono uno. Mozambico 38% del massimo teorico, dove il massimo teorico risulta quello del paese messo megloi. Abbiamo rappresentazione temporale. Se voglio fare un confronto spaziale, uso un diagramma a punti (come a statistica1) e vedo la relazione tra sviluppo umano e tonnellate di CO2 prodotte per persona. sono dati del 2003, non ci interessa averli aggiornati, servono solo per vedere come sono sistemati. Abbiamo paesi con sviluppo umano alto, Norvegia Svezia Svizzera e Francia, e paesi con tonnellata di C02 prodotto per persona molto alto. Abbiamo paesi come Uruguay e Costa Rica C02 bassa e sviluppo umano abbastanza elevato. Non dovrebbe stupire più di tanto che ci sia una relazione tra l‟ISU e le tonnellate di di CO2 prodotte. Le tonnellate di C02 prodotte vengono dalle industrie, dal traffico, dalle macchine. I paesi sviluppati e più forti economicamente hanno produzione di CO2. Non c‟è da stupirsi che i paesi più ricchi con PIL più alto e PIL pro capite più alto hanno un ISU più alto, perché l‟ISU include per un pezzo il PIL. Non è una magia che ci sia questa relazione. Guardiamo ancora l‟ISU per l‟Italia. Regioni con ISU più alto sono Piemonte ed Emilia Romagna. Tutto il Nord si sviluppa bene, non è molto alto il Trentino Alto Adige, e il sud sviluppo umano più basso. Stiamo parlando di .88 .91. Per oggi va bene così. Martedì prossimo andremo avanti con indici ed indicatori e poi PIL e indici di benessere. 81 LEZIONE 8 06/11/2012 DAL PIL AL BES LA MISURAZIONE DELLA RICCHEZZA DEL BENESSERE L‟ultima volta abbiamo discusso di che differenza ci sia tra un indice ed indicatore. Abbiamo parlato di modelli, costrutti, variabili latenti e come l‟inserimento in un organico di tanti indici ne rappresenti poi un indicatore. Iniziamo oggi un nuovo argomento che occuperà due lezioni: la misurazione della ricchezza. Misurare la ricchezza di un paese è uno dei compiti più difficili e importanti della statistica ufficiale. L‟abbiamo già detto tante volte, la statistica economica, la statistica sociale e ufficiale, ha l‟obiettivo di effettuare misurazioni sui grandi aggregati di un paese e misurare la ricchezza è uno degli aspetti più interessanti. Pensate ai singoli individui, alle singole aziende: come si misura la dimensione dell‟azienda? In base al fatturato, non agli utili. Lo stesso dicasi per un paese. Come lo dimensiono? Per la popolazione, come l‟azienda può essere dimensionata per il numero di addetti. Però si può misurare anche in relazione alla ricchezza prodotta ogni anno. La statistica, nella sua concezione più antica, è la scienza che misura le grandezze di un paese. Una delle più importanti è evidentemente la ricchezza. Ma che cosa è la ricchezza? È una domanda che prima dobbiamo porci sulla base dei discorsi anche fatti l‟altra volta. Prima iniziamo ad individuare il contesto per avvicinarci alla misurazione. Non diciamo il PIL è questo prendetelo per dato, costruiamo il ragionamento che ha portato alla costruzione del PIL. “La ricchezza delle nazioni” che penso abbiate sentito nominare come titolo di un libro, o “Indagine sulla natura e le cause della ricchezza delle nazioni”, titolo completo, è un libro che è stato scritto nel 1776 da Adam Smith, considerato uno dei padri della economia politica moderna. È il famoso autore della fabbrica di spilli. È anche l‟anno della dichiarazione di indipendenza americana. È un libro che pone le basi della moderna economia politica. Se lo cercate in libreria costa una decina di euro, non ci sono più i diritti d‟autore. “La ricchezza di una nazione non deriva dalla quantità di risorse naturali o metalli preziosi di cui essa può disporre, (non definisco ricco un paese che ha miniere di diamanti, o d‟oro o uranio o petrolio) né è generata solo dalla terra (non conta solo la produzione agricolo, considerate anche il tempo), ma dal lavoro produttivo in essa svolto, e dalla capacità produttiva di tale lavoro”. Se vado a vedere la Groenlandia o l‟Antartide trovo grandissime risorse naturali non sfruttate per varie ragioni ma non per questo sono delle potenze economiche a livello mondiale. La ricchezza delle nazioni, partendo dalla definizione di Smith, non è la misurazione della ricchezza potenziale ma quello che viene effettivamente prodotto nel paese. 82 Oggi la posso definire come “il valore totale dei beni e servizi prodotti in un Paese in un certo intervallo di tempo (solitamente un anno) e destinati al consumo dell‟acquirente finale, agli investimenti e alle esportazioni”. Abbiamo già dato macroeconomia. Un paese, una nazione, è molto ricco, non se ha molto denaro, ma se possiede molti beni e questi beni sono stati prodotti. Avere solamente tanti prodotti bancari non rende un paese ricco, si ha tanta liquidità, ma se vedete la Svizzera ha depositi bancari altissimi ma non la rendono un paese particolarmente ricco. Può essere ricca per le attività economiche connesse a queste risorse finanziarie. Una delle formule più importanti della teoria economica è la identità keynesiana. Y= C+I+NX+G-T. NX sono le esportazioni nette. - Y ricchezza prodotta nel paese in un anno (PIL/GDP, gross domestic product) - C sono in consumi finali delle famiglie (quanto le famiglie spendono) - I sono gli investimenti delle aziende per la loro crescita, comprare nuovi macchinari - Nx esportazioni nette: esportazioni meno importazioni. Esportazioni in senso positivo, mi entra ricchezza nel paese. Meno importazioni è una ricchezza che esce proprio a seguito del processo di importazione - G spesa pubblica, va ad aumentare il reddito complessivo. Attraverso la spesa pubblica lo stato da soldi alle aziende, ai privati, agli operatori economici che possono produrre e consumare - Meno T è la tassazione, parte di reddito sottratta agli agenti economici a seguito della tassazione È inutile che parliamo di risparmio, sapete che rientra indirettamente in questa equazione. Tra l‟altro Keynes ha anche scritto un trattato di probabilità. È evidente che il PIL costruito attraverso l‟identità keynesiana, noi ragioneremo su questa identità, valuta la ricchezza di una nazione solamente in relazione al valore in denaro delle transazioni o di quanto prodotto. È quindi una valutazione strettamente quantitativa , non qualitativa della ricchezza delle nazioni. Ha il pregio di essere fortemente utilizzato ed evoluto, sostanzialmente perché l‟introduzione a livello mondiale del PIL risale al dopoguerra con gli accordi di BW. Si decide di usare il PIL come misura della ricchezza del paese. È ormai un elemento diffuso, comune che se parlate ai genitori di prodotto interno lordo più o meno sanno di cosa si tratti. È un concetto che chiunque ha acquisito. Tuttavia ha anche dei limiti. In questa presentazione, oltre vedere le caratteristiche principali del PIL vedremo i limiti. Quello che ha di bello, è che a partire dal secondo dopoguerra è iniziato ad essere misurato in tutto il mondo, e consente di fare raffronti spaziali, tra paesi, e temporali in anni differenti. Per esempio, vediamo un confronto spaziale. Ho dei dati che vengono dal FMI e si riferiscono al 2010. Un po‟ vecchi, ma non è importante per quello che ci interessa. 83 Vediamo che il PIL mondiale inteso in milioni di dollari è di 74 milioni di milioni di dollari, o 74 mila miliardi di dollari, cioè 74 triliardi di dollari. Il famoso G7, la struttura dei grandi 7 che si sta man mano allargando sempre di più, rappresentava nel 2010 il 40% della ricchezza mondiale. Su 74 milioni di milioni di milioni di dollari, 29 mila erano del G7. L‟UE rappresenta il 20% della ricchezza mondiale, mentre la zona Euro il 15% della ricchezza mondiale. Gli USA da soli pesano quanto l‟intera UE. La Cina da sola pesa all‟incirca come la zona euro. Questo per iniziare a capire, a livello mondiale, dove avviene la produzione di ricchezza, dove per produzione di ricchezza intendiamo qualcosa di ben preciso. In linea di principio, su all‟incirca 200 paesi che possiamo identificare al mondo, quelli che sono al di sotto del 15esimo producono meno dell‟1% della ricchezza mondiale. Se volessimo fare una somma siamo 20-40-49-55-60-65-70. I primi 15 paesi producono circa il 70% della ricchezza mondiale. Se ci fosse una equa distribuzione della ricchezza del mondo, se noi avessimo 200 paesi nel mondo, ogni paese dovrebbe produrre lo 0,5% della ricchezza mondiale. Le motivazioni che hanno spinto Corrado Gini a produrre la spezzata di concentrazione erano ragioni di questo tipo. Se fossimo in una condizione di equi distribuzione della ricchezza nel mondo noi avremmo una spezzata di concentrazione di questo tipo. Noi ci troviamo ad avere una spezzata di concentrazione in linea di massimo di questo tipo. Questa area, di concentrazione, ci dice quanto siamo lontani dalla equi distribuzione. In questi contesti si usa molto la misura di concentrazione del Gini. Si tratta di capire quanto è forte la disuguaglianza economica tra paesi. Allo stesso modo si può individuare la disuguaglianza economica tra individui. Se volessimo fare una valutazione di tipo temporale potrei studiare il fenomeno come serie storica, ne parleremo a fine corso. Posso vedere le crescite. Ad esempio ho un grafico Eurostat in cui ho il GDP, PIL, per 5 economie dell‟area euro: Germania, Regno Unito, Spagna, Francia e Italia. Si può vedere come ci sia una correlazione tra gli andamenti. Inghilterra è meno coordinata con i paesi dell‟area euro per le ragioni del fatto che la sterlina non è entrata nell‟area euro e le fluttuazioni economiche agiscono diversamente tra i paesi dell‟area euro e i paesi che non lo sono. In questa finestra temporale l‟euro ancora non c‟era, ma l‟Inghilterra ha sempre fatto storia a sé. Un‟altra tipologia di confronto che si può fare è questa. Prendo una cartina, e andare a rappresentare un pallino di dimensione differente in relazione alla dimensione del PIL. Questo grafico l‟ho ottenuto facilmente utilizzando un software gratuito disponibile su internet che permette di evidenziare in colori differenti i paesi a seconda del continente, i pallini sono tanto più grandi quanto più è forte l‟intensità del fenomeno. Gli USA sono giallo grosso, la maggior parte della ricchezza USA è della California, stato americano con PIL più alto, i paesi UE sono abbastanza evidenti mentre l‟Africa è caratterizzata da pallini piccoli, poi Giappone e Cina. Come si calcola il PIL? Il PIL, di base, è fondato sulla identità keynesiana. Nella pratica come facciamo a misurarlo? È una procedura complicata. In linea di massima, le operazioni che vengono effettuate riguardano sia il valore dei beni materiali (case e 84 appartamenti prodotti ogni anno) sia il valore dei servizi. Le case costruite vengono costruite nel PIL solo nell‟anno in cui vengono costruite. È come se il PIL fosse fatturato dell‟azienda Italia. Nel fatturato di un anno metto le fatture attive fatte nell‟anno, ogni anno si riparte da zero. Cosa inseriamo dentro il PIL? Il valore di ogni bene o servizio dato dal suo prezzo di mercato. La somma di tutti questi valori genera il prodotto interno lordo. Ci sono però tutta una serie di servizi che non sono destinati alla vendita ma devono avere una valorizzazione economica. Per esempio il mio stipendio, la difesa militare, la polizia, le strutture legate alla vita sociale, i magistrati, queste voci non è che non si possano non considerare, rientrano nella spesa pubblica. Vengono inserite all‟interno del conteggio del prezzi politici, al prezzo di costo, ai prezzi di produzione. Insegnanti forze dell‟ordine, giudici, amministratori locali, le varie strutture statali e parastatali che si devono dare, eccetera. In questo caso si ritiene che il valore della produzione sia equivalente al suo costo. Il valore della mia produzione è equivalente allo stipendio che io prendo. Il valore del lavoro del poliziotto è pari al suo stipendio. Il valore di un militare che muore da qualche parte è uguale al suo stipendio. È un qualcosa di opinabile, ma si definisce il criterio di base. Ci sono poi aggregati che sono diversi dal PIL, prendono un nome che è diverso dal PIL. Si parla di PNL (prodotto nazionale lordo) PIL procapite e PIN (prodotto interno netto). Si tratta di prendere il PIL e sottrarre alcuni pezzettini. Un po‟ come anche col calcolo degli indici di bilancio. IL PNL, per esempio, si ottiene sommando al PIL i redditi percepiti dalle aziende italiane all‟estero, o anche dai soggetti, singoli persone: - Profitti di filiali di imprese italiane all‟estero, per esempio il parmigiano che vendiamo negli USA, le automobili che vendiamo in giro per il mondo, - Rimesse degli emigrati - Rendite da attività finanziarie acquistate all‟estero Non andiamo a vedere solamente il prodotto creato in Italia, ma quella di pertinenza dell‟Italia e tutti i flussi che in qualche modo arrivano in Italia, allegato all‟Italia, incluso anche quello venduto all‟estero. Il PIN si calcola sottraendo al Pil il valore degli ammortamenti, cioè gli accantonamenti che le aziende fanno ogni anno per un certo numero di anni, a fronte degli acquisti di immobilizzazioni in generale materiali, ma non necessariamente. Se una azienda fa un acquisto di un grosso impianto, costruisce un magazzino o acquista nuovi macchinari con un grosso investimento, sarebbe sbagliato imputare tutto il valore degli impianti all‟anno in cui sono stati acquistati, ha senso andarli a suddividere su più anni, stesso discorso vale anche per la ricchezza prodotta. Il rapporto tra il PIL di un paese e i suoi residenti è il cosiddetto PIL procapite, indicato come misura del benessere di un paese. C‟è differenza tra la graduatoria dei paesi per PIL complessivo e per PIL procapite. 85 Quello che interessa maggiormente non è il valore assoluto del PIL, per carità è importante, è la ricchezza prodotta, però quello che interessa è che la ricchezza prodotta cresca. È come sempre il fatturato dell‟azienda. L‟obiettivo è cercare di incrementare il fatturato. Portare a casa utile. Un paese deve cercare di accrescere la propria ricchezza. Quello che interessa di più non è il valore assoluto del PIL, di fatti in generale non sentite mai dire il PIL italiano è stato, ma la sua variazione. Il PIL è cresciuto del 1% o è diminuito di qualche percentuale. La variazione del PIL è facile. Viene misurata in questo modo. Si prende la variazione del PIL dal 2010 al 2011, la misuro prendendo PIL 2011 sottraendo PIL 2010 e dividendolo per l‟anno base 2010. Se PIL 2011 è maggiore del PIL 2010 la differenza positiva, se PIL 2011 è inferiore al PIL 2010 la variazione è negativa. La variazione percentuale di questo risulterà essere un valore positivo negativo a seconda che il PIL 2011 sia superiore inferiore a PIL 2010. Ad esempio PIL 20‟0 1.7 miliardi di dollari e PIL 2011 1.68, avremmo un calo dell‟1.2%. Sono interessanti le variazioni del PIL perché in relazione alla variazione del PIL valuto l‟andamento dell‟economia, di un paese. Tenete conto che il PIL è solo la crosticina. Non c‟è la possibilità di affrontare tutte le scomposizioni che vengono fatte all‟interno del PIL. Ci sono tecniche di analisi della contabilità nazionale molto simili alle analisi di bilancio che si fanno per le aziende. Si possono costruire indici ed indicatori sul bilancio dell‟economia nazionale, che prende il nome di conti nazionali. Definiamo RECESSIONE TECNICA, termine che si sente spesso, una fase che un paese affronta quando per due trimestri consecutivi registra il PIL in calo rispetto al trimestre precedente. Il PIL di un trimestre, il trimestre successivo è in calo e il successivo ancora in calo, si parla di recessione tecnica. Parliamo di recessione in senso stretto, perché si certifica una marcia indietro dell‟economia per sei mesi consecutivi. Il termine “recessione” viene però talvolta utilizzato anche in maniera impropria. Non è esattamente corrispondente a questa definizione. In linea di massima si parla di recessione quando la variazione del PIL è negativa. Tenete presente che l PIL non sarà mai negativo, sono numeri grossi di ricchezza che non sarà mai negativo, la variazione è negativa. Quando la contrazione limitata ad un solo trimestre si parla di solito di crescita negativa, non necessariamente significa una fase di recessione. Differente dalla recessione è la STAGNAZIONE. Situazione in cui la crescita del PIL è molto bassa per periodi di tempo lunghi. Bassa, pari a zero o quasi pari a zero. Il PIL in quei casi rimane pressoché costante. Non parliamo di stagnazione se ho crescita del 0,1% per un trimestre, però la stagnazione si ha per lunghi periodi di crescita praticamente nulla. Diversa dalla recessione tecnica è la DEPRESSIONE. La grande depressione del 1929. Si indica un periodo in cui alla stagnazione dell‟economia si sommano aumento di disoccupazione, bassi livelli di produzione, ribasso dei prezzi, e diffuso pessimismo da 86 parte degli operatori economici. La più famosa è quella del 1929. Altra fase di depressione la sta attraversando il Giappone, fino ad una decina di anni fa era nel pieno, con tassi di interesse bassissimi, i consumi non crescevano. Ne parleremo brevemente: una delle peggiori situazioni è la DEFLAZOINE, ribasso dei prezzi. Se so che l‟auto tra tre mesi costa meno di oggi posticipo l‟acquisto, non consumo, i consumi sono la C dell‟identità keynesiana, il mio reddito diminuisce. Con una deflazione, contrario dell‟inflazione, i consumi vengono posticipati. La teoria economica suggerisce una legge: legge di Okun. Da non confondersi con la curva di Philips, definisce una relazione tra crescita del PIL e tasso di disoccupazione. Philips mette in relazione l‟inflazione con la disoccupazione. La legge di Okun che prende il nome dall‟economista che l‟ha proposta negli anni ‟60, permette di individuare quanto debba crescere il PIL per poter ridurre di un punto percentuale il tasso di disoccupazione. Ad esempio, preso dal libro di Blanchard, Macroeconomia. Questa legge di Okun identificava variazioni del PIL del 2,5% negli anni ‟60-‟60 degli USA per ridurre la disoccupazione; 3,7% Germania, 5,88% GB e 6,66% il Giappone. Dipende da tanti fattori. Come tutte le leggi economiche bisogna prenderle con le molle. Anche la curva di Philips non è una legge deterministica o universalmente valida. Ci sono periodi storici in cui funziona e periodi in cui non funziona, paesi in cui funziona e paesi in cui non funziona. Non sono meccanismi perfetti. Questo spiega come una legge abbia dei coefficienti diversi a seconda di paesi nello stesso periodo storico o abbia coefficienti così diversi in periodi storici differenti ma nello stesso paese. Vedi la GB. Nel 1960-80 servivano 5,88 punti di PIL per ridurre la disoccupazione di un punto. Nel 1981-1994 no, ne serviva di meno. Le ragioni sono tante, sono anche valutazioni di struttura del mercato del lavoro, di flessibilità o rigidità. Vediamo come il PIL rientri in contesti di tipo macro economico e di politica economica. Per ridurre la disoccupazione dell‟1% negli USA era necessario incremento di PIL del 2.12%. poiché il PIL è espresso dall‟equazione keynesiana, allora si possono attuare manovre di politica economica volte a ridurre la disoccupazione. Se ci fosse ancora il controllo del tasso di cambio svaluto il tasso di cambio. Si riducono le importazioni, aumento le esportazioni, il PIL aumenta e la disoccupazione dovrebbe scendere. Non è sempre così e non possiamo più farlo. Altri paesi (che non sono nell‟Euro, Inghilterra) possono farlo. Oppure potremmo sostenere gli investimenti delle aziende dando incentivi per nuovi impianti, innovazione tecnologica, o aumento la spesa pubblica. Agendo su queste componenti un governo può cercare di stimare gli effetti di manovra di politica economica su una variazione della disoccupazione. Arriviamo al punto. La statistica serve, tra le altre cose, ad aiutare il decisore pubblico a scegliere la strategia migliore. Voi sapete anche che questo modello è legato ad un insieme di coefficienti di elasticità. Ci saranno variazioni del PIL e del reddito differenti a seconda dell‟elasticità, del reddito agli investimenti consumi, esportazioni nette, spesa pubblica e tassazione. È meglio aumentare la spesa pubblica 87 o diminuire la tassazione? Dipende da come è la risposta che si ottiene ai fini del reddito. Questi aspetti possono essere studiati nell‟ambito del modello econometrico. L‟econometria studia modelli di questo tipo e permette di fare le scelte più opportune in relazione ai coefficienti dei modelli. Il PIL è uno strumento largamente utilizzato, specialmente dagli anni ‟60 in poi, ma anche prima, già dai tardi anni ‟40. Però presenta dei problemi. Pensare di misurare la ricchezza di un paese solamente in termini monetari, al di là di discorsi qualunquistici è limitante. È interessante un discorso di Robert Kennedy, fratello di Kennedy poco prima che lo uccidessero. Parlando all‟università del Kansas, dice si, noi usiamo il PIL come misura della ricchezza. Ma vediamo bene cosa ci mettiamo dentro: pubblicità delle sigarette, costi per guarire i tumori, la produzione delle pistole per difendere le nostre case, spese di sicurezza, lucchetti finestre e porte blindate. È giusto inserire nel PIL tante voci che non c‟entrano con vera ricchezza e vero benessere? Ecco che nel 1968, negli USA era usato già da un bel po‟, ci si inizia a porre una domanda fondamentale: il PIL oltre ad essere una misura della ricchezza prodotta che risponde ad una serie di valutazioni economiche e finanziarie del paese, è anche una misura di benessere del paese oppure no? “Non troveremo mai un fine per la nazione, né una nostra personale soddisfazione nel mero perseguimento del benessere economico nell‟ammassare senza fine beni terreni. Non possiamo misurare lo spirito nazionale sulla base dell‟indice Dow Jones, né i successi del paese sulla base del PNL o PIL. Il PIL comprende anche l‟inquinamento dell‟aria e la pubblicità delle sigarette, le ambulanze per sgombrare le nostre autostrade dalle carneficine del fine settimana. Il PIL mette nel conto le serrature speciali per le nostre porte di casa, le prigioni per coloro che cercano di forzarle. Programmi di televisivi che valorizzano la violenza per vendere prodotti violenti ai nostri bambini. Cresce con la produzione di napal missili e testate nucleari, comprende anche la ricerca per migliorare la disseminazione della peste bubbonica, si accresce con i palpaggiamenti che la polizia usa per sedare le rivolte e non fa che aumentare quando sulla loro cenere si ricostruiscono i bassifondi popolari. Non tiene conto della salute delle nostre famiglie, della qualità della loro educazione, educazione, o della gioia o dei momenti di svago. Non comprende la bellezza della nostra poesia o la solennità dei valori familiari, l‟intelligenza del nostro dibattere, l‟onestà dei nostri pubblici dipendenti. Non tiene conto né della giustizia dei nostri tribunali né dell‟equità nei rapporti fra noi. Non misura nostra novizia né il nostro coraggio, né la nostra saggezza né la nostra conoscenza… misura tutto in breve, tranne ciò che rende la vita degna di essere vissuta. Può dirci tutto sull‟America ma non se possiamo essere orgogliosi di essere americani”. PIL è la base di molte considerazioni: rientrano dentro tutte le attività, prodotti e servizi, ma si confronta con dei grossi problemi. 88 I limiti principali del PIL quali sono? - Ignora ogni cosa che accade al di fuori del regno degli scambi monetari. Il baratto non è considerato nel PIL. La solidarietà umana non è considerata all‟interno del PIL, e quindi non tiene conto dei costi sociali ed ambientali. Se sfrutto i lavoratori del luogo come fossero schiavi non compare da nessuna parte. Le condizioni di vita dei lavoratori non rientrano. - I costi del declino sociale (es. crimine) e dei disastri naturali vengono considerati come guadagni economici. Gli alluvionati che hanno dovuto ri fare casa, negozio, prendendo a prestito denaro per riaprire il negozio, comprando di nuovo frigoriferi, affettatrici, forni eccetera, questo è una crescita del PIL, siamo più ricchi dopo l‟alluvione dell‟anno scorso. È un po‟ assurdo. - ad esempio il crimine accresce negli USA il PIL di diversi miliardi di dollari, per le misure di sicurezza, la protezione del territorio, la detenzione, il risarcimento danni, le spese mediche ei funerali. Tutto relativo al crimine, non in funerali dell‟anziano che muore. È evidente che esulando dal contesto economico, cioè se non consideriamo l‟aspetto monetario del crimine, certamente non è benessere. Il Pil può essere un buon indicatore della ricchezza prodotta, non è perfetto. Ci sono aspetti formali e sostanziali che non rendono il PIL la misura precisa del benessere del paese. Inoltre, se noi andiamo ragionare sulle miniere d‟oro di diamanti, di carbone, il legno, se noi deforestiamo l‟Italia per dieci anni, per dieci anni le nostre industrie che fanno legna fatturano. Vendono, vendono all‟estero, e gli altri dove finiscono? Depauperamento delle risorse naturali rientra nel PIL? No, sono difficili da contabilizzare. Il Pil è come una posta di bilancio, non guarda cosa c‟è dietro. Rientrano tutte le esternalità negative, dovreste conoscere da corsi di scienza delle finanze, economia dell‟ambiente. Grosso problema di internalizzazione delle esternalità. Cosa è l‟esternaltià? Io costruisco l‟industria di prodotti chimici, mi faccio ricco scaricando nell‟aria e nei fiumi gli scarti industriali. Esternalità negativa, non dipende dal fruitore ma dal produttore, è negativa perché produce degli svantaggi. Esternalità positiva? Se io canto e il vicino dice che bella voce! Le esternalità negative, come l‟inquinamento ambientale, acustico, danno luogo ad un duplice effetto; da un lato non vengono contabilizzati né come mali in sé né come perdite di benessere. Apro una discoteca in centro storico, all‟aperto, faccio soldi ma fuori non dormono più: estesternalità negativa. Ci sono in realtà dei modi per risolvere questo problema delle esternalità? Internalizzazione delle esternalità. Inquini? Paghi in proporzione a quanto inquini o metti filtri per ridurre l‟inquinamento. Tutto questo rientra nel gioco del PIL. Vengono ignorate tutte le economie che non sono dette di mercato. Il PIL non tiene conto del baratto, delle attività delle casalinghe o dei casalinghi, delle nonne che tengono i nipotini, zii nonni che tengono i nipotini, del volontariato. Attività che non avendo un costo di produzione formalizzato, non rientrano all‟interno del PIL. Tutte le 89 attività che non producono bene di consumo oggetto d‟acquisto, vengono contabi.ilzzate al costo di produzione. se questi servizi sono offerti a costo zero ecco che nel PIL ci entrano con valore zero. Eppure sono di valore: se una nonna tiene il nipotino tutti i pomeriggi perché i genitori lavorano, è ben diverso che pagare una baby sitter o un asilo. Attività quantificabile ma non rientra nel PIL. Questo grafico (22), mette su uno scatterplot il PIL complessivo e il totale annuo in tonnellate di C02. C‟è una bella correlazione positiva. Total GDP us dollar aggiustati per l‟inflazione. 100 milioni un miliardo eccetera. In inglese miliardo è billion. Siamo su un mondo ancora legato inevitabilmente alla produzione industriale: macchine, riscaldamento. Siamo basati ancora sul petrolio per molti versi. È inevitabile che a maggior produzione corrisponda un maggior numero di emissione. Ci possiamo aspettare: sono più ricchi hanno produzione inferiore. Più ricchi? Produzioni meno inquinanti. Inquina di più chi è più numeroso. L‟elemento numero di abitanti di un paese conta 20%. L‟elemento principale relativo alle emissioni di CO2 è la ricchezza. Ci sono evidenti problematiche. USA Giappone, Italia. Non siamo messi male in quanto ad emissioni di CO2. India, Russia, Cina, è evidente che da questo punto di vista il PIL non è poi un indicatore così perfetto. Lavoro nero non è considerato. La corte dei conti ha detto che in Italia conta il 20% del PIL, notizia di qualche mese fa. Le transazioni che non rientrano nel PIL sono di diverso genere: transazioni che violano la legislazione legale. Lavori importanti: imbianchino, falegname, idraulico ed elettricista, sono tipiche attività svolte a domicilio senza che ci sia un registratore di cassa che possa essere controllato in diretta dalle finanze. Transazioni illegali: droga, scommesse clandestine, prostituzione, estorsioni, riciclaggio, vendita di merci contraffatte, vendita di CD e film scaricati illegalmente da internet, lo scaricamento di materiale protetto da copyright da internet è elemento diffusissimo che non rientra nel PIL, consideriamolo furto, violazione di copyright. Il problema principale nel calcolo del valore dell‟economia sommersa è che questa non rimane costante nel tempo. Se sapessimo che l‟economia sommersa è il 22,18% del PIL, è un problema dell‟agenzia delle entrate. Se devo misurare il PIL e quello è il conto, aggiungo un 22% e siamo contenti, il problema è che varia. Per misurare l‟entità del sommerso sarebbe facile se fosse costante. Il PIL che è così bello, presenta qualche problema a livello di confrontabilità sia spaziale che temporale. Essendo composto dalla somma dei valori di beni e servizi prodotti in un paese, può variare nel tempo: possono variare nel tempo anche i prezzi. Lo stesso prodotto di oggi tra cinque anni non è più venduto. Si è fulminato il monitor dell‟ufficio, devo prendere un monitor sostitutivo, stavo guardando quelli dei miei colleghi che bello, l‟ho preso quattro anni fa ma non esiste più. Un monitor che costava 150 euro cinque anni fa, oltre a non esistere più, se oggi esistesse costerebbe 50. Ha caratteristiche tecniche molto differenti. Questi sono fenomeni legati alla 90 disinflazione tecnologica. Oggi un televisore LCD costa molto meno di 1000 euro, anche di quelli grossi, a parte la Apple, con la quale non ci sono speranze! Come posso fare a confrontare il PIL nel tempo? Ci sono in linea di massima due approcci. Uso il PIL a prezzi costanti, prendendo un riferimento di un prodotto e definendo lo stesso prezzo per prodotti che come caratteristiche magari sono simili. In quel senso, a parità di prezzi, la variazione del PIL è data dalla variazione delle quantità. Se noi avessimo due beni, se un paese producesse solo pane e salame, l‟acqua è gratis e avessimo 10-10-20-20-20-30 e il prezzo per il pane fosse sempre 1 e per il salame fosse 5, avremmo 10-20-30, 50-100-150, il PIL è dato da 60, qua 120 qua sarebbe 180. Questa crescita del PIL sarebbe legata ad una variazione della quantità prodotta, e non del prezzo. Ma se il prezzo del prodotto variasse nel tempo, come in realtà è, c‟è una componente di variazione del PIL determinata dall‟inflazione. Se anziché avere pane e salame 10 10 20 20 30 30, avessi pane salame 10-10-10-1010-10-10 e il prezzo del pane fosse 1-2-3, il prezzo del salame fosse 5-6-7, avremo 10+50=60, 20+60=80 e 30+70=100. Il PIL sarebbe 60-80-100. A parità di quantità prodotta il PIL salirebbe per una ragione puramente inflazionistica. Nella realtà la situazione è intermedia: ho l‟inflazione che determina aumento dei prezzi e determina anche un aumento del PIL ed un aumento della quantità prodotta, che determina un incremento del PIL. Per tornare al caso del Giappone, una deflazione comporta una riduzione dei prezzi e quindi anche una riduzione del PIL, per il fatto che vendo una stessa quantità ad un prezzo inferiore. Per esempio potrei utilizzare i prezzi 2005, vedere come cambia il PIL usando solo i prezzi del 2005 per i beni e l‟andamento del PIL dipende solamente dalle quantità quantità, oppure usare i prezzi attuali. La differenza tra questi due fenomeni, tra questi due elementi è l‟inflazione. In linea di massima ottengo questo risultato. Ho un PIL che può essere calcolato a prezzi attuali, correnti, col prezzo effettivo di vendita del bene quando è stato venduto, è la linea blu. Poi, possiamo usare dei valori che sono calcolati sulla base di un prezzo che è costante. La differenza è l‟effetto dell‟inflazione. Per assurdo, se l‟inflazione fosse molto forte, potrei avere un andamento PIL a prezzi correnti crescente e un andamento del Pil a valori costanti decrescente, in realtà una diminuzione della produzione effettiva del paese, ma un incremento del valore monetario del paese. Anche per quanto concerne i confronti internazionali il PIL presenta dei problemi. Ogni paese adotta particolari criteri per la valutazione del PIL. Il PIL calcolato in Italia, Francia, USA, Gabon, Sud Africa, non è proprio lo stesso, sebbene si assomigliano per molti versi. Non è possibile confrontare direttamente il Pil fra più paesi, se ci sono più persone ci si aspetta che il paese sia più ricco. Bisogna allora calcolare il bisogna calcolare il PIL procapite, l‟avevamo accennato prima. Un ulteriore problema è dato dal tasso di cambio. Se misuro il PIL in euro e gli USA lo misurano in dollari, nello cambiare da una valuta all‟altra devo adottare un tasso di 91 cambio. Se è favorevole a noi gli USA avranno PIL più basso, se è favorevole negli USA noi avremo un tasso di cambio più alto. Non è la stessa valuta, sono diverse. Se un euro vale 1,8 dollari è un discorso; se un dollaro vale 1.8 euro è un altro discorso.. Cosa succede? Che molto spesso, il PIL pro capite, per singola persona, per mitigare il fatto che i paesi abbiano una divisione differente dal punto di vista di unità differenti, si utilizzano valutazioni a PPA PPP, Parità di Potere di Acquisto. Cerca un raccordo tra due valute utilizzando un bene in comune. Un classico esempio è il panino Bic Mac di Mc Donald. Quanti Big Mac può comprare un italiano medio, un francese? L‟Italiano compra 120 panini e il francese solamente 60, allora l‟italiano è ricco il doppio del francese secondo la parità di potere di acquisto. Oppure una automobile, i-phone, o birre medie, come è stato fatto il confronto in una rivista a seguito dell‟Oktober fest tedesco. A partire da questo raccordo, vengono ricalcolati gli altri prezzi di beni e servizi che compongono il PIL. Ricalcolo tutto sulla base del panino di Mc Donald. Una Ferrari quanti panini vale in Italia o Francia? Partendo da questo punto di congiunzione tra le due valute con i due poteri d‟acquisto viene ricalcolato tutto. È una procedura complicata e laboriosa. Inizierei una serie di valutazioni su misure alternative del PIL. C‟è un grosso numero di misure alternative al PIL che non hanno raggiunto neanche un millesimo della popolarità del PIL. È talmente legato alla società moderna, che per quanto sia pieno di difetti non è eliminato. - Genuine Progress indicator, indicatore di progresso genuino; - Indice della libertà economica; - Human Development Index; - Indice di Benessere equo e solidale, di cui parleremo la prossima settimana Guardiamo i primi tre dicendo che HDI l‟abbiamo già visto. Metteva insieme i dati sull‟alfabetizzazione, speranza di vita e prodotto interno lordo procapite. GPI o indicatore del progresso autentico, misura l‟aumento della qualità della vita di una nazione, evidenziando l‟incremento della produzione di merci e l‟espansione dei servizi che hanno realmente generato benessere. È un indice piuttosto complesso, ci sono dentro una carrettata di variabili. Sono più di venti componenti per la maggior parte intangibili. Il risultato interessante di questo indicatore, di cui vedremo le componenti principali, è che se negli USA il prodotto interno lordo è quadruplicato dagli anni ‟50 ad oggi, il GPI è cresciuto del 45% tra gli anni 50 e 60, mentre il tasso declino procapite è stato 1, 2, 6% negli anni ‟70-„0-‟90. Il GPI dice che se il PIL negli USA ha avuto questo andamento, il GPI ha avuto un andamento così. Si è arrivati ad un punto in cui la produzione di un paese non è più rivolta al benessere della cittadinanza, della popolazione residente. Si sta riducendo la produzione di beni e servizi che portano ad un effettivo benessere. di fatto la produzione del benessere si è arrestata negli USA. 92 È composto da: - Consumi personali ponderati in base all‟indice di distribuzione del reddito - Valore del lavoro domestico e della genitorialità (problema estremamente importante e forte in questi ultimi periodi) - Valore dell‟istruzione superiore - Valore del volontariato - Servizi di beni durevoli di consumo - Servizi di autostrade e strade - Costo del crimine - Perdita di tempo libero - Costo della disoccupazione - Dei beni durevoli di consumo - Pendolarismo - Abbattimento dell‟inquinamento domestico - Incidenti automobilistici - Inquinamento acque - Inquinamento atmosferico - Inquinamento acustico - Perdita delle zone umide - Perdita di terreni agricoli - Perdita della superficie boschiva e danni forestali - Esaurimento delle risorse energetiche non rinnovabili - Danni da emissione di anidride carbonica - Costo dello strato di ozono - Investimenti di capitali - Prestiti esteri In linea di massima sono queste le variabili che vanno dentro questo indicatore. Si sommano, si sottraggono e si ottiene l‟indicatore del progresso autentico. Quanto più quelli in verde crescono tanto più la crescita del progresso è forte, tanto più crescono quelli in rosso e tanto più l‟indice è negativo. Altro indicatore utilizzato abbastanza spesso, è l’indice di libertà economica. È stato sviluppato da una fondazione e dal WSTREET journal. È basato su dieci fattori, ciascuno con un punteggio che va da zero a cento, servono a misurare la libertà economica del paese. Un gruppo di esperti guardano Italia, Francia, India e Cina, per ognuno di questi fattori vanno a dare un punteggio compreso tra 0 e 100 sulla base di dati disponibili presso le principali organizzazioni sovranazionali: WB-IMF. 1. Libertà negli affari 2. Nel commercio 3. Monetaria 4. Spesa pubblica 93 5. Fiscale 6. Diritti di proprietà 7. Libertà di investimento 8. Finanziaria 9. Dalla corruzione 10. Del lavoro Ognuna di queste dimensione viene votata e si fa una media. Il risultato è una mappa e poi un dossier per ciascun paese. I paesi veramente liberi sembrano: Australia Nuova Zelanda Svizzera. Poi principalmente liberi Canada USA, Gran Bretagna, Germania, Austria, Belgio, Lussemburgo, Svezia, Finlandia, Estonia, Irlanda, Islanda Cile, Giappone Taiwan e le varie cittadine stato. L‟Italia è principalmente non libera, siamo al di sotto del punteggio mediano e paesi depressi una linea verticale dalla Libia sino allo Zaire. L‟Italia ha un punteggio di 58,8 con trend negativo. Siamo esattamente 92 esimi, tra lo Zambia e il Turkmenistan. Questa è la valutazione sul documento 2011, ancora quello vecchio. Si parla di Berlusconi, scandali sessuali. Per ciascuna delle dieci dimensioni viene dato il punteggio. Siamo messi particolarmente male nello spending del governo, dove siamo messi bene è la libertà di commercio 12esimi e 23esimi sulla libertà monetaria. Ci sono un po‟ di queste considerazioni, è liberamente scaricabile da internet. Abbiamo un trend negativo dal 2008 al 2011. La prossima volta parliamo di benessere equo e sostenibile, un indice che sta cercando di sviluppare l‟Istat sulla base di alcune considerazioni che si stanno facendo a livello internazionale, e sul lavoro di una commissione voluta da Sarkozy voluta dal premio nobel dell‟economia Stigliz. LEZIONE 9 13/11/2012 Ho aggiornato il materiale su aula web. Oggi continuiamo e concludiamo il discorso sulle misure del benessere come misure alternative al PIL. Abbiamo visto il PIL la sua origine e il suo calcolo. In linea di massima possiamo dire che fa riferimento alla identità keynesiana. Calcola la ricchezza di un paese in relazione alla produzione che nel paese avviene. Sebbene sia una misura di ricchezza molto utilizzata per molti versi risulta essere incompleta, va a misurare qualcosa di prettamente monetario ed economico quando ci sono altre attività e misure che hanno la dignità di essere considerate vere e proprie misure del benessere. Negli ultimi decenni, sta prendendo piede la definizione di misure di affiancamento al PIL che vadano a colmare le lacune che ha il PIL. Il PIL non tiene conto di alcune misure di genitorialità: dei nonni che si prendono cura dei nipoti, così come qualsiasi 94 scambio che non da luogo ad uno scambio non monetario, non viene considerato all‟interno del PIL, ad esempio il volontariato. Contiene componenti non necessariamente legate al benessere. Per esempio quel denaro che nasce a seguito di diminuzioni effettive di benessere (mercato legato al contrasto, criminalità) rientra nel PIL a pieno titolo. Non c‟è correlazione tra criminalità e PIL, così come disastri naturali o l‟impoverimento delle risorse naturali che vanno registrati come variazioni positive del PIL. La valutazione della ricchezza naturale di un paese, il depauperamento delle risorse non rientra nel PIL. Il PIL non si rivela essere uno strumento completo per misurare il benessere di un paese. Sono state proposte altre misure di benessere attraverso indici ed indicatori. Abbiamo visto, nella presentazione precedente, lo HDI, l‟indice di sviluppo umano. Considera non il PIL, non lo considera pienamente ma considera anche degli altri indici, quali il tasso di analfabetismo adulto e l‟aspettativa di vita, il terzo elemento del HDI era il PIL pro capite. Abbiamo visto altri indici, tra cui l‟indice di sviluppo genuino in cui rientrano tante variabili positive e negative a a seconda che portino ad un incremento del benessere collettivo. Abbiamo visto in conclusione un altro indice, sviluppato da una fondazione e dal NYT che era l‟indice di libertà, in realtà indice composto di dieci misure di libertà assegnate attraverso specie di pagelle. 95 DAL PIL AL BES: Le misure del benessere: Nuove tendenze internazionali Il BES e le 12 dimensioni del benessere Adesso vediamo questa nuova presentazione. Parliamo oggi non del PIL quanto piuttosto delle misure del benessere. Vedremo le nuove tendenze nazionali ed internazionali in merito alle misurazioni del benessere. in particolare ci soffermeremo su una misura sviluppata in Italia. È da metà del 2011 che se ne parla ed è un tema di abbastanza attualità. Le tappe per dimenticare il Pil sono tante. È difficile credere che venga abbandonato come misura di per sé, è troppo comune e diffuso ad ogni livello. Anche i cittadini che non hanno fatto studi di natura politica ed economica non hanno grossi problemi a inquadrare il concetto di PIL, variazione percentuale del PIL e il concetto tra PIL e disoccupazione. È un concetto che fa parte della cultura popolare. Nel primo forum mondiale dell‟OCSE, (Statistics Knowledge and Policy) su queste tematiche, stato tenuto a Palermo nel 2004, si è cominciato a discutere di un sistema di indicatori a livello ufficiale, di statistiche ufficiali, che permetta di valutare non solo la ricchezza ma il benessere generale e il progresso. È chiaro che, lo vedremo anche per il caso italiano, dobbiamo vedere come definiamo il benessere. Cosa è il benessere? quando sono ricco, sto bene, riesco a studiare ,non ho malattie, mi sento realizzato? Ci sono tante componenti che entrano a far parte del benessere. L‟Istat ne ha individuate 12. A Istanbul nel secondo forum mondiale dell‟OCSE vengono messe nero su bianco le indicazioni per indicare il benessere e il progresso che possano orientare le decisioni politiche dei governi. La statistica ufficiale serve per prendere decisioni: misure, indicatori e indici servono per dare valutazioni ai governi e per fare raffronti spaziali e temporali. In tempi più recenti, fine 2007, abbiamo altre iniziative con questo scopo. Viene costituito un progetto specifico, Global Project on measuring the progress of societies, vi aderiscono varie istituzioni. E poi nel 2007 arriviamo a prime attività specifiche legate all‟UE. Beyond GDP è un gruppo di lavoro della commissione sviluppato per riuscire a costruire una integrazione del PIL da produrre entro il 2009. Nel 2009 abbiamo il famoso G20 Aquila in cui ci sono orientamenti generali a prendere in considerazioni anche dimensioni sociali ed ambientali dello sviluppo economico. C‟è stata una attività di discussione e proclami per fare, anche se in realtà poi dal punto di vista pratico non si è fatto tantissimo. Arriviamo al settembre 2009, data estremamente importante per quel che riguarda il benessere equo e sostenibile. Nel 2008 Sarkosy ha istituito una commissione Stigliz (coordinatore della commissione), con Sem e Fitoussi, che aveva il compito e lo scopo di dare un orientamento a queste intenzioni di costruzioni di indici ed indicatori. Si è 96 parlato tanto, c‟è stata tanta volontà di creare indici di benessere sociali ma di fatto dal punto di vista concreto non si era riuscito a concludere molto. Quello che andremo a discutere da qui in poi nasce da questa documentazione che è la relazione della commissione Stigliz. Nel 2009 si è ancora discusso sempre nel forum mondiale dell‟Ocse di questi argomenti e sono state discusse le conclusioni della commissione Stigliz. Sono state accolte e abbracciate da tutti, ministri e rappresentanti dei governi del mondo, università, istituti di statistica, organizzazioni non governative e istituzioni sovra nazionali banca mondiale, ONU e commissione europea. Dopo tanti anni sono state costituite delle linee guida generali abbastanza concrete. Cosa dicono queste linee generali? Guardiamo quello che voleva la CE e poi guardiamo che cosa sono le 12 raccomandazioni date dalla commissione Stigliz. La CE aveva indicato 5 indicazioni pratiche su come costruire il sistema di indicatori. Sosteneva, accogliendo quello che era stato detto, che fosse opportuno completare il PIL con indicatori ambientali e sociali. Questo non è nulla di nuovo. Quando ero studente, studiavo indicatori PIL che includessero indicatori ambientali. Non è nulla di nuovo, sono considerazioni già presenti nella letteratura economica. Fornire informazioni quasi in tempo reale a sostegno del processo decisionale. Parola d‟ordine: tempestività. È inutile avere dati che arrivano in ritardo. Se l‟informazione non è tempestiva non siamo in grado di prendere decisoni sulla base delle informazioni che ci vengono trasmesse. Ozono web è ad esempio uno strumento con cui l‟agenzia europea dell‟ambiente fornisce dati sulle concentrazioni nocive di ozono. Non si arriverà mai in tempo reale. Ottenere informazioni più precise tra distruzioni e diseguaglianze. PIL e PIL pro capite non forniscono indicazioni nella distribuzione della ricchezza di un paese. L‟abbiamo detto velocemente altre volte. L‟ho detto quando parlavamo della concentrazione della ricchezza del PIL nelle mani di pochi. Lo facevamo in considerazione dei paesi. Lo stesso vale per la popolazione di un paese. Un PIL procapite elevato non significa che non ci siano poveri, non significa che non ci siano disuguaglianze sociali. Può essere che ci sia meno disuguaglianza sociale in paesi poveri e piuttosto che in paesi ricchi. Elaborare una tabella europea di valutazione dello sviluppo sostenibile. Entro fine 2009 la CE intende presentare una visione pilota della tabella di valutazione dello sviluppo sostenibile. È stato fatto qualcosa ma poco. Estendere i conti nazionali alle questioni ambientali e sociali, appuntamento nel 2013 in modo che i paesi hanno accanto ai conti nazionali una contabilità economico ambientale integrata. Conti fisici ambientali per il consumo di energia, produzione e trattamento di rifiuti, conti monetari per le sovvenzioni ambientali. Vedremo se riusciremo ad avere tutto. Queste sono le raccomandazioni della CE. Vediamo quali erano le raccomandazioni della commissione Stgliz che arriva a dare indicazioni più tecniche. Le indicazioni della CE sono molto generali. La Stigliz va a dare indicazioni più aderenti alla singola realtà. Per valutare il benessere materiale devo: 97 1) Analizzare redditi e consumo piuttosto che la produzione. questa è una prima considerazione differente rispetto al PIL. Il PIL è prodotto e fa riferimento alla produzione. la prima cosa è: per valutare il benessere materiale, significa che ho definizione di benessere materiale e non materiale, non devo guardare la produzione ma i redditi e il consumo: 2) impostare la analisi dal punto di vista delle famiglie, non delle industrie. Prendendo in considerazione tasse, prestazioni sociali e servizi forniti dallo Stato, come sanità ed istruzione che avevamo visto essere valutati esclusivamente al prezzo di produzione o di costo. Si mettono in luce alcuni aspetti critici; 3) considerare il patrimonio delle famiglie distinguendo tra chi spende tutto per consumi, accrescendo il benessere immediato, e chi invece risparmia per il benessere futuro. C‟è già una questione di prospettiva temporale. Il PIL è una visione stock relativa al singolo anno. Non si hanno prospettive nel PIL. 4) dare più importanza alla distribuzione dei redditi, dei consumi e della ricchezza, non ricorrendo quindi a medie matematiche, che non tengono conto della differenza di reddito tra più ricchi e più poveri. 5) estendere gli indicatori delle attività non legate direttamente al mercato. Altra considerazione. Il PIL include solo ciò che è soggetto a contrattazione sul mercato e di tipo economico. Attività come fare le pulizie di casa o accudire neonati, fanno parte della produzione economica di una famiglia, ma che non vengono prese in considerazione dalle statistiche se non svolte da personale salariato. Ci sono tutti quegli aspetti che non erano incluse nel PIL. 6) migliorare la valutazione di sanità educazione e condizioni ambientali mediante calcoli oggettivi e strumenti a carattere soggettivo, usare anche dei sondaggi 7) valutare in maniera esaustiva le ineguaglianze rispetto alla qualità della vita calcolando le differenze tra persone sessi e generazioni. Particolare attenzioni alle condizioni di vita degli immigrati 8) realizzare indagini per capire come le evoluzioni in un settore della qualità della vita abbiano ripercussioni su altri 9) gli istituti di statistica dovrebbero fornire le informazioni per aggregare le diverse dimensioni della qualità della vita per creare una misura sintetica. 10) gli studi di statistica dovrebbero anche cercare di integrare alle inchieste sulle qualità della vita dati sulle evoluzioni effettuate dal cittadino nel corso della propria esistenza 11) valutare la sostenibilità del benessere. l‟indice dell‟Istat è benessere equo e sostenibile 12) stabilire indicatori precisi che quantificano le pressioni ambientali Per il 9 e 10 il problema non è irrilevante. L‟Istat considera dodici misure del benessere, per esempio il benessere fisico. Come lo misuro? Per esempio con questionari, ti senti fisicamente bene, avresti bisogno di altro supporto sanitario? Le 98 domande devono essere consolidate in un unico indice di sintesi. Il problema che nasce nella costruzione di questi indici, è che si tratta di indicatori in cui identifico il costrutto benessere, devo identificare le variabili latenti (12 dimensioni) e all‟interno di ciascuna dimensione prendo i vari indicatori. Per l‟istruzione? Numero di anni di studio, risultati a test psicoattitudinali. Vado a rilevare il benessere utilizzando 120 indicatori i differenti che devono essere fusi in un unico indice, che sia questo indice di benessere, è una procedura piuttosto complicata. Vediamo i primi passi, percorsi per la costruzione di indici di benessere. Una delle indagini che si usa in Italia è quella sulla qualità della vita fatta dal Sole 24 ore che pubblica annualmente i risultati a livello di ogni singolo comune o città relativamente a sei domini, ambiti: - Tenore di vita - Affari e lavoro - Servizi ambiente e salute - Ordine pubblico - Popolazione - Tempo libero Rispetto a questa graduatoria Genova si posiziona al 25esimo posto. Questa non è l‟unica indagine che viene fatta. Dal 2003 il QUARS, una struttura che valuta la qualità della vita a livello regionale, pubblica lo studio a livello regionale e calcola 41 indicatori raggruppati in 7 domini: - Ambiente - Economia e lavoro - Diritti e cittadinanza - Salute - Istruzione - Pari opportunità - Partecipazione È un altro studio che viene fatto in maniera disorganica. C‟è una coerenza interna. La scelta, l‟organizzazione e lo studio di questi indici avviene in maniera indipendente dal contesto internazionale. Lo sforzo che ora si sta cercando di fare è costruire indicatori di benessere che abbiano una qualche confrontabilità internazionale anche se è difficile. C‟è una valanga di esperienze settoriali e territoriale. Lega Ambiente pubblica Ecosistema urbano (aria acqua trasporti rifiuti, trasporto mobilità). Rilevazione istat sui dati ambientali delle città, poi fondazione (fondazione Singola) che ha creato il PIQ, scomponendo le quattro componenti: captale umano, conoscenza e costruzione della domanda, sviluppo del prodotto o servizio e presidi delle reti e relazioni nazionali ed internazionali. Ci sono la Confartigianato e tutta una serie di enti locali, Ires in 99 Piemonte, camera di commercio di Venezia, ufficio statistico della provincia di di Pesaro Urbino, rapporto sulla economia sociale di Sardegna. Ci sono indici ed indicatori che vengono organizzati, stimati, raccolti e gestiti da strutture differenti. Sono molto interessanti, per molti versi sono disorganici. Possiamo avere una certa serie storica, confrotnabilità territoriale per ambiti locali, ma si perde una confrontabilità a livello nazionale, hanno una validità territoriale abbastanza limitata. Abbiamo anche altri, associazione italiana sugli studi sulla qualità della vita, bilanciamo il futuro. Arriviamo al progetto italiano nel senso di livello nazionale. Il cosiddetto BES. Sul sito indice dell‟Istat trovate il logo del Benessere Equo e Sostenibile. Trovate anche in parte il materiale che ho citato in questa piccola presentazione. Il Benessere equo e sostenibile nasce da CNEL e Istat. Trae ispirazione dalla commissione Stigliz. Lo scopo, a livello internazionale, sarebbe quello di cerare indicatori di benessere che possano essere confrontabili a livello spaziale e temporale. È in linea col dibattito internazionale secondo il quale per valutare il progresso di una società vanno usati parametri non solo economici ma anche sociale ed ambientale, corredati da misure di equità e sostenibilità. Il comitato di indirizzo sulla base delle categorie suggerite da Ocse e Stigliz e e i risultati delle multi scopo 2011 ha definito dodici dimensioni del benessere. Se andiamo a vedere le indagini multi scopo delle famiglie che vi ho citato nell‟ambito del corso, ci sono alcune domande. Per esempio la 27.5, utilizzando un punteggio da uno a dieci, può indicare quanto sono importanti questi aspetti? - Avere un lavoro dignitoso di cui è soddisfatto - Essere in buona salute - Sentirsi sicuri nei confronti della criminalità - Avere un reddito adeguato - Servizi di pubblica utilità accessibili e di buona qualità. Rispetto a questi aspetti, quanto li ritiene importanti? - Vivere in una società in cui ci si possa fidare degli altri - Buon livello di istruzione - Tempo libero adeguato e di buona qualità - Istituzioni pubbliche in grado di svolgere bene le loro funzioni - Buone relazioni con amici e parenti Quanto sono per lei importanti questi aspetti? - Essere felici in amore - Il presente e il futuro delle condizioni dell‟ambiente - Partecipare alla vita della comunità locale attraverso strutture politiche e associative - Poter assicurare il futuro dei figli dal punto di vista economico e sociale 100 - Poter influire sulle decisioni dei poteri locali e nazionali Queste sono per esempio alcune domande che sono state poste e servono a capire quali sono le definizioni di benessere che una persona ha. Possiamo mettere 10 a tutto ma ci sono alcune cose essere più o meno importanti. Basandosi su questo e su altre indagini, si è cercato di capire quali siano i punti più importanti che identificano la felicità, ma soprattutto il benessere: benessere e felicità sono due cose diverse, il benessere per un cittadino italiano. Non necessariamente deve coincidere con quello di altri cittadini. È chiaro che le componenti che entrano a costituire il concetto di benessere possano essere differenti a livello territoriale. L‟approccio si basa sulla premessa che il benessere è legato a tempi luoghi e culture e non può essere definito univocamente. Per raggiungere una misura condivisa a livello nazionale è fondamentale un confronto e dialogo tra diversi attori. Che in Italia tutti sono mammoni può essere vero. Se confronto la coesione familiare italiana, e il fatto che il 90% dei figli vada a vivere in un raggio di due chilometri dalla casa dei genitori, mentre in America i figli vadano a lavorare in altre città, la visione di ruolo della famiglia nel benessere è diversa. Non si può pensare che la coesione fisica e familiare possa essere un elemento importante di benessere sia in Italia che negli USA. Lo stesso dicasi nel nord, dove la visione che ho di famiglia è differente. Febbraio 2011 l‟Istat ha realizzato la prima rilevazione statistica su un campione rappresentativo di 45 mila persone dai 14 anni in su. Detto ciò è stato messo su un sito web che si chiamava www.misuredelbenessere.it, chiedeva alle persone di contribuire esprimendo la loro opinione in base alle varie dimensioni del benessere che erano state individuate. Da ottobre 2011 a febbraio 2012, qualcosa che non si è conclusa neanche un anno fa, i cittadini sono stati invitati a rispondere online ad un questionario per esprimere le proprie opinioni sul set delle 12 dimensioni che sono state individuate. Era un‟auto selezione del campione. La rappresentatività del campione in queste condizioni è abbastanza debole. Se una persona decide di entrare a far parte del campione è una persona che ha attitudini particolari rispetto all‟argomento e non necessariamente il campione è rappresentativo della popolazione italiana. 12 dimensioni che sono state individuate sono queste: 1) Ambiente 2) Salute 3) Benessere economico 4) Istruzione e formazione 5) Lavoro e conciliazione tempi di vita 6) Relazioni sociali 7) Sicurezza 8) Benessere soggettivo 9) Paesaggio e patrimonio culturale 10) Ricerca e innovazione 101 11) Qualità dei servizi 12) Politica e istituzioni Queste dimensioni condividono qualcosa col PIL ma in buona parte no. Questo questionario che chiedeva opinioni su queste dimensioni è stato compilato da 2.518 persone, servono a dare un orientamento. Il 90% era di età compresa tra i 25 e i 64 anni e ben 2/3 avevano un livello di istruzione piuttosto elevato. È interessante capire chi è che risulta essere interessato alla costruzione di indici di questo tipo. Quasi la metà risiede in una regione del Nord, 1/3 in una del centro e il resto nel meridione. Questi sono i risultati che sono stati dati. È un grafico abbastanza curioso. È un istogramma di base, ma le barre hanno lunghezza uguale, fanno 100% tutte. È un grafico che si usa molto. La barra colorata di scuro rappresenta coloro che hanno considerato la salute come qualcosa di estremamente importante o prioritario nella valutazione del benessere. Più chiaro è quelle persone che non hanno considerato tale elemento determinante per la definizione di benessere. Se volessimo dare una classifica delle dimensioni più importanti identifico la salute come definizione prioritaria della dimensione del benessere. Ambiente al secondo posto, istruzione formazione, qualità dei servizi, lavoro conciliazione e tempi di vita, il benessere economico non è la più selezionata. Il benessere economico è importante ma non è la più importante tra coloro che hanno risposto. Questi vanno presi con le pinze. Se hanno risposto giovani di un certo livello culturale è probabile che abbiano anche un lavoro sufficientemente retribuito e non concepiscono il benessere economico come una mancanza. Quando uno non ha soldi diventa quello il problema principale, bisogna vedere le caratteristiche dei rispondenti. C‟erano poi altre definizioni del benessere. Una delle più interessanti era l‟ equità e la giustizia sociale politica e partecipazione dei diritti a scalare altre opzioni. Se andiamo a distinguere tra maschi e femmine, maschi chiaro e femmine scuro, vediamo che l‟equità e giustizia sociale più importanti per femmine piuttosto che per i maschi. Benessere psicologico e lavoro e conciliazione dei tempi della vita, forse perché tutte le donne hanno da stare con i figli. I maschi hanno più bisogno di relazioni sociali, benessere fisico salute e percepiscono come più importante rispetto alle femmine il benessere economico. C‟è anche una differenza nel benessere tra maschi e femmine. Ancora questo, aspetti che caratterizzano l‟Italia in positivo o in negativo, sono domande pericolose, possono avere validità limitata nel tempo. Cosa caratterizza l‟Italia verso l‟interno e esterno? Patrimonio artistico e culturale per moltissimi, paesaggistico per tantissimi, alimentazione, quando l‟italianità, il welfare e sanità in maniera ridotta. La descrizione dell‟indice è qualcosa di molto difficile. Non esiste nessuna sacra scrittura che esista un indice di benessere che si fa in questo modo. Siete abituati a dire: la varianza si calcola in questo modo, la dimostrazione di un teorema è questa. Quando bisogna costruire l‟indicatore è complicato. 102 Nel PIL è facile, nasce da un modello economico che ha la sua logica. Con la costruzione di un indicatore di questo tipo è molto complicato, non esiste alcun modello che ci dica se stiamo andando o no nella direzione giusta. In linea di massima, dallo studio dell‟Istat si può costruire questa mappa semantica, andare a vedere con cosa è collegata la parola benessere secondo gli italiani. In linea di massima si dice che il benessere dovrebbe essere un fine della politica. Dovrebbe orientare le politiche ai bisogni degli individui. Benessere significa buoni servizi, non c‟è benessere senza equità, benessere è un benessere collettivo. Significa coesione sociale, benessere non è solo crescita economica, è un investimento che può ridurre la spesa sanitaria. Queste sono le parole che si sono più fuse di più col concetto di benessere al termine di una indagine. La visone di benessere degli italiani era legata a queste concordanze. La mappa semantica si utilizza molto nello studio dei testi. Se voi volete studiare con che cosa è collegata la parola amore a tutte le poesie italiane prendete amore e trovate tutti i collegamenti. La usano molto gli psicologi. Cosa significa partecipazione, precisione. Dà l‟idea di cosa significhi benessere, quali siano i concetti che ruotano attorno al benessere nella testa degli italiani. Vediamo ora le 12 dimensioni del benessere. Le dimensioni del benessere sono quelle variabili latenti di cui parlavamo l‟altra vota. Grossi aggregati che vanno fusi nel costrutto che avevamo definito essere benessere. 1. Ambiente. L‟ambiente nel quale si vive condiziona fortemente il benessere dei cittadini. L‟ambiente deve essere considerato il nostro capitale naturale che influenza il benessere umano in molteplici domini, sia direttamente attraverso le risorse, sia indirettamente attraverso i servizi. La più avanzata conoscenza scientifica e la cresciuta coscienza ecologica hanno messo in luce come le tipologie di produzione e consumo, l‟uso di risorse ed energia, l‟offerta di servizi eccetera possano modificare le condizioni dell‟ambiente in misura rilevante. Il dominio o dimensione si basa su indicatori che forniscono la valutazione dello stato dell‟ambiente in Italia, dei servizi eco sistemici, della qualità percepita e misurata dell‟ambiente in cui vivono i cittadini, con particolare riferimento all‟ambiente urbano. Indicazioni generali, su queste possiamo essere d‟accordo. La parte difficile è dire: definisco questa la dimensione del benessere, voglio costruire un indice o indicatore, visto che è un sistema, che misuri la dimensione del benessere. Come posso fare? È stato aperto un grosso tavolo di lavoro, in cui si è detto: cosa aveva suggerito Stigliz e gli altri per valutare l‟ambiente? C‟è per esempio metri cubi acqua utilizzata dalla popolazione in un determinato comune. Perché? La risorsa idrica è una risorsa scarsa, se ne uso troppa consumo eccessivamente queste risorse. Avere l‟acqua disponibile è allo stesso tempo qualcosa di importante. Se consumo poca acqua può anche darsi che non sia legato al fatto che io sia risparmioso, ma che come a Palermo ci siano alcuni quartieri che un giorno a settimana non hanno acqua, consumano meno. Un indicatore di quel tipo che è preso in considerazione ha i suoi pro e contro. 103 Quantità di spazzatura prodotta. Tanta spazzatura? Significa che sto consumando troppo, io dovrei differenziare la mia produzione. Ci sono tonnellate di spazzatura raccolta e quanto e bisogna anche guardare quanto è la raccolta differenziata. Viene sufficientemente seguita? È un indicatore che potrebbe essere anche bello. Immagino di mettere questo, consumo dell‟acqua e quantità di C02 che viene emesso nell‟aria o Pm 10, polveri sottili, prodotte dalle automobili e sistemi di riscaldamento, provocano i tumori, e quando viene superata la soglia bisogna bloccare il traffico sennò diventa troppo pericoloso. Produzione di PM10 come la considero? Numero medio di PM10 nell‟aria nel corso dell‟anno. Posso anche considerare il numero di giorni in cui viene superata una certa soglia e quindi diventano giorni di rischio. Immaginiamo di scegliere come indicatore quello dei giorni di superamento della soglia di rischio di PM10. Ci troviamo di fronte ad una misura in metri cubi, l‟acqua che viene consumata nel corso d‟anno in un comune, poi le tonnellate di spazzatura che vengono prodotte e dei conteggi: giorni in cui supero i PM10. Ho tre indicazioni. Quanto è poco quanto è tanto? Quanti sono i metri cubi che dovrebbe consumare una città per persona per dire che sta rispettando l‟ambiente? Quanto dovrebbe produrre una città pro capite di spazzatura all‟anno? Quanti giorni? Zero dovrebbero essere i giorni in cui si supera la soglia di PM 10. Effettivamente, quanto è un numero di giorni di superamento della soglia del PM 10 che rappresenta un malessere per la città? 1-2-5? Non è facile dirlo. Dal punto di vista pratico, se sono definite le dimensioni, diventa complicato riuscire a costruire un indice unico. A questo punto vorrei dire: Genova o la Liguria come indicatore di benessere della dimensione ambiente ha 89, Milano 73. Genova a 89 sta meglio di Milano. Come arrivo a 89? come arrivo a costruire l‟indice? Sono problemi difficili. Giovannini, presidente Istat e tanti uffici del comune, si chiedono quali sono gli indici per costruire una misura unica del benessere in termini di ambiente? Come faccio a rilevare queste informazioni? È facile dire abbiamo l‟Arpal, agenzia regionale per l‟ambiente, che ha le centraline dislocate per Genova. Ci dice quanto PM 10 è stato rilevato ogni giorno. Oppure anche prendo il numero di giorni in cui è stato superato il limite. Ma i metri cubi di acqua consumati a Genova non è facile averlo. Una volta all‟anno viene qualcuno a vedere quanti metri cubi sono stati presi, poi c‟è l‟acqua persa nel tragitto, presa nei pozzi o dalle fonti, che non viene contabilizzata in nessun modo. Ci sono problematiche non indifferenti. Stiamo parlando di ambiente. Tra gli altri indici che ci sono abbiamo percentuale di territorio comunale con parchi naturali. Se hai dei parchi naturali l‟ambiente è tutelato. Se io non ho nessun parco, ho zero, in Valle D‟Aosta hanno tanto, cosa mi serve un indicatore che rimane fermo per dieci quindici anni? Un parco naturale o marittimo, può essere un indicatore della cura dell‟ambiente, ma poi non posso fare i confronti nel tempo, rimangono stabili. Un indicatore deve avere un po‟ di mobilità. La 104 disoccupazione ha senso andarla a guardare. Non guardo la ricchezza dei paesi in relazione alla loro superficie, che è sempre la stessa. 2. Salute. È una dimensione essenziale del benessere individuale. Ha conseguenze che impattano su tutte le dimensioni della vita delle persone e in tutte le sue diverse fasi modificando le condizioni di vita e condizionando i comportamenti, le relazioni sociali opportunità e prospettive dei singoli. Riconoscendo la caratteristica multi dimensionale l‟OMS definisce la salute come la capacità dei soggetti di essere in equilibrio con sé stessi, col proprio contesto e di godere di un completo benessere fisico mentale e sociale, non solo come assenza di malattia. E poi ci sono una serie di altre cose. Come facciamo a misurare la salute degli italiani? Non è facile. Idea è stata prendere le cause di morte più comuni per varie fasce di età. Mortalità infantile, incidenti stradali per i ragazzi, giovani fino ai 35 anni, morte per malattie cardio vascolari nella popolazione più adulta e anziana, nella popolazione anziana e malati di Alzaimer, ritenendo questi indicatori per la salute del paese. Se diminuiscono gli incidenti stradali e muoiono meno ragazzi nelle strade, l‟idea è che la principale causa di mortalità vada a ridursi. 3. Benessere economico. Non è la semplice misurazione della capacità del sistema italiano di crescere, ma anche della sua capacità di trasformare la crescita economica in un aumento di equità e sostenibilità, attraverso un‟analisi del sistema economico, delle politiche redistributive e loro effetti sulle famiglie. 4. Istruzione e formazione. Quanti anni studiamo? Qual è la percentuale di laureati o diplomati all‟interno di una fascia di età. 5. Lavoro e conciliazione dei tempi di vita. Obiettivo di questo dominio è sia misurare la partecipazione al mercato del lavoro sia la qualità del lavoro, qualificando i diversi segmenti di occupazione in relazione alla stabilità del lavoro, reddito competenze e conciliazione degli orari e tempi di lavoro e personale femminile 6. Relazioni sociali. Intensità delle relazioni sociali che si intrattengono non solo influiscono sul benessere ma rappresentano una forma di investimento e può rafforzare gli effetti del capitale umano e sociale. Gli indicatori considerati riguarderanno anche la fiducia inter personale. 7. Sicurezza. Essere vittima di un crimine può comportare perdita economica, danno fisico o danno psicologico dovuto al trauma subito. La paura di essere vittima di atti criminali può influenzare molto le proprie libertà personali, la propria qualità della vita e sviluppo del territorio 8. Benessere soggettivo. Queste informazioni soggettive forniscono il benessere percepito dalle persone rilevando opinioini soggettive sulla propria vita. 9. Paesaggio e patrimonio culturale 10. Ricerca e innovazione 11. Qualità dei servizi 12. Politica e istituzioni 105 Siamo in questa situazione. Il PIL è uno strumento importantissimo come statistica economica, rappresenta l‟aggregato principale di macro economia. Ma presenta grossi limiti. Negli ultimi anni, a partire dal 2011, da quando Giovannini diventa presidente dell‟Istat si è lanciato in maniera intensa su questo progetto perché lo vuole concludere, si è cercato di costruire indici alternativi per il benessere equo e sostenibile. Il problema fondamentale che c‟è, questo discorso lo concludiamo la prossima settimana, è che c‟è uno scollamento forte tra teoria ipotesi, grosse descrizioni delle dimensioni del benessere e loro effettivo calcolo. Abbiamo una idea chiara di cosa vorremmo misurare ma non so molto bene come misurarlo, è qualcosa di difficile. In questo momento stiamo parlando di qualcosa di attualissimo. In questi giorni, mesi si parla di questo. Ogni mese ci sono riunioni, gruppi di lavoro su questi argomenti che stanno cercando di venire a capo su questo problema. L‟obiettivo sarebbe quello di riuscire a costruire un indice di benessere equo e sostenibile, concordato sulla base delle ipotesi formulate dalla commissione Stigliz, d‟accordo con quanto è stato rilevato sugli italiani, possibilmente usando dati amministrativi. I dati amministrativi non hanno costo. Sono i dati delle amministrazioni pubbliche o possono essere dati che con convenzioni si prendono da privati. Il consumo di acqua si può provare a recuperare da aziende che la distribuiscono. Altre cose risulta difficile da pensare da rilevare con dati amministrativi, come per esempio il benessere soggettivo che dev‟essere per forza raccolto con indagini campionarie. In questo momento sono state definite le 12 dimensioni e proposti, per ciascuna dimensione un certo numero di indici, nell‟ordine degli 8-11 indici o indicatori. Ciascuno di questi indici è stato scelto perché ha una qualche caratteristica di interesse. Malattie dell‟infanzia: se queste si riducono, la salute dei bambini migliora. Come rilevare i dati? C‟è una tabella in cui c‟è scritto misura del benessere, ogni quanto viene aggiornato il dato e dove si può recuperare? L‟Istat fa il punto della situazione. Fa delle indagini. Alcuni dati si possono recuperare sull‟indagine multi scopo delle famiglie, però ce ne sono altri che non si possono raccogliere, per esempio PM10 non ha dati su traffico, superamento di PM10. Attualmente, c‟è questa tabella in cui abbiamo indice, chi produce il dato e con che periodicità il dato viene prodotto. Se fosse prodotto ogni 5 anni questo dato non avrebbe interesse da essere rilevato. La prossima volta guardiamo una o due dimensioni, non molte di più, quello che vi voglio trasmettere è il concetto e la difficoltà che c‟è nella costruzione di questi e indicatori, guardando la descrizione di indici ed indicatori e guardando questa tabella. 106 LEZIONE 10 20/11/2012 Abbiamo guardato tanto queste fonti statistiche ufficiali ed enti produttori di dati. Abbiamo anche detto quanto sia importante costruire insiemi di dati analizzabili nel tempo in maniera tale da costruire quelle che abbiamo detto essere le serie storiche. 107 INTRODUZIONE ALLE SERIE STORICHE: L‟APPROCCIO CLASSICO Iniziamo un piccolo ciclo di lezioni sulle serie storiche guardando due impostazioni di queste analisi: analisi classica delle serie storiche, la seconda è l‟analisi moderna. Iniziamo con la analisi classica, è anche quella più semplice. La classica è una tipologia di analisi più semplice che ricorda molto gli esercizi di statistica 1 in cui la variabile indipendente era una variabile di tempo. Adesso iniziamo a vedere l‟approccio classico all‟analisi delle serie storiche, faremo un intermezzo con le procedure di destagionalizzazione, per poi arrivare all‟approccio moderno. Dopodiché arriveremo alla fine del corso parlando di indice dei prezzi al consumo con l‟intervento del personale del comune di Genova. Abbiamo già accennato il concetto di serie storica. Per poter condurre una analisi economica di un fenomeno nel tempo è necessario riuscire a ricostruire una serie storica. Dobbiamo essere in grado di misurare lo stesso fenomeno nel tempo ad intervalli regolari. È anche importante che la modalità di misurazione del fenomeno sia omogenea, perché se va a cambiare la base di riferimento per il calcolo della serie storica, vediamo che il confronto temporale non regge e non è possibile condurre una analisi che abbia un senso. Qual è la definizione? Si definisce serie storica una successione ordinata rispetto ad un indice coincidente con la misura del tempo, una successione ordinata di un medesimo fenomeno rilevato nelle medesime condizioni. Perché è ordinata? Perché è importante l‟ordine con cui queste misurazioni vengono effettuate nel tempo. In generale i dati vengono definiti in un periodo limitato, da una data di inizio t e fine T. Con la lettera t indico un pedice, cioè un valore che mettiamo in basso a destra, della serie storica, che è il nostro indice che misura la successione, l‟ordine temporale delle misurazioni. X1 x2 x3 x4 sono le misurazioni del fenomeno in 4 istanti differenti, dove x4 è successivo a x3, x 3 è successivo a x2 che a sua volta è successivo a x1. La serie storica ha un termine e ha un inizio. Pensate per esempio a tutte le serie storiche che vedete nei mercati finanziari. L‟andamento di un titolo, del tasso di cambio, lo spread sono serie storiche: misurazione di un certo fenomeno (valore di mercato di un titolo) che deve essere fatta ad intervalli regolari di tempo. Potremmo parlare tanto di mercati finanziari, è un classico ambiente di analisi delle serie storiche, ma adesso rimaniamo su discorsi più generali. Facciamo l‟esempio di come l‟ignorare la dimensione temporale possa portare a delle valutazioni contro intuitive o inesatte. Si considerano i seguenti dati che considerano l‟intensità del traffico, numero di incidenti e il loro rapporto come misura del rischio di incidente. All‟ora zero intensità di traffico 90, misurata per esempio col numero di automobili che transitano in un dato chilometro, il numero di incidenti rilevati sulla rete autostradale, una cosa di questo tipo, e il livello di rischio dato dal rapporto tra l‟intensità del traffico e il numero di incidenti. 108 Immaginiamo di non sapere che 0,1,2,3,4,5 siano delle successioni temporali, delle ore che mi possano rappresentare un indice di lettura del fenomeno. Se mettessi i dati sullo scatterplot o diagramma a punti, e metto insieme numero di incidenti e intensità del traffico, troverei correlazione piuttosto elevata, una retta di regressione con una buona bontà, ro quadro 0,63 che stabilisce che quando c‟è tanto traffico ci sono meno incidenti, o che quando c‟è poco traffico, intensità del traffico bassa, ci sono tanti incidenti. Sarebbe a dire che quante più automobili circolano, tanto minore è la possibilità che ci siano incidenti. Questo sembra strano: se ci sono poche macchine, che si vadano a cozzare l‟una con l‟altra dovrebbe essere minore. no, questo risultato è sbagliato. Non considero il fatto che c‟è una relazione tra queste due variabili e un altro fenomeno, ora del giorno. Se noi andiamo a rappresentare su un grafico le ore nell‟asse delle ascisse od orizzontale, ed in ordinata andiamo ad indicare i valori di traffico e gli incidenti e l‟indice di rischio, usando due scale diverse, a sinistra trovo i valori di traffico e numero di incidenti, dove il traffico è il rosso (c‟è un errore di colorazione), il numero di incidenti è il blu, l‟indice di rischio è il verde, noi vediamo che in realtà, durante le ore notturne, abbiamo livelli di traffico più bassi, linea rossa, abbiamo dei livelli di incidenti più alti, mentre abbiamo una misura del rischio, data dal rapporto tra la blu e la rossa, più alta rispetto alle ore del giorno. Se vedo l‟andamento del traffico, il traffico ha un andamento basso nelle ore notturne, inizia a cresce nelle ore della prima mattina, quando le persone iniziano a lavorare, ha un punto di flesso tra le 12-13 quando le persone si fermano per mangiare, riprende nel primo pomeriggio per andare a calare in tarda serata: questo è il classico andamento orario del flusso veicolare o di attività sociale. Se andate a vedere il numero di scippi e borseggi ha lo stesso profilo orario, anzi nella fase centrale della giornata ha dei cali: le ore maggiori di scippi e borseggi sono le ore di prima mattina e serali, quando le persone escono per fare la spesa e quando tornano a casa. Il blu, numero di incidenti che vengono misurati per ciascuna fascia oraria, ho tanti incidenti nelle ore notturne, ci sono i colpi di sonno, ci si addormenta, abbiamo un picco di incidenti nella notte e verso l‟alba, attorno alle cinque, in quest‟ora ho meno incidenti, e poi dopo aver mangiato ci viene l‟abbiocco e abbiamo gli incidenti perché i riflessi si rallentano, viene il colpo di sonno a seguito della pennichella pomeridiana. Però vediamo che in realtà non c‟è questo andamento di correlazione tra incidenti e traffico. Il problema è legato al fatto che quando noi abbiamo tanti incidenti c‟è poco traffico quando abbiamo pochi incidenti c‟è tanto traffico. La determinante livelli di traffico su incidenti non è così forte. È più importante, come causa di incidentalità, la componente oraria: la stanchezza del guidatore. È evidente che in un caso del genere utilizzare lo scatterplot visto prima per spiegare la relazione tra incidenti stradali e intensità del traffico non è adeguato, non ho 109 considerato l‟elemento temporale, che è fondamentale. Sono contesti in cui la variabile tempo diventa una variabile esplicativa importante per descrivere il fenomeno. Vediamo un po‟ di esempi: - Rapporto in percentuale tra debito e prodotto interno lordo italiano dal 1970 al 2009. È la stessa quantità rilevata ad intervalli annui. Bisognerebbe poi capire rispetto a che data, potrebbe essere al 31/12 o rispetto al valore medio dell‟anno. Il PIL è quello, il PIL annuo è un valore ben preciso, ma il debito varia nel corso dell‟anno, il numeratore può variare. Se scelgo di prendere il debito pubblico medio annuo o il massimo che raggiungo nell‟anno, devo conservare la scelta negli anni che si susseguono; - TSE MIB dal 2004 al 2010, indici di borsa. Gli indici di borsa, i titoli azionari, sono i classici esempi di serie storiche finanziarie. Quella di prima è una serie storica economica, questa è finanziaria. Non so se seguiate i corsi sui mercati finanziari: qualcosa sui mercati finanziari fanno Sciutti e la Resta, nell‟ambito dei mercati finanziari lo studio delle serie storiche è importante per varie ragioni. Avete mai sentito parlare di analisi tecnica? È una metodologia di analisi che studia graficamente i grafici delle serie storiche. Individua, congiungendo tutti i minimi le basi, le resistenze, i trend di crescita e decrescita, cerca le figure delle serie storiche, testa e spalle, e così via, analizzando solamente l‟andamento delle serie storiche. - Le vittime per crimine violento per età. Un tasso calcolato per 1000 persone su popolazione con età superiore da 12 anni. Il tasso dal 1985 in poi è andato a crescere per 12-15 16-19 20-24. Si può dire che negli ultimi 15-20 anni sono aumentate le vittime per crimine violento nelle fasce di età più giovani. In linea di principio rimangono stabili le altre. Questo è un esempio di interpretazione che si può dare alla serie storica, le tendenze. - Altra serie storica, sulle vendite di X box. È una console per video giochi. Più famosa la Play Station, Play Station 2-3, questa è la prima X box. Esiste anche la X box 360. Sono tutte serie storiche delle vendite mensili. Cosa sono quei picchi che vediamo nel grafico? Sono i vari Natale. A natale si vendono le console perché vengono regalate, o i ragazzi lo chiedono per regalo di natale. Le serie storiche possono essere: economiche, finanziarie, di fenomeni sociali, anche serie storiche dei prezzi al consumo, di vendite. Serie storica è tutto ciò che viene rilevato ripetutamente nel tempo ad intervalli regolari. Abbiamo visto serie storiche annuali, in questo caso abbiamo serie storiche mensili, anche trimestrali quadrimestrali, semestrali e così via. In linea di massima, quello che si vuole fare nell‟analisi delle serie storiche è costruire un modello che permetta di sintetizzare l‟andamento della serie storica. Si vuole cercare di esprimere un modello statistico, immaginate modello di regressione, che sintetizzi l‟evoluzione della serie storica, del fenomeno nel tempo. 110 Esistono due approcci: il primo è l‟approccio classico, che andremo a vedere inizialmente, che ipotizza che i valori osservati di un fenomeno al tempo t siano spiegabili attraverso una componente deterministica, che per esempio può essere espressa attraverso una retta o parabola di regressione, più una componente residuale che non riusciamo a spiegare: è un po‟ il concetto di varianza spiegata e residua della retta di regressione. Ipotizzo che il fenomeno inflazione segue un andamento deterministico e un valore casuale che non permette di individuare perfettamente i valori dell‟inflazione sulla base del modello formulato. Modera? Considera la serie storica come una realizzazione discreta di un processo stocastico. Significa che il valore della serie di oggi è uguale a quello di ieri più una componente casuale che è strutturata in qualche modo. C‟è una relazione tra il valore di oggi, di ieri ed una qualche componente residuale che può essere più o meno importante. Dato che l‟impostazione moderna è stata individuata dopo, è la più difficile, vedremo di accorciarla un pochino rispetto all‟anno scorso. Approccio classico è molto semplice, quasi banale. Abbiamo una serie storica che può essere qualsiasi cosa. Non è importante sapere cosa sia x in questo grafico, può essere PIL, come possono essere vendite di frullatori, come possono essere i tassi di mortalità di bambini rispetto ad una certa malattia. Noi abbiamo X fenomeno che cerco di studiare e T, dove t è tempo. L‟analisi classica delle serie storiche è uni dimensionale, esprimo il fenomeno che sto studiando x in funzione del tempo. Andrò a costruire modelli di dipendenza funzionale, rette e parabole, ma non solo. Come vedete, questo modello ha una caratteristica parabolica. La logica della analisi classica delle serie storiche è riuscire ad introdurre un modello funzionale, per esempio una parabola che vedete rappresentata in rosso, che vada a cogliere la tendenza generale di un fenomeno nel tempo. A cosa serve questo? Per cercare di formulare previsioni per la serie storica per il futuro. Non solo. A livello econometrico, cosa che studierete in altri corsi, interessa costruire un modello di serie storica e regressione in cui oltre al tempo inserisco altre variabili. A quel punto interpereto la variazione del fenomeno x nel tempo e in relazione alle altre variabili nello stesso istante temporale. Nell‟approccio classico, la analisi condotta per le serie storica è cosiddetta TRENDCICLO. Si ritiene che il fenomeno xt sia legato ad una componente di trend e di ciclo economico più una componente di errore. Per procedere si scompone la componente di errore o di regressione sino a quando non è spiegabile attraverso un modello deterministico, cioè una funzione. Avevamo visto che la serie storica precedente, come cuore, può essere espressa attraverso la funzione indicata in rosso che rappresenta il nostro trend o la nostra tendenza di fondo. Si usa molto la parola trend, i fagiolini sono dati in trend negativo. Il trend è la tendenza, non significa che l‟andamento della serie storica è esattamente coincidente con il trend, ma significa che la serie storica segue questo cuore rosso, cioè la tendenza di fondo. Se voi avrete un gruppo di persone che va in una direzione, 111 avrete la linea della direzione e il verso, e le persone che vanno attorno a quella direzione. Trend è in linea di massima la direzione verso cui è andata la serie storica. A questo punto, una volta individuato l‟elemento di fondo come il trend, ci si chiede: questa serie storica che ha avuto questo comportamento così deterministico, spiegabile attraverso una funzione ben precisa, ha altri elementi che possono essere descritti in maniera altrettanto descrittiva? Noi possiamo individuare il numero di persone che vanno a Limone Piemonte per vacanza. Quello può essere il numero di persone che ogni mese od semestre sono andate a Limone Piemonte. Ho ancora una oscillazione regolare attorno a questo trend. Oltre alla tendenza pluriennale, che potrebbe essere il trend rosso, ci sono oscillazioni che potrebbero essere legate ai fenomeni stagionali. A Limone Piemonte ci si va in estate ed in inverno, o per le festività, come nella maggior parte dei posti di montagna. La serie storica, artificiosa, non è una serie storica reale, presenta una evidente stagionalità. C‟è una oscillazione, ogni tanto è sopra è sotto, ritorna sopra poi sotto, eccetera, della linea nera attorno alla linea rossa. Questa componente la potremmo andare a definire come stagionalità. La serie storica è la nera, mostra una evidente stagionalità dovuta per esempio alle stagioni naturali, stagionalità è legato proprio alla parola stagione, ai cicli giorno notte, che un trend parabolico non riesce a cogliere. Cosa si fa? Individuiamo e vediamo che la componente deterministica che abbiamo trovato inizialmente, il trend parabolico, è un elemento deterministico che non coglie la componente stagionale. La componente stagionale deve essere aggiunta alla componente trend per esprimere questo altro elemento periodico e quindi deterministico della serie storica. Cosa si fa? Prendo la serie storica, xt, elimino il valore teorico della retta di regressione, e calcolo gli scarti tra la nera e la rossa, e ottengo una rappresentazione dei residui. Et è il residuo di regressione, essendo xt il valore della serie storica al tempo t, e Tt il valore del trend, linea rossa, al tempo t. Et è la distanza dalla nera alla rossa per ogni istante temporale della serie storica. Tt è il trend,la rossa, mentre xt è la serie storica. Et è la differenza tra la linea nera, serie originale o grezza che abbiamo osservato, e la linea rossa, trend parabolico che abbiamo individuato prima. Facendo tutte le differenze, cosa otteniamo? Che la nera un po‟ oscilla attorno alla rossa. Se sottraggo dalla nera la rossa, tolgo il trend parabolico all‟intera serie storica. Quello che rimane è solo il residuo della serie storica dal trend. Se facciamo quelle differenze, la serie storica diventa così. Sono tutte le oscillazioni che noi abbiamo attorno alla serie storica. Per esempio. La serie è fatta così e questo è il trend. Facendo questa operazione xt meno Tt, per ogni istante temporale prendo lo scarto tra la serie storica e il valore sulla parabola di regressione. Se rappresento tutti questi scarti ottengo quello. È come se prendessi lo spaghetto, la rossa, lo tiro e vedo gli scarti che si hanno tra la serie storica e la parabola. È il grafico dei residui della serie storica dal trend parabolico. 112 Questo residuo ha un andamento che presenta la componente di periodicità, che chiameremo stagionalità. Vedete come crescita e decrescita si alternano con una buona regolarità, non in maniera perfetta. Allora cosa posso fare? Inserire all‟interno di questo elemento ondulatorio un modello periodico, in questo caso è la funzione seno, trigonometrica, da zero sale raggiunge massimo, scende raggiunge il minimo e torna al punto di partenza. Il seno è una funzione periodica perché oscilla tra due valori all‟infinito. Ecco che, a questo punto, individuiamo una seconda componente deterministica, che è questa componente stagionale. Se questa componente stagionale è l‟ultima componente deterministica, siamo riusciti a scomporre la serie in una componente deterministica, trend parabolico più componente stagionale e residuo, che è una componente non deterministica. I residui del modello rappresentano la componente accidentale, non prevedibile, non modellizzabile, perché totalmente casuale. I residui di regressione devono essere de strutturati, cioè non devono avere comportamenti regolari, devono essere incorrelati, non devono rappresentare alcun trend, devono essere una componente puramente casuale. Se prendessimo quello che abbiamo visto prima, serie storica senza il trend, detrendizzata, e se togliessimo anche la componente ciclica, otteniamo le oscillazioni della serie storica attorno alla componente trend e stagionale. In qualche modo scrivere trend più parte stagionale equivale a descrivere una serie storica con questo andamento. Attorno a questo modello deterministico avremo poi le oscillazioni della serie storica, e deriveremo di nuovo dei residui di regressione. Torniamo indietro, è facile ma importante. L‟approccio classico all‟analisi delle serie storiche è un approccio che intende prendere una serie storica e scomporla in componenti. Queste componenti saranno in linea di massima tre: - Trend – ciclo, vedremo cosa si intende; - Stagionale; - Residuale La componente trend è la componente che deve cogliere, esprimere, la tendenza di fondo del fenomeno. È di solito un modello lineare di primo, secondo terzo grado, difficile andare ai gradi superiori, e quindi rappresenta la tendenza di fondo della serie storica. Questa serie storica ha una tendenza di fondo esprimibile attraverso questa parabola. Tuttavia, se noi facciamo una analisi attenta della serie storica e di come la rossa passi attraverso i punti della serie storica, possiamo vedere che la rossa non coglie perfettamente l‟andamento della serie storica, se fosse un modello perfetto le linee nere e la linea rossa sarebbero coincidenti, ma non è così. Esiste un residuo di regressione. Il nostro obiettivo è esprimere attraverso formule e modelli, quanto più possibile, l‟andamento della serie storica. Attraverso la formula abbiamo tolto la tendenza generale della serie storica. Però c‟è questa oscillazione 113 della nera attorno alla rossa. Questo residuo potrebbe ancora essere strutturato. Potrebbe avere elementi esprimibili attraverso una funzione matematica. Dal momento che ho individuato all‟interno della nostra serie storica questo trend, allora lo mettiamo da parte e ci focalizziamo solo su quello che non abbiamo avuto modo di vedere bene. Capito questo, sottraggo il trend a tutta la serie storica e individuiamo tutta la componente di variabilità della serie storica, l‟andamento della serie storica che non è espresso dalla rossa. Ci focalizziamo esclusivamente su quello che non abbiamo capito o il cui andamento no è stato modellizzato. Facciamo lo zoom sull‟oscillazione tra la nera e la rossa. La rossa è una componente fondamentale della serie. Per fare questo utilizziamo le differenze tra la serie storica e il trend. Chiamiamo questa quantità errore. Perché? Non è un errore perché abbiamo sbagliato qualcosa, è la parte di serie storica che non è possibile prevedere utilizzando il trend. In particolare, vedo che la componente si presenta con una certa periodicità attorno alla linea rossa. Lavoro sulla differenza x-t, e vedo che l‟errore è una componente con forte periodicità. L‟obiettivo è dire: se c‟è un‟altra componente modellizzabile attraverso una formula matematica, io la modellizzo. Introduco per esempio una componente periodica che mi consente di descrivere meglio di quanto potesse fare il trend, la tendenza della serie storica. Anziché avere un trend parabolico puro e semplice ho un trend parabolico accompagnato da un andamento parabolico periodico. Questo lo portiamo avanti all‟infinito, nella pratica ci fermiamo qua, le componenti sono di questa natura. Possiamo andare ulteriormente avanti. Siamo sicuri che utilizzando il trend parabolico e inserendo una funzione periodica di questo tipo, siamo arrivati ad esprimere completamente il modello deterministico che sottostà ai nostri dati? Ho individuato il miglior modello possibile? Per fare questo analizzo i nuovi residui. Serie storica meno trend, a questi valori sottraiamo il valore della rossa. Andiamo a vedere il residuo della nera rispetto ad un modello oscillante di questo tipo. Diremo, va bene: abbiamo completamente descritto il fenomeno che stiamo studiando, se la componente di errore, quindi questo residuo dal modello presenta alcune caratteristiche piuttosto importanti: se i residui non presentano comportamenti regolari, vedremo degli esempi, per esempio un residuo di questo tipo presenta una componente regolare, sale scende, sale scende, non è un residuo destrutturato, devono essere incorrelati, ne parleremo, non devono presentare alcun trend e devono essere una componente puramente casuale. L‟analisi dei residui è una parte molto delicata, ne parleremo ancora per chiarire i concetti. Possibilmente, devono avere una varianza costante nel tempo, su questo ci torneremo tra due lezioni. Quello che vogliamo dire è: questa è la serie che oscilla. Voglio trovare una funzione che passi attraverso la serie storica e mi colga il trend e la stagionalità. Se il modello è buono, può essere così assunto a sintesi della serie storica. Se il mio modello è buono, quanto più è piccolo il residuo, l‟errore, tanto migliore sarà la mia capacità esplicativa. Facendo un pochino un salto indietro alle cose viste a 114 statistica 1, se noi avevamo la bontà del modello, questa era la varianza spiegata dal modello sulla varianza totale. Quanto più il mio errore è piccolo, tanto più la varianza residua dal modello è piccola. Lavorare sulla componente di errore, cercando di eliminare, sottrarre alla componente di errore ciò che è deterministico, mi serve per costruire il miglior modello possibile per sintetizzare l‟andamento della serie storica nel tempo. Questo è il risultato finale al quale arriviamo utilizzando l‟approccio classico nell‟analisi delle serie storiche. Otteniamo una serie di osservazioni che già ad una prima ispezione visiva si presenta destrutturato. Vedremo poi le tecniche per analizzare i residui. Rispetto ai residui che abbiamo visto prima, questi si presentano non strutturati. Se troviamo una componente per la quale non riesco a trovare la causa, o una relazione spiegabile attraverso una funzione del tempo, allora diciamo che quelli sono residui non prevedibili. È qualcosa al di là della nostra capacità di previsione. Se un mese piove o un giorno c‟è sciopero dei treni, non posso costruire un modello che includa la probabilità di pioggia o di sciopero dei treni per le persone che andranno a Limone. Esistono concause che fanno si che il modello esplicativo della serie non sia di fatto perfetto, ma ci sta, è accettabile. L‟importante è che questa componente che io ritengo essere non prevedibile, e quindi totalmente casuale, sia la più piccola possibile. Tempo fa, mi hanno invitato ad una trasmissione a Bolzano alla radio rai come esperto di probabilità e statistica. Era sul gioco d‟azzardo e sul caso. Con grande ingenuità il presentatore mi chiede: cosa è il caso? Non ha una definizione, non esiste una definizione. È qualcosa di molto affascinante. Per caso si può definire tutto ciò che può essere pensato in tanti modi. Cosa è questo residuo? Non lo so. C‟è variabilità nella serie storica e non so dire perché esista. Perché se tiro un dado una volta esce 1 e una volta 6, è un caso, non c‟è una giustificazione vera e propria. Lo stesso per le serie storiche: perché a volte la produzione industriale è più alta o più bassa rispetto al modello, o perché il prezzo del pane è più alta o più basso? In quel periodo il grano aumenti, c‟è stata siccità in Brasile, perché è aumentato il prezzo del petrolio e tutto è diventato più caro, ci sono talmente tante concause che alla fine messe assieme diventano un brusio non capibile. Io voglio prendere una serie storica: la prendo, la affetto, prendo il trend e la stagionalità, se ci sono altri pezzi che so spiegare il perché lo metto nel modello, e quello che non so più spiegare è qualcosa di inspiegabile, è puro caso. Non esiste alcuna possibilità di modellizzare ciò che è puramente casuale. Non esiste modello che mi dica i prossimi sei numeri del Superenealotto. Non esiste alcun modello che mi dica se tiro la monetina se esce testa o croce. Prendo una serie storica e cerco di capire ciò che è esprimibile attraverso funzioni in relazione al tempo. Sino a qua riesco ad arrivare. Prendo T ed S, oltre a quello non riesco ad andare, perché tutto il resto è puro caso. Questo è l‟approccio classico: cercare di ricondurre una serie storica ad una serie di formule in funzione del tempo e avere un residuo di questo modello puramente casuale. 115 Diversa è la ciclicità, ne parleremo dopo. Immaginate che il trend includa anche il concetto di ciclicità. Eliminiamo i modelli decompositivi, se è necessario le spiegheranno ad econometria, arriviamo ai cicli. Che differenza c‟è tra ciclo e stagionalità? Un ciclo è per esempio, il ciclo economico. Il ciclo economico è una alternanza di fasi di espansione e di depressione, fasi di crescita e depressione che è ricorrente (cioè si susseguono nel tempo) ma non è periodico. Se prendete le temperature dell‟aria a Genova a seconda degli anni la temperatura aumenta e diminuisce: d‟estate aumenta e d‟inverno diminuisce. Una stagionalità è qualcosa di periodico: un ciclo di dodici mesi, con picco positivo nello stesso periodo, e il picco negativo o anti picco nello stesso periodo degli anni precedenti. La stagionalità ha andamento periodico di periodo predefinito. Il ciclo no. Ha fasi di espansione e contrazione. La durata di queste fasi può essere molto differente tra di loro. Si vorrebbe che la fase di contrazione non ci fosse mai. Si vorrebbero fasi di crescita economica molto più lunghe e intense rispetto alla depressione economica. Si parla spesso di 20 anni di crescita e 5 di decrescita. C‟è una differenza ben precisa tra ciclo e stagionalità. Non è chiara la differenza tra trend e ciclo. Sono un tutt‟uno, molto legati tra di loro. La serie storica vista prima, cosa è? Può essere un trend lineare al quale possiamo aggiungere una componente ciclica, ma non lo so: diventa una discussione accademica sulla quale concludiamo poco. L‟obiettivo molto spesso è esprimere trend e ciclo in un tutt‟uno. Anziché parlare di trend ciclo e stagionalità come tre entità separate, si parla in generale di di trend-ciclo tutt‟uno e di stagionalità separata dal trend-ciclo o ciclo-trend. Anche se fosse possibile separare ciclo e trend è di interesse lo studio di correlazione tra fenomeni permanenti e fenomeni transitori. Diviene importante depurare la serie storica dagli effetti stagionali, si ritiene che divenga più agevole individuare e interpretare i movimenti ciclici e valutare le inversioni di tendenza. Andare a sciare è una componente stagionale. Vado a sciare quando c‟è la neve, pensiamo al nostro Limone Piemonte. È inutile che voglia andare a interpretare la attrattività turistica di Limone Piemonte sulla base delle stagioni, è qualcosa che non dipende da me, non dipende da Limone, non dipende dalle strutture sciistiche di Limone o quelle per le vacanze estive. Il ciclo stagionale è quello che è. Dal punto di vista economico ma anche aziendale, non è che si possa fare molto sulla stagionalità. Io posso vendere ombrelli, li venderò di più nei mesi piovosi. Ma non posso valutare tanto le mie vendite sulla base dell‟andamento stagionale. Quello li è qualcosa che subisco, che non posso controllare. È interessante vedere come vanno le vendite rispetto magari all‟anno scorso. Diventa però anche difficile fare dei confronti. Prendiamo la serie storica delle X BOX viste prima. È un trend crescente, decrescente, cosa sta succedendo? Non è così facile capirlo con una componente stagionale così forte. Si preferisce molto spesso eslcludere la componente stagionale nel caso dell‟Xbox può avere anche un significato. In questo caso per questi marchi e prodotti vale anche un 70% del mercato dell‟anno, però a volte la componente 116 stagionale o anche chiamata calenderiale, legata al calendario, con i periodi anche pasquali eccetera, sporca la mia serie storica, non mi rende facile una lettura nitida dell‟evoluzione del fenomeno. Molto spesso si preferisce cercare di andare a eliminare, ma non perché non abbia senso ma perché non controllabile, la componente stagionale. Si parla in senso proprio di metodi di destagionalizzazione delle serie storiche. Ci sono anche in questo caso una miriade di metodi per la destagionalizzazione delle serie storiche. Ne vedremo due, uno molto usato anche nell‟ambito dei mercati finanziari. Per fare una precisazione, non sarò un nobel, ma se effettivamente ci fossero miei colleghi che sapessero, trovassero modi per guadagnare certamente in borsa non ci sarebbero neanche più gli statistici, saremmo tutti a guadagnare soldi e vivere alle Bahamas. Di fatto metodi statistici che permettano di dare una previsione esatta dei mercati finanziari non esistono. Se muore di infarto Marchionne domani mattina, quello li il modello statistico non ve lo da. Se Monti dice una cosa piuttosto che un‟altra o Berlusconi fa o meno altre robe sono fenomeni prevedibili che non può avere dentro e non mette dentro. Ci sono imperfezioni nel mercato finanziario nostro e mondiale che i metodi statistici fanno poco, funzionano sino ad un certo limite. La componente di errore non prevedibile è molto grossa. L‟eta quadro, la bontà del nostro modello è molto bassa. Per togliere la stagionalità, immaginate qualcosa con questo andamento, cosa può essere? Questo è il mese di agosto, di nuovo agosto e di nuovo agosto. Questo è il classico caso di indice di produzione industriale: ad agosto la Fiat chiude, tutti al mare e la produzione industriale diminuisce. Ha un senso questo crollo? Si, ha senso perché le attività industriale chiudono, non è che la Fiat vada a mezzo servizio ad agosto, la produzione industriale viene sospesa, è un elemento di disturbo della serie storica. Il primo metodo che si viene utilizzato, è il metodo X-11 sviluppato dal bureau of Census americano negli anni ‟60, è una procedura interattiva che pensa di utilizzare una serie di medie mobili, vedremo poi come funzionano. Il secondo approccio è più complesso che ipotizza dei modelli sottostanti, non discuteremo del model based. Ci troviamo di fronte ad una serie storica, questa che è la serie storica dell‟indice generale della produzione industriale, dove 100 è il valore medio dell‟anno 2000, mese per mese abbiamo i valori della produzione industriale. Vogliamo cercare di individuare una tendenza di fondo di questa serie storica. Se noi calcolassimo una retta di regressione su questi dati, otterremmo una pendenza negativa. Lo vedo dal fatto che la serie va in giù. Dove dovrebbe essere questa serie storica? Se lo calcolassimo verrebbe in mezzo, i valori sono molto bassi, ci danno fastidio, sporcano la serie storica, sporcano la nostra analisi. Vogliamo andare a destagionalizzare la serie storica. La stagionalità più evidente è quella degli anti picchi dei valori di agosto, un pochino dopo la metà, se fosse la metà sarebbe giugno luglio, siamo verso la destra di ciascun anno quindi agosto. Se vedete, l‟andamento della serie storica si ripresenta sempre con certa periodicità. Ho novembre - dicembre – novembre dicembre, novembre -dicembre più alto, poi 117 cresciuto eccetera. La stagionalità più evidente quella di è agosto. Anche negli altri mesi c‟è una certa periodicità nell‟ordine dei valori. Qual è il mese più alto, più basso eccetera. Quello che si vuole fare con la destaginoalizzazone è costruire una serie di questo tipo, quella tratteggiata, chiamata serie destagionalizzata che cerca di compensare gli elementi stagionali, eliminarli, e cercare di individuare il comportamento della serie storica senza l‟effetto della stagionalità, cosa che non è facile. La destagionalizzazione è una procedura che ha come obiettivo la costruzione di una serie storica che non includa al suo interno l‟effetto di stagionalità. Non si esprime solamente con i crolli della produzione ad agosto, ma la si può riscontrare anche in altri mesi con altri andamenti. Se guardate la serie storica, in fin dei conti, se andate a vedere i picchi, è un po‟ in decrescita. Anche qua, se provate a passare le dita sulla serie storica, questa si stringe e va a scendere. La serie storica destagionalizzata tende a declinare, un po‟ quello che abbiamo detto a parole. Vogliamo costruire un modello che svolga questo andamento. Allora come facciamo? Utilizziamo delle medie mobili. Oggi ne parlo un po‟. Se lo trovate difficile ripartiamo da qua. È chiacchieroso, per i non frequentanti. Le medie mobili sono qualcosa di semplice. È una media calcolata su una finestra temporale di ampiezza di ordine k. Per esempio: se io prendo la produzione industriale italiana di gennaio febbraio marzo, poi febbraio marzo aprile, marzo aprile e maggio, e ne calcolo una media per ciascuno di questi tre mesi, sto facendo una media mobile. Apro una finestra di ampiezza prefissata, per esempio tre mesi, calcolo la media sui primi tre mesi, shifto verso destra di un mese, esce gennaio e rimangono febbraio marzo e aprile, il calcolo successivo, la media successiva esclude febbraio e include maggio. Si chiamano medie mMobili perché sono medie calcolate su finestre mobili che si vanno sempre a sovrapporre in parte. Il movimento dei valori calcolati è molto morbido. Questa è la formula difficile della media mobile che vedete da soli. È facilissimo. Ho tempo, mesi settimane. 1-2-3-4-5-6-7-8 mesi. Calcolo la media mobile di periodo 3. 41-7 e ne calcolo la media e la metto in corrispondenza di due. 4+1+7 diviso tre = quattro; prima media mobile per uno due tre. La seconda sarà 1-7-10, anziché prendere 1-2-3, avrò 1+7+10 diviso 3 =6. Otto sarà la media di 3-4-5 , cioè 7+7+10 = diviso 3 fa otto. Poi 10-7-13 diviso 3 = dieci. La media mobile è calcolata su valori di una finestra ben definita di ampiezza prefissata. Poi la trascino verso destra sino a quando non ho più numeri per calcolare la media mobile. La media mobile non è più calcolabile. Non ho tanti termini di media mobile quante sono le unità temporali. Se arrivo in corrispondenza di 7, 13 è la media mobile su 13-16-10 poi su 8 ci manca il valore di 9, non posso calcolare. Non si calcola su valori parziali, non si calcola proprio. Ecco che per esempio avete la serie storica originale che vedete li e in rosso la media mobile calcolata sui valori li vicini. Questo puntino 4, il primo puntino rosso, è la media 118 calcolata su questi tre valori, questo valore è la media calcolata su questi e così via. La media mobile è una media locale, si chiamano medie locali, medie calcolate su valori in un intorno, in questo caso di tre unità, che può essere più o meno ampio. Una media mobile ha una azione spianante, è un po‟ un ferro da stiro, tende a ridurre le irregolarità di tipo casuale, ricostruisce la tendenza di fondo. La media mobile molto spesso è utilizzata come approssimazione del trend Al posto di retta o parabola di regressione, calcolo la media mobile che ha proprio il compito di ripulire il trend. D‟ora in avanti parleremo di medie mobili semplici, che vengono calcolate sulle unità vicine e medie in cui ciascuna unità ha lo stesso peso. Se ipotizzo che il trend sia lineare può essere approssimato in questo modo. Vediamo ancora questo esempio. Questo è l‟andamento del PIL trimestrale italiano dal 2001 al 2010. Abbiamo il bitorzolo 2006-7-8 e poi il crollo in corrispondenza della fine 2008. Proviamo a calcolare le variazioni percentuali. Si preferiscono molto spesso non i valori assoluti, ma variazioni percentuali. Su questo si calcolano poi le medie mobili e dopo un paio di passaggi si ricostruisce l‟andamento della media mobile. Ripercorriamo il percorso. Serie storiche: approccio classico è di tipo regressivo, si vuole costruire un modello di tipo statistico per esprimere l‟andamento della serie in funzione del tempo, si va avanti fino a quando i residui non sono completamente destrutturati, sino a quando non sono pienamente casuali. Le componenti che determinano l‟approccio classico sono: trend-ciclo, assieme perché difficili da scorporare dal punto di vista concettuale ed economico, e la stagionalità. Differenza tra ciclo e stagionalità: il ciclo non presenta periodicità, è caratterizzato da crescita e contrazione di periodicità non costante. La stagionalità è comune a tante serie storiche non interpretabile, è qualcosa che non dipende da noi. Si sviluppano serie di analisi di destagionalizzazione come il metodo X-11 che vedremo la prossima volta, metodo molto complesso ma il primo dei quali è l‟utilizzo delle medie mobili, medie di valori della serie storica, calcolate su finestre ad ampiezza fissa, finestra che scorre lungo l‟arco temporale e abbiamo medie locali calcolate per ciascuna di queste finestre. Ha effetto di lisciamento su tutta la serie storica riducendo quindi la componente stagionale. LEZIONE 12 27/11/2012 Martedì viene il responsabile delle statistiche economiche del comune di Genova, il dottor Profumo, parlerà rilevazione della rilevazione i prezzi e come si costruiscono gli indici di prezzi al consumo. È un intervento molto importante, vi fornirà un plico di slides, che sono parte integrante del programma. La volta successiva dovremo avere l‟intervento di un professionista nell‟ambito del trasporto del cotone, ci spiegherà alcune cose sul mercato del cotone, analizzando alcuni aspetti di settore macro economico, poi siamo arrivati alla conclusione del programma. La prossima è il 4 e abbiamo Profumo, l‟11 c‟è Parisi, e poi ci sarebbe il 18, probabilmente annullerei quella lezione. 119 In linea di massima vediamo dove arriviamo e il programma in forma di slide mie sarà concluso. Vi predispongo un elenco di possibili domande teoriche dominanti, a livello di esercizi vedremo veramente poche cose. Per la data esatta del pre appello facciamo il 18 dicembre. Avevamo concluso, dopo aver parlato di serie storiche, analizzando il problema di stagionalità, quella componente sistematica o periodica che va a colpire le nostre serie storiche e che dobbiamo cercare di eliminare. Un approccio che avevamo considerato era quello delle medie mobili. Su queste slide che vi caricherò oggi, avevamo detto che le medie mobili sono dei filtri per cercare di cogliere la componente di fondo, cioè il trend al netto di questo fenomeno di stagionalità. Le medie mobili hanno una formulazione di questo tipo. Una media mobile è una media ponderata delle unità dei valori osservati in una finestra di tempo di ampiezza fissa. Le medie mobili sono delle medie calcolate sui valori della serie storica in un periodo di tempo ben stabilito, per esempio una media mobile calcolata su sei mesi, è una media mobile che rappresenta e calcola il valore della serie storica su sei unità temporali consecutive: gennaio febbraio marzo aprile maggio giugno. Nell‟unità successiva, febbraio marzo aprile maggio giugno luglio. È una somma ponderata dei valori della serie storica corrispondenti ad istanti temporali intorno a t, cioè dei dati tra t –q1 a t+q2, con opportuni valori dei coefficienti di ponderazione cj. Io posso dare la stessa importanza nel calcolo della media mobile a tutte le unità della finestra temporale. Se calcolo il valore medio di un titolo nel suo valore di chiusura, posso calcolare la media dei valori del primo secondo terzo quarto e quinto giorno, a cinque termini, o posso dire che i valori più recenti sono più importanti dei valori vecchi. Potrei pesare maggiormente i valori più prossimi ad istante t e pesare di meno i valori più vecchi. In generale, la media mobile viene calcolata con una finestra temporale che rispecchia il periodo del nostro fenomeno stagionale. Se ho per esempio un fenomeno con ciclo 12, per esempio la stagionalità tipica dell‟anno solare, allora la media mobile da utilizzare è di periodo 12. Se i dati che ho sono di tipo trimestrale, e quindi abbiamo 4 trimestri, la media mobile da usare è in generale una media mobile di ordine quattro. Se c‟è un mese, come avevamo nel caso della produzione industriale, che ha un valore particolarmente diverso dagli altri, particolarmente basso, se noi utilizziamo una media mobile di ampiezza 12, questo mese anomalo, è sempre incluso in qualsiasi media mobile. Se noi andiamo da gennaio a dicembre il valore è incluso, da febbraio a gennaio è incluso, da febbraio a marzo è incluso, se andiamo a luglio, da luglio ad agosto uno dei valori più bassi è all‟interno di questa finestra, e quando trasliamo ancora di una unità esce dall‟estremo sinistro ed entra dall‟estremo destro. Uno dei picchi o anti picchi è sempre incluso all‟interno della finestra mobile che utilizziamo per le medie mobili. 120 Abbiamo visto brevemente un esempio di media mobile, che è uno strumento molto semplice. La media mobile è la media su unità consecutive della serie storica. L‟ampiezza della finestra è fissa, per esempio ampiezza tre, vengono chiamate medie mobili perché i valori che vengono considerati per il calcolo della media mobile cambiano al variare del tempo, la media mobile si adegua piano piano all‟andamento della serie storica, facendo una media locale dei valori che sono stati osservati. La media mobile si accompagna piano piano ai valori della serie storica originale. Il risultato è per esempio questo. Una serie storica che presenta una stagionalità di ordine tre, in linea di massima, riduce le oscillazioni che vedete qua passando in mezzo alla serie storica e avvicinandosi a quello che potrebbe essere un trend lineare. Se calcolassimo una retta di regressione su quei dati, il trend potrebbe essere molto vicino alla media mobile. La media mobile è in realtà molto più flessibile rispetto ad una retta di regressione. Una media mobile consente di seguire tutto l‟andamento della serie anche se l‟evoluzione non è strettamente lineare, anche se il trend non è strettamente o parabolico. Se noi avessimo una serie storica che fa così, questi sono i valori tipici dei mercati finanziari, la media mobile avrebbe un andamento di questo tipo, è una forma di lisciamento della serie storica. Segue in maniera dolce la serie storica,l‟andamento globale e il trend, ma non ha la rigidità ne di una retta né di una parabola di regressione. Quale modello parametrico consentirebbe di spiegare questo trend di serie storica? Una retta probabilmente verrebbe così, inadeguato, parabola inadeguata. La media mobile viene utilizzata per andare ad effettuare dei lisciamenti della serie storica cogliendo la tendenza generale ed eliminando le oscillazioni più frequenti, intervalli più brevi, ed eliminando anche componente di stagionalità. La media mobile ha una azione spianante, detta anche di lisciamento, rende più liscia la descrizione della serie storica. La media mobile è uno strumento che guarda al passato. Per poter calcolare la media mobile devo avere già osservato tutti i valori. Non devo calcolare una media mobile quando ci mancano dei valori del futuro. La media mobile è calcolata sulle ultime k unità osservate. Non ha una grandissima capacità preditiva se non ragionandosi sopra anche con strumenti piuttosto sofisticati. Ha una caratteristica principalmente descrittiva. Non parliamo di mercati finanziari e così non facciamo. Ma qui si usa confrontare l‟andamento delle medie mobili a breve e a lungo, a 7 giorni e medie mobili a 15 giorni. I dati finanziari dopo 15 giorni sono privi di qualsiasi senso. A seconda dell‟andamento che hanno queste due medie mobili, per esempio la media mobile a lungo e a breve, se la breve interseca quella a lungo dal basso verso l‟alto significa una certa cosa, se sono invertite significa altro: ci sono fasi alziste e ribassiste del titolo. La media mobile è utilizzata con degli strumenti di analisi tecnica. Qua volevamo vedere un esempio di destagionalizzazione su questa serie, PIL trimestrale italiano da 2001 a 2010. PIL italiano da 2001 a 2010 in milioni di euro. Consideriamo, molto spesso non interessa e l‟avevamo già detto parlando di PIL, il 121 valore assoluto del PIL quanto piuttosto la variazione percentuale, consideriamo qual è l‟andamento delle sue variazioni percentuali anno per anno della serie precedente, dove per variazioni percentuali intendo valore PIL t meno valore PIL nel trimestre t meno uno, diviso il PIL del t-1. Il primo trimestre per il quale possiamo avere il risultato sarà per forza il secondo trimestre 2001, faremo PIL secondo trimestre 2001-PIL primo trimestre 2000 diviso pil primo semestre 2000 per 100. Ottengo la variazione percentuale PIL trimestre su trimestre. Il nostro obiettivo è cercare di costruire una media mobile che sia morbida e che cerchi di riprodurre la tendenza di fondo di questa serie. In questo modo cerchiamo di ricostruire il trend generale della serie storica. Per fare questo si usa una media mobile a tre periodi e si indica q = 1, perché è t più o meno q, quindi t è a tre periodi. La media mobile è data dalla somma di xt t+q per q che varia da meno k a k. Ho cambiato un po‟ la notazione ma è la stessa cosa. È un modo difficile per scrivere quanto detto. Noi abbiamo t , t meno 1, t più uno, t meno due, t più due. Possiamo scrivere allora t più q e t meno q. avremo i corrispondenti valori xt meno q, xt meno due, xt meno due, xt, xt più 1, xt più due, xt più q. La media mobile è la media di questi valori. Quindi, in formule, vedi il foglio a quadretti a fianco. È più difficile a spiegarsi che a farsi. Sono medie ad ampiezza fissa che vanno avanti indietro, avanti indietro. Quello che vediamo li non sono altro che medie mobili calcolate per tre periodi, quindi di ordine uno, che sono state centrate all‟interno dell‟intervallo. Notate che le medie mobili possono essere rappresentati in due modi: posso disegnare la linea nell‟ultimo istante temporale di cui si fa riferimento come dato nel semestre 2-3-4, posso decidere se mettere il segno nel trimestre tre o nel trimestre quattro. Anche se sarebbe più corretto mettere il trimestre 4, perché è l‟ultimo anno a disposizione, è preferibile come effetto grafico di interpretazione del trend metterlo al centro, in modo tale che la serie risulti ben centrata sulla serie storica originale. Se posizionassi la serie storica nel periodo 4? Sarebbe tutto traslato a destra di una casella, di una unità. Cambia poco ma il risultato è più vicino alla serie storica originale. Notate ancora che la serie può essere calcolata solamente se i dati sono disponibili. Perdiamo due osservazioni: una qua, ci manca il dato della variazione percentuale del primo semestre, posso solo partire da qua, ho l‟andamento e lo stesso problema si presenta alla fine, ci manca il dato della variazione percentuale del quarto trimestre. Le medie mobili hanno una finestra di possibili valori più ristretta rispetto alla serie storica originale. I residui tra la serie storica e il modello a medie mobili non mostra un trend apparente, ma sembra che la variabilità della distribuzione aumenti a partire dal 2005. Sino al 2005 la serie storica originaria, della variazione percentuale del PIL trimestrale è abbastanza tranquilla. Dopo il 2005 balzi in basso o in alto, dovuta a quella che si chiama volatilità della serie storica. 122 Potrebbe essere ragionevole pensare di utilizzare una media mobile di un ordine superiore, per esempio una media mobile a cinque termini, cioè di ordine tre. Utilizzando una media mobile di cinque termini si ha una finestra temporale più ampia, e quindi la oscillazione locale va ad influire di meno sull‟andamento della serie storica. Aumentare il numero di elementi che vengono utilizzati per calcolare la media mobile, stabilizza l‟andamento, il profilo della media mobile. Se per assurdo utilizzassimo una media mobile di ampiezza massima, calcolassimo la media su tutti i valori, otterremmo la media di tutte le variazioni percentuali, avremmo un solo valore per tutti.. Quanto più la finestra della media mobile è ampia, tanto più la media mobile risulterà essere vischiosa nei movimenti. Una nuova unità pesa per un settimo, ho una media mobile di ordine tre, quindi ho sette elementi. Un nuovo elemento che entra pesa per 1/7. Per sei settimi la serie storica della media mobile sarà uguale ai valori che c‟erano nell‟unità temporale precedente. La media mobile di ordine superire risulta essere più lenta nel suo processo di adeguamento al trend, risulta anche meno sensibile alle fluttuazioni locali che possiamoo avere nella serie storica. Qui ho la media mobile di ordine uno, e quindi di tre elementi. La media mobile di ordine zero non ha senso calcolarla, è la serie storica stessa, sarebbe xt. La media mobile di ordine due è a cinque elementi, la media mobile di ordine tre è a sette elementi, di ordine quattro è a nove elementi. Vedete come quanto più si aumenta il grado della media mobile, tanto più questo trend risulta essere meno sensibile alle oscillazioni locali dei dati. Se andiamo a vedere i residui che possiamo ottenere, troviamo che: le medie mobili di ordine minore vanno incontro a degli errori, degli scarti, che sono minori rispetto alle medie mobili di ordine superiore. Cosa sono i quattro grafici che vediamo? Gli errori. Qt meno la media mobile di ordine 1-2-3-4. Prendiamo il valore più basso: -1%. Se andiamo nella media mobile di ordine due arrivo al meno 2%, ordine tre lo supero e di ordine quattro è ancora più grande. Non deve stupire. Le medie mobili di ordine basso danno più importanza ai valori locali recenti, vicini, di quanto facciano le medie mobili di ordine superiore. La media mobile di ordine uno utilizza tre osservazioni vicine. Ogni nuova osservazione che entra nella media di ampiezza 3 pesa 1/3, mentre nella media mobile di ordine quattro, con un totale di nove osservazioni che entrano nel calcolo della media mobile di ciascuna casellina, ogni nuova unità pesa per un nono. Pesa poco, molto di meno. L‟effetto memoria della serie storica rimane, viene trascinato e l‟andamento della media mobile di ordine elevato è molto più lento. Se ci sono crescite rapide o decrescite rapide della serie storica, la media mobile di ordine basso tende a coglierlo subito, di ordine alto con più lentezza, ha questa memoria legata al passato.. In questo grafico vedo la serie storica del PIL utilizzando le varie medie mobili: di ordine uno o utilizzando la media mobile di ordine quattro. Sembra cambiare poco, in realtà un po‟ cambia. Mi serve per ragionare sugli ordini delle medie mobili Ci sono alcuni problemi sulle medie mobili: 123 1. Deformano le fluttuazioni di periodo diverso da k, modificando in particolare i punti di svolta (in genere, anticipandoli per le serie crescenti, posticipandoli per quelle decrescenti). Se voi avete dei dati trimestrali, dovete utilizzare come regola le medie mobili di numero di termini 4. Se avete dati annuali medie mobili di numero di termini 12, se i dati sono semestrali si usano medie mobili di numero di termini due. 2. L‟effetto Slutzky Yule, 3. Fanno perdere le osservazioni all‟inizio e alla fine della serie 4. Se non è dispari è facilmente centrata, altrimenti sono necessari dei pesi particolari, se k è dispari i problemi di problemi di centralità della serie storica possono non essere banali. 124 IL PROGRAMMA X11 Le medie mobili sono ancora utilizzate molto. Anche con Excel, se voi avete un grafico messo come media mobile, in pochi clic potete ottenere le medie mobili. O anche Yahoo Finance, o qualsiasi sito che abbia un minimo di strumento di analisi finanziaria grafica, le medie mobili le trovate. Se prendete Milano Finanza, o altri giornali di tipo econoimco finanziario troverete sempre la scheda di analisi tecnica con due medie mobili: a breve e a lungo. Ci sono una serie di considerazioni che possono essere fatte sul modo in cui si comportano congiuntamente le due medie mobili. Le medie mobili le abbiamo anche viste in relazione alla stagionalità. Servono per individuare un trend, che non sia necessariamente un lineare o parabolico. Il vantaggio delle medie mobili come strumento di identificazione di un trend di una serie storica è legato al fatto che non hanno sottostante la necessità di sviluppare alcun modello parametrico. Non bisogna specificare una retta o parabola di regressione. Il problema che può nascere è selezionare l‟ordine giusto delle medie mobili. Le medie mobili servono e vengono utilizzate, ora un pochino meno, perché sono una parte fondamentale del programma X11, programma di destagionalizzazione, sviluppato dal bureau of census negli anni 1960. Ora il programma è usato meno, ci sono state modifiche e migliorie nella metodologia, ma è un punto importante per capire come trattare la destagionalizzazione. In molti contesti, specie economici, è necessario riuscire a eliminare gli aspetti superflui, estranei alle mere dinamiche economiche. A noi interessa focalizzare l‟attenzione sui processi economici, non tanto che l‟agricoltura ha un ciclo legata alle stagioni. È importante riuscire ad utilizzare questi dati che siano depurati dal fenomeno della destagionalizzazione. Introduzione. Il problema che abbiamo è questo. Ci troviamo di fronte a una serie storica di qualcosa: PIL, produzione industriale. Quello che vogliamo è eliminare la componente stagionale. Ci sarebbero tante cose da dire sulla analisi delle serie storiche. Non so se avete capito ma il corso serve per darvi una infarinatura di tante cose. Il problema di scegliere se destagionalizzare sulla serie grezza o sulle variazioni percentuali, come abbiamo fatto col PIL come visto precedentemente, non è una cosa così banale. In linea di principio cercate di capire, se vi capiterà di fare una analisi di serie storica per la vostra tesi, quale sia la scelta più opportuna. Molto spesso, le fonti statistiche ufficiali producono dati che sono già destagionalizzati. L‟Istat per molte cose produce una serie di dati grezzi e destagionalizzato. Ma almeno sapete cosa si intende per destagionalizzazione. La serie grezza dell‟indice di produzione industriale presenta una brusca caduta nel mese di agosto per le ferie estive. Ciò rende difficile un confronto corretto tra mesi contigui (nello specifico tra agosto e luglio), bisogna valutare nel tempo la serie storica grezza ricorrendo a variazioni percentuali tendenziali, calcolate rispetto allo stesso periodo dell‟anno precedente. In questo caso vado a lavorare sulle variazioni 125 della produzione industriale come tendenziali, non congiunturali, calcolate rispetto allo stesso periodo dell‟anno precedente. La corrispondente serie destagionalizzata mostra una dinamica molto più omogenea, era quella tratteggiata, pur presentando reazioni significative dovute sia a fattori di natura ciclica sia alla presenza di una componente regolare. La destagionalizzazione permette di interpretare correttamente anche le variazioni percentuali congiunturali calcolate rispetto al periodo immediatamente precedente. Voglio capire come riuscire a costruire una serie storica di quel tipo. Avete anche capito che la morbidezza della linea tratteggiata dipende da quante unità temporali vado ad inserire nel calcolo della media mobile. Quello che vogliamo fare è cercare di sviluppare una procedura che ci consenta di procedere ad una destagionalizzazione della serie storica come questa. La procedura, o programma x 11, è una serie di passi ben definiti che non comportano alcuna scelta soggettiva da parte della persona che fa la destagionalizzazione. Il programma X11 è un metodo sulla destagionalizzazione basato su filtro. La media mobile è un filtro, perché è una elaborazione dei dati che vengono filtrati secondo una perazione, della serie mensile dei numeri indici della produzione industriale. Sviluppato dal Bureau of Census degli Stati Uniti è anche stato notevolmente utilizzato in varie parti del mondo, anche dall‟Istat, anche se in tempi più recenti si sia indirizzato su metodi di stagionalizzazione bastato sui modelli (X11 Arima, X12), la metodologia X11 rimane piuttosto nota. Il metodo x11 ha questi passi ben precisi e molto semplici: - Si prende una stima iniziale mediante medie mobili del trend e si fa una stima di componente di stagionalità lorda, vedremo cosa si intenda per lordo e netto. - Stima della componente stagionale netta. Parto da una prima stima di componente di stagionalità lorda, qualcosa che voglio eliminare. - Stima iniziale della serie destagionalizzata - Stima finale del trend- ciclo utilizzando medie mobili particolari di Henderson - Stima finale dei rapporti lordi di stagionalità Tutto questo ora non è chiaro. Questa è la produzione media giornaliera delle industrie della estrazione di petrolio e gas naturali. Anno 1980 è l‟anno base come valore pari a 100. Come leggo le tabelle? Quando trovo anno base = 100, vuol dire che quello che mi trovo di fronte non sono valori assoluti, ma sono in realtà indici. Nel gennaio del 1983, la produzione media giornaliera delle industrie era 128,4. Significa che era il 28,4% superiore rispetto al valore medio del 1980. Se prendo dicembre 1985 era il 44,4% superiore al valore del 1980. Fatto 100 la produzione media giornaliera del 1980, la produzione di gennaio 1983 era 128,4, significa che la produzione era il 28,4% superiore rispetto alla produzione media del 1980. Questa è la serie storica, quelli sono i valori e questo è il grafico. Come vediamo c‟è una prima fase calante, poi fase crescente che sembrerebbe essere abbastanza 126 lineare. Ci sono in realtà delle oscillazioni che sembrerebbero legate a componenti stagionali. Riguardiamo assieme i dati. Ho che il mese di gennaio e di dicembre sono, insieme a novembre, i mesi con la produzione più alta, o rispetto alla parte centrale dell‟anno, questo è vero. Giugno luglio agosto settembre hanno valori che sono, tranne l‟86, in linea di massima più bassi rispetto ai valori dei mesi invernali, probabilmente perché la produzione risente anche delle temperature e di utilizzo di gas e petrolio per i riscaldamenti. Quello che vogliamo fare è costruire una serie che non abbia stagionalità, una serie storica che sia depurata da un effetto ciclico stagionale. Fase 1. Nella fase 1, la serie storica viene inizialmente destagionalizzata usando una serie storica a 12 termini. I dati che abbiamo a disposizione sono mensili, 12 sono i mesi dell‟anno, immagino che la stagionalità sia di periodo 12, e la media mobile che utilizziamo sarà di 12 termini. Notate che non è un ordine preciso, sarebbe 5,5. Non avendo il valore centrale, essendo pari, la media mobili è difficile da definire come ordine. Questa procedura comporta la perdita di sei valori all‟inizio e alla fine della serie a causa della finestra temporale su cui le medie mobili sono calcolate. Che cosa succede? Prendiamo questi dati e calcolo le medie mobili di ordine 12. Prendo la prima colonna e ne calcolo la media, e la mettiamo per esempio in corrispondenza di luglio. Poi da febbraio 1983 a gennaio 1984, tutti questi valori ad eccezione del primo e questo, e ne calcolo la media in corrispondenza di agosto. Poi da marzo a febbraio in corrispondenza di settembre, e così via, da qua sino alla fine 1998. È chiaro che il 1998 si dovrà fermare a giugno, a questo punto avrò in giugno 1998 la media di tutti i 12 mesi del 1998. Non avendo i valori del 1982 e non avendo i valori del 1989, è chiaro che queste due parti non avranno dei corrispondenti di media mobile. Avremo la serie grezza ma non la media mobile corrispondente. Il risultato è questo. Mancano i primi e gli ultimi valori di queste medie mobili a 12 termini, perché non posso avere quelli ante cedenti a gennaio 1983 e posteriori a dicembre 1988. Anche se la serie storica è vecchia, è importante capire il metodo. Dopo che abbiamo effettuato questo lisciamento della serie storica, anche nota come perequazione dei dati grezzi, si calcola il quoziente tra dato grezzo e perequato, eliminando il trend. Questa operazione sembra un po‟ strana, ma funziona. Calcolo il rapporto esistente tra questa tabella, cioè il dato grezzo 13, e questa tabella, 16, luglio 106,8. Faccio il quoziente tra questi valori e ottengo questi quozienti lordi di stagionalità. Vedete come è meccanico, non stiamo dando interpretazioni. Prendo la serie storica, ne facciamo un lisciamento attraverso media mobile di ordine 12, prendo i valori coi quali ho la media mobile, prendo le prime e ultime sei osservazioni e faccio rapporto tra serie storica originale e serie storica delle medie mobili di ordine dodici. Si ottiene in questo modo un quoziente che ci dice qual è il rapporto tra la serie grezza e la media mobile. Se il valore è al di sopra di 100, il valore grezzo è superiore 127 al valore lisciato. Se è al di sotto del 100, il valore grezzo è più piccolo del valore della media mobile destagionalizzata. Se è uguale a 100 il valore reale grezzo e il valore della media mobile sono uguali. Con questa operazione, si va di fatto ad eliminare il trend che è stato individuato attraverso il modello media mobile di ordine 12, e il risultato è questo. Noi avevamo questa serie storica, calcoliamo la media mobile di ordine 12 per tutti i mesi ad eccezione dei primi sei e degli ultimi sei, ottengo la cosa in cima a pagina 19, molto liscia, sono 12, è un periodo lungo. Ogni nuova osservazione dà una informazione che pesa un dodicesimo. È una serie storica, quella lisciata, che ha una memoria molto lunga. È lenta a cambiare, ma mantiene un trend. Stavamo dicendo che ha un trend lineare. Coglie un primo trend-ciclo, ricordo che trend e ciclo sono difficili da separare. Facciamo il rapporto tra serie storica vista prima con questa che inizia luglio 83 e finisce a giugno 83. Prendo la serie storica solamente nei mesi dei quali ho le stime iniziali trend-ciclo e faccio il rapporto. Tutti i mesi in cui questa linea è al di sopra di cento, sono mesi in cui la serie storica originaria, i dati grezzi, sono al di sopra della stima provvisoria iniziale del trend ciclo. Tutti quelli che sono al di sotto? Sono valori che vengono sovra stimati dal trend-ciclo. Se potessimo rappresentare assieme le due serie, avremmo la serie originaria che passa attorno a quella lisciata, come avevamo visto prima. A volte la serie viene approssimata per eccesso, a volte per difetto, attraverso il modello a media mobile. Ma era quello che succedeva con la retta di regressione. Anziché calcolare i residui di regressione come differenza tra i valori teorici e il valore reale, qui calcoliamo i quozienti. Se voglio fare un piccolo confronto tra quanto facevamo prima nelle altre lezioni e a statistica 1, se a statistica 1 parlavamo di errore come differenza tra il valore reale e il valore teorico, l‟abbiamo usato anche nell‟ultima lezione quando guardavamo gli scarti dalla sere storica, ora uso il quoziente dato da Yi diviso Yi*. A questo punto andiamo ad eliminare di fatto quello che è il trend. C‟è una dimostrazione, che possiamo saltare. Facendo il rapporto tra i valori reali e il valore del trend ciclo si elimina il trend. Vedete come sono belli orizzontale. Li avevamo chiamati residui di regressione, ma li abbiamo calcolati in questo secondo modo. Adesso ci poniamo ancora un‟altra questione. Bene, vediamo se il nostro modello riesce a cogliere bene le componenti stagionali o è tanto soggetto alle variazioni molto diverse della serie storica. L‟insieme dei rapporti lordi, qi o RL, viene corretto per ridurre la presenza di rapporti di stagionalità anomali, cercando di far pesare meno i valori che si discostano molto dalla media, e far pesare di più i valori che sono vicini alla media. Io dico questo: se ci sono dei quozienti lordi, molto lontani da questo 100, questi devono essere esclusi dalla costruzione del mio modello di trend, perché non c‟entrano nulla, sono legati a fattori esterni. È un po‟ il discorso che facevamo parlando di serie storica grezza della produzione industriale. Grossi crolli ad agosto, dicevamo va bene, c‟è il crollo, però sappiamo bene qual è la ragione. 128 L‟idea di questo approccio è dire: i quozienti lordi non hanno tutti la stessa importanza. Per me hanno più importanza quelli che sono vicini al 100. Man mano che ci allontaniamo dal 100, hanno una importanza sempre meno rilevante. In questo modo andiamo a dare meno importanza i valori estremi, anomali e legati probabilmente ai fattori stagionali. Cosa si fa? Prendiamo i rapporti lordi, quanti sono? 5 per 12 = 60. Di questi rapporti lordi ne calcoliamo la media, supponiamo 100, non è detto che sia 100, lo supponiamo. Questi 60 rapporti lordi calcolo lo scardo quadratico medio, facciamo 10. Lo scarto medio dei rapporti lordi dalla media è 10, mediamente mi aspetto uno scarto di 10 dalla media come rapporti lordi. Non è media aritmetica ma quadratica. A questo punto ho i miei 60 rapporti lordi. RL 1-2-3-….-60. Ad ognuno di questi assegno un peso a seconda del valore che assume. Allora dico: il mio rapporto lordo risulta essere oltre più o meno 2,5 sigma dalla media, cosa è? Può essere minore di 2,5 per dieci, cioè 25, minore di meno 25 più 100, oppure maggiore di 25 più 100. Posso avere il rapporto lordo che sia maggiore di meno più 2,5 sigma dalla media. Significa minore di 75 oppure maggiore di 125. 75 è 2,5 per dieci, meno 25 più 100, o 125. Oppure può essere compreso tra 75 e 85 (meno 15 più 100) oppure compreso tra 115 e 125. Oppure il mio rapporto lordo può essere compreso tra 85 e 75. Cosa stiamo facendo? Stiamo definendo tre fasce. Qui abbiamo il nostro tempo, qui ho i nostri rapporti lordi, e qui la media del rapporto lordo. Ho la prima fascia: media del rapporto lordo +1,5 sigma e -1,5 sigma. Se questo fosse 100, questo sarebbe 115 e questo 85. Questa è una fascia che noi indichiamo con il numero 3. Poi posso avere un‟altra fascia in cui ho media RL -2,5 sigma e media RL più 2,5 sigma. Questa fascia va da 115 a 125 e da 85 a 75. Questa fascia la chiamiamo 2. Infine, abbiamo tutto il resto che è la nostra fascia 1. Di fatto, noi ci troviamo ad avere tre fasce. La fascia 3 dei valori vicini alla media. La fascia due dei valori non proprio vicini alla media ma non proprio così lontani, e la fascia uno dei valori lontanissimi dalla media. A questo punto, ogni rapporto lordo si trova associato un peso. Se il rapporto lordo è compreso tra la media dei rapporti lordi meno 1,5 sigma e più 1,5 sigma, cioè è in fascia 3, il suo peso è pari a 1. Se è invece in fascia due, compreso tra media RL meno 2,5 sigma e più 1,5 sigma, varia da zero a 1 a seconda quanto sia vicino al valore di media RL meno 1,5 sigma e lo stesso dall‟altra parte. I valori che invece sono al di fuori di questo range, hanno un peso pari a zero. In altri termini, se questa fosse la funzione del peso, andiamo a dare più importanza per la definizione del nostro modello destagionalizzato ai valori centrali e meno importanza dai valori lontani a quelli centrali. Tutto questo ovviamente è fatto col computer, non è una cosa manuale. 129 Viene quindi calcolata la nuova media delle variazioni. Si vanno a ripesare tutti questi rapporti, queste osservazioni. Si ricalcola la media delle variazioni da mese a mese del trend-ciclo e si va a costruire un nuovo modello di trend basato su un coefficiente R. Il coefficiente R è un rapporto che risulta da questa operazione. A seconda del valore di questo coefficiente globale, è un numero solo su tutta la serie storica pulita, si utilizzano medie mobili differenti. A seconda di quanto è eterogenea la serie storica posso usare una media mobile di ordine 9,12 o 23. Questo indice R, il cui calcolo ve lo vedete, è facile, è una misura di eterogeneità della serie storica, di volatilità della serie storica e di importanza della componente stagionale. Se la componente stagionale non è molto rilevante, si utilizza una media mobile di 9 termini per identificare il trend della serie storica. Intermedia? 13 termini. Se il valore di R è al di sopra di 3,5 con forte variabilità della serie storica, è un modello a 23 termini. Il risultato finale è quindi una serie storica che non è depurata stagionalmente utilizzando solamente una media mobile di ordine 12, ma è depurata usando una media mobile il cui numero di elementi è determinato al termine di tutta la procedura, e consente di eliminare dal calcolo della media mobile quei valori di disturbo che ci fanno cadere la media mobile. Trovo il modo di ignorare i valori molto bassi. La serie storica sulla produzione industriale ha salti in basso molto forti. Ora li taglio e non ho problemi relativi alla stagionalità. Il risultato finale è una serie storica che non è brutta come quella liscia, contiene una sua variabilità generale ma risente molto meno delle componenti stagionali. La destagionalizzazione, in particolare il metodo X11, è usato perché si ritiene che la componente stagionale sia di disturbo per la compresione dei fenomeni economici. È molto meccanica, abbiamo visto fasi. Serie grezza, lisciamento, quoziente, ponderazioni, indice R, e a seconda del valore dell‟indice R ci dice quale media mobile utilizzare. È arbitrario considerare la serie storica aggiustata con una descrizione di ciò che il fenomeno sarebbe stato se non avessero agito i fattori dai quali si vuol prescindere la stagionalità. Non è fuori luogo ammettere che il risultato ottenuto possa valere come una descrizione del fenomeno delle componenti che si presume esso rappresenti qualora vengano utilizzate tecniche conformi all‟ipotesi assunta sul comportamento interno alle componenti. Non mettiamo la mano sul fuoco che la procedura funzioni, ma è una descrizione dell‟andamento. Di nuovo le medie mobili nascono per finalità descrittive e di comprensione, non tanto di previsione. I modelli visto sino ad adesso sono modelli di tipo descrittivo, a posteriori, e non previsivo. 130 LEZIONE 13 4/12/2012 Vi presento il dottor Profumo, responsabile delle statistiche economiche del comune di Genova, che farà un intervento sulla rilevazione dei prezzi andando molto nel dettaglio tecnico. Il problema è che in molti corsi, incluso il nostro, è quello di perdere un po‟ di vista l‟aspetto pratico. Le statistiche che abbiamo visto, dell‟Istat e dell‟Eurostat, sembrano dei numeri che non vengano prodotti ma nascano, e siano la verità. C‟è un procedimento di raccolta e di elaborazione di questi dati estremamente complesso. Vediamo oggi gli aspetti tecnici di questo elemento anche se ci saranno aspetti più generici: normativi e metodologici. Questo materiale verrà messo su aula web insieme al famoso esempio di domande teoriche del compitino del 18. È il mio primo intervento davanti ad una platea universitaria. Mi perdonerete se c‟è qualche passaggio vuoto e momenti in cui devo pensare a quello che devo dire: non sono abituato ad avere una platea di ascoltatori. Noi siamo, come ufficio di statistica qui a Genova, una vera e propria direzione che comprende 22-23 persone. Le persone che si occupano di statistica economica sono 8, tra cui io. Io nel passato mi sono occupato anche di statistiche demografiche e sociali, ho la conoscenza dei vari settori del nostro ufficio che si occupa di censimenti, statistiche demografiche, rilevazioni presso le famiglie e rilevazioni dei prezzi. Questo per dare un quadro di tutto quello che si fa in un ufficio di statistica comunale. La cosa importante da dire è, che parlando di rilevazione dei prezzi, si sentono in giro tante opinioni. C‟è chi dice che la rilevazione dei prezzi e la diffusione dell‟indice dei prezzi al consumo che avviene ogni mese, non sia del tutto attendibile. C‟è chi dice che la rilevazione dei prezzi è incompleta, come vedremo interessa tutto il territorio italiano, ma in certe zone ancora non è possibile effettuarla. Si sentono dire tante cose, c‟è chi dice che l‟approccio metodologico può essere corretto e non produce un indice dei prezzi attendibile. Il mio compito è quello di parlare dell‟organizzazione dell‟‟ufficio, della organizzazione della rilevazione, della metodologia in sé stessa per costruire un indice. Sarà un po‟ anche vostra cura trarre le conclusioni se, tutta questa metodologia, che sicuramente è migliorabile, sia o meno corretta. A mio avviso si: come vedrete l‟‟approccio metodologico è molto curato, va molto nel dettaglio, tutto quello che si sente in giro dai giornalisti che vanno a fare le rilevazioni presso i negozi dicendo Milano è meno cara di Genova, nello stesso negozio abbiamo trovato dei prodotti che costano meno, queste cose lasciano quello che trovano, al di dietro non c‟è alcuna metodologia di indagine accurata come quella che andremo a vedere oggi. 131 Il problema della costruzione di un indice dei prezzi, risale a molto tempo fa, alla prima guerra mondiale, o comunque nell‟immediato dopoguerra, quando tutti gli stravolgimenti economici che erano stati causati dalla prima guerra mondiale, avevano determinato talmente evidenti squilibri tra i prezzi e i salari, che c‟era bisogno di uno strumento che permettesse di misurare e di adeguare quelli che erano gli stipendi e i salari di allora agli aumenti registrati nei prezzi al dettaglio. Da un centinaio di anni si avverte l‟esigenza di avere un indicatore dei prezzi al consumo. I comuni, a quell‟epoca, che avevano un ufficio di statistica adeguato a compiere queste rilevazioni, provarono in parte ad effettuare queste rilevazioni. Era una rilevazione che non era coordinata: ogni comune usciva con un dato che derivava da una metodologia e da una rilevazione diversa. Non c‟era un ente centrale che imponesse a tutti regole uguali e soprattutto facesse suo questi indici costruiti dai vari comuni per poi sintetizzarli in un indice globale a livello nazionale. Con la creazione dell‟Istat nel 1926, questo inconveniente è stato superato. L‟Istat fece un po‟ da fulcro di tutti questi lavori costruiti dai singoli comuni e, soprattutto, costruì una metodologia unica (un insieme di regole uniche) in maniera che tutti i comuni si basassero su queste identiche regole per arrivare al dato finale della costruzione di un indice dei prezzi. Col tempo la metodologia si è affinata, fino ad arrivare ai giorni nostri. È recente una forte correzione delle metodologie di rilevazione dei prezzi di qualche anno fa, in cui molti prodotti che venivano rilevati trimestralmente, sono oggi rilevati mensilmente. La metodologia è in continua evoluzione. Da un po‟ di anni a questa parte, a sua volta l‟Istat stesso e tutti gli uffici centrali di statistica di tutte le nazioni europee sono coordinate da Eurostat. C‟è un organo a livello europeo sovranazionale che coordina tutti gli uffici centrali di statistica. A loro volta gli uffici centrali di statistica coordinano tutti gli uffici comunali di statistica, UCS. C‟è un organo nazionale, Istat, che coordina tutti gli uffici di statistica comunali. C‟è un organo europeo, Eurostat, che a sua volta coordina tutti gli uffici centrali di statistica a livello nazionale. Questo perché col trattato di Maastricht del 1992, anche Eurostat ha pensato di costruire un indice dei prezzi a livello europeo, che prima non c‟era. Per costruire un indice dei prezzi a livello europeo, tutti gli stati membri dovevano uniformarsi ad un insieme di regole che fosse uguale per tutti. Questo insieme di regole viene dettato da dei regolamenti europei, e viene poi riproposto, trasmesso da Istat ai vari UCS, con delle leggi, con delle regole a livello nazionale. Le prime cose che andremo a vedere, abbastanza velocemente, sono la base normativa dell‟indagine sui prezzi, l‟insieme di regole che disciplinano proprio la rilevazione dei prezzi al consumo. La rilevazione dei prezzi riguarda leggi e regolamenti che costituistcono la base normativa. Definiscono soggetti e funzioni. I soggetti sono l‟Istituto nazionale di statistica, o meglio tutti gli istituti nazionali di statistica dei vari stati membri UE e dei comuni. L‟indice dei prezzi nasce da un lavoro di equipe, di squadra, che ogni comune fa con l‟Istat. Io come responsabile e i miei collaboratori dell‟ufficio di 132 statistica di Genova sentiamo quotidianamente Istat, se non siamo noi che chiamiamo sono loro che chiamano o che ci scrivono, proprio perché la costruzione di un indice che è assai complesso, comporta un continuo confronto tra gli uffici comunali e l‟Istat, per cambiamenti, per correzioni e precisazioni. Quotidianamente noi siamo in rapporto con l‟ufficio delle statistiche economiche centrale dell‟Istat. Vediamo la base normativa. Questo vi stupirà, un po‟ meno rispetto a quello che vi ho detto prima. Guardate quanto è vecchia la legge che conferisce all‟Istat la promozione della costruzione dell‟indice dei prezzi, stiamo parlando di una legge del 1927. Non ci sorprende più, l‟Istat è del 1926. Da un anno dopo la sua nascita, la legislazione si dà da fare per far sorgere quell‟uniformità di regole che permettono una costruzione di indici omogenei, come metodologia, per tutti i comuni. Questo regio decreto del 1927 dice che gli indici vanno calcolati obbligatoriamente in tutti i comuni con più di 100 mila abitanti, in altri scelti preferibilmente tra i capoluogo di provincia, o comuni con più di 50.000 abitanti con uffici di statistica idonei, questo è molto importante. Ancora oggi, non tutti i capoluoghi di provincia, non tutti i comuni che hanno diverse migliaia di abitanti hanno uffici di statistica idonei. Non metterei la mano sul fuoco su alcuni uffici di statistica di alcuni capoluoghi di provincia, il problema è che non ce lo mette nemmeno l‟Istat. Molti capoluoghi sono esclusi dalla costruzione dell‟indice, proprio perché non hanno conoscenze e personale adeguato per formare un indice attendibile. Vedremo la copertura territoriale dell‟indice e i capoluoghi di provincia che ne sono esclusi. Più recentemente la legge 1975 modifica il regio decreto: è obbligatorio costruire indice per i comuni che sono capoluogo di provincia e per quelli con più di 30.000 abitanti con un ufficio di statistica idoneo. Passiamo da 50.000 a 30.000 abitanti. Se non avevano un ufficio di statistica idoneo, si presume che per i comuni con più di 50.000, ancora più difficilmente ce l‟abbiano quelli con più di 30.000. Complessivamente nel tempo le cose sono andate migliorando, tant‟è vero che oggi solo 84-05 sono in grado di costruire un indice dei prezzi. Il regio decreto, sempre la legge fondamentale per la costruzione dell‟indice dei prezzi, dice tutta una serie di altre cose. È necessario conoscere le basi legislative per la nascita dell‟indice. Dice che l‟Istat dirama le istruzioni affinché la raccolta avvenga con criteri di uniformità e metodo, promuove i provvedimenti per l‟organizzazione dei servizi di statistica locale e vigila sull‟esecuzione dei lavori concernenti il calcolo degli indici. La vigilanza, i controlli e le verifiche dell‟Istat sono veramente assidui. Tutti i giorni siamo in contatto con uffici Istat. Nonostante Genova è un buon comune dal punto di vista di costruzione dell‟indice, i controlli dell‟Istat sono ripetuti nel tempo e sono capillari e assidui, vedremo cosa Istat controlla, anche giustamente. Se su 100 controlli 95 non hanno senso, perché le cose sono corrette, c‟è sempre una percentuale inferiore in cui il comune può sbagliare e l‟Istat può correggere. La legge dice inoltre che cì‟è l‟obbligo di costituire apposite commissioni, Commissione di controllo della rilevazione dei prezzi al consumo, vedremo a cosa servono queste 133 commissioni. Servono semplicemente a validare l‟indice costruito dall‟ufficio di statistica del comune. La commissione, vedremo come è composta, che valida questo indice, non può cambiare i criteri metodologici fissati da Istat, ma può fare ulteriori verifiche e ulteriori controlli. Cosa succede in sostanza? Il comune di Genova lavora e costruisce un dato, un indice, indice provvisorio dei prezzi. Istat non lo valida, lo controlla e lo verifica. Dice: va bene, è corretto ma non sono l‟organo deputato a validarlo, che è invece la commissione comunale di controllo. Solo dopo che la commissione di controllo lo ha validato, l‟indice può essere diffuso, ovviamente il dato è provvisorio. Ci si riserva ancora di compiere ulteriori controlli fino a che il dato non diventerà definitivo. Il dato diventerà definitivo dopo una quindicina di giorni. Il comune di Genova lavora, produce un indice provvisorio dei prezzi del comune di Genova, diffuso in genere l‟ultimo giorno del mese. Venerdì‟ 30 il comune di Genova ha diffuso l‟indice provvisorio della città, dopo che il dato è stato validato dalla commissione regionale di controllo. Dopo il dato non è ancora definitivo. Passano 15 giorni di controlli, non più operati dalla commissione comunale di controllo, che ha validato l‟indice, anche con una funzione puramente formale, ma lo ha fatto. I controlli vengono effettuati dall‟UCS, in concomitanza con l‟Istat. Solo dopo che sono passate circa due settimane, approssimativamente la metà del mese successivo, l‟indice diventa definitivo. Attenzione, l‟indice può cambiare. Diventa definitivo ma può essere diverso da quello provvisorio. Questi ulteriori controlli, che sono stati effettuati, possono aver portato a delle variazioni talmente consistenti che hanno fatto cambiare l‟indice. Una città che può aver fatto registrare in sede di indice provvisorio una variazione congiunturale, cioè una variazione mensile rispetto al mese precedente, pari a mezzo punto, 0,5 in più rispetto al mese precedente, in sede di indice provvisorio questo può cambiare e può cambiare e diventare 0,4 o 0,6 in genere il cambiamento è di un decimale, non può essere un cambiamento troppo evidente. Può accadere che in sede di indice definitivo ci sia un piccolo cambiamento. Solo allora il dato diventa definitivo, solo allora quel dato ha effetti legali e amministrativi validi. Quando il dato è provvisorio, indica soltanto una tendenza ma non ha alcun effetto legale valido. Abbiamo cominciato dalla fine: abbiamo costruito l‟indice e c‟è la commissione che lo valida. Da chi è composta? Da un sindaco o un suo delegato (di solito assessore con funzione di presidenza), un membro dell‟ispettorato del lavoro, dirigente ufficio di statistica della camera di commercio, dai membri delle associazioni rappresentative dei datori di lavoro (per Genova Confindustria, Confartigianato e Ascom), dagli esponenti delle associazioni rappresentative dei lavoratori (sempre un numero di tre, per Genova CGIL, CISL e UIL) dal responsabile dell‟ufficio statistico o dal suo delegato e da una segreteria che ha funzioni di aiuto. Perché ho inserito questa slide qua? Questa slide riguardava la parte legislativa e per farvi notare che una volta non c‟erano i canali di diffusione dei dati come ora. Oggi si fa un comunicato stampa, si mette online, si diffonde subito alle televisioni e alla 134 stampa. Una volta lo scopo essenziale di tutta questa riunione era di far conoscere immediatamente agli esponenti più rappresentativi, alle varie categorie del mondo del lavoro, le tendenze dei prezzi, proprio perché non c‟erano i canali di diffusione che ci sono ora. Adesso, questa riunione che ha un compito di validazione dell‟indice, in realtà svolge una funzione meramente formale e burocratica di validazione. Comunque la vera validazione dal punto di vista tecnico la da l‟Istat. Tant‟è vero che ci sono comuni che non riescono nemmeno a costituire la commissione comunale di controllo, o che, nel giorno di uscita dell‟indice, non raggiungono il numero legale. Gli esponenti complessivamente sono dieci, questi due esponenti hanno tre rappresentanti, a volte la comunale di controllo non raggiunge le sei unità per cause varie. Magari sono 4-5. In quel caso la responsabilità di validazione dell‟indice provvisorio è assunta direttamente dal direttore dell‟UCS e in seconda battuta dall‟Istat. Da quando ci sono io, io sono 13 anni che lavoro in UCS e sei anni che mi occupo di rilevazione dei prezzi, per fortuna il numero legale è stato sempre raggiunto. Anche perché c‟è un interesse da parte di queste categorie di associazioni, non solo di avere comunque il dato, quello lo possono vedere online dopo un quarto d‟ora che è stato diffuso, ma soprattutto di capire come si stanno muovendo le tendenze dei prezzi, e quindi avere un minimo di commento a quello che è successo in quel settore. Ancora un cenno sul decreto legislativo 322 1989. Solo per dire che questa è una legge quadro in materia di statistica. È la legge che, oltre a ribadire che la rilevazione dei prezzi è di interesse nazionale, quindi viene promossa da questo stesso decreto legislativo, istituisce il Sistan, il Sistema Statistico Nazionale. È l‟insieme di enti e organismi composti dagli uffici di statistica di regioni comuni camere di commercio USL, amministrazioni dello stato enti privati che fanno statistica a livello nazionale, che collaborano con l‟Istat per la raccolta dei dati statistici. Questo decreto ribadisce che l‟Istat è l‟unico soggetto a cui è demandata la produzione degli indici dei prezzi. Infine una norma che va richiamata è il regolamento comunitario del 1995 cui hanno fatto seguito ulteriori specificazioni, che istituisce l‟indice armonizzato europeo dei prezzi al consumo, quello che avete già sentito chiamare con l‟abbreviazione IPCA (Indice Prezzi Consumo Armonizzato). Indice europeo nato dopo la costituzione dell‟Europa, dopo il trattato di Maastricht. Questo regolamento impone all‟Europa e ai paesi membri di calcolare non solo un indice nazionale ma anche un indice che possa essere utile per la costruzione di un indice europeo. È un indice diverso da quello nazionale: vedremo perché non tiene conto di tutte le rilevazioni. La cosa importante è che è un indice confrontabile a livello di tutti gli stati membri della comunità, perché la metodologia di costruzione è la stessa in tutta Europa. Già da questo capiamo che in realtà ogni UCS, fa una rilevazione mirata non alla costruzione di un solo indice, ma di più indici. Abbiamo parlato di indice nazionale (sono due), ed indice europeo, l‟indice dei prezzi al consumo armonizzato perché è confrontabile in tutti i paesi d‟Europa. 135 Ora vediamo come è organizzata la rilevazione dei prezzi in Italia. Questi sono gli ultimi dati che abbiamo, 2012, i comuni capoluogo che partecipavano alla rilevazione erano 84. Ne abbiamo perso uno rispetto al 2011. Invece di andare avanti siamo andati indietro. Non è perso completamente, è perso per il 2012. Siena ha interrotto perché Istat non ha ritenuto questo comune attendibile dal punto di vista di costruzione di indice e quindi lo ha fatto uscire dalla rilevazione. Mi auguro che l‟uscita sia provvisoria. È già successo anche con altri comuni di dimensioni più grandi di Siena. Purtroppo sta di fatto che sia perso diciamo un comune di discrete dimensioni. Può anche capitare che un comune salti un indice. È una cosa molto incresciosa, a Genova non è capitato. Ma è capitato a comuni di grosse dimensioni, anche magari per problemi non proprio dipendenti da loro. Qualche comune ha avuto dei crash informatici e non sono riusciti ad avere la rilevazione. Altri comuni, sto parlando di comuni capoluogo di regione, non faccio nomi, ma hanno ricevuto una ispezione Istat perché non lo ritenevano attendibile dal punto di vista della rilevazione, qualcuno è finito anche sulla carta stampata. Questo per ribadire l‟estrema attenzione dell‟Istituto nazionale di Statistica. Prendiamo questi 84 comuni che riescono a costruire un indice più che affidabile. In questi comuni vengono interrogati, vengono comunque considerati circa 42 mila punti vendita e ci addentriamo nella organizzazione vera e propria della rilevazioni, anche 8300 abitazioni presso le quali vengono rilevati i canoni di affitto. Parliamo di numeri abbastanza grandi: 42 mila esercizi, negozi e quant‟altro in cui vengono rilevati i prezzi, e 8300 abitazioni in cui vengono rilevati i canoni di affitto. Ogni mese si rilevano quasi 600 mila quotazioni di prezzi. Non abbiamo parlato di prezzi, ma di quotazione dei prezzi. Ogni quotazione non rileva solamente il prezzo ma tante altre cose del prodotto, vedremo quali cose si rilevano insieme al prezzo. Di queste 591 mila rilevazioni, la maggior parte, circa il 78% sono rilevate dai comuni, da UCS, ma ce ne è una parte importante, 22-23%, 80.000, che sono rilevate direttamente da Istat. Istat ha una duplice funzione: non solo verifica, controllo dei dati di aggregazione dei vari indici regionali, ma anche funzione di rilevare direttamente determinate quotazioni di prodotti. Vedremo quali sono quelle che rileva direttamente Istat e vedremo perché vengono direttamente rilevate da Istat e perché non le rilevano i comuni. Istat non solo controlla, ma opera esecutivamente con la rilevazione dei prezzi. Questa è una rappresentazione di come la rilevazione dei prezzi sia distribuita sul territorio nazionale. Ad eccezione del Nord Est, in cui tutte le 22 province del nord est operano e costruiscono un indice dei prezzi, ci siano nelle altre macro regioni italiane delle carenze. Il nord ovest ha anche dei buchi, mi pare in Lombardia. Noi siamo abbastanza virtuosi, tutte e quattro le province, sia pure con diverso titolo, sono in grado di costruire l‟indice. Man mano che si scende al sud, appaiono evidenti le lacune. Anche dove c‟è una piena copertura, nella Campania, pensate che solo nel 2007 Napoli e Salerno costruivano l‟indice. Benevento era in fase di costruzione, Caserta e Avellino non ce la facevano. 136 Poi evidentemente si sono adeguate. Questo cosa ci dice? Che il grado di copertura territoriale, rispetto alla popolazione italiana, è di 52 milioni su 60, abbiamo un grado di copertura dell‟86,3%, che comunque è già abbastanza un successo. La legge italiana impone l‟ obbligatorietà degli uffici comunali di statistica solo per comuni con più di 100 mila abitanti. Quelli si devono sicuramente adeguare. Capite bene che non sono tantissimi i comuni che raggiungono i 100 mila abitanti. Ci sono tutta una serie di capoluoghi che non arrivano a questo valore e che spesso non hanno degli uffici di statistica completamente preparati per la costruzione dell‟indice. Hanno magari personale che si occupa non esclusivamente di statistica. Magari opera su lavori di anagrafe, di demografia, ma non fa esclusivamente statistica. Il compito dell‟Istat è cercare di salire a questo dato, arrivare al 100% recuperando quelle realtà, specialmente nel centro e sud Italia che non ce la fanno. A questo proposito il fatto dell‟accorpamento di determinate province può essere utile. accorpando alle province più piccole province più forti, magari si riesce a costruire l‟indice in quelle zone del territorio italiano che ora non sono ancora coperte. Andiamo a vedere i campi di osservazione degli indici. Gli indici dei prezzi al consumo misurano anzitutto una variazione dei prezzi nel tempo. Ovviamente non di tutti i beni e servizi, è impossibile, sarebbe inumano andare a rilevare tutto quello che si vende al dettaglio e al consumo in ogni territorio. Misurano le variazioni di un insieme di prodotti che costituisce il paniere, che comprende i prodotti più rappresentativi, secondo una scelta fatta esclusivamente da Istat ma che comporta il parere di vari uffici comunali di statistica. La cosa che si impara è che non vengono rilevati i prezzi di tutti i prodotti, ma quelli di un paniere. Questa slide ci dice quali sono gli indici che vengono costruiti tramite la rilevazione dei prezzi: - NIC, l‟indice nazionale intera collettività, è il più comunemente usato per gli studi e le ricerche e che vedete da tutte le parti; - FOI, Indice di prezzi al consumo per le famiglie di operai ed impiegati, indice costruito insieme al NIC con alcune brevi differenze, è l‟indice al quale vengono attribuiti gli effetti amministrativi più importanti. Ad esempio l‟adeguamento dei canoni d‟affitto. Non vengono adeguati in base al NIC, ma in base al FOI; - PCA, indice armonizzato dei prezzi al consumo a livello europeo. La legge in più fa anche costruire altri due indici che derivano direttamente da questi. Da questi due indici nazionali nascono questi due indici, che noi per comodità chiamiamo NIS e FOS. La S indica senza. Non è una simbologia ufficiale. È una terminologia degli ucs per semplificare le cose. NIS Nazionale Intera Collettività senza tabacchi e FOS senza tabacchi. Escludono dalla rilevazione solamente i tabacchi. In genere, i due indici coincidono o al massimo c‟è un decimale di differenza. 137 Si calcolano solo perché lo impone la legge: non hanno più valenza amministrativa né formale. Il NIC è l‟indice dell‟intera collettività. Considera il paese come un‟unica grande famiglia di consumatori. Eravamo arrivati a descrivere il NIC. Il NIC è l‟indice più importante, considera tutta la collettività dei consumatori, è l‟indice con maggiori possibilità analitiche di studio e comparazione sul piano territoriale nazionale ed internazionale. È l‟indice che trovate quasi sempre, se trovate dati diffusi sull‟indice dei prezzi, quasi sempre trovate il NIC. Quasi mai si parla di FOI indice dei prezzi al consumo delle famiglie di operai ed impiegati. Si parla solo di questo indice quando ci sono degli effetti amministrativi. È l‟indice col quale si adeguano i valori monetari di anni e periodi diversi (per esempio è utilizzato per adeguare ai canoni di affitto gli assegni dovuti al coniuge separato). Abbiamo come UCS molte telefonate i giorni seguenti l‟uscita dell‟indice definitivo, quello che è a metà mese. I cittadini, quando ci sono soldi di mezzo sanno quando è diffuso l‟indice definitivo, chiamano l‟ufficio di statistica e ci chiedono l‟indice dell‟ultimo mese per adeguare il canone di affitto. IPCA nasce con Maastricht elaborato dal 1997. Permette ad Eurostat di diffondere un indice armonizzato dei paesi UE. Permette soprattutto di elaborare e diffondere l‟indice sintetico europeo che ovviamente deriva da una elaborazione degli indici nazionali. Cosa hanno in comune e di differenza questi indici? Se non ci fosse la rilevazione dei prezzi nessuno dei tre si potrebbe costruire. La metodologia di calcolo è uguale per tutti e tre gli indici, come anche la base territoriale, si lavora in quei comuni che riescono a costruire un indice. Lo schema di classificazione del paniere che tra un po‟ esamineremo è comune a tutti e tre gli indici. Se sono tre indici diversi è perché qualcosa cambia da uno all‟altro. NIC e FOI si basano sullo stesso paniere e sui consumi finali delle famiglie. Però a ogni bene e servizio è attribuito un peso differente. Per esempio, la pasta può avere un peso percentuale dell‟1% in NIC, nel FOI avrà un altro peso percentuale, sicuramente un po‟ di più, comunque il FOI è riferito ad un insieme di famiglie che tiene conto solo degli operai impiegati e non tiene conto della grande ricchezza, dei grandi patrimoni. Il paniere è lo stesso ma il peso dei prodotti, vedremo che importanza hanno sul paniere, sono diversi. Differenze tra gli indici: entra in scena IPCA. Ha la stessa popolazione del NIC e FOI ma si differenzia dagli altri perché si riferisce alla spesa monetaria per i consumi finali sostenuta esclusivamente dalle famiglie. Vuol dire che l‟IPCA tiene in considerazione solo le somme spese effettivamente dalle famiglie nell‟acquisto dei prodotti. Ci sono dei prodotti, come per i medicinali, in cui la famiglia non paga il prezzo pieno, ma il ticket, una parte dell‟effettivo prezzo del medicinale, il resto lo paga lo stato, la pubblica amministrazione. La differenza per l‟IPCA è questo: 138 considera quanto pagato dalle famiglie. La differenza è minima, ma su alcuni prodotti, o alcune categorie di medicinali. Per esempio sui farmaci di fascia A, i salva vita. Il consumatore paga il ticket e la spesa sostenuta dallo stato è maggiore. Il prezzo pieno comprende il ticket più una parte di somma che dev‟essere inglobata al ticket. Esclude alcuni prodotti: lotterie, lotto e i concorsi pronostici. Non ci rientrano per il semplice motivo che gli altri paesi europei abbiano un sistema di gioco simile al nostro. Non si può fare una comparazione diretta. Lotterie, lotto, concorsi pronostici, alcune rilevazioni sui servizi di istruzione, anche sulle assicurazioni della vita, vengono proprio tolte dall‟IPCA, è impossibile armonizzarle a livello europeo. Sicuramente Eurostat si darà da fare per ampliare la popolazione di riferimento. Ancora qualche differenza. Della prima parte vi ho già detto. Questo è importante. L‟IPCA considera le riduzioni temporanee di prezzo: promozioni, saldi e sconti. NIC e FOI non ne tengono conto. Noi come UCS nella rilevazione siamo costretti a rilevare anche i saldi, gli sconti e le promozioni, questo serve a calcolare l‟IPCA. Nel calcolo del NIC e FOI il programma non tiene conto di saldi sconti e promozioni. Tenete presente che a proposito di saldi sconti e promozioni, le istruzioni impartite da Istat sono molto severe. Lo sconto che si va a rilevare in un negozio, deve permanere per almeno 15 giorni nel negozio stesso. Il rilevatore è obbligato ad accertarsi se la promozione avrà una dorata di almeno 15 giorni, altrimenti non ne deve tenere conto. Non solo, deve essere accessibile a tutti i consumatori. Se vado alla Coop e non sono socio Coop non ho diritto a determinati sconti, proprio perché non sono socio, mentre chi è socio ne ha diritto. Questa è una disomogeneità che non può essere ritenuta valida, non vale per tutti i consumatori. Se non tutti i consumatori hanno diritto allo sconto, esso non si calcola. Si calcola il prezzo pieno di vendita. Questo non ha nessun effetto per il calcolo di NIC e FOI, ce lo ha per l‟IPCA. Per gli sconti bisogna che abbiano durata di almeno 15 giorni e che tutti ne possano usufruire, altrimenti il rilevatore non ne deve tenere conto. Incominciamo ad addentriamoci nell‟organizzazione. Immaginiamo che da domani siete incaricati a costruire l‟indice dei prezzi. La prima domanda che vi dovete porre è: i prezzi che devo rilevare, di quali prodotti sono? Chi è che definisce la struttura del paniere? Noi UCS o Istat? La struttura del paniere, tutti i prodotti che devono essere rilevati lo definisce Istat, con dei pareri e suggerimenti che ogni UCS è tenuto a mandare. In questo periodo si sta ridefinendo il paniere del 2013. Non vi posso dire le novità per una questione di segretezza d‟ufficio di cui Istat è molto geloso, però le novità che verranno introdotte nascono da concertazione tra ogni ufficio comunale di statistica e Istat stesso. Genova fa le sue proposte ma non vengono accettate: magari se ne accetta una dell‟anno scorso che quest‟anno non abbiamo riproposto. Quantomeno prima o poi ne hanno tenuto in considerazione. 139 Queste operazioni a cosa mirano? Ad aggiornare il paniere. Il paniere è in continua evoluzione. Da anni non si rilevano le video cassette, prodotto che quasi nessuno acquista. Ogni anno c‟è necessità di ridefinire la struttura del paniere. Non è detto che ci siano solo prodotti nuovi nel paniere 2013. Ci saranno anche dei prodotti che escono. Alcuni escono, non sono più acquistati in maniera significativa dai consumatori, e ci saranno altri che cambiano descrizione. Vedremo bene cosa significa la descrizione del prodotto: devono essere rilevati in un‟altra maniera. Per ora accontentiamoci di dire che ogni anno viene definita la struttura paniere, lo fa l‟Istat con la nostra collaborazione e vengono ridefiniti i pesi dei prodotti. Se il pane pesa 1,4% rispetto al complesso dei prodotti che ci sono nel paniere, non è detto che l‟anno dopo abbia lo stesso peso. Può essere aumentato o diminuito, a seconda dei consumi delle famiglie. Come si ridefiniscono i pesi del paniere? Operazione fatta da Istat. Ci sono dei dati sui consumi delle famiglie, già in possesso da Istat, dei dati che arrivano nuovi dall‟indagine dei consumi delle famiglie di cui forse avrete sentito parlare, che permettono a Istat stesso di capire quali sono i consumi che stanno aumentando o diminuendo di importanza. Sulla base di questi dati, con calcoli matematici molto complessi che si fanno a livello centrale, viene poi ridefinita la struttura del paniere Istat. È una struttura molto complessa quella dei pesi: i prodotti inseriti nel paniere complessivamente per un milione. I singoli prodotti pesano per una parte di questo milione. Se il pane avesse peso dell‟1,4% peserebbe 14.000 in realtà pesa 13900 e passa. La definizione del peso del paniere è molto articolata, si arriva ad un dettaglio molto articolato, a livello di milionesimo di peso. Scelta e descrizione dei prodotti. La scelta definitiva di quali prodotti inserire o togliere o la descrizione di alcuni prodotti dentro il paniere la fa l‟Istat. La descrizione dei prodotti è fondamentale. Dobbiamo dire ai rilevatori, o meglio lo deve dire l‟Istat, esattamente cosa devi rilevare. Non puoi dire vai a rilevare il quotidiano. Il rilevatore si sente in difficoltà: che quotidiano rilevo? Un quotidiano di diffusione nazionale o locale? Quando lo rilevo? Tutte le domeniche, tutti i lunedì, tutti i giorni della settimana, tutto il mese? Quando ci sono degli inserti, devo rilevare il prezzo degli inserti o no? La descrizione del prodotto è essenziale. A proposito del quotidiano Istat dice: bisogna rilevare il quotidiano più diffuso a livello locale nella settimana di riferimento che va dal 9 al 15 di ogni mese compreso il prezzo degli inserti obbligatori, non quelli facoltativi. Ecco che con questa descrizione il rilevatore sa cosa deve fare. Sa che si deve muovere nella seconda settimana del mese, dal 9 al 15, sa che deve rilevare il quotidiano di maggiore diffusione locale, non tutti i quotidiani, sa che deve tenere in considerazione il prezzo anche degli inserti obbligatori, e sa che poi deve fare una media aritmetica dei prezzi rilevati durante quella settimana. 140 La descrizione precisa di Istat sarà: media aritmetica del quotidiano più diffuso a livello locale nella settimana di riferimento dal 9 al 15 del mese compresi gli inserti obbligatori. La descrizione è fondamentale. Se dovessi rilevare il prezzo del cinema che cosa rilevo? Cinema multisala rilevo tutte le sale o una sola? Rilevo i cinema in tre dimensioni o solo quelli normali? Devo fare la media aritmetica se rilevo tutte le sale o no? Istat mi deve dare esattamente la descrizione del prodotto. Le cose cominciano a farsi un minimo più complesse. Ogni prodotto, sono quasi 1400, ha una sua determinata descrizione. Le scelte delle città dove condurre l‟indagine è opera dell‟Istat. Abbiamo visto secondo quali criteri l‟Istat inserisce le città nelle rilevazioni: quelle di cui si fida, dove c‟è un ufficio di statistica idoneo alla costruzione corretta dell‟indice. L‟Istat decide in corso d‟anno se togliere qualche città. Scelta della vendita in cui effettuare la rilevazione. Ho il paniere con tutti i pesi determinati da Istat. Ho la descrizione dei prodotti che devo rilevare e so che siamo una delle città che deve condurre la rilevazione dei prezzi. Istat dice il mio compito è finito, ti ho dato gli strumenti: adesso sei tu che devi operare secondo sue indicazioni che poi vedremo. Noi dobbiamo cominciare a pensare dove andare a rilevare i prodotti contenuti nel paniere, in quali punti vendita effettuare la rilevazione (compito UCS). Analogamente dobbiamo scegliere la referenza. Non parliamo più di prodotto. Stiamo parlando di referenza, tra poco vedremo che cosa è. Per ora diciamo che è il prodotto. Se dobbiamo rilevare la pasta, devo rilevare la pasta in confezione di un chilogrammo e devo andarla a rilevare in un determinato punto vendita. Il rilevatore deve scegliere che pasta rilevare: Agnesi, Voiello, De Cecco, Barilla? Nella descrizione Istat la marca non c‟è. È il rilevatore che deve scegliere quale, secondo lui, è il prodotto più idoneo a rilevare, secondo delle disposizioni di cui parleremo tra poco. Altra cosa da determinare (fatto da rilevatori insieme a UCS) è il rispetto della periodicità della rilevazione del prodotto. Ci sono prodotti che vanno rilevati mensilmente ed altri che vanno rilevati più di una volta al mese. Quando scegliamo la referenza, un prodotto da rilevare, il rilevatore deve sapere quante volte andare a rilevare il prodotto presso il punto vendita. Le cose non si stanno ancora complicando del tutto ma dobbiamo farci una serie di domande. Non solo dobbiamo rilevare la pasta andiamo a rilevare la pasta. Chiediamoci: ma dove, che tipo di pasta rileviamo, e quante volte dobbiamo rilevarla? Di queste cose vi hanno già parlato. È impossibile misurare le variazioni di prezzi di tutti i singoli prodotti e devo quindi selezionare un campione di beni e servizi dei quali misurare la dinamica dei prezzi. Diciamo, non tutti i beni e servizi hanno la stessa importanza. Se noi andiamo a rilevare i prodotti alimentari, nella divisione dei prodotti alimentari, trovo pepe e carne: hanno la stessa importanza? Decisamente no, Istat attribuisce un peso molto diverso alla carne, al pane, pasta, rispetto a sale e pepe. Le posizioni rappresentative (per ora assimiliamoli ai prodotti, anche se sono qualcosa di più) sono selezionate tra le tipologie maggiormente consumate. Altro problema che 141 si deve porre il rilevatore. Le disposizioni Istat dicono si che devi rilevare la pasta, ma devi rilevare la pasta che è maggiormente smerciata nel punto vendita. Altro problema che si aggiunge: abbaiamo visto scegliere il punto di vendita, trovare il prodotto, quante volte rilevare il prodotto? Una, due volte al mese, una volta all‟anno? In che periodo rilevarlo (quotidiano dal 9 al 15 di ogni mese), ma poi soprattutto rilevare il prodotto maggiormente consumato. Il rilevatore Non può andare al super mercato e rilevare il prezzo di un prodotto che non compra nessuno. Non mi può portare una marca di pasta sconosciuta, ma possibilmente (anche se viene ammessa qualche piccola deroga), il prodotto più venduto. È quello maggiormente rappresentativo dei consumi della popolazione. La gente compra quello: l‟indice dei prezzi è più influenzato da quel prodotto e non da quello che non compra nessuno. La costruzione dell‟indice è più corretta sul prodotto maggiormente consumato. Si avvicina di più all‟intera collettività dei consumatori, i gusti e le preferenze dell‟intera collettività dei consumatori. Le referenze, i prodotti devono essere rilevate sul territorio. Della revisione annuale del paniere e dei sistemi di ponderazione ne abbiamo già parlato prima. Abbiamo già cominciato a parlare della metodologia di rilevazione. Il rilevatore sa già che ha dei limiti a cui non può derogare, derivano dalla descrizione del prodotto, punto di vendita, rilevare il prodotto maggiormente venduto, e lo deve rilevare in determinati periodi e giorni del mese. Questa è l‟attuale divisione del paniere. Non vi spaventate, è semplicemente una divisone derivante dalla disaggregazione dei prodotti. All‟ultimo ci stanno i prodotti, quello che il rilevatore deve rilevare. Per esempio: la pasta di semola di grano duro, il cappuccino al bar. Al di sopra ci sono posizioni rappresentative, sono molto meno, derivano da una aggregazione di prodotti, spesso coincidono questi due casi. La posizione rappresentativa è nota come posizione rappresentativa semplice, coincide il prodotto. In molti casi no. Rifacendo l‟esempio di prima. un prodotto può essere il cappuccino al bar, il caffè al bar, caffè decaffeinato al bar. I prodotti vengono conglobati in una posizione rappresentativa che si chiama caffetteria al bar. Si calcola indice specifico anche per posizione rappresentativa. Poi si sale fino ad arrivare alle fondamentali 12 divisioni di prodotto, i grandi gruppi di prodotto: alimentari, bevande alcoliche e tabacchi, abbigliamento e calzature, prodotti sanitari, trasporti, comunicazioni, beni per ricreazione cultura e spettacolo, beni per la casa, prodotti relative alle spese per le spese per la casa e così via. Sono i grossi raggruppamenti di prodotti: per ognuno viene calcolato un indice. Posso avere indice di Genova mese x +0,5. Magari a livello di divisione di prodotto, gli alimentari hanno fatto segnare +0.1. trasporti hanno fatto segnare 1% prezzo carburante è salito talmente tanto che ha trascinato al rialzo la divisione del prodotto dei trasporti. Alimentari hanno fatto da contrappeso. Dalla media ponderata, ognuno ha un peso, di tutte le divisioni è uscito un indice di +0,5. 142 Queste sono le dodici divisioni di prodotto. Prodotti alimentare, bevande alcoliche, abbigliamento, spese per la casa (abitazioni acqua elettricità), servizi sanitari, immobili e così via. Abbiamo anche parlato dei pesi. Qui fanno 100, abbiamo semplificato in termini percentuali. In realtà è fatto a milione, per andare nel dettaglio del peso fino all‟unità di misura. Prodotti alimentari e bevande alcoliche pesano 15,97% sul campione, pesano parecchio, più o meno come i trasporti, e molto più di altre importanti divisioni: spese per casa, servizi ricettivi e di ristorazione. C‟è anche una differenza tra 2011 e 2012 e un‟altra per il 2013. Questo deriva dal processo di rifasamento, di aggiornamento della struttura del paniere, cambiamento per anno in anno, dei pesi di tutti i prodotti che portano a livello di aggregazione di un cambiamento di peso nella divisione del prodotto. Vedete come nel 2012 rispetto al 2011 si è ritenuto che alcune divisioni del prodotto devono scendere per importanza. Particolarmente sono scese le spese per i servizi sanitari e per la salute. Brutta considerazione: se i consumi per questo scendono in un paese che invecchia, la gente spende di meno per la medicina, proprio perché può avere carenze economiche per comprare gli altri prodotti. Ogni anno la ponderazione viene rifatta. Questo è il peso che ogni regione ha nella costruzione dell‟indice. Fatto 100 il NIC, la vedete che la Liguria ha spesa per il 3%. Sommando Piemonte Veneto Lombardia Emilia Romagna e Lazio, queste 5 regioni hanno come importanza quasi la metà del peso totale sul campione. L‟indice di Genova 1,9-2%, non è poco, è molto sotto controllo, comunque pesa del 2% su campione. Se ci sono errori su Genova del 2% di riflesso si ripercuotono anche sull‟indice nazionale. Questo è uno specchietto relativo non ai prodotti, ma qui siamo ancora alle sotto classi. Siamo ad un livello di aggregazione abbastanza elevato. Sottoclassi, segmenti di consumo, posizioni rappresentative e prodotti. A parte il codice del prodotto che non interessa, cominciamo a scendere nel dettaglio delle singole sottoclassi e vedo per ciascuna il peso che è assegnato. Ovviamente la somma di queste sotto classi deve dare un milione. Andando ancora più nel dettaglio, quando dico formaggi e latticini, si scende nel livello di dettaglio passando a segmenti di consumo, formaggi freschi e stagionati, sino ad arrivare ai singoli prodotti. Si da un peso anche ai singoli prodotti: al gorgonzola, piuttosto che alla ricotta, eccetera. Questo è un altro esempio ancora più dettagliato, ma semplificato, ho tolto un po‟ di cose lasciando le cose che a voi interessano. Alla fin fine, quando viene calcolato indice dei prezzi, viene calcolato l‟indice per ciascuna posizione rappresentativa. Vedete che avete un prospetto di alcuni segmenti di consumo, posizioni rappresentative che entrano nel campione; questa è la frequenza di rilevazione. Susine B, bimensile, rilevate due volte al mese, per la loro particolarità. Tutti i prodotti orto frutticoli, suscettibili di variazioni di prezzi, non ci accontentiamo di rilevarli una volta al mese, ma due volte al mese e il programma fa la media delle due rilevazione. IS-FS in stagione o fuori stagione. Qui c‟è il peso attribuito alla singola posizione rappresentativa, o al singolo segmento di prodotto. Vedete il dettaglio: classe frutta, 143 sotto classe, frutta fresca e refrigerata, frutta secca e congelata. Poi arance, pesche, banane, mele eccetera. La somma dei pesi dei segmenti di consumo dà il peso della sottoclasse. Somma sottoclassi da peso delle classi, la somma delle classi da il peso dei gruppi, la somma dei gruppi da il peso delle divisioni. È tutta una cascata. Questi sono prospetti che derivano dalle schermate del computer e non è che noi sappiamo a memoria i pesi o le variazioni. A livello di classe come è cambiata la frutta? Conta 1,26% rispetto al peso del campione (peso totale fatto a 1.000.000), 12600 su un milione, alla fine cosa dico? La frutta rispetto al mese precedente, questa è la variazione congiunturale o mensile, è aumentata dell‟ 1,8%. Rispetto all‟anno precedente, variazione tendenziale, la frutta aumenta del 9,9%. Ogni mese ho valori nuova di frutta e di tutte le suddivisioni della frutta. Questo prospetto non riporta i prodotti. Le mele sono genericamente mele. Ma quali mele rileviamo? Siamo ancora a livello di posizione rappresentativa composita: questa rappresentazione porta insieme tutte le qualità di mele. Questa non è ancora la suddivisione più disaggregata possibile. Siccome noi non possiamo diffondere indici che siano a livello più dettagliato di posizione rappresentativa, parliamo di mele come posizione rappresentativa. Il codice non ve ne frega niente. Queste sono le disaggregazioni dell‟indice delle classi sottoclassi. La divisione di prodotto sarà prodotti alimentari, poi il gruppo, mi pare che sia alimenti, poi la classe frutta, sottoclasse segmento di consumo. La frequenza di rilevazione, i prodotti orto frutticoli almeno due volte al mese. Stagionalità del prodotto, peso ed indici. Gli indici servono a calcolare la variazione mensile e tendenziale (congiunturale e rispetto allo stesso mese dell‟anno precedente). Se noi vogliamo far uscire questo 1,8, preso il mese corrente, 107,5 sottraggo 105, 6 divido per 105,6 e moltiplico per 100. Se voglio trovare l‟1,9 confronto questi altri due. A livello di prezzo mela vengono pesate diversamente o sono consumate nella stessa quantità? Non sono tutte consumate nella stessa quantità. Istat non calcola un indice per ciascuna tipologia di mela anche se sotto sotto lo fa, altrimenti non potrebbe calcolare l‟indice dalla posizione rappresentativa, è una media geometrica di tutte le rappresentazioni fatte. Diciamo che poi arriva al calcolo dell‟indice della singola posizione rappresentativa. Se tu mi fai una domanda: richiesta di diffondere l‟indice della mela Delicius non te lo do. Ha un peso deciso dall‟Istat, diverso dalle Renette. La metodologia va talmente in profondità che ogni regione ha un peso diverso rispetto ad un‟altra regione. Il peso 411 delle ciliegie per la Liguria è diverso da quelle della Lombardia e da quello della Calabria. L‟Istat pondera tutto, hanno dei modelli di calcolo molto sofisticati. Immaginate peso diverso per ogni regione con tutti i prodotti che ci sono dentro il paniere e per ognuno calcolare il suo indice, a livello regionale e poi nazionale. I consumi della ciliegia in Liguria possono essere diversi da quelli della Calabria. Per considerare questo l‟Istat ha considerato pesi diversi. Poi sono loro che mettono insieme tutto. Hanno dei programmi di calcolo molto avanzati. 144 Questo era per dirvi che, come avete potuto capire, la metodologia è abbastanza avanzata. Non è semplicemente misurare il prezzo del prodotto come fanno i giornalisti. Rilevo a Milano a Genova e vedo chi è più caro. Non è che se il prosciutto è più caro a Milano, Milano è più cara di Genova. Questi sono prodotti rilevati da Istat. Rileva un po‟ di prodotti che hanno prezzi uguali su tutto il territorio. Soprattutto i beni tecnologici, sono soggetti a variazioni continue, li rilevano loro. Tutta la divisione dei prodotti delle comunicazioni è a carico Istat. I servizi il cui godimento non è ristretto alla popolazione di un singolo comune (esempio stabilimento balneare: ci può andare il cittadino genovese e quello di Savona) interviene Istat e anche in servizi bancari e postali in cui la rilevazione di Istat è più efficiente. Questo porta a far si che la rilevazione Istat pesa 22,8% con le comunicazioni rilevate da loro. Con UCS attribuiamo alimentari e abbigliamento e calzature. Per altri prodotti c‟è un po‟ una commistione, un po‟ loro e un po‟ noi. Qua siamo ancora nella fase di organizzazione della rilevazione. Eravamo rimasti a quali punti di vendita scegliere. Immaginiamo di dover organizzare la rilevazione. Un‟ altra domanda che ci dobbiamo fare? Quanto andiamo a rilevare in percentuale nei negozi tradizionali, grandi magazzini, supermercati? Devo distribuire la rilevazione anche in base ai consumi della popolazione nella distribuzione tradizionale e nella distribuzione moderna. Quante mele rileviamo? Quante quotazioni effettuiamo? Come distribuiamo la rilevazione sul territorio? Tutto il territorio comunale, trascuro la periferia, punti rappresentativi, negozi più grandi, negozi che attirano più gente, come ci organizziamo? Quante quotazioni facciamo misurare ai rilevatori? Abbiamo delle linee guida. Le quotazioni previste, il minimo di quotazioni previste sono 7 per i beni alimentari e 5 per i non alimentari e servizi. Quando rilevo la mela devo farlo per 7, anzi 14 perché la rilevazione della mela è bimensile, arriviamo ad un minimo di 14, già Genova ne fa 30. 5 per beni non alimentari e servizi. Per tutto ciò che non si mangia, è sufficiente numero minimo di rilevazione di 5. Istat definisce numero di appartamenti presso il quale rilevare gli affitti: 150. Ci fornisce le tavole sull‟andamento generale delle vendite del commercio. Dalle tavole posso dedurre quanto incide la grande distribuzione presso super mercati, iper mercati in termini percentuali rispetto alla distribuzione dai negozi tradizionali. Noi ci organizziamo poi, con un minimo di oscillazione (l‟Istat lo concede), nell‟organizzare la rilevazione dicendo quante quotazioni vado a fare nei negozi tradizionali e quante presso super mercati, iper mercati, discount? Abbiamo tavole che ci danno un range e noi non dobbiamo uscire da questo range. Una volta rispettate le linee guida ci organizziamo e aggiorniamo il nostro piano della rilevazione, spostiamo le quotazioni. Stiamo rilevando troppo presso i supermercati: tolgo qualche quotazione da una parte e la mettiamo nella distribuzione tradizionale. L‟UCS di Genova da linee guida. Noi siamo un grande comune, siamo un capoluogo di regione, siamo la sesta città in Italia, non possiamo limitarci a rispettare le quotazioni medie di Istat, facciamo molte più quotazioni. Gli alimentari, che comportano 7 145 quotazioni, d noi spesso per i prodotti alimentari se ne fanno 20, per i bimensili le 14 da noi diventano 30. Andiamo a rilevare un maggior numero di referenze. Non è che trascuriamo le periferie, zone di montagna. Opero nelle estreme periferie. Più difficilmente li è presente il grande negozio, che ha tanto commercio e tanta vendita, dobbiamo esser anche li. Scelgo i punti vendita tra quelli maggiormente frequentati e rispettiamo la proporzione come vi ho detto di vendita nella distribuzione moderna tradizionale. Se nella distribuzione moderna abbiamo un 40% di quote di mercato e 60% nella tradizionale, e ho 10 quotazioni da fare, ne faremo 4 nella moderna e le altre 6 presso la distribuzione tradizionale e rileviamo o cerchiamo di rilevare il prodotto più venduto. Questi sono i numeri delle nostre rilevazioni. Abbiamo 5 rilevatori che operano nelle 5 grandi zone della città: ponente levante, le due valli, la Polcevera comprende Sampierdarena e centro. Abbiamo 97 giri di rilevazione, un giro di rilevazione è un insieme di ditte abbastanza vicine sul territorio raggruppate, per comodità, in maniera che il rilevatore sa che in quella zona del territorio li ha un determinato numero di ditte ben elencate che deve rilevare. Istat effettua i controlli proprio sui centri di rilevazione. 842 punti di vendita. Mensilmente ci rechiamo presso 842 tra negozi, professionisti. In molti ci andiamo due volte, per le rilevazioni bimensili: frutta, ortaggi, pescherie, benzinai (i carburanti hanno un prezzo volatile). Facciamo circa poco più di 110 mila quotazioni annue e rileviamo 150 affitti. Questa è la percentuale di rilevazione per grossi step nel nostro territorio. Nel 42,2% si rileva nei negozi tradizionali rispettando le linee guida che ci vengono imposte, 39,3% supermercati, 5,8% nei mercati rionali. 12,7% è residuale. Nelle farmacie rilevo molti prodotti, studi medici: pediatria, cardiologia, ginecologia. Unità diverse: parrucchieri, esercizi di liberi professionisti, commercialisti, avvocati. Ed esercizi non classificabili che sono veramente residuali, ad esempio assicurazioni. Questa è la distribuzione della rilevazione tra grande e piccola distribuzione. Dove operano i rilevatori? Già parlato. Vi ho parlato di prodotti. Quando andiamo a rilevare, non rileviamo solo il prezzo del prodotto, ma la referenza: è costituita da un insieme di cose. Oltre il prezzo, devo rilevare la quantità del prodotto in termini di peso, altrimenti non ha senso. Pasta ma quanto? La marca, e rileviamo la varietà, per differenziare un prodotto dall‟altro. Esempio di elettrodomestici: lavatrice, marca, in genere si specifica il modello, ma anche: classe energetica. Ogni referenza è estremamente differenziata l‟una dall‟altra. Entrano in gioco nella classificazione della referenza tutti questi anche dove si rileva, anche il negozio in cui si rileva. Si fa presto a dire inflazione, c‟è dietro una attività molto complessa e complicata. Ringrazio il dottor Profumo, spero che l‟intervento vi sia stato utile. è una attività molto misconosciuta, l‟attività del comune è anche molto complessa. 146 Vi aggiornerò col materiale su aula web. 14 LEZIONE 11/12/2012 Parliamo di cotone. In fondo è una commodity che riguarda tutti noi. In quanto noi ci vestiamo, ed indossiamo abiti in cotone: intimo, camicie, e d‟estate i vestiti, ci sono molti impieghi per quel che concerne la materia prima. Questa è un campione prelevato da un pezzo di cotone, è un cotone russo, coltivato nelle ex repubbliche sovietiche. La domanda che ci poniamo è: come passare dal fiocco al filo, dal filo al tessuto? Noi abbiamo varie categorie di fibre. Abbiamo le fibre naturali, di origine animale, per esempio la lana. Oppure di origine vegetale, delle quali fa parte il cotone, ma anche: lino, canapa. Fibre naturali di origine animale, vegetale. Fibra naturale di origine vegetale, che ha fatto scandalo anni fa: l‟amianto. Sono stati prodotti dei tessuti intrecciando fili di amianto. Queste fibre naturali si contrappongono alle microfibre che sono artificiali, sintetiche o miste. Tutte ottenute grazie a reazioni chimiche, oppure utilizzando in alcuni casi il petrolio. È evidente la correlazione tra l‟andamento del costo del petrolio e i costi di produzione di certe fibre artificiali: correlazione positiva. Cenno storico. Cotone coltivato già in Messico nel 5800 avanti Cristo, poi Pakistan, e l‟india ne fu il primo esportatore. In arabo cuttun. L‟origine della parola proviene dall‟arabo. Nel 14esimo secolo la produzione dei capi era più che altro artigianale. Il ciclo di filatura e tessitura avevano una dimensione artigianale. I primi capi di vestiario avevano una componente mista tra cotone e lino. Successivamente, nel 18esimo secolo, sono apparsi i macchinari: velocizzato la produzione e aumentato le quantità consumate. Dire che le piante di cotone sono ibrido complesso, significa pensare ai procedimenti statistici dove si testano varie componenti a livello di seme per ottenere un certo risultato. I famosi piani di esperienza. Questo ibrido viene realizzato anche con analisi di correlazione. Il cotone è seminato e raccolto circa sei sette mesi dopo. Si coltiva tra le latitudini 45 gradi nord e 35 gradi sud. Vedete dal Kasakistan o l‟Argentina e Australia sono le zone estreme. Il primo riconoscimento che si fa sulla pianta del cotone è determinare la lunghezza della fibra. La fibra può essere: corta media lunga o extra lunga. Questo grafico esprime il ciclo tra la piantagione, la maturazione (giunge dal valore modale) e via via fino alla raccolta. Abbiamo due modalità di raccolta. Nel primo caso è un taglio più ergonomico, segue più la forma del seme, la fibra sarà irregolare. Il fiocco matura intorno al seme, nell‟altro caso saranno più omogenee. 147 Lo standard mondiale è 220 chili. I cinesi avevano balla da 80 chili, si sono dovuti adeguare agli standard internazionali. Il cotone è una delle piante totalmente riciclabili, con la raccolta del seme si fabbrica olio vegetale, cosmetici, pane e biscotti. La rimanenza serve a produrre alimentazione per ovini ma, la peluria attaccata al seme, viene usata per produrre la carta per banconote e pergamene. Tutti noi abbiamo avuto in mano un blocco della Fabriano. Fabriano è l‟unica cartiera, fornitrice della Zecca, che compra del cotone per mixarlo alla carta. Chi produce le statistiche sul cotone? USDA. Questa tabella rappresenta una serie storica: la stagione comincia il primo agosto e finisce il trentun luglio, va a cavallo dell‟anno. Abbiamo serie storica su 4 anni più proiezione per la stagione in corso, mese per mese. Vedete che in termini di milioni di tonnellate, abbiamo circa 25 milioni di tonnellate nel mondo. Da questo grafico vedete che Cina India e Stati Uniti hanno una netta predominanza. Riguardo a queste statistiche, paese per paese, abbiamo detto che risulta evidente la predominanza del mercato cinese. Non solo la Cina è primo produttore nel mondo, ma anche primo importatore. Determina il prezzo del cotone determinato nel NY cotton excange. Tutto funziona secondo un sistema di quotazione internazionale. West Africa: Benin, Burkina, Ciad, Costa d‟avorio e successivamente Mali, Senegal, Togo, e Zimbaue. La maggior parte del quantitativo viene trasportato via mare. Il cotone russo, tra le ex repubbliche sovietiche Azerbagian, Kazakistan, Tagikistan, Turkmenistan e maggior produttore Uzbekistan. Veniva portato a Riga col treno. Gli europei andavano a Riga a vederlo. Poteva poi proseguire per camion, ferrovia. Nel Mali, che produce (in migliaia di balle), il cotone per arrivare al porto di Cotoneau viene fatto viaggiare col treno. Abbiamo, per quest‟anno, una previsione di 116 milioni 834 mila balle nel mondo. Fino al 1960-70 aveva netta predominanza, col sintetico il gap si è ridotto. Paesi produttori di lana sono l‟Uruguay. Dopo vediamo che cambia. Nel sintetico abbiamo una serie storica divisa per regioni, per paesi, Stati Uniti, Europa dell‟Ovest, Corea Taiwan, e il Giappone è rimasto sempre costante. Anche l‟Italia produce. Il Gruppo Orlandi, sopra Bergamo da noi. Brevemente, con una serie di dati, l‟equazione del trend è questa. Siccome i dati non sono allineati, introduciamo un modello additivo. Se ho un numero abbiamo pari la somma è zero. Se il numero è dispari ho una situazione diversa. Con i minimi quadrati ordinari posso stimare a e b, dove a è la media delle osservazioni, e b stimato è la somma delle osservazioni sulla sommatoria al quadrato. Servono a stimare i parametri, se ho una serie di punti. Stesso procedimento, consumo mondiale di fibre. Quando vedete coefficiente 486,3 per cento vuol dire che spiega i valori con 86,3%. In questa serie metto in relazione il GDP che producono sul suolo americano, diverso dall‟indice che comporta le aziende sul suolo e all‟estero (GNP). Il GDP è rapportato al consumo globale di fibre pro capita. 148 Abbiamo un trend di questo tipo. Guardando un altro grafico vediamo che se rapportiamo a 1990 il GDP con il consumo di fibre, ho una distribuzione di osservazioni di questo tipo che si potrebbe regressare con una funzione di tipo esponenziale. Interessante è vedere nel caso lineare, se rapportiamo il GDP con i chilogrammi pro capita di fibre consumate, ho una relazione di questo tipo. Ho la spiegazione del GDP verso la quantità di fibre consumate nell‟ordine dell‟80,5%, buon grado di spiegazione. Questa serie che abbiamo visto si può dividere in due serie a seconda della posizoine geografica dei paesi. Per i paesi più freddi abbiamo più dispersione dei dati, per i paesi più caldi abbiamo più concentrazione. Si potrebbe ipotizzare non solo il modello lineare dei minimi quadrati ordinari ma anche altri modelli. Un esempio dell‟uso statistico che si può fare è in ambito di qualità. Se metto in relazione la lunghezza della fibra col numero di fibre corte ho una relazione strettamente proporzionale. Questo grafico illustra il prosieguo della ripartizione del mercato fra fibre sintetiche e fibre naturali. Anche se aggiungo le altre fibre naturali c‟è una predominanza comunque del sintetico. Altra serie storica sulla produzione di fibre naturali paragonata alla produzione di fibre sintetiche, vediamo la netta predominanza. Una parola sul cotone organico. Il cotone, dal punto di vista agricolo, è grande consumatore di pesticidi. Al fine di ottimizzare la produzione c‟è l‟uso dei pesticidi con un impatto ambientale forte. È stato inventato un cotone più ecologico con meno utilizzo di pesticidi. C‟è comunque una crescita, ma è limitato. Per quale ragione? Il costo. Tutto ciò comporta un costo elevato. In questa tabella, dato 2009, se sommo cotone lana e seta, sulle fibre naturali ho predominanza del cotone, abbiamo questa cifra: 26392. Questa cifra la ritrovo qua quale base anno 2009 alla quale aggiungo le fibre artificiali per un totale ed è stato calcolato un rapporto fra totale e popolazione. Abbiamo detto: fiocco raccolto, si formano le balle. Certificato di deposito. Poi va venduto. Viene proposto sul mercato sul mercato locale. Il coltivatore vende sul mercato locale (dentro gli USA). Questa foto di questa balla, è di cotone egiziano è uno dei più elevati standard di qualità. Programma di selezione delle balle. Il filatore ha le sue esigenze. Per produrre esige un mix di qualità, programma apposito in base ai criteri di qualità. Parte internazionale del commercio. Ho qualche situazione simile. I caricatori vendono direttamente ai filatori attraverso un agente di vendita in Italia, oppure ci sono cooperative di commercianti, commercianti spot, oppure chi vende ai filatori italiani o di altri paesi dirretamente. Associazioni, in caso di divergenze contrattuali. Breve cenno sulle condizioni di endita. Il cotone americano è quotato in borsa a NW sulla base di CIF nord Europa. Ci sono anche dei porti in Italia, ma abbiamo perso molti traffici. I famosi magazzini del cotone sono stati fiori all‟occhiello del porto, specie quando è arrivato il cotone americano. Col peggioramento delle tariffe, aumenti su aumenti e problemi di ordine 149 organizzativo, è stato deviato sui porti del nord Europa. È più veloce, economico, per quale ragioni? inoltrato via ferrovia. In termini di risparmio, quando si mandava il cotone a Vicenza, interamente col camion o intermodale (treno , scarica il termine e ultima parte va fatto col camion) risparmio 700 euro. Indici a e b. il b è stato abbandonato, veniva usato per cotoni inferiori. Indice a usato per molti paesi, con Cina e Brasile. Nel continente americano maggior produttore è il Brasile. Controllo di qualità. Deve garantire certa qualità del prodotto. Prendo buona parte del cotone, devo pettinarla e strapparla. Da li si può misurare la lunghezza della fibra. Più la fibra è lunga, più resiste, avremo capi di vestiario migliori. Un po‟ di criteri tecnici. L‟intervallo ideale è tra il 7 e il 4,2 pollici. Il colore ha una importanza perché se il cotone è già nastro è stato raccolto ma immaturo. Abbiamo guardato questo piccolo campione di cotone, in realtà devo considerare due luci, con taratura eccetera. Nelle varie categorie di colorazione ho: se è grigio non si può filare, va buttato via. Resistenza della fibra. Per fare una fibra resistente, bisogna comunque fare un test. Oggi lo fanno le macchine, una volta a mano. Più la fibra è resistente più soddisfa tutto il criterio industriale di produzione. Descrizione tecnica: passaggi per determinare l‟indice di resistenza, ha a che fare con la statistica. Se ho un risultato di 8, per una fibra si spezzerebbe da sola di 86400 libbre. Altra componente è il glucosio. Risultati. Se il risultato di questo test da un colore rosso si può utilizzare al massimo il 5% di quel lotto rappresentato da quella serie di campioni. Arancio va mixato. Il blu è lavorabile direttamente. L‟umidità è una componente importante. Qui avete il procedimento tecnico. Se il cotone è troppo umido non si attorciglia uniformemente. Se è troppo secco non diventa uguale nella sua lunghezza. Classifiche di cotone. Alcune secondo gli standard americani. Ci sono degli standard di classifica egiziani. Cotone turco. Buona parte del cotone viene raccolto a mano. In america è tutto a macchina, in Africa tutto a mano, è un grosso generatore di impiego. Cotone russo, cotone sudan, cotone Israele. Israele coltiva cotone ma può venderlo nei paesi arabi. Arrivava a trieste con avvolgimenti a livello di balla, venivano cambiati i di documenti. Ciclo di filatura. Abbiamo una breve descrizione: battuto, pettinato, stirato. Eventuali lavorazioni successive, filato gasasto, trattato con la soda. I filati si classificano secondo questi criteri. Alla fine del filo non è strettamente attorcigliato ma rimane aperto. In America, Messico, Italia, Cina, e soprattutto il Bangladesh. La tessitura avviene attraverso i telai, è un intreccio. I tessuti possono essere classificati in questo modo: abbigliamento, arredamento, vari tipi di tessuto. Poi abbiamo un breve cenno sui tessuti non tessuti. Non vanno nel ciclo di tessitura classico: tovaglie, strofinacci, presine. 150 Alcuni tessuti subiscono procedimento di fissaggio. Abbiamo percorso pressoché tutto. Abbiamo ragionato in termini di mondo del cotone: contestualizzare un mondo molto specifico, molto particolare. Il problema che c‟è in questi corsi universitari, stiamo cercando di portare persone che lavorano nel mondo reale, si fa presto a dire inflazione, produzione del cotone nel mondo. Dietro ci sono tante cose che non si vedono. Quello che vorrei vi rimanesse è che tutta la produzione, i dati che vedete, non sono numeri teorici hanno dietro il mondo, la misurazione, la statistica. La statistica ha dietro il mondo, serve per misurare le grandezze del mondo. Il mondo del cotone utilizza la statistica. Controllo della qualità, quanto è buono il cotone. Soprattutto importante la parte delle statistiche ufficiali e andamento storico sul cotone. Sulla serie storica del cotone si è visto che c‟è stato un calo del prezzo. Negli anni 2004-5 c‟è stato un calo drastico. Molti commercianti sono falliti. Avevano comprato il cotone a caro prezzo e rivenderlo a basso prezzo, funziona come il sistema delle futures. Molti commercianti sono falliti, perché non si riesce a competere. Ci i concentra più su dei prodotti a maggior valore aggiunto. Tenete conto che un jeans venduto a carissimo prezzo in alta moda in Germania, costa produrlo alle Mauricius 16 euro. Aggiungeteci 1-2 euro di trasporto. Il resto costi di pubblicità e soprattutto margini. 151