STATISTICA ECONOMICA
A.A. 2012/2013
APPUNTI DELLE LEZIONI
PROF. UFFICIALE DEL CORSO: ANTONIO GAMBINI.
PROFESSORI: ENRICO DI BELLA & LUCA PERSICO
1
LEZIONE 1
18/09/2012
INTRODUZIONE AL CORSO
Statistica economica. C‟è qualcuno di statistica del turismo? Ci siamo già visti ieri,
alcune cose quelli di turismo le sentiranno una seconda volta.
Voi di statistica economica crederete di avere infiltrati di statistica del turismo,
invece è il contrario. Statistica economica è parzialmente contenuta in statistica del
turismo. In quest‟aula siete studenti di due corsi: statistica economica e statistica del
turismo, per il turismo, non ricordo la dizione corretta.
Il fatto è questo: statistica economica è un corso che esiste da tanti anni, è l‟ultimo
anno che esiste così com‟è, in futuro si chiamerà statistica economica e sociale. Il
corso che vedrete quest‟anno è un corso in evoluzione, se non siete intenzionati a darlo
venite a parlarci.
Il corso di statistica del turismo esiste una sola volta a Genova. Inizia e finisce
quest‟anno. Il corso di statistica del turismo era da 9 crediti. Gli studenti da 9 crediti
hanno anche l‟incontro di lunedì, con voi solamente il martedì e il giovedì. Il corso di
statistica economica è formalmente contenuto all‟interno di statistica del turismo.
Il corso di statistica economica è un corso da 6 crediti, 48 ore di lezione frontale. È
un corso che va a focalizzare l‟attenzione su quella parte di statistica che si occupa
della misurazione degli aggregati economici o delle grandezze economiche.
Questa è la declaratoria del corso: “Il corso di statistica economica ha l‟obiettivo di
indirizzare gli studenti verso la comprensione, la conoscenza non superficiale dei
comportamenti e dei soggetti economici.
Ricorrendo alla definizione e misurazione degli aggregati economici e tracciando i
metodi analitici sulla base di applicazioni concrete, fornisce le basi per l‟analisi uni
variata e multivariata dei dati economici.
Vengono inoltre approfonditi i concetti di inferenza statistica introdotti durante il
corso propedeutico di Statistica 1 e vengono introdotte le tecniche di base del
campionamento statistico”.
Di che cosa parleremo? Anzitutto immaginate già che il corso si chiami statistica
economico e sociale. Studia aspetti relativi alla misurazione di fenomeni economici e
sociali: la ricchezza di un paese misurata attraverso il PIL, la produzione industriale,
la disoccupazione, gli indici dei prezzi al consumo, alla produzione. Quali sono gli enti
ufficiali produttori di dati e statistiche, dove voi potete trovare i dati relativi alle
grandezze dell‟Italia e di un paese.
La statistica economica e la statistica sociale studiano l‟analisi di fenomeni
macroeconomici. È una statistica che ha l‟obiettivo di aiutare il decisore pubblico, o
comunque anche il cittadino, a capire quale sia la condizione economico e socio
economica del paese.
2
È diversa da statistica 1, anche se ci sono strumenti che noi andremo ad utilizzare che
sono stati introdotti nel corso propedeutico di statistica 1. Il percorso che ci attende
è questo:
- Fonti statistiche ufficiali. Sono quelle fonti di informazioni di dati che
ufficialmente vengono utilizzate per conoscere la dimensione dei fenomeni
economici e sociali. Che differenza c‟è tra dati prodotti dall‟Istat o dati
prodotti dalla
Caritas e università? Sono uguali oppure no? C‟è una
certificazione col quale il dato è stato raccolto e pubblicato o no? Questi gli
aspetti principali che riguardano le fonti statistiche ufficiali. Ci focalizzeremo
poi su Istat ed Eurostat. L’Istat è l‟Istituto nazionale di Statistica, principale
fonte di dati statistici ufficiali, certificati secondo una serie di criteri e di
logiche. L‟Eurostat è un ufficio statistico che di per sé non produce dati (ne
parleremo non così diffusamente come vorrei ma abbastanza), Ufficio
statistico CE ha un ruolo di coordinamento sulla produzione di statistiche di
paesi Europei (paesi dell‟UE) o candidati (anche Turchia). L‟Eurostat non è un
produttore di dati ma è un coordinatore di modalità di raccolta dati. Esempio,
entriamo sulla tipologia di dati. Come possiamo definire un disoccupato? Una
persona che non ha lavoro. Non è vero, ci sono persone che non hanno lavoro
perché non sono interessate al momento ad andare al lavoro. Alcuni di voi
lavoreranno altri no, preferiscono studiare a tempo pieno. Chi studia a tempo
pieno non è un disoccupato, ha scelto di non avere. È disoccupata una persona
che non si trova bene nel suo posto o ha ricevuto molestie? No. È una persona
che sta cambiando lavoro È possibile aprire una finestra temporale tra la fine
del primo contratto lavorativo e l‟inizio del secondo oltre la quale definisco la
persona disoccupata o meno. Se l‟Italia va a definire i disoccupati come le
persone che non hanno attività lavorativa e vorrebbero averla, e questa attività
lavorativa non l‟hanno trovata negli ultimi 6 mesi, un altro paese, la Finlandia,
definisse 9 mesi, non avremmo la possibilità di confrontare i dati. Si aprono
problemi e questioni di comparabilità dei dati, necessario risolverle. L‟ente
preposto è l‟Eurostat. È quell‟ente che stabilisce con quali criteri i dati vadano
raccolti e in che modo vadano definiti i vari fenomeni. Non è un ente
dittatoriale che impone dall‟alto le scelte. C‟è un collegio, che include l‟Istat ed
altri enti, che stabilisce quali siano questi problemi.
- Dopo aver affrontato i primi temi riguardo le fonti statistiche ufficiali, e avere
iniziato a guardare alcuni dei principali aggregati, andremo a vedere che sorge
necessario, per la pubblica amministrazione, per il governo ed enti locali,
utilizzare indici ed indicatori, delle misure di sintesi che permettano di capire
questi grossi aggregati di dati. Io posso darvi il numero dei disoccupati in Italia,
ma spesso si preferisce lavorare col tasso di disoccupazione. Il tasso, può
essere definito come un indicatore, (vedremo la differenza tra indici ed
indicatori) che sintetizza la direzione, si dice indicatore anche perché indica
una direzione, un verso verso il quale si tende nell‟evoluzoine dei fenomeni. In
3
-
-
particolare andremo a guardare: indici di prezzi e produzioni. Ne vedremo
anche altri molto brevemente. A me interessa che per voi sia chiara la logica
nella costruzione di indici. Si potrebbe parlare di indici e indicatori per dieci
corsi da nove crediti! Si tratta di vedere come sono costruiti, cosa c‟è dentro e
interpretazione. Ma sarebbe qualcosa di estremamente meccanico.
Successivamente focalizziamo l‟attenzione sull‟evoluzione storica dei fenomeni
economici. Non faremo storia economica. Guarderemo le principali metodologie
statistiche per analizzare il comportamento dei fenomeni economici nel tempo.
Qualcosa avete già visto in statistica 1, guardando l‟andamento delle vendite nel
tempo. Parleremo di serie storica, fenomeni che vengono misurati nel tempo.
Una serie storica, è una misurazione ripetuta nel tempo ad intervalli regolari
(ogni anno, trimestre, mese, settimana, ora, secondo e millesecondo) di un
certo fenomeno. Possiamo vedere la produzione industriale mensile, trimestrale,
quadrimestrale, semestrale, annuale. La serie storica fa riferimento ad un
medesimo fenomeno definito nello stesso modo, sennò si perde la
confrontabilità, ad istanti regolari. Serie annuale sempre annuale, semestrale
sempre dati semestrali. All‟interno di questo insieme parleremo di trend
(tendenza generale di un fenomeno nel tempo) o cicli e stagionalità. Un ciclo
economico è un andamento della serie storica, che alterna fasi espansive e
restrittive senza avere una particolare regolarità. Periodi di grossa crescita
economica. Ora siamo in fase di recessione, poi costrizione del fenomeno, PIL
che si usa per misurare la ricchezza nel paese che va a ridursi, per poi crescere
nuovamente. Questo è un ciclo. Si differenzia dalla stagionalità, perché è legata
ad una ciclicità precisa. La successione delle stagioni è qualcosa che si compie
ogni anno. C‟è una periodicità, più corretto, che si propone con regolarità:
d‟estate la produzione industriale cala perché le fabbriche chiudono, o a Natale
le vendite aumentano perché ci sono le festività. Di inverno la produzione
agricola diminuisce nell‟emisfero boreale e aumenta nell‟australe. Si parla di
stagionalità e non di ciclicità per questa ragione. Questo perché la stagionalità
è legata a componenti cicliche. La stagionalità sarà necessario eliminarla, è una
componente di disturbo, parleremo di metodi di destagionalizzazione,
eliminazione della componente stagionale periodica. I metodi più utilizzati per
analizzare le serie storiche sono: i metodi delle medie mobili, i processi
stocastici e i modelli lineari, parleremo di retta o parabola di regressione,
trend lineari o trend parabolico, e la procedura di Box e Jekins, dedicheremo
a quella parte un bel po‟ di lezioni.
Successivamente altre metodologie statistiche. In particolare l‟analisi
statistica multivariata. In statistica 1 avete visto la descrittiva mono
dimensionale, bi dimensionale e il piano di regressione. Quello che si studia nella
statistica multivariata è la relazione tra tante variabili allo stesso tempo. Non
si studia tanto la dipendenza di un fenomeno tra gli altri, quanto piuttosto la
correlazione che esiste tra vari fenomeni. La produzione industriale dipende dal
4
-
PIL? I consumi dipendono dalla ricchezza o è la ricchezza che determina i
consumi? Ci sono situazioni in cui le triangolazioni tra variabili dipendenti e
indipendenti sono tutt‟altro che chiare. Negli esercizi che vi davamo a statistica
1, la variabile dipendente si distingueva bene dalla variabile indipendente. Il
peso in dipendenza della statura. Tendenzialmente le persone più alte sono
anche più pesanti. È vero che esiste una correlazione, e qui forse si potrebbe
pensare che il peso è in funzione della statura, ma quando un ragazzo cresce
aumenta anche il suo peso, è la crescita che determina l‟incremento di peso, non
è che una persona ingrassando aumenti anche di statura. È evidente la variabile
dipendente dalla variabile indipendente In questi casi non è sempre ovvio.
Adesso sarebbe opportuno svolgere questa parte in aula informatica. Riuscire a
fare applicazioni di analisi multi variata sulla carta è impossibile. Allo stesso
modo vedere la metodologia senza fare applicazioni pratiche è come leggere il
regolamento del calcio e pensare di essere bravi come Ronaldo. Forse
organizziamo due gruppi, due classi, vedremo.
Questa parte dovrebbe essere svolta, dobbiamo ancora decidere come coordinarci, da
Luca Persico. Il corso ufficialmente è del professor Gambini che in questo momento
non sta bene e ci ha chiesto se riusciamo ad aiutarlo. Già che ci mettiamo mano è
meglio che abbiano interlocutori unici, me e Persico.
In linea di principio io sarò in aula lunedì con turismo, martedì con tutti, giovedì ci sarà
Persico. Il Giovedì e Venerdì io sarò a Bolzano perché ho un corso su, non mi troverete
mai di giovedì e venerdì. Il mio ricevimento è il martedì alle 16.30. Alla fine di questa
lezione, se avete bisogno, venite.
Riprendendo il discorso sui dati e fonti statistiche ufficiali, ad eccezione di questa
settimana e della prossima ci sono io. Quando parleremo di fonti statistiche ufficiali
dell‟Istat ed Eurostat parleremo delle modalità attraverso le quali questi enti
producono dati.
La produzione di dati ufficiali può avvenire in due forme: o attraverso una attività
censuaria (l‟anno scorso c‟è stato il 15 censimento popolazione e abitazioni) o
attraverso indagini campionarie. Anziché intervistare tutti gli italiani intervisto un
sottoinsieme di italiani campionato secondo certi criteri.
Campionamento su uso del tempo, c‟è una indagine dell‟Istat che si chiama uso del
tempo, come gli italiani passano il tempo, e andassi a prendere i 14enni romani
probabilmente si penserebbe che gli italiani starassero solo davanti alla Play Station a
giocare a Fifa o poco altro. È opportuno che un campione sia costruito in maniera tale
da essere una immagine della popolazione. Se in Italia abbiamo 55% di donne, il
campione dovrebbe contenere 55% di donne e, l‟altra parte, un 45% di uomini.
Se la popolazione si ripartisce tra Nord Centro Sud con numerosità differenti, un po‟
le prendo nel nord, centro e sud Italia. Se la popolazione vive un po‟ in città e un po‟
al di fuori dei centri urbani è opportuno che la proporzione all‟interno delle unità
campionate tra persone in città e fuori sia rispettata. Questa è una logica di
5
campionamento stratificato. In questa parte del corso, penso sia discussa da Persico,
vedrete le principali metodologie di campionamento.
Il campionamento richiede una componente inferenziale. Nel momento in cui non ho la
intera popolazione ma un sottoinsieme di essa, siamo soggetti ad una forma di
variabilità, detta variabilità campionaria. Posso prendere una qualsiasi tra le file dei
banchi e vedere se siete bravi studenti. Vi faccio test di statistica 1 e guardo il
risultato che ottengo.
Posso seguire due strade. Do test a tutti voi, faccio censimento, o solo ad una fila tra
queste. Se lo dessi solo alla prima o alla seconda otterrei risultati comunque
differenti, magari simili, ma è difficile che le risposte siano identiche. Il fatto di
rilevare un‟informazione su campioni anziché su popolazione, determina una
componente detta variabilità campionaria. Ogni campione fornirà risultati differenti.
Se facessi il test su di voi più volte dovrei ottenere sempre lo stesso risultato. Stessa
statura mille volte? Otterrei gli stessi risultati. Se prendessi 1000 campioni diversi?
Tutte le unità sui campioni sono diverse, le stature diverse. Entra in gioco la
variabilità campionaria, che è l‟ oggetto di inferenza statistica.
Tutti voi avete visto un minimo di inferenza statistica a statistica 1. Qualche cosa
avreste dovuto vederla. Riprendiamo i pochi punti visti e li portiamo avanti, non di
tantissimo. Il posto più opportuno per sviluppare quegli argomenti è il corso di
statistica 2 che ormai nella triennale non esiste più, è nel corso EIF primo anno per
chi di voi continuerà. Il corso di Statistica 2 verrà tenuto dal professor Lagazio,
nuova acquisizione della nostra facoltà, persona assolutamente in gamba.
Il programma in linea di massima è questo, di carne al fuoco ce n‟è. Libri di testo. Ho
fatto richiesta per la pagina di Aulaweb, colpa mia che l‟ho chiesta tardi, a breve sarà
disponibile. Su aula web troverete molto materiale, devo organizzarlo, sistematizzarlo,
e decidere con che ordine presentarvi gli argomenti. Ho già un buon 60-70% di
materiale che è studiabile sulle slides in Power Point.
Per la parte prima del programma, cioè fonti statistiche ufficiali, Istat ed Eurostat,
farete riferimento in maniera pressoché esclusiva al materiale su aula web, non esiste
libro di testo su queste cose. Sul punto 2, serie storiche economiche, troverete slides
su aula web, più che sufficienti per la preparazione, ma comunque suggerisco un testo,
prevalentemente a coloro che non seguiranno il corso o tutte le lezioni. È questo, Di
Fonzo T. e Lisi F Serie storiche economiche. Analisi statistiche e Applicazioni,
Carocci editore . Sarebbero da studiare 1-2-3-5-6-9.
L‟acquisto non è così fondamentale. Ci sono tanti libri suggeriti, vi suggerisco io quelli
da acquistare. Costa 20 euro, non è una cifra folle, se siete abituati coi libri di diritto,
siamo su livelli più bassi, per quanto riguarda la parte relativa alla statistica
multivariata, ci saranno sicuramente slide sulle quali sta lavorando il professor
Persico, non so se e quante verranno caricate su aula web.
A livello di libro suggeriamo questo, libretto qua, Di Bella E. Persico L. costa sei
euro, è una sostituzione della parte terza del libro di statistica descrittiva che avete
già acquistato per statistica 1. È una sostituzione abbastanza significativa perché, dei
6
6 capitoli è stato aggiunto un capitolo complessivamente, totalmente, che non c‟era
prima, l‟ultimo, e riscritti: l‟analisi fattoriale e dei cluster, recuperiamolo.
La parte di inferenza statistica, potete studiarla tranquillamente su questo libro che
dovete già avere. C‟era un capitolo guardato in maniera superficiale in statistica 1, il
capitolo 8, l‟Inferenza Statistica. Non lo andrete ad esaurire. In statistica 2
studierete anche il capitolo 9. Suggerirei di non venderlo sino al superamento di
statistica 2 e anche oltre, per econometria potrebbe essere utile.
L‟ultimo libro, utilizzato per la parte relativa al campionamento statistico, è “Il
campionamento statistico per la ricerca sociale e di mercato”, non costa tanto, sono 15
euro. È di Gambini: da studiare i capitoli 2-3-4. Non l‟uno perché è sostanzialmente un
riassunto del capitolo 8 del libro verde. Potete usarlo come ripasso, ma meglio il
capitolo 8.
Ricordo, nessun acquisto è obbligatorio. Sembra che, solo perché il fatto che siano
nostri vi suggeriamo di acquistarli, ma solo per via dei contenuti, abbiamo meglio da
fare che scrivere su quella roba li. Visto che è ancora bello io andrei ancora al mare
anziché scrivere quella roba li.
Ultima cosa. Esercizi. Si aprirà un problema di esercizi risolti sul campionamento. Li
potete trovare sulla parte terza del libro degli esercizi disponibili in PDF da
acquistare sul sito della Giappichelli. Abbiamo trovato un accordo. Compro il file in
PDF e costa 4-5 euro, una cifra molto modesta. Gambini ha sempre insistito sul
cercare di ridurre il più possibile il costo dei libri rinunciando ai diritti d‟autore e
tutto il resto. I libri di statistica non vi saranno mai risultati particolarmente costosi,
anche se si tratta sempre di soldi.
Ancora qualcosa. Propedeuticità. La nostra direzione, anche per il futuro, è quella di
eliminare la propedeuticità di statistica 1 con statistica economica. Conseguentemente
se non avete dato statistica 1 non potete registrare statistica economica. Dato che
una buona parte non richiede prerequisiti di statistica 1, potete venire a dare l‟esame.
Vi facciamo un foglietto, siete pochi rispetto ai numeri di statistica 1, e quindi vi
possiamo gestire bene anche con foglietti, annotazioni eccetera. Non fatevi problemi.
Venite però segnalatecelo. Vi segniamo il voto e ve lo registriamo dopo che avete
passato statistica 1. Questo non lo facciamo per statistica 1 rispetto a matematica
generale, sennò ci sarebbero maree di foglietti e la propedeuticità è abbastanza
forte.
Il corso si concluderà nella prima decina di dicembre. Voi sapete che adesso i corsi di
sei crediti fanno 4 ore a settimana anziché farne 6 e finire prima. ho concordato con
Persico di fare un pre appello attorno al 20 dicembre, al giovedì e dovremmo avere
anche un‟aula. Vedremo, visto che siete in così tanti, se c‟è qualche altra aula
disponibile.
Il preappello preclude la possibilità di dare il primo appello. Chi da il preappello non
può fare il primo appello. In linea di massima se voi date il preappello il 20 non
penserete che io col panettone in mano mi metta a correggere i vostri compiti. I
risultati o tra natale e capodanno o dopo, verosimilmente a ridosso del primo appello.
7
Non avreste tempo di decidere s ridarlo o no, vi potete ovviamente ritirare.
Solamente chi consegna non può dare il primo appello.
L‟obiettivo del corso è sterminarvi entro gennaio. Avere qualche coda entro l‟anno, ma
in linea di massima di esaurirla. Rimane qualcuno che lavorava, non è riuscito a
studiare, eccetera. Mi aspetto che lo passiate non dico alla prima. Non pensate che sia
così selettivo come statistica 1.
L‟esame. Come funziona l‟esame? Ci saranno due esercizi e due domande teoriche. I
due esercizi uno sulla mia parte relativa alle serie storiche e uno su
inferenza/campionamento di Persico. Domande teoriche saranno una sulla mia parte,
se andate su AW scorso anno trovate la lista di possibili domande teoriche, di
argomenti, magari qualche piccolo cambiamento ci può anche essere , sulla mia parte e
sulla parte di Persico inclusa anche la analisi multivariata, soggetta solamente a
domande
di
tipo
teorico.
Esercizi
solamente
su
serie
storiche
e
campionamento/inferenza.
Il resto domande con risposta aperta. Non è previsto orale a meno che non mi
chiediate di individuare una parte di programma specificamente per la parte orale,
però diventano belle parti da sapere. L‟orale ha l‟obiettivo di migliorare uno due punti i
voti dello scritto, non di più, l‟esame è già ampio. Potrebbero essere domande orali su
multi variata o campionamento, domande su argomenti abbastanza elitari, di qualità.
Se volete fare giuste proporzioni, è come se parassimo di variabili aleatorie continue
(uniforme rettangolare) e non gli assiomi di Kolmogorov.
Non ci sono domande relative al programma di statistica 1. Nel giro di un anno vorrei
che i risultati venissero registrati. Non esiste il rifiuto nella speranza di migliorare.
Se prendo 18 e rifiuto, rifiuto.
Per oggi basta così, abbiamo parlato delle cose principali. La prossima volta iniziamo
con le fonti statistiche ufficiali. Non c‟è ancora aula web comunque poi le metterò.
8
LEZIONE 2
20/09/2012
LE FONTI STATISTICHE UFFICIALI: INTRODUZIONE
Martedì prox NO lezione.
Cominciamo a parlare di questa statistica un po‟ particolare, è una statistica che si
ricollega maggiormente alla parola statistica. Se pensate la parola statistica contiene
all‟interno la parola stato. C‟è chi ritiene che non sia la parola stato contenuta in
statistica, ma sia la parola stat (tedesco) che vuol dire città. C‟è anche chi pensa che
l‟origine della parola statistica sia legata a stadera, parola latina per bilancia.
In ogni caso la parola statistica fa riferimento alle dimensioni di uno stato, di una
città. La statistica vista in statistica 1 è una statistica di sintesi.
Che legame c‟è tra la statistica di statistica 1 e quella che vediamo ora? Sono molto
collegate. La statistica è la scienza che misura le grandezze. La statistica ufficiale
misura le grandezze degli stati. Misura i principali fenomeni che descrivono la
ricchezza di un paese: ricchezza (PIL, PIL pro capite) superficie, chilometri di
autostrade, di ferrovie, teu movimentati nei porti, la quantità di ovini, di suini, bovini
allevati ogni anno in un paese, quantità di produzione agricola, la percentuale di
superficie paese destinata alla produzione agricola, il numero di posti barca, numero
occupati disoccupati, laureati, giovani, anziani, il numero di ricoveri all‟ospedale. Sono
tutte grandezze che non fanno riferimento al micro, fanno riferimento al macro.
La statistica ufficiale che include la statistica economica e la statistica sociale, e una
parte che fa riferimento alla demografia (studio della popolazione), tutte queste
statistiche studiano gli aggregati macro economici, o comunque i fenomeni collegati al
sistema paese, o anche l‟intero pianeta. Possiamo parlare di transazioni finanziarie
internazionali, povertà e fame nel mondo, sono tutte statistiche che fanno riferimento
ad un paese città nazione continente o pianeta.
Di fronte a moli di dati così rilevanti (pensate a tutti i pensionati INPS), diventa
importante operare delle sintesi. Se abbiamo le dichiarazioni dei redditi degli italiani
e vogliamo andare a sintetizzare dobbiamo vedere reddito medio dichiarato dagli
italiani, redditi sopra di 300000 euro, e la percentuale di persone al di sotto di soglia
di povertà assoluta o relativa.
Recentemente si è discusso, se seguite il dibattito politico nazionale, se sia opportuno
o meno introdurre la patrimoniale, imposta sui patrimoni. Una considerazione è che
solo 10 mila persone in Italia hanno dichiarato reddito superiore a 300 mila euro. Vale
la pena aprire un capitolo sulla patrimoniale in Italia? La Fornero dice che con l‟IMU
loro pensano di aver ottenuto il risultato più vicino alla patrimoniale.
Questo cosa c‟entra con la statistica? C‟entra perché il governo, amministrazioni locali
e cittadini per poter valutare le politiche economiche e azioni della PA devono o avere
dati per decidere. Vale la pena di introdurre la patrimoniale? La % di persone sotto la
soglia di povertà è aumentata o no? Quanto è aumentata la discriminazione economica
9
all‟interno del paese? Sono valutazioni che si fanno a partire da dei dati. Questi dati o
fonti di informazioni sono i dati della statistica ufficiale.
Cominciamo parlando di Fonti Statistiche Ufficiali. Tutti voi avrete dato istituzioni di
diritto privato e pubblico. Quando l‟ho fatto io tra le primissime lezioni si parlava di
fonti del diritto, dove c‟erano tutte le leggi dai regolamenti alla Costituzione. Perché
abbiamo sempre bisogno di sistemi di riferimento dai quali tutto discende. Le fonti
statistiche perché sono chiamate fonti? Sono una origine di informazione, non solo: di
conoscenza per poter prendere delle decisioni.
Se prendo un dizionario qualsiasi, vediamo che le fonti statistiche sono il principio da
cui qualcosa emana o proviene direttamente (Devoto 1971).
Ecco che le fonti che forniscono l‟informazione statistica sono un principio. Abbiamo
bisogno di informazione statistica per prendere coscientemente delle decisioni. Il
comune di Genova apre l‟asilo nido in Via della Maddalena. È scelta corretta? Devo
conoscere i possibili fruitori del servizio. Oppure tra 15 anni si pensa che la
popolazione anziana sia di più, di quanto crescerà la popolazione anziana tra 15 anni a
Genova? Gli ultra 65 anni sono il 25% a Genova, tra 15 anni il 33%, 1/3 della
popolazione a Genova sarà ultra 65 anni. Questo ha diverse implicazioni.
Bisogna prevedere servizi per anziani. Tra 35–40 anni, queste persone moriranno,
avremo vuoti cittadini rispetto a vari aspetti. Varie caratteristiche: tante case
rimarranno vuote. Al contempo abbiamo i flussi migratori. Ora abbiamo 40 mila
stranieri regolari a Genova a fronte di una popolazione di 600 mila abitanti. Tra 15
anni saranno 140 mila. Questi migrati, tendenzialmente giovani, porteranno con sé
aspetti di natalità, aspetti di malattie ed esigenze sanitarie relative alla maternità,
molto meno frequenti nella popolazione di cittadinanza italiana attuale, sono
considerazioni fatte sulla base di numeri e proiezioni demografiche cittadine.
I dati rappresentano l‟informazione statistica delle decisioni pubbliche per queste
ragioni. ci devono aiutare a capire le esigenze opportune da soddisfare, capire come
soddisfarle e dove andarle a soddisfare.
Per esempio nel 1990 la maggior parte degli stranieri a Genova risiedeva in Portoria,
adesso la popolazione straniera si sta diffondendo su tutto il territorio, alcune etnie
si concentrano maggiormente in alcuni quartieri, esempio Sampierdarena. Quali sono le
esigenze degli stranieri e fornire risposte adeguate. Tanti latino americani a
Sampiedarena? Personale che sappia parlare spagnolo. Zone con più comunità slave
qualcuno che conosca la lingua slava, magari uno straniero che abbia acquisito la
cittadinanza italiana.
Avere la conoscenza dei dati permette di prendere decisioni opportune. Permette di
misurare i fenomeni e vedere come si evolvono nel tempo. Se decidiamo di attuare
politiche per la famiglia o natalità a Genova bisogna aspettare a dire poco 9 mesi, ma
ragionare su un periodo più lungo. Monitorare le nascite nel tempo e vedere se le
politiche a favore della natalità, attuate in città, favorendo asili nido e l‟inserimento
scuole materne, se queste operazioni, politiche, hanno dato dei risultati. Come
facciamo a misurare i risultati? Con i, confrontando la situazione prima e dopo la cura,
10
e tenendo conto del legame che questi fenomeni possono avere con altri fenomeni,
come per esempio i cicli economici.
Noi abbiamo bisogno di queste informazioni perché il decisore pubblico ne ha bisogno
e il cittadino deve conoscere il proprio paese. Si sta sviluppando a livello
internazionale un dibattito sugli open data, dati liberi, è considerata nuova forma di
democrazia partecipativa. Io voglio essere in grado di sapere le informazioni
attraverso le quali la mia amministrazione locale e nazionale prende le decisioni. È
come ricevere busta paga senza sapere quanto c‟è dentro: stipendio lordo, trattenute.
Conoscere è una forma di democrazia, è quasi trasparenza. Si sta aprendo il dibattito
sulla questione della Polverini in Lazio. Nascondere i dati è sempre una fonte di
dubbio, nascondere i bilanci dei partiti è fonte di dubbio. È diritto del cittadino
sapere, avere informazioni per sapere come gli amministratori pubblici hanno agito.
Piano piano si sta andando sempre di più verso una logica di diffusione libera dei dati.
Problemi importanti. Ma chi produce questi dati?
Un discorso è se l‟ISTAT pubblica dati sulla disoccupazione, sono quelli che usa il
governo.. Altro discorso i dati che pubblica la cgil, i sindacati, può essere che
l‟indagine dei sindacati sia fatta meglio e più accurata. Ma abbiamo due indagini che
forniscono risultati differenti. La domanda che ci si viene a chiedere è quale delle due
fonti è attendibile? Con quali strumenti i dati sono nati?
L‟obiettivo di questa parte del corso è fare un po‟ di chiarezza su quelle che sono le
fonti statistiche ufficiali. Non vuol dire che le fonti statistiche non ufficiali operino
male e i dati siano sbagliati. Questo no. Vedremo che ci sono enti preposti alla
produzione dei dati e la loro disseminazione e diffusione di questi dati è quella che
maggiormente viene utilizzata per prendere decisioni di tipo economico politico e
sociale.
Queste fonti che producono informazione statistica, questi enti che producono dati
che rappresentano informazione, possono essere suddivisi in tre grosse aree, o meglio
secondo tre criteri:
1. Natura dell‟ente;
2. Scopo della Rilevazione;
3. Territorialità
Natura dell’ente. La prima classificazione, forse la più importante perché riguarda
l‟aspetto giuridico dell‟ente produttore, la seconda è più importante sulla tipologia di
costruzione e raccolta dell‟ente, la prima è basata sulla natura giuridico
amministrativa della fonte. Distinguiamo tra enti istituzionali, pubblici o erogatori di
servizio pubblico, enti privati ed enti di natura scientifica.
Quelli che ci interessano di più sono i primi tre, gli enti di natura scientifica
producono dati ma particolari. Le fonti istituzionali sono gli enti produttori di dati che
per loro natura devono produrre dati, per loro statuto devono produrre dati che
esistono perché producano dati, sono stati assunti per produrre dati, questa
informazione.
11
La regina in tutto questo contesto è l’ISTAT. L‟Istituto Nazionale di Statistica è il
principale produttore di informazione statistica in Italia. Vedremo sulla base di quali
principi e criteri produce dati, ha vincoli precisi che deve rispettare. Altri enti
producono dati: i ministeri, le regioni, le province autonome, comuni prefetture.
La provincia, molte andranno a morire, ha come produzione statistica rilevante tutto
ciò che riguarda l‟attività scolastica. Comuni e regioni hanno tutti, a parte i comuni più
piccoli, un ufficio statistico. Durante il corso verrà a parlare una persona del comune
di Genova su come verranno rilevati i prezzi. Vedremo prezzi alla produzione, al
consumo. I comuni hanno il compito di rilevare i prezzi per conto dell‟Istat. Poi
trasmettono con un software i prezzi rilevati. L‟Istat macina i dati e costruisce
l‟indice dei prezzi al consumo, alla produzione eccetera.
La regione anche produce dati, ad esempio l‟annuario statistico regionale. È necessario
avere un senso della misura dei fenomeni. Il mercato nautico è in crisi. Perché? Perché
me lo dice il mio vicino che vende imbarcazioni al porto di Lavagna, o perché può avere
ragione, o perché ho dati che mi dicono quante imbarcazioni sono state vendute o non
necessariamente immatricolate?
Esistono delle strutture, è una impalcatura complessa a livello nazionale, che hanno
per loro natura l‟obbligo di rilevare dati per finalità informative e statistiche.
Poi abbiamo le “fonti pubbliche. Sono le strutture prevalentemente pubbliche ad
esclusione delle amministrazioni e l‟Istat. Questi enti, solitamente, producono dati
nello svolgimento della loro attività quotidiana. L‟INPS è l‟esempio più semplice,
istituto nazionale di previdenza sociale, è l‟ente che eroga le pensioni. Incamera
contributi pensionistici ed eroga pensioni. Non come obbligo istituzionale produrre
statistiche sulle pensioni, eppure ha in pancia tanti dati. Numero di pensionati in vita,
contributi, età dei pensioni, le pensioni di anzianità, le pensioni di invalidità, le pensioni
irreversibili. Nello svolgere la sua attività l‟INPS può produrre studi che analizzano i
pensionati italiani.
Qual è la differenza tra questa produzione di dati e quella dell‟Istat? Istat conduce
indagini con fine di condurre indagini e con finalità conoscitive, vuole conoscere degli
aspetti del paese. L‟Inps svolge un‟altra attività e utilizza dati che produce nel suo
processo quotidiano di attività ed elabora statistiche che aiutano a prendere
decisioni. I dati che sono prodotti in questo modo sono detti process produced,
prodotti attraverso la produzione del processo.
Sono anche dati amministrativi, che sono anche più ampi, non includono solo questi.
Insieme all‟Inps possiamo inserire la BDI. Ha un ufficio studi eccellente con profili
scientifici strepitosi, ci sono persone estremamente qualificate. La BDI non ha la
finalità di produrre statistiche sul mercato finanziario e sul credito a Genova, in
Liguria ed in Italia. Lo fa perché è importante nello svolgere la sua attività sapere
cosa sta succedendo, monitorare gli importi finanziati a breve medio e lungo periodo.
Valutare i tassi di interesse applicati sui mutui. Sono cose di interesse dell‟attività
quotidiana.
12
Ci sono altri enti, li citati, a base pubblica, con tutt‟altra finalità rispetto alla
produzione dei dati ma che li producono, conservano, producono informazione
statistica perché serve a loro o al paese.
Poi abbiamo le fonti private. Sono enti che non hanno un carattere pubblico dal punto
di vista giuridico, ma sono enti privati: Caritas, ferrovie dello stato, poste, sindacati.
Ci sono tantissimi enti che producono indagini. La Confindustria. A loro interessa
analizzare un aspetto particolare. Immaginiamo che la Caritas voglia studiare la
situazione della popolazione straniera e regolare in Italia. Non ha un obbligo
istituzionale per farlo. L‟ente assistenziale ha la finalità di assistere le persone che
sono in difficoltà. Nel fare ciò può ritenere opportuno fare studi specifici per
conoscere il fenomeno, per agire meglio, o per sensibilizzare rispetto ad un certo
fenomeno. A differenza delle fonti statistiche istituzionali, non ha obbligo di
produzione statistica. A differenza delle fonti pubbliche non hanno nessuna (o
parziale) produzione di dati attraverso il processo, sono generalmente enti che
producono studi che rappresentano informazione statistica ma studi spot, saltuari su
alcuni aspetti.
Infine gli enti scientifici: producono statistiche su vari aspetti, hanno un carattere di
produzione simile a quella degli enti privati. Pensiamo alle università che producono
statistiche sugli immatricolati, sarebbero dati di natura amministrativa, process
produced, poi altri enti scientifici con non finalità assistenziali ma di ricerca che
producono statistiche. Su questi non torneremo più, era giusto per completare.
Ritornando indietro. Abbiamo fonti istituzionali tra le quali primeggia l‟Istat, fonti
pubbliche come la BDI, fonti private come i sindacati e la Caritas, fonti scientifiche
come l‟Università e il CNR.
Altro criterio per distinguere le fonti statistiche è lo Scopo della rilevazione. Perché
raccogliamo i dati? Alcuni enti raccolgono dati per finalità puramente statistica, con la
finalità conoscitiva, per esempio la Caritas può fare indagine sugli immigrati
clandestini in Italia, finalità puramente conoscitiva, anche in questo caso rientra nel
primo punto: fonti di origine statistica, materiale che è stato raccolto con l‟intento di
conoscere alcuni aspetti della vita sociale.
Invece, sono i dati process produced, ci sono moltissimi documenti predisposti dalle
amministrazioni sia pubbliche che private, ma anche dagli enti di ricerca, per scopi che
non riguardano la produzione statistica, quanto piuttosto la loro attività. Per esempio
l‟Inps ha i dati dei pensionati. Comune di Genova ha l‟anagrafe. L‟università ha gli
studenti iscritti. Dati che provengono da origine statistica sono rilevati per finalità
conoscitive. I dati amministrativi sono dati che esistono per altre finalità di gestione
quotidiana dell‟attività dell‟ente ma non per finalità di tipo statistico. Già che questi
sono disponibili si reputa opportuno analizzarli per produrre informazione statistica.
Possiamo fare quindi una distinzione ulteriore all‟interno delle fonti di origine
statistica. Possiamo distinguere:
a) Le rilevazioni amministrative (dati amministrativi, dati che certe strutture
hanno in pancia perché devono svolgere attività ordinarie)
13
b) Censimenti
c) Indagini campionarie
Le rilevazioni amministrative. Guardiamole un secondo, poi abbiamo una presentazione
specifica su quelle. Le rilevazioni amministrative non sono solamente dati prodotti
dagli enti pubblici o privati. Anche il comune di Genova possiede dati di carattere
amministrativo. Le due classificazioni viste prima, quella in base alla natura giuridica
dell‟ente (istituzionale pubblico privato e di ricerca) e tra le due tipologie di
rilevazione (per finalità statistiche ed amministrative) non sono esclusive, non ci sono
abbinamenti precisi, possono intralciarsi.
Le rilevazioni amministrative nel caso del comune di Genova sono per esempio i dati di
tipo anagrafico. Il comune deve tenere un‟anagrafe dei residenti. Da qui capiamo
quanti sono i residenti a Genova come numero, quanti sono per nazionalità, per fascia
d‟età, per età, per genere. Possiamo anche conoscere il loro indirizzo, nel rispetto
della normativa sulla privacy. Se lo conoscessimo è semplice sapere quanti sono i
residenti per ciascun municipio, ex circoscrizione o per ciascun quartiere.
Per ciascun quartiere posso sapere i residenti per nazionalità e fascia d‟età. Quanti
studenti ci sono in una scuola: quanti al liceo scientifico, classico, tecnico, eccetera.
Questi dati esistono perché le scuole devono svolgere il loro compito di informazione.
Il comune deve gestire la anagrafe dei residenti.
Al tempo stesso ci sono altre attività che vengono svolte (registro delle imprese).
Finito il corso di formazione volete aprire una azienda la iscrivete nel registro delle
imprese attive, in cui ci sono una serie di dati: nome azienda, azionisti, capitale
sociale, forma societaria, tutte le cose viste in diritto commerciale.
Il PRA. Se comprate una macchina, moto o motorino, o qualsiasi cosa di due quattro
ruote soggetta di immatricolazione è iscritto nel PRA. È interessante da utilizzare.
Noi possiamo sapere quanti sono i mezzi circolanti per cilindrata, per tipologia
inquinante, euro zero, uno, due tre eccetera. Auto elettriche, ibride eccetera. Oppure
sapere gli autoarticolati che sono immatricolati in Italia versus quelli in Francia, età
media del parco vetture. Poi abbiamo le liste elettorali.
Esempi di dati amministrativi usati per finalità di tipo statistico. In questo corso non
ne parleremo, in futuro mi piacerebbe. Ci sono aspetti molto rilevanti sulla privacy.
Qualche anno fa, 5-6 anni fa, forse non eravate neanche in università, era venuta
fuori una polemica perché l‟agenzia delle entrate aveva pubblicato sul suo sito le
dichiarazione dei redditi degli italiani. Tutto bloccato entro dieci minuti, tutto
ritirato, evidentemente ci sono problemi di privacy non indifferenti: ognuno guardava
il vicino quanto guadagnava eccetera. Perché poi siamo un paese di pettegoli! 
È evidente che sono dati sensibili. Non tutti i dati possono essere trattati allo stesso
modo. Anche i dati sanitari non possono essere trattati allo stesso modo, magari un
soggetto non ha piacere che si sappia che ha un tumore. Perché deve essere diffuso
in internet?
14
Di altra natura problema aperto in Inghilterra tre quattro anni fa. Proposta del primo
ministro o della giustizia, pubblicare su internet tutti coloro che sono stati accusati di
pedofilia, così i genitori poterono vedere se c‟erano pedofili vicino a casa, o vicino alla
scuola dei figli. Questa proposta è caduta in nome della privacy. La pubblicità dei dati
è soggetta ad aspetti di privacy. Abbiamo parlato di dati di natura amministrativa, li
ritroveremo.
Adesso vediamo i dati di origine statistica raccolti per finalità esplicitamente
informative. Accenneremo i censimenti e indagini campionarie. Censimenti in maniera
diffusa con una presentazione ad hoc, forse dopo questa, sui dati di tipo campionario
ne parleremo ampliamente in seguito. Questa è una panoramica.
Cosa è un censimento? C‟è stato l‟anno scorso, 15esimo censimento della popolazione
e delle abitazioni. È una indagine esaustiva su tutte le unità che compongono la
popolazione. Il censimento più famoso, non è l‟unico esistente adesso, è il Censimento
della Popolazione e delle Abitazioni. Ha come obiettivo il conteggio degli italiani
presenti sul territorio ad una certa data, anzi di tutti coloro che sono residenti in
Italia, il conteggio di tutte le abitazioni. Sembrerà strano ma non è così sicuro che le
abitazioni presenti sono quelle che sono al catasto, molte abitazioni non sono regolari.
Il censimento delle popolazioni e abitazioni è così definito dall‟Istat: è l‟insieme delle
operazioni di progettazione, raccolta, analisi e diffusione dei dati di carattere
demografico, culturale economico e sociale di tutti gli abitanti del paese. Non quindi
cittadini italiani.
È una indagine esaustiva. L‟obiettivo è cercare di raggiungere tutti gli italiani, tutte le
unità statistiche del territorio. La cadenza è decennale, ogni dieci anni viene fatto
questo lavoro, è un lavoro estremamente costoso, richiede molto tempo di analisi e
vuole determinare non solo l‟entità numerica ma anche la struttura della popolazione di
un paese.
Avete aiutato i genitori a compilare il questionario? Compilazioni online. Ricordate le
domande, c‟erano due forme: una lunga e una breve. La forma breve aveva meno
domande della forma lunga. La forma lunga, che aveva più domande, vedremo perché ce
ne erano due, chiedeva che tipologia di riscaldamento hai, come è fatto il palazzo,
domande sulle abitazioni, sull‟origine, attività lavorativa, se la casa è utilizzata anche
come luogo del lavoro eccetera. Non semplicemente il conteggio delle teste, ma
qualcosa di più complesso.
Esistono tanti altri censimenti. Nel 2010 è stato fatto censimento generale
dell‟agricoltura, attraverso il quale si vuol sapere quanti maiali ci sono in Italia: ovini
bovini suini, caprini, quante aziende agricole operano, per quale superficie operano, in
quale terreno, per capire qual è l‟attività agricola, dove per agricola si intende anche
l‟attività pastorizia del paese.
Ritorno a quanto dicevo all‟inizio. Questa è statistica macro economica, guarda i grossi
aggregati, non il singolo soggetto, ma guarda all‟insieme nazionale di un certo
fenomeno.
15
Censimento generale dell‟industria e dei servizi, dovevano farlo l‟anno scorso ma non è
ancora partito. Adesso è in corso il Censimento delle associazioni no profit, quante
sono cosa fanno eccetera.
Diversa dal censimento è l’indagine campionaria. Il censimento (indagine censuaria) è
estremamente costoso; indagine campionaria = campionamento. Col censimento bisogna
raggiungere tutti i 60 milioni di italiani, tutti i nuclei familiari. Solamente a Genova per
un anno hanno lavorato 350 persone, comune di Genova, non provincia, ha un costo non
indifferente. Si parlava di saltare il censimento e non farlo. La multa dell‟UE era
talmente alta che conveniva fare il censimento. è un obbligo comunitario, è stato un
censimento coordinato a livello europeo.
Ci sono inoltre tantissime difficoltà nell‟analizzare i dati: questionari, metterli in
forma informatica, analizzarli. È un processo che richiede 3-5 anni per essere
concluso. A Gennaio primi dati definitivi sul censimento, a Roma sono un po‟ indietro. I
primissimi risultati ad un anno dalla fine del censimento, e poi le analisi conclusive si
avranno dopo due- tre anni la fine del censimento. c‟è un calendario che dovrebbe
essere rispettato.
Ci sono situazioni in cui non vale la pena mettere su tutto il cinema. Se voglio sapere
le abitudini degli italiani nelle vacanze, quanti andranno all‟estero, quanti in albergo,
quanti rimarranno a casa, non devo per forza fare un censimento e raggiungere tutti
gli italiani uno per uno e chiedere a questi cosa intendono fare. È più semplice
utilizzare un campione.
Sono caratterizzate dal fatto che solo una parte delle unità componenti la popolazione
viene selezionata ed indagata. Esempio molto semplice. Vi voglio chiedere se il corso vi
sta piacendo. Posso prendere ognuno di voi e chiedervi: ti piace questa lezione?
Diventa snervante per voi. In fin dei conti su 50, se ho chiesto a 49 persone, quanto
serve sapere l‟informazione della 50esima persona. Se ne ho 49, non posso prenderne
48? Esiste una soglia al di sopra della quale il costo di rilevazione dell‟opinione della
persona o del dato è superiore al beneficio che ho nel raccogliere il dato. Su 50, 15 di
voi sono il 30%. 15 su 50 mi danno informazione buona se il corso è bello brutto, se
piaccia o meno, se sembri antipatico o simpatico. È una informazione che vale sul
momento. Poi ci saranno altre lezioni, poi altre lezioni, poi viene Persico, l‟informazione
raccolta ha validità limitata.
Avrebbe senso condurre una indagine campionaria per informazione che vale poco
tempo? Una indagine sulla forza lavoro, che cerca di capire quanti e perché sono
occupati, non ha senso a livello censuario. Meglio fare indagine su poche unità, ben
fatta, secondo alcuni criteri che vedremo, costa di meno. Condurre indagine
campionaria ha un costo eccessivo rispetto al beneficio che trarrei dall‟indagine
pienamente censuaria, molto meglio la campionaria.
Questo espediente, diminuendo l‟onere della rilevazione, consente di destinare
maggiore attenzione a tutte le attività connesse al miglioramento e al controllo della
qualità dei dati raccolti.
16
Se voi avete 2000 questionari, avete tempo di contattare le persone con più calma,
preparare meglio le domande, le risposte, e verificare meglio la correttezza e la
qualità della risposta. Se avete centomila risposta il tempo che potete dedicare a
ciascuna persona è di meno.
Selezionare solo un campione implica una minore attendibilità delle misure osservate
in quanto stime dei parametri di interesse. Vero. Visto a statistica 1. Se chiedessi solo
ad alcuni di voi se il corso è bello, potrei avere una valutazione sbagliata. Sono
sfortunato e potrei beccare persone che non mi sopportano, potrei beccare persone
molto contente. O è realistico credere che se a un 50% non piace e l‟altro 50% piace,il
campione è frutto del caso se è ben fatto, se non è distorto, avrà il 50% di persone a
cui piace e 50 a cui non piace.
Il campione auspicalmente dovrebbe rispettare la composizione della popolazione.
Anche se non ho la percezione assoluta dello studio censuario, lo studio campionario è
comunque soddisfacente. Avrò l‟errore dovuto al fatto di avere il campione anziché la
popolazione, ma in linea di massima questo errore dovrebbe essere nullo.
È chiaro che a seconda di quali unità vengono inserite nel campione prescelto, i
risultati riferiti alla popolazione complessiva varieranno. Cosa significa? Se prendo
campioni di 5 da voi quanti ne posso prendere? Tanti: i primi 5 del primo banco,
dell‟ultimo banco, a caso e così via. Ogni campione è composto da unità differenti. Ogni
unità da una valutazione diversa. Se il campione è ben fatto, le risposte saranno più o
meno simili tra loro e ruoteranno attorno al vero valore della popolazione che a me
interessa stimare, proprietà della correttezza dello stimatore.
Le indagini sui campioni della popolazione rientra nell‟attività Istat da circa un
ventennio. Quella sulle forze lavoro realizzata nel settembre del 1952 è stata l‟unica
ad indagine diretta con interviste personali.
Terza classificazione. La territorialità. I dati statistici possono essere suddivisi in
base alla territorialità dell‟ente che produce il dato. Possiamo distinguere tra enti
a) Internazionali sovranazionali. Non sono legati direttamente ad un paese. Per
esempio l‟ufficio statistico delle nazioni unite; la banca mondiale; la FAO,
l‟Eurostat, anche se sappiamo che non è un produttore di dati; il FMI, sono tutti
enti sovranazionali o internazionali.
b) Nazionali. Istat. Bureau census è un analogo dell‟Istat per gli USA è un ente
nazionale, è referenziale su un paese. L‟analogo dell‟Istat di Francia Germania e
Inghilterra sono fonti statistiche nazionali, non internazionali. Nazionali estere.
c) Locali. Regione comune, camera di commercio, fanno riferimento alla
territorialità dell‟ente che produce il dato.
Tutto questo meccanismo è coordinato attraverso il SISTAN. È un sistema che non
produce dati, ma ha lo scopo di coordinare l‟attività di produzione statistica ufficiale
italiana. È un network di enti (ogni pallino del logo dovrebbe essere un ente) collegati
in questa rete.
17
È stato istituito nel 1989 e connette in un‟unica rete tutte le componenti disperse
nelle amministrazioni con l‟obiettivo di acquisire nuovi e maggiori conoscenze per
influire sui processi decisionali della PA (vedi sito Sistan) e con quello ulteriore di
ridurre le molestie verso il pubblico e le imprese che ha raggiunto livelli eccessivi.
(aveva ai tempi, forse ora un po‟ meno).
Esempio. Qualche tempo fa ero in banca, ci hanno fermato guardia di finanza,
carabinieri e guardia costiera, uno dice, coordinatevi! Lo stesso discorso può avvenire
per le rilevazioni statistiche. Se c‟è una rilevazione dei prezzi, la deve fare un ente
solo bene, anziché tanti male. Il Sistan ha l‟obiettivo di coordinare all‟interno del
Programma Statistico Nazionale, l‟attività di rilevamento dei dati su tutto il territorio
nazionale.
Stabilisce, grazie al programma statistico nazionale, chi rileva cosa e che cosa c‟è da
rilevare. Al centro del Sistan, (quel pallino al centro del quadrato) si trova l‟Istat. Non
è al vertice del Sistan, non è una cupola, non è il capo del Sistan, ma è il centro di
coordinamento di ricerca, consulenza formazione e garanzia metodologica e si
trasforma in una azienda in grado di fornire servizi al pubblico.
Se il comune di Genova non sa come fare qualcosa, chiama l‟Istat e l‟Istat gli dà la
risposta. Se la camera di commercio di Genova deve rilevare dei dati e non sa come
fare, chiama l‟Istat e l‟Istat lo risolve. L‟Istat è un aggregatore, responsabile di
riferimento principale per tutti gli enti che fanno attività di rilevamento dei dati.
L‟Istat non è il capo del Sistan. Chi fa parte del Sistan?
- Istat
- Uffici di statistica centrali e periferici delle amministrazioni centrali e delle
amministrazioni ed enti autonomi (amministrazioni centrali es. ministeri);
- Gli uffici delle regioni e delle province autonome;
- Delle province;
- Dei comuni;
- Delle ASL;
- Degli uffici delle camere di commercio;
- Gli uffici di statistica comunque denominati di amministrazioni od enti pubblici;
- Uffici di statistica di soggetti privati che svolgono funzioni di interesse
pubblico.
Chi svolge le funzioni di ufficio statistico nei comuni? La anagrafe. Di solito, nei
comuni piccoli, Bargagli per intenderci, non c‟è l‟ufficio statistico, la anagrafe gestisce
anche gli aspetti statistici.
Tutta questa struttura lavora secondo delle finalità che sono esplicitate nel
programma statistico nazionale: definisce le rilevazioni che devono essere fatte in
Italia. L‟Istat non può smettere di fare la rilevazione sulle forze lavoro, perché è nel
programma statistico nazionale, c‟è l‟obbligo, è una legge e deve essere rispettata.
È li che si parla di cosa deve fare l‟ISTAT, è li che si dice chi deve fare che cosa e
con quali criteri. Il programma statistico nazionale parte dal presupposto di fornire
18
un servizio pubblico per la circolazione delle informazioni con la tutela del segreto
statistico (privacy). Il Sistan creando una rete di collegamento, vuole riportare la
statistica la dove si formano le decisioni, ma il pluralismo delle fonti deve essere
coordinato con gli atti di indirizzo e coordinamento.
Che significa? Che se a Genova i prezzi sono rilevati in un modo, deve essere così
fatto anche a Matera. Non possiamo rilevare le cose in modo differente, diamoci un
coordinamento con stessi tempi e modalità. Si decide di mandare i prezzi all‟Istat
l‟ultimo del mese? Lo facciamo tutti.
Il programma statistico nazionale afferma che la produzione deve essere orientata
all‟utente, il quale deve avervi ampio accesso. I dati devono essere usati in maniera
coordinata, organizzati in serie temporali e forniti tempestivamente, devono essere
imparziali, coordinati con l‟Eurostat, standardizzati ed integrati per l‟interconnessione
dei sistemi informativi.
Il Sistan non produce dati, è un network, sopra il quale si appoggia il Programma
Statistico Nazionale che non produce dati, perché è una legge, in quanto tale ha come
obiettivo dare un indirizzo, indicare gli enti che rilevano i dati e quali dati devono
rilevare.
Se vogliamo fare statistiche sui lacetti fucsia delle scarpe lo possiamo fare ma o
lometto nel programma o lo faccio per i fatti miei. Se c‟è scritto sul programma
statistico nazionale di fare indagine sui laccetti fucsia delle scarpe non si può non
farlo.
Esiste il programma Statistico Regionale, della Regione Liguria, in approvazione in
questi giorni. Definisce cose simili nell‟ambito regionale.
Concludiamo con alcuni piccoli aspetti normativi veloci. Dove è la statistica nei
documenti ufficiali? Qual è il corpus normativo che ruota attorno alla statistica?
A livello europeo:
- nel TFUE al 338. Fatto salvo l‟articolo 5 del protocollo dello statuto del SEBC e
della BCE il parlamento europeo e il consiglio, deliberando secondo la procedura
legislativa ordinaria, adottano misure per l‟elaborazione di statistiche laddove
necessario per lo svolgimento delle attività dell‟unione;
- la elaborazione delle statistiche dell‟unione presenta caratteri della
imparzialità, affidabilità, obiettività, ed indipendenza scientifica dell‟efficienza
economica, e della riservatezza statistica. Essa non comporta oneri eccessivi
per gli operatori economici.
A livello nazionale, la Costituzione tratta della statistica e del trattamento dei dati
all‟articolo 117.r: pesi, misure, determinazione del tempo, coordinamento uni formativo
statistico ed informatico dei dati dell‟amministrazione statale, sono di legislazione
esclusiva dello stato.
A livello locale esistono tutta una serie di leggi, e in particolare sulla base del parere
della conferenza permanente per il rapporto tra stato regioni e province, vengono
definiti:
19
-
il ruolo degli uffici di statistica;
il programma statistico regionale e le modalità del suo inserimento totale o
parziale nel programma statistico nazionale;
le rilevazioni statistiche di interessi regionali;
compiti uffici statistica;
le organizzazioni degli uffici di statistica delle regioni;
criteri e modalità per l‟interscambio dei dati.
Tutto questo è inserito in un documento di diverse pagine, non vi consiglio di scaricare,
vi dico solo che esiste, è il Codice della Statistica Ufficiale lo trovate sul Sistan,
raccoglie tutte le leggi che riguardano l‟ambito statistico, e non sono poche.
La prossima volta, giovedì prossimo, andremo ad approfondire alcuni di questi temi e
direi il censimento.
20
LEZIONE 3
27/09/2012
LE FONTI STATISTICHE UFFICIALI II: L‟ISTAT E L‟EUROSTAT
Da Giovedì inizierete con Luca Persico.
Ritorniamo a ciò che abbiamo detto la volta scorsa, un aspetto fondamentale nel
campo del governo di un paese, nella gestione degli enti locali e la conoscenza dei
cittadini devono avere del loro paese è rappresentata dalle fonti statistiche, dai dati
statistici.
Ci siamo soffermati sulle fonti statistiche ufficiali, quelle fonti statistiche che
seguono una particolare procedura nella loro produzione. In particolare, le statistiche
ufficiali nascono all‟interno del Programma statistico nazionale il cui cuore è l‟Istat ma
viene scritto e gestito assieme agli altri enti che fanno parte del Sistan, sistema
statistico nazionale.
Per statistiche ufficiali intendiamo quelle statistiche che nascono all‟interno del
programma statistico nazionale. Questo per quel che concerne l‟Italia. In maniera
simile possiamo identificare fonti statistiche ufficiali per altri paesi europei,
principali paesi del mondo occidentale e non solo, e gli enti internazionali. Una cosa che
andremo a vedere, non so ancora se la prossima lezione o la successiva, sono i criteri ai
quali si attengono gli enti nella produzione dei dati, criteri che non devono essere
seguiti dagli enti che non sono indicati nel Sistat.
Vediamo due particolari strutture, di particolare interesse: Istat ed Eurostat. Non
andremo molto nel dettaglio. Inviterei di andare nel sito Istat per vedere
l‟abbondanza di informazione di dati che sono disponibili.
L‟ISTAT. È il principale produttore italiano di statistica ufficiale in Italia. Abbiamo
visto che non è l‟unico, ma il principale. È il cuore del Sistan, è stato istituito per le
finalità di conoscenza statistica, è un ente pubblico, anzi è una fonte istituzionale, è
una fonte di informazione statistica che esiste per produrre dati, non nella sua
attività quotidiana. Non è un ente che può fare altro come può fare l‟Inps, l‟Istat ha
come scopo della sua esistenza la produzione di dati ed informazioni statistiche.
L‟attività che svolge è sviluppata nell‟ambito del programma statistico nazionale. Al di
fuori del programma statistico nazionale può decidere di fare anche altro ma in
particolare si attiene a quello.
Ha altri obiettivi: divulgazione della statistica e conoscenza statistica, formazione e
supporto agli uffici del Sistan che hanno bisogno di consulenze statistiche.
L‟Istat è piuttosto recente, è del 1926. Prima, tutta la produzione statistica, era
gestita all‟interno del Ministero dell‟Agricoltura. Ci sono pubblicazioni statistiche
precedenti all‟Istat: popolazione (il censimento è stato fatto anche prima del 1926),
forza lavoro, superficie agricola coltivata, coltivata come, quanti ovini, caprini, bovini.
L‟informazione statistica ufficiale prima era all‟interno del Ministero dell‟ agricoltura.
21
Nel 1926 Mussolini decise che era importante, per avere un forte governo sul
territorio, conoscere i dati, conoscere il paese. Interessante sarebbe vedere un
documentario prodotto dalla RAI per i 150 anni dell‟unità. In questo documentario si
parla della storia della statistica. La storia siamo noi ha fatto una puntata dedicata
alla statistica. Se abbiamo tempo, se riusciamo martedì potremmo provare a vederlo.
Mussolini ha chiamato a dirigere l‟Istat Corrado Gini, quello che ha inventato l‟indice
di Gini: di concentrazione, di dispersione. Inizialmente si chiamava Istituto Centrale di
Statistica. Successivamente, nel 1989, l‟anno in cui è stato istituito il Sistan, abbiamo
questo incrocio di informazioni con le slides viste la volta scorsa, viene istituito il
Sistan e viene organizzato l‟Istat, cambiato come nome in Istituto Nazionale di
Statistica.
L‟Istat nasce per produrre informazione, per produrre dati, per statuto la
realizzazione di indagini, studi e analisi è finalizzata alla produzione di statistica
ufficiale e a soddisfare il bisogno informativo espresso dalla collettività.
Le rilevazioni di pubblico interesse sono stabilite dal Programma statistico nazionale,
il documento che regola l‟attività di produzione statistica.
L‟Istat svolge sia attività di tipo censuario, censimenti,
sia attività di tipo
campionario. In realtà prima le attività di tipo campionario erano piuttosto poche,
prevalentemente indagini sulle forze lavoro. Poi cresciute sempre di più per una serie
di vantaggi che rappresenta l‟indagine campionaria rispetto all‟indagine censuale.
Il censimento più celebre è quello sulle popolazione e abitazioni, ha raggiunto la 15
edizione. Nel 2001 il censimento ha riguardato 57 milioni di cittadini, nel 2011 il
conteggio definitivo attorno ai 60 milioni di individui e 23-24 milioni di famiglie. In
Italia i censimenti sono partiti immediatamente, ne riparleremo. Ogni qualvolta nasce
un nuovo paese, nazione, la prima cosa che si fa è contare le persone. Lo abbiamo fatto
con l‟Unità di Italia, gli Stati Uniti nel 1776 quando c‟è stata la costituzione degli
Stati Uniti, succede ogni volta che i paesi si dividono, uniscono, organizzano per avere
una popolazione legale di riferimento a fini elettivi.
Con il Regno di Italia, per fare un esempio, si è reso necessario fare le prime elezioni,
come nel 1776 negli Usa. Quanti rappresentanti doveva mandare la Sicilia, la Campania
o qualsiasi altra regione, città al parlamento? Il problema ce lo poniamo oggi come
allora. Questo è un elemento, il numero di abitanti residenti, quindi la popolazione
legale, sono il risultato dell‟indagine campionaria. Su questo ne riparleremo
prossimamente.
Abbiamo già accennato al censimento dell’agricoltura, eseguito nel 1960, in realtà
c‟erano anche altri dati, ufficialmente il censimento dell‟agricoltura nasce nel 196‟. È
stato eseguito nella sesta volta nel biennio 2010-2011. Qual è l‟obiettivo? Censire le
aziende con almeno un ettaro di SAU (superficie agricola utilizzata) o che soddisfano
alcune condizioni particolari.
Poi altri censimenti. Adesso è in corso il censimento per le organizzazioni no profit.
Anche un altro censimento, il censimento dell’industria e dei servizi, non si sa se
22
andrà avanti oppure no. È il principale strumento per capire la struttura economica del
paese.
Inizialmente nel 1911, prima dell‟Istat, sempre a cura del Ministero dell‟agricoltura, si
aveva il censimento degli opifici e delle imprese industriali. Nel corso degli anni ha
cambiato nomi attenendosi alla differente struttura del paese: censimento
dell‟industria e del commercio (1951), dell‟industria e dei servizi (1981). Di solito si
faceva in contemporanea col censimento delle popolazioni e abitazioni. Bisogna vedere
se verrà fatto. Attualmente i registri delle imprese e gli archivi amministrativi
potrebbero rendere superflua la condizione di uno studio censuario.
Le attività dell’Istat. Oltre alle indagini censuarie, possono essere indagini di tipo
campionario con cadenza differenziata. Possiamo avere cadenza mensile, trimestrale,
semestrale, annuale, sino ad arrivare a cadenze quinquennali. A seconda dell‟indagine si
trovano cadenze differenti.
Per esempio. Ci sono indagini multi scopo sulle famiglie italiane; indagini che analizzano
più aspetti contemporaneamente e già che telefonano o raggiungono la persona, vanno
a rivelare vari aspetti della vita quotidiana o delle scelte di vita delle persone.
Indagini su :
- Vita quotidiana
- Viaggi e vacanze
- Condizioni di salute e ricorso ai servizi sanitari
- Sicurezza dei cittadini
- Uso del tempo
- Cittadini e tempo libero
Sono tutte indagini di tipo campionario. Sottoposte solamente ad un sottoinsieme della
popolazione, costruito in maniera tale da essere rappresentativo della popolazione
totale. Tutti questi aspetti li approfondiremo nel prosieguo.
Ci sono tante altre indagini, alcune sono molto importanti, altre un po‟ meno. tra le più
importanti:
- Indagine continua sulle forze di lavoro (cosa significa continua? Fatta
continuamente, non c‟è un punto di riferimento ma è molto fluida, le varie fasi
temporali si sovrappongono, non è mensile, è quasi giornaliera);
- Sui consumi delle famiglie. (Le famiglie campionate ricevono un libretto di una
ventina di pagine. Su ogni libretto la famiglia deve andare ad indicare quanto ha
speso giorno per giorno nei differenti alimenti: pane carne acqua, succhi di
frutta, ricariche del telefonino. Ci sono un po‟ di pagine, in cui il capo famigila
segna le spese fatte per il periodo di una settimana, poi è ridato all‟Istat che ha
il profilo del consumo settimanale della famiglia);
- Indagine dei prezzi al consumo (i prezzi, su questo mi piacerebbe invitare
qualcuno del comune di Genova per parlarne, vengono rilevati dal comune.
Alcune persone come lavoro rilevano i prezzi su alcuni beni particolari: una
certa tipologia di pane, carne. Questo avviene mensilmente. I prezzi vengono poi
23
-
trasmessi da tutti i comuni d‟Italia all‟Istat, li consolida li pesa per la
numerosità delle popolazioni residenti per tutti i comuni e, alla fine, produce un
indice sintetico di prezzo, solitamente si utilizza l‟indice NIC). Ogni tanto
sentirete dire che l‟Istat ha cambiato il paniere. Come si misura l‟inflazione?
Identifico paniere standard e vedo quanto costa il paniere nel tempo. Posso
vedere anche come il costo di questo paniere cambi tra differenti regioni,
comuni, si parla di rilevazione di prezzi al consumo come indagine mensile,
campionaria, perché i punti vendita sono campionati, non è un censimento dei
punti vendita ma un campionamento, basata su un paniere di beni ben precisi. Se
a Genova prendo il pane all‟olio e a Milano il pane all‟acqua non c‟è confrontabili
di prezzo;
Sui percorsi di studio e di lavoro dei diplomati;
Inserimento professionale dei laureati;
Cause di morte; (soprattutto infantile):
Degli istituti di cura
Ce ne sono tante altre effettuate con una regolarità o con meno regolarità. Sul sito
Istat vediamo che presenta varie aree tematiche molto interessanti da approfondire.
Dopo il censimento vedremo le fonti statistiche ufficiali per la statistica economica.
Per le fonti internazionali o sovranazionali, che avevamo accennato l‟altra volta, vi
avevo già detto di stare attenti a distinguere le fonti statistiche internazionali dalle
nazionali estere. Il Bureau census americano piuttosto che l‟ufficio statistico della
repubblica francese sono fonti statistiche nazionali estere. Sennò per il francese
l‟Istat sarebbe fonte statistica internazionale; no, per il francese è una fonte
statistica nazionale estera. Ricordiamo gli istituti nazionali di statistica, le banche
centrali (FED banca tedesca) fonti statistiche nazionali estere.
Le fonti sovranazionali riguardano tutti i dati che sono prodotti dagli enti
sovranazionali, tipo l‟ONU, Ocse, fondo monetario internazionale, che avrete sentito
nominare un po‟ di volte, e poi l‟Eurostat, dubito che molti l‟abbiate sentito nominare.
L’Eurostat è l‟ufficio statistico della commissione europea, ha una funzione di
direzione generale della commissione e coordinamento dell‟attività della statistica
comunitaria.
Se Genova rilevasse il prezzo del pane all‟olio e Milano all‟acqua ci sarebbero dei
problemi perché non potremmo utilizzare una variazione di prezzo dei due beni come
confronto, sono due beni differenti. Serve un ente, una struttura, che dica come
dobbiamo rilevare i prezzi o far riferimento per rilevare un modo di rilevazione dei
prezzi: principio di omogeneità nella rilevazione dei dati.
A livello italiano c‟è il Sistan con al centro l‟Istat. A livello europeo c‟è l‟Eurostat. Se si
presenta un problema di omogeneità della raccolta dei dati a livello nazionale lo si può
presentare anche a livello internazionale, all‟interno dell‟UE. Se definiamo la
disoccupazione in un certo modo deve essere così per tutti i paesi europei sennò
perdiamo la confrontabilità del dato e dell‟informazione.
24
Nel 1953 è stato istituito l‟Ufficio Statistico della Ceca, ha preso subito il nome di
Eurostat. È l‟ufficio statistico della commissione europea con l‟obiettivo di garantire e
accrescere la comparabilità della produzione statistica dei differenti paesi UE. Si
cerca di fare in modo che tutti i paesi e tutti gli istituti produttori di statistica
ufficiali all‟interno di questi paesi producano dati e statistiche che siano tra loro
confrontabili per le ragioni che abbiamo detto prima.
L‟Eurostat non ha un ruolo di produzione dei dati, non produce dati. L‟Eurostat ha lo
scopo di coordinare le attività di raccolta dati e di definire le statistiche e il modo in
cui andare a produrle e calcolarle.
L‟Eurostat non raccoglie dati di per sé; la raccolta dati è condotta dai singoli istituti
nazionali. Ha il compito di assicurare che siano confrontabili ed armonizzati.
L‟obiettivo a lungo periodo sarebbe quello di avere un sistema statistico europeo
unico, cosa ancora molto lontana.
Le attività dell’Eurostat non sono di produzione dati ma sono di pubblicazione. Ma ha
iniziative che vengono fatte specificatamente a carattere europeo: indagini sulla
forza lavoro europea o sul costo del lavoro europeo. Se per la vostra tesi di laurea che
può essere di qualsiasi materia, cercate dati sull‟UE il vostro punto di partenza è il
sito dell‟Eurostat.
Dati su molte cose e indagini campionarie di particolare interesse: su forza lavoro,
salute, redditi e condizioni economiche delle famiglie. Conduce queste indagini
principalmente per interesse, ad uso della Commissione europea. La attività di
disseminazione di dati, di analisi svolta dall‟Eurostat, deve supportare la commissione
europea nel governo dell‟Unione.
Altre indagini, altre attività sono i database, dati resi a disposizione della collettività
e gli euro barometri: sondaggi di opinione sovranazionali, a livello aggregato europeo e
non nazionale fatti periodicamente su persone al di sopra dei 15 anni.
25
IL CENSIMENTO DELLA POPOLAZIONE: TRA PASSATO E PRESENTE
Il censimento è una delle attività più evidenti delle statistiche ufficiali. È quella che
maggiormente si collega al concetto di statistica come misurazione delle grandezze
relative allo stato, parola legata allo stato.
Come al solito partiamo un pochino dalla parola. Censimento si compone di Censere e di
Mentum, due parole latine, lo possiamo ricondurre ad un atto del contare, annoverare,
stimare, principalmente una attività di conteggio.
Nel momento in cui la concentrazione delle persone supera una certa soglia, bisogna
contare, per vedere quanti siamo, se ci siamo tutti. Quando ci sono, non so se abbiate
ancora le compagnie oceaniche del liceo quando si arriva ai bar a 27, quanti siamo? Ci
dobbiamo contare.
Il censimento della popolazione e delle abitazioni: è l‟insieme delle operazioni di
progettazione, raccolta, analisi e diffusione di dati di carattere demografico,
culturale economico e sociale di tutti gli abitanti del paese.
Da subito, dall‟antichità, nei luoghi dove c‟era aggregazione di persone era necessario
procedere al conteggio della popolazione presente. Una delle più vecchie, antiche
citazioni di censimenti:
- Attorno al 3500 avanti Cristo troviamo i conteggi in Mesopotamia;
- 3000 avanti Cristo in Cina ed India;
- 1400 a.C. Mosè conta gli israeliti. Non che abbia interesse particolare a citarlo,
ma questo censimento citato non a caso nel libro dei Numeri della Bibbia conta e
ci dà i risultati: Fate il censimenti di tutta la comunità degli Israeliti, secondo
le loro famiglie, secondo il casato dei loro padri, contando i nomi di tutti i
maschi, testa per testa, dall‟età di venti anni in su, quanti in Israele, possono
andare in guerra…. Se andate avanti nella lettura trovate i risultati del
censimento.
Abbiamo le fondamenta del censimento come lo concepiamo noi seppure con alcune
differenze.
Tutta la comunità: carattere di universalità anche se parziale.
Secondo le loro famiglie: raggruppati per famiglie. In fin dei conti anche noi quando
facciamo il censimento abbiamo il foglio di famiglia. Ogni famiglia riceve il libretto del
censimento e bisogna scrivere nome cognome data di nascita di famiglie residenti nella
stessa abitazione.
Secondo il casato dei padri.
Contando il nome di tutti i maschi testa per testa. Non si contano le famiglie, ma le
unità statistiche del censimento che è la persona. Non è proprio universale come lo
intendiamo oggi.
Dall’età di 20 anni in su, dai 20 anni in su
26
Quanti in Israele possano andare in guerra. Ecco che troviamo una delle ragioni per
le quali nel 3500 e 3000 1400 a. C si fanno i censimenti, sono ragioni militari, vedremo
che ce ne saranno anche altre.
Il re, signore principe doveva sapere di quanti soldati doveva contare, quante persone
potevano andare in guerra. Voleva sapere anche quanti di quelli si potevano ribellare.
Se tu controlli un territorio e sai che ci sono 10 mila persone stanzi una forza militare
ma con 100 mila altre. Le ragioni iniziali del censimento erano essenzialmente di tipo
militare.
Chi ha veramente portato il censimento a livelli stratosferici è stato l’Impero romano.
Teniamo conto che per fare un censimento sono necessarie due cose: essere tanti in
un’area delimitata, se siamo tanti e sparpagliati non c‟è concentrazione, siamo noi tre,
gli altri lontani e sono pochi anche loro. Ma Cina India e Mesopotamia erano terre
fertili, dove era concentrata la popolazione, dove si sono sviluppate le principali civiltà
antiche. Ecco che è necessario sapere quanti fossero. Oltre avere la popolazione
concentrata in piccole zone, bisognava anche avere una struttura statale o
parastatale che consentisse di procedere a questo conteggio.
Per il mondo occidentale, l‟unica struttura che si era veramente sviluppata a livello
regionale importante era l‟Impero Romano. La Grecia era limitata a delle città, le
famose città stato. L‟impero di Alessandro Magno era troppo breve per poter durare,
per sviluppare una struttura statale e non strutturato per effettuare censimenti e poi
si è sfaldato dopo la morte di Alessandro Magno, qualcosa c‟è stata coi persiani. A
livello puramente occidentale la prima struttura statale che si è sviluppata è stata
l‟impero romano. Si sono sbizzarriti i romani, hanno fatto una quantità enorme di
censimenti.
Quali erano le finalità?
- Di tipo militare, quante unità dislocare sui diversi territori e province per
poterlo controllare;
- Tributarie: per la stima dei tributi dovuti in base a beni posseduti. Quante
persone ci sono, quanti soldi devo incassare da ciascuna provincia. Se non so i
contribuenti non riesco neanche a stimare il gettito fiscale.
Chi è stato l‟imperatore che ha portato lo sviluppo del censimento è stato Ottaviano
Augusto, in un periodo di pace e calma, ha iniziato, ha continuato e sviluppato questa
regolare attività di censimenti. Ottaviano Augusto è a cavallo dell‟anno zero. I
censimenti dell‟età augustea possono essere suddivisi in tre categorie:
1) Censimenti universali: fatti per conteggiare i cittadini militari. Se ricordate
l‟esercito romano era fatto solo di romani, non anche di barbari. Almeno quasi
sino alla fine dell‟impero. Tra le ragioni che vengono addotte oltre alle questioni
economiche, per la caduta dell‟impero romano c‟è stata anche l‟introduzione di
popoli barbari all‟interno dell‟impero;
27
2) Censimenti provinciali: per determinare la ricchezza e la tassazione del
territorio, per sapere quanto si doveva prendere come gettito fiscale,
rivediamo la seconda ragione vista prima, ragioni tributarie;
3) Censimenti di alleati: l‟impero romano aveva degli alleati, o degli stati tributari.
È chiaro che per uno stato alleato dover dire quanto erano i propri residenti
equivaleva a dire se facciamo una ribellione siamo tot. Con questa tipologia di
censimenti l‟impero romano sapeva qual era la potenziale minaccia di ribellione in
uno dei paesi alleati.
Solitamente niente di questo era molto gradito, in particolare le ragioni tributarie e i
censimenti di alleati. Solitamente ad ogni censimento corrispondeva una rivolta.
L‟informazione statistica era troppo importante.
I censimenti dell‟età Augustea, non pensate che ve lo chieda all‟esame, solo per vostra
informazione, avevano una discreta regolarità, dal 30 avanti Cristo al 36 dopo Cristo:
- 30 a.c. Egitto
- 28 Universale per l‟esercito
- 27 a.c. Gallia
- 15 Egitto
- 12 Gallia
- 10 Sicilia
- 8 Universale, dopo all‟incirca una generazione.
- 2
- Egitto
- 7 Cirenaica
- 6 d.c. Siria e Giudea
- 14 Universale
- 16 Gallia
- 36 Spagna Lusitania e Cappadocia
Per avere sempre una informazione sull‟impero. Ne osservate uno in particolare? Siria
e Giudea. Perché Gesù che era nazzareno è nato a Betlemme? Perché c‟era il
censimento. Giuseppe e Maria stavano andando verso Gerusalemme per registrarsi per
il censimento.
Arriviamo al medioevo. Buco temporale notevole tra la caduta dell‟impero romano e il
medio evo. Con la caduta dell‟impero romano, arrivano i barbari e non portano la
struttura statale ben strutturata. Quella struttura statale dei romani viene a
collassare, viene a mancare il concetto di stato, (lo stato moderno viene a svilupparsi
da questo periodo in poi), di fatto viene a mancare la struttura che possa condurre lo
studio censuario.
Arriviamo a censimenti spot, sparpagliati, non contemporanei nei posti dove si va a
formare maggiormente una identità statale. Nel 1886-7 Guglielmo il Conquistatore,
l‟ultimo che ha conquistato l‟Inghilterra, preso possesso del suo regno, ha iniziato un
28
censimento preciso e puntuale per descrivere beni, persone e terre del suo regno,
chiamato Domesday Book = Libro del giorno del giudizio. Non c‟era niente, neppure un
pezzo di terra, un maiale, capra e pecora che potesse scappare a questo censimento,
come nessuno scapperò al giorno del Giudizio. Censimento meticoloso per finalità
puramente, esclusivamente fiscali.
Ci sono stati altri censimenti di tipo meno interessante. Il ruolo più importante a
livello di dati storici del periodo medioevale o tardo medioevale sono quelli raccolti
dalla Chiesa, nel mondo occidentale dove la chiesa cattolica si è andata a diffondere
maggiormente. Pur non essendo veri e propri censimenti la struttura della Chiesa è
molto capillare è quanto più simile si possa ipotizzare essere una struttura statale a
livello europeo.
Avevamo i registri per ogni parrocchia dei:
- Battezzati
- Matrimoni
- Defunti
- Stati delle anime (parrocchiani vistati nelle case per la benedizione pasquale)
- Fuochi (intesi come famiglie)
Qualcosa del genere avrete sentito a Storia economica. Se vedete, in realtà, tutto ciò
è stato reso obbligatorio a partire dal 1545-63 con il Concilio di Trento. I dati più
interessanti e completi sono disponibili per lo più dal tardo XVI secolo in poi, fine
„500.
Nel 1600 peste in Europa che ha fatto stragi. Molto spesso ci sono dati di alcuni
comuni prima del passaggio della peste e dei paesi vicini dopo la peste, si perde una
visione di insieme. Due comuni, uno ha la popolazione prima della peste molto alta, uno
dopo la peste ed è molto basso, non si costruisce la popolazione per un paese o regione
in un certo anno con precisione. È un po‟ complicato.
Finalmente le nazioni iniziano a formarsi, arriviamo allo stato moderno. Tra il 1700 e
1800 gli stati si formano in maniera più stabile: Francia, regni germanici, paesi
scandinavi, Stati Uniti, sono paesi che si formano e consolidano come paesi, con
strutture amministrative centralizzate
Questi paesi, nel nord Europa, in particolare Svezia e Norvegia, effettuarono
rilevazioni di carattere:
- Periodiche
- Simultanee
- Nominative
- Universali
- Neutrali
Arriviamo così al censimento moderno che ha queste 5 caratteristiche.
29
Periodiche? Bisogna dare una periodicità, regolarità, temporale all‟indagine censuaria.
Noi facciamo censimento ogni dieci anni. Mussolini aveva provato ogni 5 anni ma poi
scoppia la guerra e non li facciamo più.
Simultanee. Abbiamo visto il problema: prima peste e dopo peste. È importante che il
censimento venga condotto su un territorio nello stesso istante, con riferimento alla
stessa data. Il censimento dell‟anno scorso aveva come data di riferimento mi pare il
16 ottobre. Sappiamo popolazione residente o soggiornante in Italia al 16 ottobre.
Anche se viene compilato successivamente a quella data, i dati che si chiedono fanno
riferimento a quella data in maniera tale che siano uguali per tutti .
Nominative. Contate testa per testa, ogni singola persona. Rilevazione nominativa di
ogni singola persona.
Universali. Non voglio solo sapere chi ha più di vent‟anni. Voglio conoscere tutti gli
italiani, anche i neonati, senza discriminazioni di genere. Se andiamo a vedere la frase
che abbiamo visto sulla conta degli Israeliti solo maschi no, noi vogliamo anche le
femmine, senza discriminazione di religione o altro.
Neutrali C‟è stata una piccola discussione in ambito cittadino, senza che i rispondenti
siano invogliati a mentire. Se devo rispondere al censimento, do informazioni vere e
rimango fregato perché sono un evasore fiscale e mi beccano, do informazioni
sbagliate anche al censimento. Se mi viene garantito che i miei risultati non vengono
mai utilizzati per finalità fiscali, tributarie, allora sarò più invogliato a dire il vero.
Se ricordate, il Secolo aveva scritto: coi dati del censimento il comune scoverà i
furbetti dell‟IMU o una cosa del genere. Il comune non potrà mai avere accesso e
sapere le informazioni che i cittadini danno all‟Istat. L‟Istat ha garantito e garantisce
che i dati raccolti attraverso il censimento non verranno mai utilizzati per altra
finalità se non quella dell‟Istat: conoscere gli italiani e le risposte. Non verranno mai
utilizzati per incroci per esempio con la anagrafe tributaria.
Potete essere d‟accordo o meno, è il punto fondamentale per la neutralità delle
risposte nel censimento. Dev‟essere neutrale per far si che gli italiani non siano
intenzionati a mentire, non abbiano vantaggi a mentire o svantaggi a dire il vero.
Ci sono problemi che possono emergere che sono non banali. Quando si entra nella
pratica di queste attività ci sono problemi di varia natura. Per esempio, a Genova è
abbastanza facile che chi ora è Italiano sia nato in Italia, Genova è sempre stata in
Italia. Chi rispondeva al censimento a Trieste è nato austriaco ma loro si sentono nati
italiani. La cittadinanza dei genitori era italiana o straniera? Per forza straniera per
forza, Trieste era del regno asburgico. Ci sono problemi pratici che complicano le
rilevazioni dei dati.
Censimenti moderni:
1749 Svezia
1769 Norvegia Spagna
1790 Stati Uniti, non 1776. 1776 è importante anche per un‟altra data. Chi ha
pubblicato cosa? Adam Smith pubblica la ricchezza delle nazioni.
Irlanda
30
Australia
Olanda
1861 Regno d‟Italia appena formati, subito censimento per fare le elezioni.
Censimenti in Italia, siamo stati non bravissimi per regolarità. Primo 31/12/1861, poi
secondo dieci anni dopo 1871 e terzo 81, più che bravi. Poi mancano i soldi e non si è
più fatto il censimento. Poi dopo vent‟anni altro censimento e si è andati avanti
cambiando data dieci febbraio e dieci giugno. Successivamente siamo arrivati al
periodo fascista. Mussolini ci tiene sotto controllo: meglio contare bene, anziché
decennale quinquennale. Aveva una particolare sensibilità nei dati, lo aiutava a capire
cosa fare e come farlo. Peccato che non usavano ancora i sondaggi elettorali, sennò
sarebbe stato un utilizzatore frequente.
Tra il sesto e settimo censimento nel 1926 abbiamo la Costituzione dell‟Istituto
centrale di Statistica. Poi bravi ad eccezione del fatto che nel 1941 saltato per
modelli bellici: dal 1951 al 2001 (9 ottobre, non il 16) regolarità decennale e 2011
quindicesimo censimento.
Abbiamo visto che prima era per motivi militari. Motivi tributari, abbiamo visto che
non si può più utilizzare perché il censimento per essere attendibile dev‟essere
neutrale, non spinge i rispondenti a rispondere il falso.
A cosa serve il censimento oggi? Per conoscere e per conoscerci. Dobbiamo capire
quanti siamo, per definire la cosiddetta popolazione legale. Da qui a 10 anni Genova e la
Liguria avranno lo stesso numero di deputati e sentori a meno che non vengano ridotti
come numero. Il numero dei rappresentanti in parlamento è definito in base
proporzionale al numero di residenti. Se tra 10 anni ulteriore calo della popolazione
genovese potremmo avere meno rappresentanti in parlamento. Essendo di meno
abbiamo diritto a meno posti. Questa è la popolazione legale, rilevata attraverso il
censimento, non è basata su dati amministrativi.
Col censimento si fanno operazioni di rettifica e pulizia della popolazione residente
che risulta dalla anagrafe. La anagrafe non necessariamente è corretta. Ci sono
persone che sono in anagrafe e non dovrebbero esserci e persone che non sono in
anagrafe ma ci dovrebbero essere.
Può essere fatto per fare il censimento delle abitazioni. Rilevate abitazioni che al
catasto non sono presenti. .
Dopo di che c‟è tutta una serie di domande relative a fenomeni che non possono essere
rilevati in maniera amministrativa. La tipologia di riscaldamento utilizzata, come è
fatta la costruzione in cui vivi, come è fatta la casa, la usi come ufficio, di quanti vani
è composta?
Con questo si analizza l‟evoluzione. Domande specifiche sugli immigrati, sugli immigrati
di seconda generazione e così via. Il censimento adesso non ha più un senso militare né
tributario ma ha un senso conoscitivo della struttura della popolazione.
31
Il censimento, abbiamo detto essere una indagine esaustiva della popolazione,
raggiungiamo tutte le persone sul territorio e facciamo a queste persone domande
relative ad una data specifica, simultaneità. Non tutti i paesi fanno così.
In Francia si usa un sistema diverso che ha i suoi pregi e difetti: rolling Census o
censimento rotante. È una soluzione sviluppatasi in Francia per sopperire alla carenza
che loro hanno di database amministrativi. Non hanno archivi anagrafici a livello né
locale né centrale.
Cosa si fa? Anziché fare un unico censimento su tutto il territorio nazionale ogni 10
anni, si fa un censimento continuo, però su piccole aree, a rotazione anno dopo anno. È
come se noi facessimo il censimento un anno a Uscio, un anno a Recco, poi a Moneglia,
poi a Bargagli e così via. Non si fa il censimento contemporaneamente su tutti i comuni.
Ogni anno un insieme di comuni viene censito, in realtà non è esattamente censito ma è
una indagine campionaria, e ogni anno questi comuni cambiano, generando una
ripartenza del ciclo. Si ri inizia con Uscio, Recco, Moneglia, Bargagli e così via. Si
chiama rolling perché gira, ruota, rotola. Non viene fatto contemporaneamente
ovunque.
Poi ci sono zone in cui il censimento è fatto ogni anno. Se noi facciamo un rolling
census di base quinquennale per Uscio lo vado a rilevare ogni 5 anni. Ci sono zone in cui
il censimento in forma campionaria è fatto ogni anno (città grosse). Abbiamo dati che
sono contemporaneamente rilevati o una volta ogni cinque anni, o una volta ogni anno, o
una volta ogni tre anni.
Si genera una specie di tabella di marcia in cui anno dopo anno le rilevazioni sono
diverse. Non sono rilevazioni censuarie, non vengono rilevate tutte le unità che
risiedono in un comune, ma vengono campionate.
Questo è il Basso Reno, è una regione. Immaginate che sia la Liguria. Ci sono 4 città,
comuni al di sopra di dieci mila abitanti. È una slide presa da una presentazione di una
persona di una struttura di ricerca francese.
In grigio ci sono i comuni al di sopra dei 10 mila abitanti coinvolti in ogni anno. Ogni
anno vengono campionate all‟interno di questa città un certo numero di famiglie e
vengono intervistati.
Alcuni comuni intervistati nel 2004 alcuni nella tornata del 2005-2006-7-8. Finito il
giro col 2008 si ricomincia. Gli intervistati nel 2004 saranno intervistati nel 2009,
2010, 2011,2012 e 2013. Si chiama rolling per questo motivo, si ruota.
Vantaggi? Permette di avere dati continuamente aggiornati. Avendo questi dati
rilevati ogni anno anche se parzialmente, vengono poi combinati e si aggiorna di poco,
anno dopo anno, un dataset di rilevazioni con i nuovi dati. Nel 2009, i nuovi dati del
2009 che verranno presi sul rosa verranno sostituiti, anziché commune 2004
troverete commune 2009. Gli altri, 2005-6-7-8 entreranno nell‟‟analisi. Nel 2009 i
dati censuari saranno aggiornati solamente in sostituzione con i dati del 2004. C‟è un
aggiornamento progressivo dei dati utilizzando questo sistema. È un sistema un po‟
complicato.
32
Il rolling census è una soluzione sviluppatasi in Francia. Rappresenta una alternativa al
modello classico del censimento attraverso la conduzione di un‟indagine campionaria
cumulativa continua, (perché tengo i dati del 2005-6-7-8 e ci appiccico quelli del
2009, cumulativa perché conservo fino a quando non sostituisco con i nuovi dati), che
copre l‟intero paese per un lungo periodo di tempo, in generale anni (per esempio li
sono 5) piuttosto che un solo giorno o un breve periodo di rilevamento.
Le indagini annuali possono essere condotte durante l‟intero corso dell‟anno o in un
particolare mese o periodo di tempo.
Più in generale il rolling census combina cicli annuali triennali quinquennali su campioni
di popolazione a rotazione.
Il metodo comporta rischi rispetto ai due fondamentali aspetti del censimento
moderno:
- Esaustività delle numerazioni degli individui e famiglie abitualmente dimoranti;
- Simultaneità dei risultati
Esaustività? Noi l‟avevamo chiamata nominatività e universalità, sostanzialmente
universalità. Perché? Possiamo perdere una fetta di residenti che si sono stanziati in
altri territori. Se sono nell‟anno rosa, quelli che nel frattempo si sono stanziati nei blu
verdi gialli e arancioni li perdo. Se sono soggetto a un periodo di forte immigrazione io
colgo l‟immigrazione dei comuni che vado a rilevare, cioè quelli rosa. L‟informazione è
più aggiornata però di quella del censimento. col censimento lo faccio ogni 10 anni e il
movimento demografico non lo osservo.
Così accetto di andare a violare alcuni assunti di un censimento secondo gli standard
internazionali, ma anziché avere una informazione aggiornata una volta ogni dieci anni,
avrò una informazione con un leggero errore ma si aggiorna continuamente.
Rispetto al primo requisito, con la soluzione francese non è possibile ottenere dati
della popolazione legale, cioè residente in un comune ad una certa data.
Rispetto al secondo requisito, (simultaneità dei risultati)vi è il rischio di diminuire la
comparabilità dei dati nel tempo e nello spazio. Infatti con il rolling census diviene
necessario accettare risultati costituiti da stime riferite a medie di periodi
pluriennali.
Devo accettare il fatto di mettere insieme le informazioni del 2009 con quelle del
2008 2007 2006 e 2005. I valori che io ottengo sono dei valori che vanno a cavallo su
cinque anni, sono medie su dati che sono pluriennali.
Ci vediamo martedì parlando di fonti statistiche ufficiali per la statistica economica.
LEZIONE 4
02/10/2012
Finita lezione vedo di caricare le presentazione viste in questi giorni. Ho fatto alcune
aggiunte qua e la. Se avete quelle dell‟anno scorso attenti alle differenze.
Codice Italiano delle statistiche ufficiali. È in questo ambito che si muove la
statistica economica e sociali.
33
Giovedì non c‟è Persico. Mentre lunedì c‟è lezione per quelli del turismo in aula
teledidattica.
Vi ho aggiunto questa piccola parte perché mancava. Questo è il materiale ufficiale del
Sistan, non l‟ho fatto io non mi prendo meriti che non ho. A livello europeo è stato
sviluppato un codice di statistiche ufficiali. È differente rispetto al codice della
Statistica ufficiale. Perché è il codice italiano delle statistiche ufficiali.
Mentre il codice delle statistiche ufficiali è una raccolta di leggi, il codice italiano
delle statistiche ufficiali è un insieme di regole, di principi, ai quali si devono
attenere gli enti produttori di statistiche ufficiali. Lo vedremo abbastanza
brevemente, è un elenco con una piccola descrizione, le cose da dire non sono
tantissime. .
Il codice italiano delle statistiche ufficiali è del 2010, sufficientemente recente,
concepito insieme al codice europeo. C‟è un tentativo di uniformare la produzione
statistica ufficiale in tutta l‟Unione europea.
Il codice italiano è l‟esito di un processo condiviso di analisi e consultazione che ha
coinvolto i principali attori centrali e locali del Sistan. Ha come obiettivo
fondamentale la promozione di una cultura comune di attualità a sostegno della quale
sono indicati principi e parametri di valutazione degli assetti istituzionali dei processi
e dei prodotti della statistica.
Per il principio detto prima, che la conoscenza è una forma di democrazia. Dato che il
dato statistico è una forma di conoscenza, fonte di informazione e conoscenza,
diventa anche forma di democrazia mettere a disposizione questi dati, e che siano
corretti.
Quali sono le definizioni che possiamo dare di alcuni elementi chiave? Questa è una
parte che mancava. Tanti discorsi, ma al definizione formale di statistica ufficiale non
l‟avevamo data. La statistica ufficiale è la produzione statistica contenuta nel
Programma statistico nazionale (l‟avevamo detto, è importante tenere presente che è
produzione statistica tutto ciò che avviene qui) , nei programmi statistici regionali e,
in generale, quella prodotta dal Sistan, intendendo tutti gli enti ed organismi pubblici
di informazione indicati in quelle leggi. La statistica ufficiale è tutta la produzione
statistica sviluppata secondo il programma statistico nazionale o regionali. Questa
produzione statistica è quella che viene sviluppata dagli enti che sono indicati in quelle
voci.
Quali sono gli obiettivi del codice? Accrescere la fiducia nella indipendenza integrità e
responsabilità dei produttori della statistica ufficiale, nonché rafforzare la
credibilità e migliorare la qualità dei prodotti diffusi.
La statistica ufficiale è incontestabile. Se dovete preparare una tesi triennale o
specialistica e portate i valori del PIL proposti dall‟Istat o dall‟Eurostat non saranno
mai contestati. Se portate dati o informazioni sviluppati da enti non ufficiali
produttori di statistica, possono essere contestate queste informazioni: le famose
battaglie sui numeri.
34
Quali sono i destinatari del codice? Il codice ha una doppia valenza. Ha dei destinatari
che sono gli enti produttori di statistiche, gli enti e uffici di statistica del sistema
statistico nazionale per la produzione delle per la produzione delle statistiche e
statistiche ufficiali. Per sapere che esiste il codice, gli utenti sono tutti coloro che
hanno accesso ai dati, con lo scopo di attestare l‟imparzialità delle autorità
statistiche, nonché l‟obiettività, l‟affidabilità e l‟attendibilità delle statistiche da essi
prodotti e diffuse.
È il discorso di prima. Questo codice, è un elenco numerato, rappresenta i principi ai
quali si ispirano i produttori di statistiche ufficiali. Obiettivo di sollevare una
sensazione di sicurezza nei confronti delle statistiche ufficiali, si sa che sono
prodotte con questo spirito.
Sono importanti questi punti per i fornitori di dati ai fini di assicurare loro la giusta
tutela della riservatezza. C‟è un punto, riservatezza: i dati raccolti per fini statistici
non possono essere diffusi in forma non aggregata. Se date una informazione sulle
vostre condizioni di salute o vi viene analizzata la vostra cartella clinica, vi deve
essere garantito che i dati sulle vostre cartelle cliniche, dati reddituali, non vengano
diffusi in nessun modo, se non in forma aggregata. Quanti sono i malati di sclerosi
multipla, malati di tumore, di quanto sono cresciute le malattie della pelle, eccetera.
Vediamo i 15 punti. Sono divisi in tre gruppi: contesto istituzionale, processi statistici
e produzione statistica. Non mi aspetto che all‟esame li conosciate tutti, ma magari i
principali. È possibile una domanda relativa al codice italiano della statistica ufficiale.
È sufficiente che mi spiegate cosa è, ricordare le tre categorie e qualche punto che vi
ha interessato. Non voglio che li sappiate a memoria come se fossero tabelline o dei
pezzi dell‟Eneide.
Contesto istituzionale. Quali sono i punti del codice che riguardano la struttura che
esegue l‟indagine? I fattori istituzionali e organizzativi influiscono in modo rilevante
sull‟efficienza e sulla credibilità della statistica ufficiale. Chi produce statistiche
deve essere credibile. Se l‟Istat non fosse credibile, i suoi dati prodotti non
sarebbero credibili. La credibilità è un aspetto importante.
Gli aspetti da considerare sono: l‟indipendenza professionale. Se l‟Istat producesse
dati su ordine del governo di passaggio e taroccasse i dati a seconda del governo ecco
che non avrebbe alcuna credibilità, indipendenza professionale significa indipendenza
da qualsiasi organismo politico: se il PIL è in calo lo è, non si può dire il falso.
Mandato per la rilevazione dei dati. Ci deve essere un mandato che autorizzi la
raccolta dei dati, adeguatezza delle risorse, impegno a favore della qualità,
riservatezza statistica, imparzialità e obiettività, che sono i sei punti iniziali.
Indipendenza professionale è uno dei più importanti. Il mandato per la raccolta dei
dati è un mandato giuridico in base al quale vengono raccolte le informazioni. Ci deve
essere una legge che sancisce che l‟ente deve raccogliere e produrre informazione
statistica. Adeguatezza delle risorse: è importante sapere che un ente dedica risorse
adeguate a differenti indagini.
35
Impegno in favore della qualità. Tutti i membri del sistema statistico nazionale si
impegnano ad operare e collaborare conformemente ai principi fissati dalla
dichiarazione sulla qualità del sistema statistico europeo.
Altro punto importante è la riservatezza statistica. Assolutamente garantita la tutela
di dati personali dei fornitori di dati: famiglia, imprese, amministrazione ed altri enti
rispondenti, così come la riservatezza delle informazioni da esse fornite e l‟impiego di
esse ai fini esclusivamente statistici.
Sulla prima parte i più importanti sono l‟indipendenza professionale e l‟indipendenza
statistica, anche l‟imparzialità e l‟obiettività. Questi i più significativi.
Processi statistici. Questa parte, quattro punti, riguarda il processo di produzione, di
definizione dell‟indagine. Non è la produzione del dato, è proprio il disegno della
procedura attraverso la quale si vanno a raccogliere i dati. Gli orientamenti, le buone
pratiche e gli standard nazionali e internazionali vanno pienamente rispettati nei
processi utilizzati dalle autorità statistiche per organizzare rilevare elaborare e
diffondere le statistiche ufficiali. Un‟efficiente gestione rafforza la credibilità delle
statistiche.
Gli aspetti rilevanti sono una solida metodologia, procedure statistiche appropriate, un
onere non eccessivo sui rispondenti e l‟efficienza rispetto ai costi. Significa che
l‟Istat, ma tutte le strutture del Sistan, devono procedere con le più aggiornate
metodologie. Se ci sono nuove tecniche, devono cercare di utilizzare nuove tecniche,
nuove metodologie. Non vediamo differenze tra tecnica, metodologia e metodo.
Usiamoli come sinonimi. Solida metodologia: le statistiche di qualità devono fondarsi
su una solida metodologia: ciò richiede, strumenti procedure e competenza adeguata.
Procedure statistiche appropriate, onere non eccessivo sui rispondenti, non pesare
troppo sugli intervistati facendo mille domande, ma cercando di avere questionari
leggeri, efficienza rispetto ai costi: le risorse devono essere usate in maniera
efficiente.
Infine, come devono essere i dati che vengono pubblicati prodotti? La prima parte
riguarda l‟istituzione, l‟ente che va a produrre dati. La seconda parte è il modo in cui
produciamo dati e il terzo è il prodotto. Abbiamo l‟azienda, la macchina per fare i
biscotti e i biscotti, le tre parti.
La produzione statistica è il risultato del processo statistico. Le statistiche
disponibili devono soddisfare le esigenze degli utenti. Rispettano le norme sulla
qualità e rispondono ai bisogni delle istituzioni, amministrazioni pubbliche, istituti di
ricerca delle imprese e del pubblico in generale. Aspetti importanti delle statistiche
sono la pertinenza, accuratezza, attendibilità, tempestività, coerenza e comparabilità.
Li rivedremo la settimana prossima. Una volta si credeva che una produzione statistica
fosse adeguata, buona, quando era accurata, quando stimava in maniera corretta una
certa quantità, ora gli aspetti sono più ampi.
Pertinenti, devono avere un senso, non si fanno statistiche che non hanno senso.
devono essere accurate e attendibili, rispecchiare la realtà.
36
Devono essere tempestive e puntuali, è inutile fare una indagine e pubblicare i dati del
1995 oggi. Devono essere tempestive, veloci, più aggiornate possibili.
Coerenza e confrontabilità. Ragioni ovvie. I dati devono avere coerenza, i dati devono
essere calcolati nello stesso modo coerentemente in modo da garantire
confrontabilità nel tempo e nello spazio. Se misuro l‟inflazione secondo un certo
criterio, questo criterio deve valere per tutta Italia, Europa, usando lo stesso criterio
per molti anni così ho una confrontabità non solo spaziale ma anche temporale.
Accessibiltà e chiarezza. Le statistiche ufficiali devono essere presentate in una
forma chiara e comprensibile, devono essere diffuse in maniera conveniente e
opportuna, ed essere disponibili ed accessibili con imparzialità, con i relativi metadati,
e le necessarie istruzioni.
Cosa sono i metadati? Piccoli documenti, abbastanza brevi ma qualche volta anche
piuttosto lunghi, che descrivono come i dati sono stati raccolti, da chi sono stati
raccolti, contengono anche delle definizioni, cosa si intende per disoccupato se si ha
un indice di disoccupazione, è un testo che descrive la modalità di raccolta dei dati in
maniera tale da garantire nello spazio e nel tempo, a persone di altri paesi o di altri
tempi, di sapere come ciascun indice è stato calcolato, si chiamano metadati.
Famosa terna: Micro macro e mega dati. Microdati sono le singole rilevazioni. Ciascun
foglio di famiglia del censimento è il micro dato, la singola unità statistica. Macro dato
aggregazione delle singole unità statistiche, quanti siamo, in Liguria a Genova, , gli
stranieri a Genova, disoccupati a Genova, eccetera. I meta dati sono le descrizioni di
questi dati. Che cosa sono, come sono stati calcolati in che periodo, se sono periodi
differenti e così via.
Tutto questo lo troverete su aula web spero da oggi pomeriggio. Ho aggiunto una
piccola slide sul censimento, è inutile guardarla, è abbastanza breve.
37
LE FONTI STATISTICHE UFFICIALI DELLE STATISTICHE ECONOMICHE E
SOCIALI
Ci focalizziamo sulle fonti delle statistiche ufficiali in ambito economico e sociale, in
particolare ci soffermeremo su Istat ed Eurostat,
sono le strutture che
maggiormente vengono utilizzate.
Una piccola premessa. Sappiamo che l‟Istat è principale ente produttore della
statistica ufficiale in Italia. Lo sappiamo, l‟abbiamo definita, sappiamo come è stata
costituita e perché, quali sono le indagini principali che fa, ma come pubblica i dati? I
canali sono gli stessi sia per l‟Istat e per altri enti nazionali, nazionali esteri o
internazionali di statistica. I canali sono sempre tre.
Comunicati stampa brevi e frequenti relazioni di carattere anche mensile su alcuni
fenomeni importanti. Ogni mese abbiamo le stime su disoccupazione, indice dei prezzi
PIL eccetera, produzione industriale.
Banche dati, dati che possono essere rianalizzati.
Volumi e pubblicazioni annuali o studi monotematici di approfondimento. Gli stranieri
a Genova. Un lavoro specifico sugli stranieri a Genova, per esempio. Inoltre, è
importante che tutti i lavori delle statistiche pubblicate da enti che rientrano nel
Sistan siano accompagnati dal curatore o dai curatori del volume.
Se voi state cercando dei dati sul turismo, o sull‟economia della cultura, e non trovate
quello che cercate, su queste pubblicazioni, o su questi siti, trovate sempre il nome di
un riferimento al quale potete chiedere approfondimenti.
Oltre a questi, è possibile che vengano distribuiti dei micro dati. Già citati prima. Sono
i dati relativi alle singole rilevazioni. Se si fa uno studio sugli accessi ai musei
genovesi, è possibile che non solo venga detto quanti accessi sono stati fatti a Genova,
ma anche che siano disponibili dati con accessi per ciascun museo in ciascun mese
dell‟anno. È un micro dato che non verrà pubblicato, non si può pubblicare sempre tutto
quello che si raccoglie, ma se si fa uno studio di relazione tra i passeggeri sbarcati a
Genova per le crociere e gli effetti sugli accessi ai musei genovesi ecco che dovete
sapere mese per mese quanti sono stati gli sbarchi e l‟accesso ai musei genovesi.
Correlazione tra i fenomeni, dipendenza del numero dei musei e croceristi e potete
provare a sviluppare un modello. Ci sono situazioni in cui i dati non sono pubblicati e
non sono disponibili.
Si può alzare il telefono e chiedere: sono uno studente unige, tesi su questo, vorrei
sapere se è possibile avere dati più dettagliati, micro dati, relativi a questi studi. Vi
possono dire si, no, ci sono ma non potete averli perché coperti da privacy perché
magari sono dati sanitari.
Il problema principale che c‟è con la produzione statistica ufficiale è di tempestività.
I dati devono essere tempestivi. Perché se pensiamo al censimento 2001 è stato
completato il 21 luglio 2005, ci sono voluti quattro anni per completare tutta la
procedura censuaria. Ci sono problemi di tempestività nella produzione statistica
38
ufficiale. Questa è la ragione per cui molto spesso vengono utilizzati questi documenti
flash, comunicati stampa, di cui parlavamo prima, che anticipano studi più completi.
Guardiamo il sito dell‟Istat. Se voi fate www.istat.it ottenete una pagina web fatta in
questo modo. Ci siete mai andati sul sito Istat? Andateci a vederlo, anche se c‟è di
meglio da fare.
È molto cambiato rispetto alla versione di due anni fa. Chi ha la vecchia presentazione
vedrà cambiamenti. È cambiato profondamente come interfaccia. La navigazione può
avvenire su più livelli. A sinistra ultime notizie, che cosa è stato pubblicato: elenco
amministrazioni pubbliche, occupati disoccupati mensili, codici comuni provincia e
regioni, ci sono una serie di news, ultime novità di dati e produzione statistica
dell‟Istat.
Dopodiché c‟è questa parte centrale in cui vi viene dato un grafico in tempo reale sui
dati di una qualche caratteristica, in questo caso dovrebbero essere gli occupati. Ci
sono altre opzioni che possono essere scelte. Abbiamo un banner che da notizie chiave
e una forma di navigazione che potrebbe sfuggire: prodotti strumenti informazione,
statistiche per regione ed argomento.
Il sito dell‟Istat è il primo riferimento per le statistiche ufficiali italiane. La home
page contiene dati aggiornati sui temi di interesse economico e sociale. I grafici
mostrano le serie storiche, rilevazione dello stesso fenomeno nel tempo ad intervalli
di tempo equi spaziati. Notizie e menu che permettono di trovare le notizie per
regione e argomento. Se volete produzione statistica dell‟Istat sulla Liguria, in alto a
destra.
Immaginiamo di prendere argomento. Strutture e competitività dell‟impresa, ambiente
energia, popolazione, condizioni economiche delle famiglie, prezzo, lavoro, cliccate la
sopra e si apre la pagina relativa all‟argomento con le ultime pubblicazioni relative
all‟argomento e grafici interattivi sull‟argomento, in questo caso prezzi.
Proviamo ad aprire conti economici trimestrali. Nel secondo trimestre 2012 il PIL cala
dello 0,8% rispetto al trimestre precedente e del 2, 6% in un anno. Notizia in breve
andiamo a leggere sull‟argomento. Clicco su conti economici trimestrali e si apre una
pagina sul documento con una prima descrizione: nel secondo trimestre 2012…
Ogni sezione racchiude novità e studi approfonditi sugli anni precedenti. Ad ogni
analisi vengono associati vari documenti. Testo integrale (nella colonna al centro),
serie storica, triangoli di revisione, scheda di revisione. No nel dettaglio per i triangoli
di revisione. Sono tutti documenti che vanno associati ad un unico soggetto.
Se guardate li in fondo, sono indicati numeri telefonici. Se volete avere informazioni
aggiuntive trovate l‟e-mail e il numero di telefono per contattare la persona.
Proviamo a guardare il testo integrale. Cosa è? È un documento fatto in questo modo.
File pdf di un certo numero di pagine, sette pagine, con sei tavole, figure e grafici. Un
glossario, cosa si intende per ciascun aggregato di dati, e nota metodologica per
sapere come sono stati raccolti i dati e in che modo sono stati analizzati.
Ciò risponde a criteri tempestività e trasparenza. Le notizie flash, una volta si
chiamavano comunicazioni, dà l‟idea di fotografia veloce sull‟argomento. Non sono
39
lavori sistemici. Parlano dei conti economici trimestrali del secondo trimestre 2012 e
ci dicono anche quando ci sarà prossima diffusione, 10 dicembre 2012, state sicuri che
uscirà il nuovo documento, ci diranno andamento PIL a livello tendenziale e
congiunturale. Poi ci sono tavole dati. Posso scaricare dati associati a documenti con
struttura in excel di questo tipo.
Differenti rispetto alle tavole dati sono le Banche dati Istat, ce ne sono parecchie,
con tanti dati disponibili.
I.stat offre un patrimonio informativo statistico completo ed omogeneo. I dati sono
organizzati per temi, presentati in tavole multi dimensionali e corredati di un ampio
apparato di meta dati, cioè di descrizione dei dati.
Se voi andate a guardare sulla sinistra dati su censimento agricoltura, censimento
popolazione e abitazioni, ambiente ed energia, salute e sanità, sono le stesse categorie
viste nel menu per argomenti. Si può cliccare su uno di questi campi e si aprono le
tabelle che si possono rielaborare differentemente.
I metadati sono un insieme di informazioni che servono a capire come i dati resi
disponibili siano stati raccolti e come debbano essere interpretati. Metadati PIL
troviamo questa spiegazione. Poi vedremo presentazione specifica sul PIL. Il 19/10/11
l‟Istat ha rilasciato le nuove serie annuali di conti nazionali basate sulle versioni più
aggiornate della classificazione dell‟attività economica nel tempo e dei prodotti per
attività. Allo stesso tempo, come in altri paesi europei, le serie storiche dei conti
nazionali sono state oggetto di una revisione straordinaria alla quale ha beneficiato di
miglioramenti nei metodi e nelle fonti.
Il PIL ai prezzi di mercato rappresenta il risultato finale dell‟attività di produzione
dell‟unità produttrice residente. Deducendo dal PIL gli ammortamenti si ottiene il
prodotto interno netto…. Spiega tutto come è stato calcolato, perché non ci siano
dubbi su come è stato derivato.
Ci sono anche altre banche dati. Per esempio possiamo avere dati su serie storiche
sempre su argomenti, si perde un po‟ di confronto rispetto alle statistiche per
argomenti: ambiente energia, popolazione famiglia, sanità, salute, giustizia, istruzione,
cultura, eccetera. Se vogliamo avere dati nel tempo, questa risorsa può essere
disponibile. Questi dati sono stati raccolti secondo i criteri del codice delle
statistiche ufficiali.
Anche altri dataset: statistiche per le politiche di sviluppo, sistemi di indicatori
territoriali, Sistema Amministrativo Storico della Amministrazioni Territoriali
(Sistat), l‟atlante statistico territoriale delle infrastrutture, l‟atlante statistico dei
comuni . Tutti questi sono nel sito dell‟Istat, queste sono banche dati esclusivamente
trasversali che includono più argomenti: economia, sociale, popolazione.
Poi altri dataset puramente economici, per esempio Rivaluta, non è una banca dati, ma
un servizio che permette di aggiornare secondo l‟inflazione per esempio gli assegni
familiari. Se era stato stabilito che un marito desse 1.500 euro alla moglie nel 2006,
quanto deve dare oggi secondo le rivalutazioni? Si usa questo sistema, ufficiale
dell‟Istat, inattaccabile.
40
Coeweb statistiche del commercio estero.
National Summary del FMI, una pagina riassuntiva contenente dati più significativi
prodotti da Istat, BDI Ministero dell‟economia e delle finanze secondo gli standard
richiesti dal FMI.
E poi dati congiunturali sulle retribuzioni contrattuali.
Ancora altri di ambito economico. Abbiamo il sistema informativo su agricoltura e
zootecnia e il sistema di indagini sulle acque. Tutti dati che vengono prodotti
dall‟Istat pubblicati e resi disponibili a tutti.
Perché vi faccio questa carellata? Perché non ho la più pallida idea di che tesi voi
farete per la vostra triennale. Può capitare che vi serva qualcuno di questi dati,
almeno sapete che c‟è una fonte statistica ufficiale che produce questi dati. Se
farete tesi di tipo economico, con un minimo di aspetto quantitativo, non proprio una
tesi di diritto pura, se cercate dati li potete trovare qua, serie storica, ma anche
Isat o I.stat è uno dei punti di rifermento più importanti sull‟Italia, poi vedremo cosa
fa l‟Eurostat a livello europeo.
Demo Istat per aspetti più demografici, come indirizzo dovrebbe essere
demo.istat.it, che permette di sapere la popolazione residente per età sesso e stato
civile a livello di comune, inclusi gli stranieri. Da anche le previsioni della popolazione,
non a livello di comune ma a livello di provincia. Ci sono anche previsioni della
popolazione sino al 2065 a livello italiano e a livello provinciale.
Questo può essere interessante per chi vuole fare una indagine sul servizio sanitario
nazionale e vuole capire la situazione demografica (anziani maschi femmine stranieri)
di qui a dieci venticinque anni.
Ci sono anche altre banche dati di tipo sociali. Abbiamo un dataset sulla coesione
sociale, simile come struttura a I.stat, struttura simile, che raccoglie le statistiche
relative agli aspetti di coesione sociale: biografia, lavoro, capitale umano, portatori di
handicap (quanti portatori di handicap si sono iscritti nelle scuole), eccetera.
Poi ci sono sistemi informativi su professioni, sulla giustizia, cultura, scuola università
e lavoro, altro dataset molto importante è Health for All, si utilizza spessissimo,
raccoglie dati non solo sulla salute, ma anche permette di sapere le cause di mortalità,
quante sono le malattie croniche, infettive, quanto viene dedicato di bilancio alla spesa
sanitaria di ciascun paese. L‟Italia aderisce a questo sistema internazionale di
database sanitario, e poi dati sulla disabilità.
Infine, ormai stanno morendo, se ne fanno molto di meno, le monografie, “Il valore
della moneta in Italia dal 1961 al 2008”, sono studi che vengono fatti una volta ogni
tanto. Questo è del 2009, difficilmente verrà riaggiornato se non tra parecchi anni. A
quel punto le rivalutazioni vengono fatte usando Rivaluta. Non fate trarvi in inganno da
questo prezzo: 20 euro. Tutti i documenti dell‟Istat sono assolutamente gratuiti, si
possono scaricare in pdf. 20 euro costa la versione cartacea, allora è un discorso.
Andate un po‟ a vedere il sito se ne avete voglia. È interessante capire quanti dati
siano disponibili. Se uno ha bisogno di dati prova a vedere se trova quello che serve.
41
Voglio che vi rimanga nel cranio che sul sito di Istat ed Eurostat trovate vari dati
sicuri, validati, incontestabili, sugli argomenti della vostra tesi di laurea.
L‟EUROSTAT. Non ha un indirizzo www. Eurostat.it scrivete Eurostat su Google e lo
trovate immediatamente.
Ha varie sezioni. Selezionate statistics in alto a destra e quello che ottenete è questa
pagina in cui avete le statistiche suddivise per tema o argomento. Avete statistiche
generali e regionali, economia finanza, popolazione e condizioni sociali, industria
commercio e servizi, agricoltura e pesca, commercio estero, trasporti, ambiente ed
energia, scienza e tecnologia.
Prendiamo economia e finanza, sezione più ampia. Seleziono HICP Indice dei prezzi al
consumo armonizzati. Che cosa succede? Arriviamo ad una struttura simile a quella
vista dell‟Istat. Trovo tabelle, database, e documenti sotto forma di news o flash, o
documenti che sono annuari che ricoprono un intero anno.
Gli indici dei prezzi fanno riferimento all‟inflazione. C‟è una piccola descrizione del
fenomeno inflazione e cosa include l‟indice dei prezzi al consumo armonizzato, e
seleziono principali tabelle.
Si aprono dei documenti di questo tipo: IPC tutti beni: cibo alcol tabacco, vestiti, casa,
salute, trasporto, comunicazione, ricreazione e cultura, educazione. Tutti gli item
esclusi energia cibo alcol e tabacco. Questi dati sono rappresentati a livello mensile
per tutti i paesi UE. Sono indici armonizzati.
Il valore di base indice 2005 uguale 100. Su questi vedremo ulteriormente. Mi
interessa che vi permette di avere una analisi storica e geografica dei valori.
Confrontabilità temporale e spaziale. Spaziale per riga e temporale per colonna.
Inoltre ha anche tre linguette: table, graph map. Vi permette anche di fare dei grafici
se non siete in grado di farli con Excel. Per esempio, sono molto simili, ma abbiamo
che la Bulgaria ha avuto dal 2005 al 2011 un aumento dei prezzi del 40%, Estionia 30%
Grecia incremento 20% e altri paesi sono allineati. Abbiamo la zona euro, Belgio,
Repubblica Ceca, Danimarca, eccetera. Si possono selezionare varie opzioni.
Altra cosa carina da sfruttare ai fini della tesi è la rappresentazione su mappa. Vi
colora diversamente i differenti paesi per intensità del fenomeno. Vediamo Italia,
Svizzera, Germania, Francia, Olanda e Irlanda valore compreso tra 104 e 110. Turchia
Bulgaria Ungheria e Romania hanno avuto una crescita dei prezzi nell‟ordine 30-56%
dal 2005 a 2011 anche i Paesi Baltici e l‟Islanda. Questo come prima rappresentazione.
È poi possibile avere una rappresentazione a livello regionale per i dati forniti a livello
regionale.
Questa è una rappresentazione naz2 mentre questa è una rappresentazione è naz1
dove naz sono le Unità statistiche territoriale di livello 1-2-3 (paesi, regioni,
province); con l‟Eurostat non si arriva al naz 3, ci si ferma al due.
In questo caso ho il trasporto marittimo secondo le naz2. Vengono escluse, sono
grigie, dati non disponibili, i terreni che non hanno un porto. L‟Italia è abbastanza
colorata tutta perché quasi tutte le regioni hanno un porto. Tutta la Costa azzurra,
Costa brava, Lusitania, nord della Spagna, Francia e Inghilterra sono colorate come
42
coste perché evidentemente hanno i porti. Queste sono mappe che si possono
ottenere con pochi clic e sono di aiuto per la lettura dei dati e della loro
visualizzazione su cartina geografica, servizio totalmente gratuito.
Anche qui abbiamo i meta dati che ci dicono come sono raccolti i dati. In questo caso
la descrizione più complessa, ci sono a volte differenze tra i paesi che devono essere
esplicitate.
Poi ci sono una serie di database piuttosto importanti. Per esempio i dati mensili
complessivi, abbiamo i pesi dei differenti paesi, ci sono tutta una serie di informazioni.
I database hanno una struttura tabellare, abbiamo i paesi e anni.
Come produce i dati l‟Eurostat? Esattamente come l‟Istat. Produce i documenti che si
chiamano news releases ma di ambito europeo. Ad esempio l‟inflazione nell‟area euro è
salita al 2,4%, invece l‟Unione Europea è stabile al 2,8%.
Documenti che si
assomigliano alle notizie flash dell‟Istat. Sono documenti brevi, di poche pagine, che
vengono rilasciati in date ben stabilite.
Disoccupazione gennaio 2011 giorno 1. Rilasciato… Scorrendo l‟elenco vedo ciò che è
stato rilasciato e quello che non è ancora stato rilasciato. Se ci sono ritardi si indica
delate e viene indicato quando verrà rilasciato. Questo per avere una informazione
tempestiva, un supporto complessivo nelle decisioni.
Poi ci sono dei documenti un pochino più approfonditi. In questo caso ci sono gli indici
armonizzati dei prezzi al consumo, documenti un po‟ più lunghi, sette pagine, lo vedete
scritto piccolino, documenti chiaramente gratuiti e disponibili. Se andate sul web
Eurostat potete trovare queste news elencate.
Sono documenti abbastanza scarni, vorrei vedere con voi un documento ufficiale, che
descrivono gli avvenimenti di riferimento (importante). È importante sapere che la
produzione statistica ufficiale non dà mai interpretazioni di quello che è successo. Si
limita a dire che il Pil è cresciuto del 2,8%, in particolare la produzione industriale è
cresciuta dell‟1,2% e l‟altro settore è cresciuto di più. La disoccupazione è diminuita.
Nel dettaglio è diminuita tra i giovani.
Non ci sono interpretazioni. Non spetta né a Istat né a Eurostat dare interpretazioni
di ciò che è successo. Troverete descrizioni e confronti con ciò che è successo nel
passato. Non troverete ami spiegazioni del perché è cresciuta inflazione, del perché
siano scesi turisti o siano aumentati i malati di tumore. Ci saranno sempre confronti
spaziali e temporali, non perché. Non spetta all‟Istat dare interpretazioni. Devono
essere oggettive, ne abbiamo parlato prima. Nelle 15 regole c‟è la regola di
oggettività. Le relazioni statistiche ufficiali sono puramente oggettive.
Poi ci sono anche i libri e i tascabili (poketbooks). Documenti corposi su statistiche
economiche europee e statistiche di prezzo europeo. 300-600 pagine pieni di tabelle e
grafici di raffronto in cui si danno delle letture delle tabelle: dopo la caduta del muro
di Berlino i prezzi in Russia sono aumentati di tot, si danno degli andamenti.
Differenti i poketbooks, libretti di 200 pagine, di formato non standard, non di
formato A4, sono la metà di un A4, che contengono aspetti chiave. Per esempio i
43
poketbook dei dati economici dell‟UE, valori chiave su business europeo, manuale sulle
statistiche euro mediterranee. Hanno tutte logo Eurostat, commissione europea.
Anche qua abbiamo dei documenti puramente metodologici per la ragione di solidità
della metodologia. Ci sono dei lavori che dicono come deve essere condotta una
indagine sulla povertà e la deprivazione materiale nei paesi europei.
Se l‟Eurostat concorda con gli enti statistici nazionali di andare a fare una indagine
sulla povertà, questo concordare significa realizzare assieme un manuale che detti le
regole operative. Allora tutti i paesi aderenti all‟UE e che producono statistiche per
l‟Eurostat e la CE si adeguano a queste direttive in maniera che i dati abbiano una
perfetta confrontabilità, perché finiranno in un calderone unico, come le tabelle che
abbiamo visto prima, paese ed anno.
Se vado a vedere statistiche che l‟Eurostat produce, sono tutte statistiche che fanno
riferimento ad ambiti europei. Non trovate grandi statistiche sulla giustizia, ma
statistiche sull‟ economia (perché è un sistema unico), sulla popolazione. C‟è qualcosa
su crimine e giustizia criminale. Però in linea di massima le dimensioni principali sono le
dimensioni di competenza dell‟UE. Quindi grossi fenomeni, macro economici. Sono
principalmente variabili di interesse macro economico.
Ci vediamo martedì prossimo e parleremo dei dati amministrativi.
LEZIONE 5
09/10/12
La prossima volta inizierà il professor Persico, le sue lezioni, e parlerà un pochino delle
indagini, dei dati amministrativi che potete trovare all‟interno delle aziende e così via.
Aggiornamenti. Spero che in settimana aula web sia attiva in maniera tale da caricare
le presentazioni. Tutti i file che ora vedrete li caricherò e metterò su ancora file che
non abbiamo visto ma utilizzeremo. Qualcuno sarà modificato, alcuni aggiunti. Sono
enumerati in maniera sequenziale per l‟ordine di studio.
Come vi avevo accennato, stiamo affrontando temi piuttosto discorsivi. Le domande
che vi dovete attendere su questi argomenti sono di tipo teorico. Questa è la ragione
per cui io non ipotizzo la prova orale aggiuntiva rispetto alla scritta. Le domande del
compito saranno già in parte domande di carattere teorico.
Facendo il punto della situazione, siamo partiti definendo il concetto di Statistica, che
non avevamo affrontato in maniera così storica in statistica 1, l‟abbiamo guardato in
una prospettiva piuttosto ampia, considerando il concetto di statistica e il concetto di
probabilità.
La statistica economica e la statistica sociale sono prevalentemente statistiche
applicate, e la statistica del turismo, sono statistiche applicate a fenomeni differenti.
La statistica economica è la statistica macroeconomica, la statistica delle macro
aggregazioni economiche. La statistica sociale è la statistica demografica, della
popolazione, delle abitazioni, dei modi, delle persone di vivere. Quando parlavamo delle
indagini Istat dell‟uso del tempo oppure sui viaggi e vacanze li stavamo parlando di
statistica sociale.
44
La statistica economica, come vedrete, si distingue molto da un‟altra disciplina, che si
chiama econometria. Mentre la statistica economica ha l‟obiettivo di riassumere
fenomeni macroeconomici e sociali, l‟econometria costruisce modelli interpretativi
delle fenomenologie economiche. Per esempio, se vogliamo prenderla alla larga,
l‟identità keynesiana è un modello macroeconomico/econometrico, le statistiche sulla
disoccupazione, come misurare il PIL, l‟inflazione, l‟indice dei prezzi al consumo, la
produzione industriale, l‟attività di misurazione dei fenomeni macroeconomici è tipica
della statistica economica. Vedrete nel prosieguo dei vostri corsi l‟econometria come
costruzione di modelli statistici.
Introdotta la statistica economica e sociale in questo modo, ci siamo posti il problema
delle produzioni statistiche degne di ufficialità, o degne di essere ritenute più
attendibili rispetto ad altre, abbiamo parlato di statistiche ufficiali, con i 15 criteri
del codice italiano della statistica ufficiale. Tra gli enti produttori di statistiche
ufficiali abbiamo nominato l‟Istat e abbiamo guardato la sua produzione statistica e i
modi in cui l‟Istat diffonde le statistiche ufficiali.
L‟Istat rientra all‟interno di un sistema di produzione di statistica ufficiale che si
chiama Sistan, dovrà anche rinnovare il sito web. Il Sistan è una rete di enti che
producono statistiche ufficiali, secondo una legge: programma statistico nazionale.
Abbiamo concluso guardando la produzione delle statistiche in ambito economico.
Abbiamo guardato come sono fatti il sito di Istat ed Eurostat, essendo l‟Eurostat un
non produttore di statistiche ufficiali, quanto più aggregatore di statistiche ufficiali.
L‟Eurostat raccoglie in un unico contenitore le statistiche provenienti da tutti i paesi
membri. La caratteristica importante di queste statistiche diffuse sul sito Eurostat è
che sono tutte omogenee rispetto a modalità di raccolta e di misurazione. Per esempio
l‟inflazione viene misurata nello stesso modo,tempi e sugli stessi oggetti.
45
FONTI STATISTICHE E AMMINISTRATIVE: ANALOGIE E DIFFERENZE
Adesso parliamo della differenza tra fonti statistiche e fonti amministrative.
Abbiamo detto che le statistiche ufficiali si dividono in: fonti statistiche, fonti di dati
che nascono proprio per finalità di tipo conoscitivo, statistico. Sono indagini fatte per
finalità statistiche, come per esempio il censimento, indagine sulla popolazione e tutte
le analisi dell‟Istat.
Diverse sono le fonti amministrative. Fonti di dati, di informazioni, che scaturiscono
da un processo di elaborazione, di attività, di un ente. I dati dell‟Inps, Inail, i dati
dell‟ACI, del registro automobilistico, dell‟anagrafe sono tutti dati che hanno origine
amministrativa. Questi enti che ho nominato, non hanno come scopo prioritario quello
della produzione statistica, ma hanno come finalità altri scopi rispetto a quello di pura
produzione statistica.
Tuttavia, raccolgono tutta una serie di dati che possono essere utili e importanti per
successive lavorazioni. Un esempio classico di fonte amministrativa è l‟anagrafe. Poi
abbiamo anche il PRA oppure il registro delle imprese.
Quali sono le analogie e le differenze? Un piccolo ringraziamento alla dottoressa
Militello, che è dell‟Istat, grazie alla quale ho recuperato alcune slides. Riprendiamo
in mano il discorso su fonte statistica. È il caso in cui l‟informazione è tratta da
annuari statistiche e da banche dati statistiche, per esempio il sito dell‟Istat, oppure
raccolta mediante appositi questionari. In questo caso si parla di rilevazioni dirette.
Sono eseguite dall‟Istat, o da altri enti del Sistan mediante una intervista diretta
rivolta alle famiglie, istituzioni, enti, strutture alberghiere eccetera.
Le fonti amministrative sono informazioni sulle unità statistiche raccolte dalle
amministrazioni pubbliche per finalità proprie dell‟ente: dell‟Inps, del registro
automobilistico, o derivanti da obblighi di legge. Esempio decessi, matrimoni,
trasferimenti di residenza, denunce di reati, dati sulle strutture sanitarie,
produzione scolastica. Queste lavorazioni sono indirette. Non fatte direttamente con
finalità statistiche, ma l‟informazione statistica è rilevata indirettamente da questi
archivi amministrativi.
Le rilevazioni statistiche possono essere caratterizzate da:
- Rilevazione completa, o universale, o totale: è estesa a tutte le unità
dell‟universo o popolazione statistica, è la classica rilevazione che abbiamo
anche chiamato censuaria. Tutti questi termini vanno bene per identificare una
indagine esaustiva sull‟indagine della popolazione. Non mi attacco troppo ai
termini, vanno bene tutte come definizioni. Abbiamo censimenti, matrimoni,
decessi, trasferimenti di residenza;
- Rilevazioni parziali. Riguardano una parte dell‟unità dell‟universo, definita
specificamente da un ricercatore. Se stiamo facendo una indagine sui laureati,
definisco come universo la popolazione degli italiani, ma come popolazione
parziale, universo parziale quello dei laureati. Abbiamo il censimento intermedio
dell‟industria e dei servizi. È un censimento, una rilevazione parziale. Sembra
46
-
quasi una contraddizione. No, non lo è nel momento in cui prendo un universo,
per esempio tutte le aziende e vado a fare una partizione di queste aziende e
vado a seguire uno studio censuario su questa partizione;
Rilevazione campionaria. È una indagine che indaga una popolazione, totale, o
partizionata nel modo precedente, ma non in maniera esaustiva, ma campionaria,
basata su un campione.
Abbiamo discusso abbastanza lungamente sulla indagine campionaria e sulla indagine
censuaria. Guardiamo un attimo il confronto tra le indagini totali e le indagini
campionarie. L‟indagine paraziale può essere ricondotta, in linea di massima, ad una
indagine campionaria anche se è un sottoinsieme dell‟universo di origine.
Se vogliamo fare uno studio di tipo censuario, vogliamo raggiungere tutte le unità della
popolazione di nostro interesse, andiamo incontro ad evidenti vantaggi e grossi
svantaggi.
Vantaggi. In primo luogo vediamo che con un censimento ho una ampia copertura del
fenomeno di interesse, copriamo tutti i possibili valori. Se cerco di valutare le
condizioni di vita degli italiani, con uno studio censuario, noi abbiamo una visione
completa. Il risultato è una fotografia completa. Inoltre, se abbiamo un gran numero
di unità statistiche, perché stiamo misurando su tutte le unità dell‟universo, stiamo
eseguendo uno studio censuario, noi avremo informazioni di dettaglio per tutta la
nazione, per ciascuna regione, provincia, comune sino ad arrivare alla singola sezione di
censimento, che è una zona con superficie più o meno ampia a seconda della
popolazione residente. A Genova nell‟ordine del 130. Le sezioni di censimento
coincidono con pochi palazzi.
Quali sono gli svantaggi di una indagine censuaria?
- Con una indagine campionaria vedo tutte le unità statistiche. Ma a che prezzo?
Devo raggiungere ciascuna unità statistica. Il costo di una indagine campionaria
è estremamente elevato;
- Tempi lunghi. Per raggiungere tante persone c‟è bisogno di molto lavoro e c‟è
anche bisogno di tanto tempo per andare a convertire le risposte che sono
state raccolte in forma cartacea, convertirle da forma cartacea a forma
elettronica.
- È possibile che ci siano errori. Se ho tantissimi questionari somministrati e un
numero di personale ridotto, è chiaro che vado incontro a errori di compilazione
del questionario che possono essere notevoli: mancate risposte, risposte errate,
risposte multiple dove dovrebbe essercene una sola, non ho tutto il tempo
necessario per fare verifiche sul singolo questionario;
- Problemi di copertura. Possiamo avere unità statistiche che possono essere
rilevate più volte o più frequentemente delle unità statistiche che non vengono
rilevate affatto. Problemi di sotto copertura. Quando la lista non include alcune
unità che effettivamente fanno parte della popolazione. Può accadere che ci
siano movimenti di residenti che non vengono colti dagli archivi anagrafici, sui
47
-
quali si basa inizialmente il censimento. Allora ci sono persone alle quali la
scheda del censimento non viene consegnata. Questi sono i classici problemi di
sottocopertura, corretti con una serie di tecniche che non andremo a vederema
sono interessanti;
Non si può pensare di avere quantità e qualità dell‟informazione allo stesso
tempo. Se eseguo uno studio su tutta la popolazione, il numero di domande che
andrò a fare inevitabilmente sarà ridotto. Non posso dedicare troppo tempo a
ciascuna unità statistica per vedere qual è l‟informazione che mi può dare.
Molto spesso, negli studi di tipo censuario, l‟indagine è poco approfondita, le
informazioni raccolte sono poco approfondite.
Diverso il discorso sulle indagini campionarie. Si può pensare che una indagine
censuaria sia migliore di una indagine campionaria. Uno dice vado a prendere tutte
le unità della popolazione, ho più unità rilevate rispetto a quelle che avrei
utilizzando un campione.
Questo non è in realtà vero. L‟indagine campionaria, essendo basata su un numero
di osservazioni molto minore di quelle che si utilizzano per una indagine censuaria,
consente all‟intervistatore di dare maggior cura all‟intervista. Dedico più tempo a
ciascuna persona, la si può seguire meglio, con più accuratezza se ha capito il
significato della domanda e, ad una seconda verifica dei questionari, si può
ritornare facilmente dall‟unità statistica intervistata per integrazione. C‟è tanto
lavoro nel censimento che la cura del dettaglio passa in secondo piano.
Il censimento richiede tempi molto lunghi. L‟informazione censuaria è una
informazione già vecchia quando viene diffusa. I dati del censimento, i primissimi
sono usciti a marzo, i primi dati sul censimento usciranno nel marzo 2013, dopo un
anno e mezzo dal giorno di riferimento del censimento del 2011. Da qui a un anno e
mezzo cambieranno le cose e i dati censuari sono piuttosto vecchi, servono come
grosso riferimento, come cartina torna sole di un certo fenomeno.
Invece, una indagine campionaria, è veloce snella. Consente di raccogliere le
informazioni che interessano anche in maniera approfondita e, in poco tempo,
avere un riscontro sulle informazioni raccolte. Sono delle informazioni che
permettono aggiornamento dei dati in tempo breve.
Il costo è più contenuto rispetto all‟indagine campionaria. Un minor numero di unità
statistiche da rilevare determina un minor costo complessivo dell‟indagine.
Errori controllabili. Non ci sono grossi problemi di sovra-sotto copertura. In linea
di principio, costruendo bene un campione, vedrete con Persico come costruire un
campione, per esempio stratificato, è possibile ottenere campioni che sono buone
immagini della popolazione di riferimento. Se il campione è una buona immagine
della popolazione di riferimento, uso l‟informazione proveniente dal campione per
l‟intera popolazione. Procedo con un processo di induzione o di inferenza.
Induzione significa dal particolare al generale.
48
Gli errori sono più controllabili. Ho la possibilità di costruire, scegliere bene le
unità statistiche da rilevare. Posso anche verificare, con maggior attenzione, la
qualità dei dati raccolti. Più tempo nella verifica delle risposte sul questionario. La
maggior frequenza è legata al fatto che avendo un costo minore, se l‟informazione
mi è di interesse, ripeto l‟indagine ogni sei mesi, ogni tre mesi, o, come fa La7
quando presenta i sondaggi elettorali ogni settimana (come cambia l‟orientamento
politico di settimana in settimana).
Bisogna considerare che la variabilità di settimana in settimana di quei sondaggi
elettorali può essere dovuta ad un fenomeno campionario. Non essere vere
modifiche dell‟orientamento politico degli italiani, ma che ci siano differenze del
0,5% legate al caso delle unità del campione. L‟indagine campionaria, perché ha un
costo limitato e un tempo di analisi veloce, si fa con maggior frequenza.
Inoltre, con la maggior frequenza, è possibile costruire serie storiche. Torniamo
ai sondaggi elettorali di La7. Se ogni settimana ho rilevazione sull‟orientamento
politico degli italiani, posso fare un raffronto dell‟andamento di un partito rispetto
a quest‟altro. Posso vedere se l‟orientamento rispetto al partito è salito, sceso o ha
comportamenti particolari.
Ci sono però degli svantaggi. Se non ci fossero svantaggi non avrebbe senso fare
studi campionari
- I valori che otteniamo sono stimati. Per stima, visto in statistica 1, intendiamo
un valore che ipotizziamo essere plausibile per una ignota quantità all‟interno
della popolazione. Se voglio sapere la percentuale di italiani che oggi voterebbe
per un certo partito, posso prendere 2000 4000 italiani e chiedere per che
partito vota oggi? Partito Pinco Pallino, 12,7% Non è detto che la popolazione
italiana sarebbe orientata su quella percentuale ma in quell‟ordine. Con stima noi
indichiamo un valore vicino ad una ignota quantità della popolazione.
- Disaggregazione territoriale non articolata. Se facciamo un sondaggio
elettorale su immaginiamo 4000 unità statistiche in tutta Italia, a Genova
quanti volete che ce ne siano, visto che siamo 600 mila su 60 milioni? Ci saranno
5 persone che vengono intervistate a Genova. Non è neanche detto che Genova
nei sondaggi elettorali venga considerata tutte le volte. Spesso si dice il 35%
della popolazione italiana vive in città al di sopra dei 50.000 abitanti? Il 35% va
intervistato in quelle città. Poi quali è tutto un altro paio di maniche È chiaro
che non siamo più in grado di estendere una informazione campionaria diffusa
su tutto il paese sino ad un livello comunale o di sezione di censimento. Se a
Genova intervisto 5 persone sulle 2000 intervistate, l‟informazione specifica su
Genova non è utilizzabile per una divisione territoriale. Disaggregazione
territoriale non articolata significa questo. Se voi vedete, gli approfondimenti
di Mannaymer a Porta a Porta o di altri sondaggisti politici, non vanno mai a
guardare il profilo geografico dell‟elettorato quanto più sociologico, che è
trasversale alle regioni. I laureati preferiscono Tizio; i disoccupati Caio. Coloro
che hanno un diploma preferiscono quest‟altro. In linea di massima la
49
-
-
disaggregazione a livello territoriale non è molto articolata, proprio perché non
si riesce ad arrivare ad un dettaglio articolato.
Diversamente è possibile avere una disaggregazione a livello di variabili socio
economiche demografiche trasversali all’intera nazione. Ho 2000 persone? 400
sono laureati. Su 400 ho una rappresentatività che ci consente di affermare
qualche .
Difficoltà di mantenere omogenei e confrontabili nel tempo gli aggregati.
Questo è un discorso complesso. Se facciamo una indagine campionaria, è
difficile riuscire a ripetere l‟indagine sotto le medesime condizioni. Se abbiamo
una popolazione molto fluida, cambia molto, di volta in volta, il mio campione
deve essere molto modificato. Conseguentemente succede che si perda
confrontabilità ed omogeneità dei dati nel tempo. Questo si riesce ad ovviare
usando dei campioni un po‟ particolari, chiamati Panels, si compongono di unità
statistiche sulle quali si rilevano un insieme di fenomeni ripetutamente nel
tempo. L‟auditel è un classico esempio di panels. Si compone di un campione di
popolazione italiana, selezionato secondo rappresentatività geografica, di titolo
di studio, anagrafica, di genere, viene rilevato sera dopo sera cosa guardano in
televisione. È un panels, le stesse unità statistiche sono rilevate ripetutamente
nel tempo.
IL DATO. È il risultato di una misurazione sperimentale.
L‟informazione raccolta mediante questionari e reperite da annuari statistici si
chiama dato statistico. Se è acquisto per via amministrativa mediante la
compilazione di appositi modelli che spesso sono cartacei si parla di dato
amministrativo.
Parliamo adesso di dati amministrativi, ritorneremo sui dati statistici per fare un
po‟ di raffronto. Le indagini basate sui dati amministrativi. Le informazioni sono
raccolte per finalità diverse da quella di produrre informazione statistica.
Abbiamo i certificati di nascita, archivi Inps sui dipendenti e archivi giudiziari. La
raccolta
avviene
mediante
compilazione
cartacea,
andiamo
verso
l‟informatizzazione delle procedure. Se domani andate a fare il cambio di
residenza, compilate il foglio di carta in cui scrivete dove andate ad abitare, chi
avete lasciato nell‟abitazione in cui abitavate. Dovete dire chi è residente
nell‟indirizzo di destinazione dove andate a vivere ora.
I dati amministrativi sono raccolti su entità individuali. È importante avere in
testa il concetto di unità statistica, per ogni analisi che dovrete fare. Un‟anagrafe
deve essere gestita su base individuale, per esempio. La anagrafe demografica, del
comune. Un registro di imprese deve avere come riferimento la ragione sociale, e
la partita iva dell‟azienda. I dati amministrativi sono raccolti su entità individuali.
Questo è un punto base, visto nel censimento, quando si parlava di contare le teste,
una per una, degli israeliti. L‟unità statistica deve essere ben definita, tutte le
misurazioni fanno riferimento ad una unità solamente. Se considerassimo le
50
aziende non in base alla partita IVA, ma in relazione all‟azionista di maggioranza e
considerassimo il fatturato in base all‟azionista di maggioranza, avremmo dei
pasticci.
Le indagini basate sui dati amministrativi consentono azioni da parte delle
amministrazioni che li gestiscono. Il fine statistico con cui si possono analizzare
tali dati è rivolto alla produzione di indicatori sintetici: frequenze, medie, indici, a
partire dalle informazioni disponibili. Per esempio prendo le aziende di un certo
settore, codificate secondo la codifica a-teco, e andare a vedere per esempio
quante sono le aziende nel settore trasporto marittimo fallite negli anni. Oppure
qual è la redditività media del settore? La confronto a quella del settore
trasportistico terrestre.
Gli archivi amministrativi possono essere distinti in relazione al grado di
centralizzazione e informatizzazione. Posso avere un unico archivio gestito a
livello centrale-nazionale, è il caso dell‟archivio sulle denunce dei crimini; separati a
livello locale (trasferimenti di residenza e anagrafi sociali). Non so se avrete letto
il decreto sviluppo governo Monti. Pare che oltre al censimento annuale, vogliono
anche un archivio centralizzato delle anagrafi. Le caratteristiche del sistema
amministrativo si distinguono tra:
- Archivio cartaceo
- Archivio informatizzato
In linea di massima la modalità di acquisizione dei dati amministrativi avviene in due
modi differenti. Uso di dati individuali (detti anche micro dati) o uso di dati aggregati
(o macro dati).
L‟uso di dati individuali è abbastanza raro, ma non così raro. Per esempio, quando si
dice che il numero di contratti di telefonia che Tim e Vodafone hanno attivato nel
2012 è tot, noi ci troviamo di fronte a dati amministrativi aggregati. 300 mila nuovi
contratti è un dato amministrativo, perché alla Vodafone non interessa avere un
archivio dei propri sottoscrittori, se non per avere nuovi contratti, definire nuovi
profili e giustificare col mercato la propria espansione. 300 mila nuovi contratti? Dati
aggregati diffusi con finalità di comunicazione ai mercati.
Spesso sono quelli che interessano al mondo. La Apple ha ordinato dieci milioni di mini
I-pad, notizia dell‟altro ieri. Significa che la Apple ha in programma vendere un certo
numero di unità di questo prodotto.
Diverso discorso riguarda i dati individuali. Sicuramente venite contattati dal vostro
gestore telefonico: promozione, buono di 60 euro al mese se riattivate il telefono
eccetera. Loro cosa fanno? Hanno un grosso elenco come se fosse in Excel, in cui c‟è
nome cognome, telefono e codice fiscale, e quanto avete consumato in traffico voce,
dati, sms, canoni eccetera. Utilizzando questi micro dati, questi dati che sono
amministrativi, usati per fatturare i dati, la Vodafone o la Tim può decidere di attuare
politiche differenziate di marketing. Può dire: se ha meno di 25 anni gli mandiamo la
promozione x, se ha più di 65 anni gli mandiamo la promozione y, cose di questo tipo.
51
Si possono differenziare le politiche di marketing a seconda del profilo del
consumatore. Il dato stesso può avere caratteristiche sia di uso di dato individuale,
per finalità di marketing o altro, e uso di dati aggregati che possono essere anche gli
stessi che in origine erano disaggregati, ma che vengono trasferiti in forma
aggregata.
Pubblicazioni Istat? Vi troverete di fronte a dati aggregati, in cui il livello di
disaggregazione arriva al limite al livello comunale. A volte, per i dati demografici, voi
potete sapere per ogni comune italiano quanti sono i residenti tra maschi femmine,
celibi, nubili, vedovi, vedove per ogni età. Quello è il massimo livello di disaggregazione
per i dati pubblicati dall‟Istat.
Dopodiché: io vorrei elenco di tutti i residenti del comune di Crevari per qualche
ragione. Perché volete aiutare il comune nel scegliere il servizio sociale più opportuno
da attivare per il 2013. Potete provare a chiedere i dati al comune che può darveli o
meno per ragioni di privacy.
Fonti amministrative. Potenzialità e limiti.
Se noi abbiamo dati interesssanti perché raccolgono informazione in sé, posso pensare
di utilizzarli senza andare a disturbare ulteriormente la persona. Se volessi capire
dove mettere il centro di ascolto per una comunità di sud americani, vado a vedere
dove c‟è la più alta concentrazione di sud americani a Genova e predisporla con delle
persone che parlino per esempio lo spagnolo; lo stesso per comunità rumene o albanesi.
Di cosa ha bisogno la comunità a Genova? Bisogna andare a raggiungere le unità
statistiche e intervistarle per capire loro esigenze, bisogni, che possono essere
differenti tra comunità e rispetto alla comunità italiana. Ecco che ci troviamo di
fronte a due casi. In un primo possiamo agire senza procedere a indagini campionarie
costose lo steso. Oppure noi dai dati amministrativi non raccogliamo tutta
l‟informazione di cui abbiamo bisogno e ci troviamo costretti a muoverci verso una
indagine di tipo campionario.
Le fonti amministrative hanno un ruolo importante per la costruzione delle liste della
indagine campionaria. Se devo fare una indagine sulle necessità delle comunità
straniere a Genova? Io creo un campione rappresentativo della popolazione straniera a
Genova, quella regolare, la irregolare è più complesso. Mi prendo i dati anagrafe, vedo
quanti stranieri ci sono, di che nazionalità, come si dividono in percentuale le varie
nazionalità, e poi vado a condurre indagini campionarie avendo rispetto di questa
proporzione. Se ho che il 35% dei residenti stranieri a Genova sono ecuadoriani? Il
campione sarà composto per il 35% da ecuadoriani. Nazionalità meno rilevanti? Non
valgono di meno, ma per rappresentatività rispetto alle nazionalità ci saranno meno
unità nel campione.
I dati amministrativi possono essere utilizzati per costruzioni di liste. La costruzione
di lista rappresenta l‟elenco di unità statistiche che compongono la popolazione. Quelle
unità che potenzialmente possono essere raggiunte attraverso l‟unità di
campionamento. Le altre cose sono banali.
Le fonti amministrative hanno dei limiti.
52
-
-
-
-
-
-
La raccolta dei dati amministrativi è progettata ed eseguita con fini diversi
rispetto ai statistici. Possono esserci archivi amministrativi che non tengano
contano di alcun archivio storico. Per esempio la Telecom potrebbe avere
l‟archivio storico delle persone che sono state titolari di un contratto di
telefonia con loro come no. Potrebbero avere la anagrafe di tutti coloro che
hanno numero di telefono attivo e non disattivo;
C‟è il cosiddetto muro che si muove. Ci sono dataset che tengono traccia dei
vecchi dati sino ad un anno e mezzo prima. ogni giorno che passa vengono
cancellati i dati del giorno di un anno e mezzo fa. C‟è una finestra temporale
mobile di un anno e mezzo. Questo è un classico caso di società di logistica del
fashion. Immaginate tutta attività di distribuzione di alcuni marchi, hanno
magazzini che hanno informazioni su ricevimento, spedizione e stoccaggio, ma
non tengono le informazioni per sempre. Tengono le informazioni sino ad un
certo periodo. I dati hanno una dimensione non trascurabile, non ci sono molto
spesso capacità di stoccaggio sufficienti a tenere le informazioni che si
vorrebbe tenere. In alcuni casi le informazioni dopo un po‟ di tempo non sono
interessanti
Ci sarebbero situazioni dove sarebbe bello avere uno storico. Sarebbe bello
avere fotografie della popolazione genovese al primo gennaio di ogni anno.
Dopodiché ci sono errori di copertura, non tutti i dataset amministrativi
corrispondono alle popolazioni di nostro interesse. Ci sono tanti datest che si
rilevano incompleti rispetto agli scopi che ci prefiggiamo. È possibile che in
anagrafe ci siano degli errori. Poniamo errori materiali, errori studiati da chi
voleva essere escluso sfruttando delle incompletezze del sistema. È possibile
che la popolazione residente e la anagrafe non siano perfettamente coincidenti.
Il censimento è una delle occasioni attraverso le quali questi errori di anagrafe
vengono corrette.
Ci sono poi classificazioni non corrette dal punto di vista statistico. L‟ente ha
interesse ad una certa tipologia di classificazione mentre la struttura statistica
ha interesse ad altre classificazioni. È il caso degli animali. Ci sono alcuni
allevamenti delle definizioni merceologiche che non hanno una perfetta
coincidenza con le definizioni che magari dà l‟Istat
La qualità dei dati non è necessariamente certificata. Il processo statistico
che sta alla base della generazione dei dati non rispetta i 15 punti del codice
italiano sulle statistiche ufficiali. Non ci sono procedure ben determinate.
Vi sono spesso tempi di attesa molto lunghi per avere i dati amministrativi.
La domanda che può nascere è perché usare fonti diverse? Perché non possiamo
usare solo fonti statistiche o amministrative? Un pochino l‟abbiamo già detto. C‟è una
mancata esaustività di ciascuna fonte nel cogliere il fenomeno oggetto di studio, a
causa di errori nella rilevazione, anomalie e lacune o perché previsto dalla rilevazione
stessa.
53
Immaginiamo, per esempio, di voler fare una indagine sulle categorie deboli a Genova.
Quali sono le categorie deboli? Anziani, bambini, portatori di handicap e stranieri.
Deboli perché? Sono nelle difficoltà di non riuscire a difendersi da soli o perché sono
nelle difficoltà di non riuscire ad affermarsi con lo stesso grado di autorevolezza di
persone più giovani o più abbienti.
L‟archivio per esempio degli anziani, bambini e stranieri, immaginiamo di ricavarlo dalla
anagrafe. Per i portatori di handicap non è così facile averlo come dataset, come
informazione. Bisogna riuscire ad integrare più fonti amministrative in un unico
dataset.
Se immagino di andare in una associazione che assista una categoria di disabili e di
trovare Marco Rossi. A Genova ce ne sono altri. Come faccio a vedere se è lo stesso
che troviamo nella anagrafe? Devo riuscire ad integrare i dataset per formare una
lista unica. La chiave di riferimento univoca per incrociare i dataset è il codice fiscale.
Molto spesso col codice fiscale riusciamo ad incrociare in maniera univoca dataset di
origine differenti.
Se siamo di fronte a più fonti amministrative differenti, con l‟esigenza di
confrontarle, succedono due operazioni distinte: integrazione dei database e
armonizzazione. Obiettivo delle procedure di integrazione è quello di ottenere
maggiore copertura statistica dei dati osservati, anche con riferimento a livello
territoriale. Nel mercato del lavoro, se voglio ottenere occupati o disoccupati, posso
avere più registri differenti che devono essere integrati assieme.
Se ci troviamo di fronte al problema dell‟armonizzazione ci troviamo nella condizione
di dover correggere o aggiustare i dati per ridurre o eliminare le differenze che
determinano la non comparabilità.
Problemi classici sono rilevazioni amministrative a base individuale confrontate con
dati amministrativi a base familiare. Per esempio ho il reddito dei singoli individui e il
consumo delle famiglie. Come incrocio le informazioni? Ci troviamo di fronte ad una
armonizzazione. L‟unico modo è aggregare i dati che sono disaggregati. Se ho dati
aggregati non possiamo disaggregarli a livello di singoli individui, ormai sono aggregati.
L‟aggregazione è un processo senza ritorno. Se ci troviamo di fronte ad un dataset
disaggregato e lo dobbiamo legare ad uno che è aggregato, l‟unica cosa da fare per
armonizzarli è aggregare secondo un campo famiglia i dati a livello individuale e
collegarli al dataset delle famiglie. Inizialmente, in origine, si pensava che la qualità
dell‟informazione statistica fosse solamente la sua accuratezza, la sua vicinanza tra la
stima e ciò che realmente stavamo cercando di stimare, conoscere. Una indagine, un
dato statistico era appurato quando era vicino al vero valore della popolazione. Quanti
sono i tossicodipendenti a Genova? Stima e valore reale dovevano essere vicini. Se la
stima era totalmente sbagliata o lontana dal valore reale era inutile. Ci si è resi mano a
mano conto, negli ultimi 50 anni che, per un dato di qualità, oltre alla accuratezza del
secondo punto, vediamo la pertinenza, accuratezza, tempestività, accessibilità,
comparabilità, completezza e coerenza. Vediamoli uno ad uno.
54
Pertinenza: è la capacità dell‟informazione statistica di soddisfare le esigenze degli
utenti, deve essere valutata all‟interno del programma statistico. L‟indagine che stai
facendo, è pertinente? È qualcosa che realmente serve o è qualcosa di inutile?
Ponetevela sempre come domanda. Se domani presentate un vostro prodotto al
cliente, gli state presentando qualcosa che è pertinente o non gliene frega niente? Può
essere bellissimo il prodotto, ma se non è pertinente al suo business non gli interessa.
Dovete cercare di convincerlo che quello che gli state vendendo gli deve interessare
perché ha una serie di finalità. L‟informazione statistica è buona, è pertinente quando
è utile. Potete al posto di pertinenza mettere utilità, ma dal punto di vista economico
ha un altro significato.
Di cosa ha bisogno l‟utente finale? Ritorniamo alle statistiche dell‟Eurostat. Vi ho
detto che le statistiche sono di competenza della Commissione Europea. Sono
pertinenti per la Commissione europea. Che l‟Italia vada a fare delle indagini sul
turismo degli Afghani in Pakistan, interessantissimo ma non è pertinente.
Accuratezza. Ne abbiamo parlato. Brevemente intendo la vicinanza tra la stima
prodotta per un parametro e il vero valore ignoto dello stesso. L‟abbiamo chiamata
anche correttezza o non distorsione, a statistica 1 parlando di stimatore. Uno
stimatore è corretto quando, mediamente, il suo valore atteso è uguale all‟ignoto
oggetto di stima. La stima differisce dal vero ignoto valore del parametro a causa di
una serie di errori.
Gli errori possono essere presenti in qualsiasi fase dell‟indagine. Oltre agli errori di
statistica 1, errori campionari, si introducono gli errori cosiddetti non campionari. Di
questo ne parlerete anche con Persico. Vi faccio un esempio semplice di errore
campionario. Tra le varie metodologie di campionamento che vengono utilizzate nelle
indagini di mercato, c‟è il campionamento per quote.
C‟è una indagine della Kraft, che vuole produrre un nuovo formaggio spalmabile.
Vediamo se va bene per la clientela. Intervisto 1000 persone. A Genova devono
esserne intervistate 20. La società di marketing individua la persona di Genova o che
opera in Liguria e dice: devi intervistare 20 persone: 14 donne e 6 maschi di queste
fasce di età. Devi intervistare queste persone e poi fai come vuoi.
Cosa succede? Questa persona che è sul territorio, in genere è uno studente
universitario, o post universitario che individua queste 20 persone come la madre, la
zia, la zia e la madre del ragazzo, magari anche la nonna, poi anche se stesso, l‟amica,
il fratello del ragazzo eccetera. In linea di massima, le persone che rispondono fanno
parte di un claster, di un gruppo di persone omogenee per caratteristiche sociali,
economiche e demografiche. Si genera una distorsione: quelle persone non sono più
rappresentative della popolazione ma di un particolare gruppo della popolazione.
Questo è un classico esempio di errore non campionario, legato al fatto che il
campione non è casuale.
Tempestività. Il fatto che i risultati del censimento arrivino con un anno e mezzo di
ritardo ci indispongono un pochino. Evidentemente, per tempestività intendiamo il
55
tempo che intercorre tra l‟istante e il periodo in cui intercorre l‟informazione
statistica e il periodo in cui tale informazione è disponibile per l‟utenza.
C‟è la necessità di dare un feedback rapido alle indagini che vengono fatte. Il mondo
corre, è sempre più veloce. Anche l‟informazione statistica ufficiale deve essere
tempestiva. È per questo che Istat ed Eurostat fanno quelle pubblicazioni veloci, i
flash. Bisogna cercare di essere sempre sulla palla, se non in contemporanea bisogna
riuscire anche ad anticiparlo. Non a caso si danno le stime sull‟andamento. Non solo si
cerca di dire cosa è successo, ma dare una previsione su ciò che succederà per
cercare di essere più che tempestivi con l‟informazione statistica.
È chiaro che quanto più vogliamo essere tempestivi tanto più difficile è essere
appurati. Se poi le informazioni sono vecchie a quel punto non diventano interessanti e
non sono pertinenti. Non è interessante dopo 5 anni pubblicare uno studio sul turismo.
Ormai il mondo è cambiato. L‟11/9 quando gli aerei hanno colpito le Torri Gemelle, li c‟è
stato un punto di svolta in cui l‟informazione precedente potevi buttarla via, è
cambiato tutto dopo quel momento.
Accessibilità. Si riferisce alla facilità con cui gli utenti possono apprendere
l‟esistenza dell‟informazione ed è anche per questo che batto molto sul sito Istat ed
Eurostat e su dove voi trovate le informazioni. I dati devono essere accessibili e le
persone devono sapere dove andarle a prendere. Dove? Per esempio sul sito Istat.
Essere in grado di trasferire le informazioni nel proprio contesto lavorativo. Bisogna
sapere quando verrà rilasciata l‟informazione. Ve l‟ho fatto vedere: in fondo alla
pagina, sul documento vi si dice quando verrà rilasciato il prossimo bollettino
trimestrale sull‟andamento dei prezzi della produzione industriale e così via.
C‟è un calendario preciso delle pubblicazioni dei dati, sistema di distribuzione
dell‟informazione: sito web, pubblicazioni cartacee, il costo dell‟indagine e la
disponibilità ad informazioni aggiuntive per una corretta interpretazione
dell‟informazione: glossario, note metodologiche, note integrative, cose viste la volta
scorsa.
Comparabilità. Indica che l‟informazione è confrontabile nello spazio e nel tempo.
L‟abbiamo già detto. È importante che l‟informazione sia comparabile. Avere un dato
che nel 2001 è diverso dal dato del 2002 e che è stato calcolato in maniera diversa nel
2003 non ci permette di costruire quella che viene definita serie storica. Allo stesso
modo non ha senso geograficamente che ci sia differenza tra Genova e Mantova.
Coerenza. Le statistiche derivanti da fonti diverse sono coerenti se basate su
definizioni, classificazioni e metodologie standard, cioè se sono integrabili. Si lega alla
comparabilità. Oltre alla confrontabilità è se tutto rientra in un insieme unico.
Completezza. La capacità di fornire informazioni sugli aspetti indagati senza lacune
od omissioni ingiustificate. Per esempio, fare una indagine sulla popolazione straniera,
considerando solamente la popolazione regolare non soddisfa un elemento di
completezza, va ad escludere tutta la componente irregolare.
56
In linea di massima, quando c‟è da condurre una indagine statistica, ci troviamo di
fronte ad una fase preliminare che richiede la specificazione degli scopi della ricerca.
Abbiamo esigenze conoscitive: vogliamo conoscere qualcosa relativamente ad un
fenomeno. Quanti sono gli italiani, quali sono i profili degli immigrati e sapere quali
sono i bisogni della popolazione straniera a Genova.
Questa è la pertinenza del nostro dato e dell‟indagine che viene fatta. Qual è la
coerenza del dato che otteniamo rispetto alle esigenze conoscitive che avevamo in
origine. Non è facile. Ci sono situazioni in cui le esigenze conoscitive sono chiare, ma
non è facile capire come individuarle. Come facciamo a misurare l‟integrazione della
popolazione straniera a Genova? Non è facile.
Poi abbiamo tutta una serie di metodologie, tecniche, strutture e fasi che si
sviluppano nelle indagini che mi identificano l‟appuratezza della procedura: l‟assenza di
errori, l‟utilizzo di una struttura di analisi corretta.
Infine, tempestività accessibilità completezza coerenza compatibilità risultano
relative alle conclusioni, all‟informazione che si deriva al termine di tutta l‟indagine.
LEZIONE 6
16/10/2012
Volevo vedere le ultime slides che sono rimaste sulla presentazione. Spero che questa
settimana si attivi aula web.
Abbiamo visto la differenza tra rilevazioni dirette ed indirette. Cosa è una fonte
amministrativa, eccetera. Queste cose le abbiamo già viste l‟altra volta. Il problema
dell‟armonizzazione delle fonti. Tempestività, accessibilità, completezza, coerenza. Li
abbiamo guardati uno ad uno in maniera abbastanza rapida.
Abbiamo detto che nel processo di produzione di informazioni la pertinenza delle
statistiche ufficiali riguarda le esigenze conoscitive, le indagini devono essere
pertinenti, devono essere interessanti per le finalità che ci si pone. Accuratezza è il
modo in cui viene condotta l‟intera indagine in modo tale da avere stime vicine a quello
che realmente stiamo cercando di conoscere e stimare, è quello che abbiamo chiamato
correttezza in statistica 1 nella parte finale. L‟informazione che deriva dal processo
di produzione statistico (micro macro e meta dati) devono rispondere a logiche di
tempestività, completezza, accessibilità, coerenza e comparabilità.
Facciamo un paio di riflessioni, giusto anche per concludere un po‟ il discorso e vedere
la differenza, facendo degli esempi, tra dati statistici ed amministrativi, così
chiudiamo questo discorso.
Un aspetto importante è la qualità del dato, molto spesso vengono usati dati che non
rispondono a requisiti di qualità anche se vengono prodotti da istituzioni ed enti il cui
nome sembrerebbe essere rassicurante. Ci sono svariati osservatori, sistemi integrati
per il controllo di qualche cosa eccetera. Di fatto i dati che vengono prodotti non
necessariamente rispondono a requisiti di qualità.
È emerso, nella conclusione della lezione di ieri, (statistica del turismo, buona parte di
voi non c‟era), che ci sono dati relativi a vari sistemi informativi territoriali o turistici.
57
In linea di principio, dati con cui vi troverete a lavorare possono essere di varie
origini, ma non sono necessariamente fonti statistiche ufficiali per come le abbiamo
definite noi. Noi ci stiamo soffermando volutamente su tutti gli enti di produzione
statistiche rientrano all‟interno del Sistan. All‟interno del Sistan non rientra la BDI
che produce dei dati secondo alcuni criteri, non consideriamo tutti quegli enti che
producono dati non necessariamente all‟interno del Programma statistico nazionale e
non necessariamente secondo un codice di qualità come abbiamo visto nelle lezioni
scorse.
Non per questo però i dati che vengono al di fuori del sistema statistico nazionale e
del Sistan sono dati di bassa qualità. In linea di principio si può credere che tutti i
dati che provengono dall‟Istat, dal sito dell‟Eurostat o dalla BDI siano dati di buona
qualità. La qualità delle fonti informative è un problema che si affronta di frequente
nelle analisi statistiche. La qualità dei risultati strettamente connessa alla qualità dei
dati rispetto al livello di comprensività delle metodologie e tecniche di analisi
statistica. La qualità dei dati è importante. Se i dati che voi avete a disposizione per
la tesi di laurea non sono di qualità, le vostre conclusioni e affermazioni potranno
essere sempre contestate.
Se un istituto non esegue correttamente una analisi, ecco che tutte le considerazioni
che farete su questa analisi sono deboli. A dato debole e di bassa qualità
corrispondono inevitabilmente considerazioni di bassa qualità. Questa affermazione è
ancora più vera negli studi territoriali, da questi scaturiscono proposte di politica a
livello territoriale. Molto spesso il problema della qualità del dato è che non riusciamo
ad avere un dettaglio territoriale molto elevato.
I dati, alla fine per essere buoni, di buona qualità e prodotti secondo certe regole,
devono avere la caratteristica di comparabilità. Il problema della comparabilità dei
dati ha una importanza cruciale, sia perché si presenta con frequenza nella ricerca
applicata, sia perché costituisce un fattore fortemente distorsivo nell‟analisi dei
fenomeni.
Possiamo avere due situazioni in cui abbiamo uno stesso fenomeno analizzato da due
strutture differenti. Questi dati sono comparabili o no? Questi dati portano allo
stesso risultato oppure no= Le famose battaglie di numeri. Non so se avete mai fatto
caso. Quando c‟è uno sciopero, manifestazione, i sindacati o chi organizza la
manifestazione dice una cifra, i giornali un‟altra e la questura un‟altra ancora. Il
problema è capire dove stia la verità. È chiaro che nel momento in cui la qualità del
dato è più attendibile ecco che dovrebbe esserci la verità.
Cause e veridicità della fonte, soluzioni. Bisogna capire perché i risultati sono
discordanti, nel caso degli scioperi perché ci sono alcune persone che hanno interesse
a gonfiare il successo di una manifestazione, valutare la veridicità della fonte. Se in
una piazza c‟è un milione di persone ma notoriamente ce ne possono stare al massimo
800mila non è vero, e poi si può trovare una soluzione che permetta di armonizzare,
trovare un equilibrio tra le differenti fonti di dati.
Le discordanze tra diverse fonti di dati possono essere legate a:
58
-
diversa classificazione dei fenomeni. Per esempio definizioni differenti dei
concetti di inflazione, disoccupazione, di disabilità eccetera;
Modalità di rilevazione. Alcuni dati possono essere rilevati in mesi differenti.
Se vado a rilevare i flussi turistici nei mesi di gennaio, aprile, luglio, settembre
e un altro paese in altri mesi, non c‟è più confrontabilità legata alla modalità di
rilevazione.
Se i dati sono discordanti, più informazioni su un medesimo fenomeno, quale dobbiamo
prendere come fonte? Quella che si avvicina di più all‟ufficialità della fonte. Questo
criterio vale sempre. Voi vi fidate di più ad una persona affidabile o di uno che è un
conta balle? Se la persona è più affidabile vi fidate di più di quella persona li. Nelle
classiche beghe tra amici, alla fine si sentono varie versione e c‟è chi crede a qualcuno
e quelli che credono ad altre persone.
Lo stesso discorso per i dati, cercare di risalire alla ufficialità del dato, all‟ente che
l‟ha prodotto secondo ciò che si avvicina di più al concetto di ufficialità, nel senso di
appartenenza al Sistan. A parità di dati discordanti, date sempre prevalenza ai dati
ufficiali.
Se poi ci sono questioni non semplici da risolvere, queste soluzioni si provano caso per
caso, non c‟è una regola universale, secondo quello che si ritiene essere più realistico e
più logico. Non vi aspettate che i dati siano sempre gli stessi chiunque li raccolga. Se
si mette mano alla realtà, si vede uno stesso fenomeno studiato da più enti differenti,
i risultati possono essere anche molto differenti.
Fonti informative. Forniscono i dati necessari al calcolo di indicatori per l‟analisi dei
fenomeni e la lettura in chiave territoriale. Forniscono i dati necessari: lo vedremo, la
disseminazione dei dati ufficiali avviene essenzialmente in forma impersonale. Se
prendete un documento Istat o Eurostat, è molto difficile trovare interpretazione dei
fenomeni. Troverete solamente che un certo fenomeno è variato in positivo o negativo
rispetto all‟anno precedente, un settore è in crescita e l‟altro no. Non troverete mai
nelle statistiche ufficiali valutazioni di merito, di giudizi, delle opinioni, non fanno
parte della statistica ufficiale. Neutralità: l‟abbiamo visto l‟altra volta.
La raccolta dei dati produce serie territoriali, sequenze di valori assoluti delle
variabili nello stesso momento in vari ambiti territoriali, oppure anche in serie
storiche. Avete per esempio il grado di invecchiamento della popolazione per area,
oppure la serie storica: la sequenza di valori di un medesimo fenomeno ad intervalli
regolari nel tempo, l‟abbiamo già accennato una volta. I meta dati li abbiamo già visti.
Vediamo due esempi di indagine statistica e amministrativa. Le indagini statistiche
sono tante, sono numerose. Se andiamo a guardare quelle prettamente ufficiali sono
quelle che fa l‟Istat o la BDI.
- Indagini multiscopo: di tipo campionario ed effettuate dall‟Istat, con finalità
puramente statistica, finalità conoscitiva di produzione statistica. Le indagini
multiscopo sono un nsieme di indagini condotte sulle famiglie da parte dell‟Istat,
sono poco meno di una decina, e riguardano differenti aspetti che riguardano la
59
-
-
-
-
-
società. Indagine sui consumi delle famiglie, sull‟impiego del tempo, viaggi e
vacanze, sicurezza. Sono tutte indagini che vengono rilevate in maniera
contemporanea. Chiamate multiscopo perché già che l‟Istat contatta le famiglie
italiane, decide di chiedere una serie di informazioni. Anziché fare una indagine
sul turismo, la fa anche su altri temi, per questo multi scopo. più finalità
conoscitive
Sui consumi
Continua sulle forze di lavoro (FDL). Ne abbiamo parlato tempo fa. È una delle
indagini dell‟Istat. È una indagine continua, praticamente avviene nel quotidiano.
Rilevazione dei prezzi al consumo, cadenza mensile, per vedere l‟andamento
delle operazioni in Italia con la rilevazione dei prezzi effettuati a livello
comunale. I dati spediti a Roma e consolidati a livello italiano.
Censimenti. Della popolazione, industria, agricoltura. Ora c‟è il censimento delle
aziende no profit. Sono tutte queste indagini per finalità puramente
statistiche, sarebbe a dire per finalità puramente conoscitive.
Amministrative. Condotte utilizzando i dati di alcuni enti che non hanno come
finalità prevalente quella di produrre statistiche, ma hanno archivi
amministrativi e, usando i dati presenti negli archivi amministrativi, si riesce a
estrapolare della informazioni di interesse sociale. Se prendo l‟ufficio anagrafe
dei comuni di GE ho nati e morti, con magari qualche mancanza. Genero così non
solo una misurazione di uno stock, il complesso dei residenti
amministrativamente in Italia, ma costruisco anche una parte del flusso: nati
meno morti rappresentano una variazione di stock, quindi un flusso. A questo si
aggiunge poi l‟immigrazione ed emigrazione per ottenere il flusso complessivo
della popolazione.
Popolazione residente annuale. Questo punto l‟avevamo già discusso quando
abbiamo presentato i servizi offerti dal sito dell‟Istat. Sul sito Istat trovate
un sotto sito demo.istat.it , a sinistra posso selezionare, anno per anno, dal 2001
in poi, quanto erano i residenti in Italia al 31/12 dell‟anno. Inoltre, potete anche
ricavare le proiezioni demografiche da qui al 2060. Questi dati vengnono
costruiti incrociando le informazioni che vengono da tutti i comuni italiani con
l‟ufficio di statistica e l‟ufficio anagrafe. Genova ha un ufficio di Statistica
comunale separato dalla anagrafe, c‟è la direzione statistica, con tante finalità
tra cui fare la rilevazione dei prezzi in tanti punti vendita a Genova. Nei paesi
più piccoli no, l‟ufficio statistico coincide con l‟ufficio anagrafe.
Sui trasferimenti di residenza, e si utilizzano i dati dell‟ufficio anagrafe.
Archivio statistico dei trattamenti pensionistici, che utilizza come dati quelli
dati dell‟INPS.
Per le imprese c‟è un archivio, ASIA , archivio statistico delle imprese attive. È
un archivio sulle società che operano in Italia suddivise per vari settori.
Sempre dalle fonti Inps, utilizzando delle fonti aperte, è possibile avere un
archivio dei lavoratori dipendenti. Se voglio sapere quanti sono i lavoratori a
60
Genova, posso vedere quanti stanno versando contributi previdenziali all‟Inps.
Una volta c‟era anche l‟Inpdap.
Archivio Statistico delle Imprese Attive, Asia. È una banca dati sulle imprese attive
che contiene un insieme di informazioni sulla struttura produttiva italiana. Realizzato
dall‟Istat, è stata obbligata dall‟Eurostat, in modo che a livello europeo fosse possibile
costruire un archivio analogo. Ogni anno viene aggiornato.
Come costruisco questo archivio e cosa contiene? Anzitutto prende dati da tanti enti.
La camera di commercio, rientra nel Sistan, gestisce il registro delle imprese. Per
aprire l‟impresa, qualcuno ve l‟avrà insegnato, dovrete aprire una posizione nel RDI,
impresa attiva, indicare il campo di attività dell‟impresa, lo statuto, indicare la forma
societaria, codice fiscale e attivare una casella di posta elettronica certificata.
Le informazioni possono ance essere prese da Inps e Inail. Se sono una azienda faccio
da sostituto di imposta, anche per i contributi previdenziali, devo pagare l‟ Inail per i
miei dipendenti. Poi ho altre informazioni che possiamo prendere dall‟ Enel o altri enti
simili produttori di energia elettrica.
Poi posso prendere altri archivi, usando quelli per esempio della BDI, ABI. Infine,
altre informazioni vengono prese anche altre informazioni dalle indagini statistiche
dell‟Istat.
Abbiamo visto in maniera abbastanza precisa la differenza tra fonti statistiche ed
amministrative, indagini statistiche ed indagini amministrative. L‟indagine
amministrativa può essere finalizzata alla costruzione di archivi, come l‟Asia, o può
essere indirizzata a comprendere meglio i fenomeni lavorando non su indagini
statistiche come quelle viste in slide, ma piuttosto usano dataset di questo tipo.
Tenete presente che non sono elenchi esaustivi, solo esempi generali.
61
LE TECNICHE DI RILEVAZIONE DEI DATI
Iniziamo ora ad avvicinarci un po‟ di più al concetto di indagine dal punto di vista
operativo. Questo tema lo approfondiremo di più e meglio con Persico. Iniziamo a
guardare oggi le modalità attraverso cui si possono rilevare i dati usando delle indagini
statistiche.
Qua ci sono le sei fasi che descrivono l‟indagine statistica. Le vedremo e
approfondiremo uno per uno. Ci focalizzeremo in linea di massima, quasi
esclusivamente sulla fase uno ed in particolare sulla modalità di rilevazione dei dati.
Questo elenco non lo andremo ad esplorare punto per punto, ma solo il punto uno e un
suo sottopunto.
Come si compie una indagine statistica? Fase iniziale della progettazione. Uno dei
primi errori classici che si fanno quando si conduce una indagine di tipo statistico è
quello di partire a scrivere il questionario. Non funziona così. Bisogna definire bene
quali sono gli obiettivi della ricerca. Ho una fase di progettazione, definisco bene gli
aspetti del problema e si decide come operare.
Successivamente avviene la fase di individuazione del campione da rilevare. Abbiamo
messo un cappello all‟argomento. Voglio rilevare i dati. Come facciamo? Anzitutto
dobbiamo dire qual è la popolazione di riferimento, la lista dalla quale noi possiamo
campionare, come raggiungere le persone di questa popolazione? Elenco del telefono,
ma abbiamo già detto che non copre la popolazione italiana (persone non hanno il
telefono o non vogliono esserci).
Rilevazione. Attività che consistono nel predisporre l‟attività effettiva di
campionamento e le interviste.
Dopodiché dobbiamo acquisire i dati, avremo una fase di preparazione dati. Dopo i
dati devono essere analizzati e documento di pubblicazione dei dati col quale li
diffondiamo.
Iniziamo dal principio:
- Progettazione. Richiede innanzitutto di definire bene un problema. Che cosa
vogliamo fare? È facile dire sarebbe bello fare indagine sulla condizione degli
immigrati clandestini a Genova. Cosa significa? Sono vivi o morti? No, anche
altre cose: chi sono, da dove sono arrivati, perché sono a Genova, vogliono
andare via o si fermano. Questa è una finalità descrittiva, primo problema.
Secondo problema capire le esigenze che loro hanno, riescono ad accedere ai
servizi di prima accoglienza, hanno bisogno di servizi che non riusciamo a dare,
o se hanno paura di accedere a servizi per paura di essere denunciati. Non è
facile, bisogna specificare bene il problema. Definire a priori che cosa si vuole
fare, a cosa mi serve questa informazione, qual è la finalità della mia indagine?
Io voglio offrire nuovi servizi alla popolazione clandestina per andarle incontro,
sono fasce deboli. Come faccio a raggiungere queste persone? Se è clandestina
non li trovo nell‟ elenco telefonico. Posso utilizzare una metodologia di
campionamento, campionamento per ceto, vado a cercare i clandestini nei luoghi
62
-
-
-
-
in cui si aggregano. Ci sono bar frequentati da clandestini, centri culturali,
anche il clandestino ha una vita sociale. È chiaro che io non posso brutalmente
fare una intervista al clandestino come la farei al regolare, quello ha paura di
essere denunciato. Questa fase di progettazione identifico la domanda di
ricerca, il problema, il punto al quale si vuole arrivare. Poi obiettivi da
raggiungere e andare a rilevare le informazioni che ci servono.
Problema del campionamento. Molto collegato alla progettazione. Le liste di
riferimento saranno a cascata derivanti dalla specificazione del problema e
dalla definizione degli obiettivi.
Poi abbiamo anche questioni di dimensione campionaria. Quante unità vado a
campionare? 3500? 4000? 2000? Dipende da tante cose. Dipende se voglio fare
una indagine ripetuta nel tempo, tante volte per vedere come si evolve, o una
volta sola per capire come è una certa situazione. Scoppia una guerra nella
penisola balcanica? Arrivano tanti immigrati che scappano dalla guerra.
Situazione di emergenza. Mi interessa in quel momento sapere come è la
situazione. Poi magari mi interessa non ripeterla subito. Posso dedicare un po‟ di
risorse economiche ad una indagine spot piuttosto che pensare di suddividere la
spesa negli anni, poco alla volta. Non immaginate le fasi assolutamente
separate, sono molto concatenate.
Dopo avviene la fase di rilevazione. Selezione degli intervistatori, sembra
molto semplice, ma non lo è. A seconda del problema servono intervistatori
differenti. Per la popolazione straniera è bene avere intervistatori che parlino
lingue straniere, si aiuta l‟intervistato a rispondere. Poi organizzare bene il
lavoro sul campo. Se penso di intervistare 100 persone alla Maddalena, 100
persone a Castelletto, 50 alla Foce, 80 ad Albaro, bisogna che ci sia una
persona che pianifichi l‟attività, che verifichi quali persone hanno risposto e
quali no. Programmi il ritorno sul campo di persone non trovate, che gestiscano
tutta l‟indagine campionaria. Sono aspetti organizzativi piuttosto importanti.
Dopodiche, una volta che gli intervistatori sono stati formati, è stato spiegato il
questionario, difficoltà che possono emergere e ritornano coi questionari
cartacei o informatici, dovranno andare a fare delle modifiche, registrazioni e
correzioni, a seconda delle risposte date. È normale che su 4000 questionari
ogni tanto qualcuno risulti incompleto. Perché c‟è
un errore materiale
dell‟intervistatore, magari mette due crocette dove ce ne è una e nessuna
crocetta in altre domande, oppure può risultare che le risposte siano in
contrasto tra di loro, le ragioni sono parecchie.
Alla fine il risultato finale di una indagine campionaria è un foglio di Excel, ogni riga è
un questionario ogni colonna è una risposta.
Se intervistiamo 3500 persone e a ciascuna poniamo 10 domande, avremo un foglio di
Excel con 3500 righe e 10 colonne, una per ogni domanda. Metteremo le risposte che
sono state date. La prima persona intervistata a 35 anni. In corrispondenza della
63
domanda: la tua età? La risposta è 35. Alla domanda: che titolo di studio hai tra questi
dieci, A-B-C-D, dovrai mettere una lettera. Il risultato finale di una operazione di
campionamento a livello di dati grezzi, e questi sono i micro dati, è un file di Excel.
Se l‟indagine è particolarmente grande, uso degli strumenti più sofisticati sennò
Excel dà pienamente l‟idea della struttura di un insieme di micro dati. Ci siamo posti
delle domande inizialmente. Voglio sapere quanti stranieri irregolari presenti a
Genova risultano essere discriminati oppure sono pentiti di essere da noi. Queste
lavorazioni sono compiute solo nella parte finale. Facciamo le analisi, incrocio i dati,
uso tabelle, grafici, posso anche pensare di fare studi più sofisticati: regressioni,
modelli econometrici, modelli sociali, fare modelli multivariati. Se stiamo facendo una
indagine di marketing, vogliamo cercare di dividere i consumatori in gruppi uso
tecniche di analisi dei gruppi (Klaster analysis).
Alla fine, i dati raccolti con un bel costo, una indagine campionaria è costosa,
dobbiamo predisporre un documento riassuntivo che permetta di condividere con
terzi le informazioni che sono state ottenute. Al di là della statistica ufficiale,
prodotta da Istat o BDI, queste considerazioni che stiamo dicendo sono compatibili
con indagini private, indagini di aziende che vogliono conoscere meglio i loro clienti. Se
l‟amministratore delegato ha deciso di fare una indagine, ha bisogno di prospetti che o
documenti che permettano di acquisire l‟informazione in poche pagine. Torniamo alla
Statistica, statistica come forma di sintesi, statistica come sistema per prendere le
3500 righe e colonne e ridurle in cinque - dieci pagine.
Focalizziamoci sulla fase 1, PROGETTAZIONE, in particolare il secondo punto. Si
precisano gli obiettivi definizioni e classificazioni. Cosa si intende per obiettivi? Cosa
vogliamo ottenere, qual è la finalità conoscitiva dell‟indagine. Voglio sapere se il
formaginno piace e venderà? Voglio sapere se se ha senso proporre un prodotto
alternativo alla Nutella. La Plasmon aveva fatto la sua nutella, che molti chiamavano la
nutella della Plasmon, fallimento commerciale. Ci sono comunque altre creme. La
questione è capire la finalità del nostro studio.
Dobbiamo dare delle definizioni, metterci d‟accordo sul gergo. Se parlo di capo
famiglia che cosa intendiamo? Se faccio una indagine sul consumo o scelte di acquisto,
chi deve rispondere? Questa fase si deve già definire nella fase di progettazione.
Nella indagine di marketing, la persona che risponde al questionario è delegata agli
acquisti. Molto speso la madre, piuttosto che i figli o piuttosto che il padre. Non è
detto che si debba cercare la madre per forza di cose, può essere delegato qualcun
altro agli acquisti.
Classificazioni, d‟accordo sulla metodologia. Si scelgono le tecniche di indagine. Come
si può intervistare una persona o una unità statistica di nostro interesse? Poi
definisco il questionario, lo vedremo in un‟altra lezione.
Ora ci focalizziamo, abbastanza brevemente, sulle tecniche di indagine. Le tecniche
di indagine sono essenzialmente tre:
64
-
-
L’intervista diretta, faccia a faccia. La persona intervistata è intervistata
dall‟intervistatore e compila il questionario. Questa è una procedura che avviene
in forma cartacea, non sempre ma molto spesso. Poi:
Intervista telefonica: persona contattata telefonicamente dall‟intervistatore.
Auto compilazione. Sono diverse da una cosa che chiameremo autoselezione del
campione, si chiarirà poi successivamente.
In generale, l‟intervista, e quindi l‟intervista diretta e telefonica, l‟auto compilazione
non è una intervista. L‟intervista prevede intervistatore o rilevatore e l‟intervistato, il
rilevato, o comunque l‟unità statistica, persona o azienda.
L‟intervista comporta un processo di interazione tra l‟ intervistatore e intervistato.
Non è un rapporto alla pari, c‟è una asimmetria, non simmetria. L‟intervistatore fa
domande all‟intervistato e si deve comportare secondo tutta una serie di regole che
non.
Come si somministra il questionario? Dipende. Può essere somministrato in vari modi.
- Lunghezza del questionario. L‟anno scorso c‟è stato il censimento? Il
censimento somministrato per via postale, poi auto compilazione. La persona si
metteva li e chi aveva voglia in famiglia rispondeva riconsegnando il questionario
in centri di raccolta comunali, oppure poteva portarlo alla posta che lo riceveva
gratuitamente, o via internet ottenendo una ricevuta elettronica da stampare e
conservare per evitare la multa perché c‟è l‟obbligo di rispondere al
questionario.
- Struttura del questionario. La tipologia di questionario deve essere tanto più
libera quanto meno sappiamo del fenomeno. Se non sappiamo nulla di un certo
fenomeno, possiamo procedere ad un sistema di intervista, chiamato intervista
qualitativa. In linea di massima facciamo una chiacchierata con l‟intervistato su
alcuni temi. Voglio capire quale sia una certa situazione nelle gang di ragazzini
che vivono in zone deprivate delle città o delle grosse città. Piuttosto che fare
questionari nelle bidonville piuttosto che nelle baraccopoli, è meglio intervistare
opportunamente alcune persone. Questa forma di intervista è detta qualitativa.
Se riesco ad avere una visione sempre più chiara del problema, uso forme più
definite: questionario semi strutturato e strutturato. Strutturato? È, per
esempio, il questionario del censimento. è perfettamente strutturato, presenta
domande a scelta multipla sugli argomenti che vogliamo noi. Semi strutturato?
considero qualcosa sul fenomeno ma non tutto il fenomeno del nostro interesse.
Se voglio un questionario strutturato Queste domande devono coprire
totalmente le opzioni possibili. Se non le conosco, non posso usare una forma
completamente strutturata. Quali sono le principali criticità di Genova oggi?
Posso pensare: disoccupazione, traffico, criminalità, servizi pubblici che non
vanno bene. Ognuno potrebbe aggiungerne. In queste situazioni, su queste
domande, si preferisce utilizzare o domande semi strutturate dove posso
esprimere altro o si lascia la risposta aperta da parte del rispondente. Il
65
-
rispondente può scrivere lui ciò che è più pertinente. Ciò genera problematiche.
3500 questionari e 3500 persone hanno risposto cose simili ma diverse, devo
ricodificare per essere in grado di analizzare.
Tipologia e approfondimento dei temi trattati. Se devo chiedere a voi che
scuola avete fatto? Scientifico classico tecnico professionale? La rosa è di quei
dieci istituti. Posso inserire la voce altri istituti per quelli residuali. La rosa è
definita, se uno ha fatto una tipologia di liceo non ne ho fatto un‟altra. Se vi
chiedessi l‟aggettivo che associate in maniera più forte con la parola statistica?
A parte gli insulti, non è semplice. Adesso il 23 non c‟è lezione. È la giornata
italiana della statistica. La mattina facciamo un intervento con le scuole
superiori. Questionario? Che percezione hanno gli studenti delle superiori della
statistica. Non è facile trovare il modo di raccogliere informazione. I liceali
hanno questa percezione, prima di studiarla. Fare un questionario è molto
complicato, come regola di vita, se dovete costruirlo, mai risposte aperte. Cosa
ne pensa della situazione del porto di Genova? Mai aperta, complicato riuscire a
ricodificare. A meno che non sia un campione molto ristretto. Nelle interviste
non strutturate, qualitative, le persone che sono intervistate sono di solito
poche, sono figure chiamate mediatori culturali. Se voglio caprie le dinamiche
all‟interno di gang giovanili, posso parlare con persone specifiche, queste magari
mi spiegano, diventa una specie di indagine giornalistica se vogliamo. Perde i
connotati di analisi quantitativa e assume quelli di una analisi qualitativa. Se ho
un grosso numero di risposte aperte, dovete ricodificarle per poterle
analizzare, oppure riportarle tutte ma allora si perde del beneficio della sintesi
che dà la scienza statistica. Se intervistate 3500 persone e 3 domande aperte?
10500 risposte aperte e bisogna trovare il modo di sintetizzare in poche
categorie, non è per niente facile. Se voi, per la tesi pensate di sottoporre alle
aziende un questionario di qualche tipo, cercate di fare scelta multipla, o scelta
singola o numeriche. Quanti dipendenti avete, qual è il vostro fatturato? Avete
uffici all‟estero? Si-No. Cercate di evitare il più possibile le domande a risposta
aperta.
La scelta della tecnica di somministrazione del questionario è legata all‟unità della
rilevazione. Possiamo avere le imprese, le istituzioni, gli individui oppure le famiglie. È
chiaro che a seconda dell‟unità di rilevazione cambia la tecnica di somministrazione del
questionario. Per esempio, se voi andate a parlare con la camera di commercio o
guardate anche su un database nel quale noi abbiamo l‟abbonamento in facoltà, potete
trovare per gruppi di aziende le e-mail, e potete predisporre un questionario on line
che può essere proposto alle aziende via e-mail.
Si genera una e-mail. Buongiorno, mi chiamo Pinco Pallino, sto facendo una tesi in
presso facoltà di economia, studio di, sarei grato se la sua azienda volesse rispondere
a queste domande utili per tesi il cui relatore è Tezie.
66
Mail col link. Può cliccare e si apre una decina di pagine, poche domande per pagina e
le persone possono rispondere. Voi andate sul sito e potete scaricare il file Excel con
tutte le risposte con il questionario. Questo non potete farlo con le famiglie e le
istituzioni.
Le modalità di intervista. Quella che storicamente è più intervista è la modalità
PAPI. Acronimo che si può indicare in due differenti modi: paper and pencil interview,
intervista carta e penna, o paper assisted personal interview. In realtà quella che
ritengo più aderente al vero è la carta e penna, paper and pencil. Pensate, se l‟avete
visto, al questionario del censimento, domande e crocette. È il metodo base, è il
modello base. Ci sono, ovviamente, vantaggi e svantaggi.
Vantaggi?
- Certezza dell’identità dei rispondenti. Non può succedere che faccio un
questionario per l‟amministratore delegato e risponda la segretaria
dell‟amministratore delegato. Se fatto via internet, non posso vedere chi mi sta
rispondendo. Però, se vado in azienda col foglio e so che l‟amministratore
delegato si chiama Pinco Pallino, so che è lui e l‟identità del rispondente è certa.
- Possibilità di fornire chiarimenti. Se l‟intervistato ha dei dubbi, se le domande
non sono poste in maniera chiara, nonostante tutta la fatica che si possa fare
per realizzare il questionario, qualche domanda può non venire chiara, c‟è la
necessità di dare chiarimenti all‟intervistato.
- Possibilità di motivare gli intervistatori. Se voi mandate una e- mail, uno può
dire ah, si si poi rispondo. Arrivano 50 mail, la vostra mail va in fondo e chi s‟è
visto s‟è visto. Questi sistemi dicono tra tutti hanno risposto alcuni non altri.
Rinnoviamo l‟invito? Rimando la mail solamente a quelli che non hanno risposto.
Ogni mail ha un link diverso. Da un punto di vista cartaceo, se c‟è
l‟amministratore delegato o chiunque che si trova davanti il tesista che dice, mi
rispondi alle domande? Alla fine risponde, per toglierselo dai piedi. Se fatto r
via internet: non l‟ho vista, non è arrivata, è andata nello spam, mille scuse
possibili per non rispondere.
Svantaggi? Se avete tante persone che girano per fare interviste
- L’organizzazione complessa e costo elevato.
- Effetto rilevatore. Essendoci tanti rilevatori può esserci il rilevatore che non
ha voglia, magari mette lui le crocette al posto di chi dovrebbe rispondere,
fatto gravissimo, ma magari non è capace a dare una spiegazione giusta a
domande. Campionamento per quote a volte si usa. Se il rilevatore intervista:
madre, sorella, madre del ragazzo/a, ecco che l‟effetto rilevatore si trasforma
in una forma di errore, detto errore non campionario
- Reticenza. Le persone possono anche non avere piacere di ricevere una persona
con il questionario carta e penna a mettere le crocette. Se è una intervistaa
casa devi fare le persone a casa, in ufficio devi farle entrare in ufficio e non ne
hai voglia.
67
-
-
Possibile che ci sia incoerenza nelle risposte. C‟è un comportamento psicologico
strano nelle persone che rispondono alle domande, specialmente quelle politiche
ma non solo. Di solito le prime risposte hanno modalità di una valutazione
differente rispetto alle ultime. A volte se la persona è arrabbiata col governo,
sindaco e istituzioni, inizialmente ci va giù pesante. Cosa ne pensa dell‟operato
del governo? Una schifezza. Dopo che il nervoso è passato, comincia a
rispondere con un po‟ più di calma. È possibile allora che ci siano incoerenze
nelle risposte
Siete mai stati intervistati? La stessa domanda può essere posta più volte o in
maniera leggermente diversa, per vedere se c‟è una corrispondenza tra la
domanda posta precedentemente e la domanda posta dopo, per vedere se la
persona stia dando giusta attenzione alle domande. . Se il questionario è lungo la
persona si stufa, si annoia e risponde male.
Cosa succede? Il questionario cartaceo è uguale per tutti. Se avete preso il
questionario del censimento, a parte le due versioni, long e la short form, il
questionario cartaceo è un questionario sempre uguale, stampato per tutti. Se anziché
usare la carta uso il computer, posso mischiare le domande in modo che la prima
domanda non sia mai sempre la stessa e l‟ultima domanda non sia sempre la stessa, in
maniera tale da ridurre l‟effetto noia delle risposte. I questionari dovrebbero essere
brevi. Una decina di domande, non più di tre - quattro minuti.
L‟alternativa rispetto al Papi è il CATI, è quello in linea di massima più utilizzato nei
sondaggi elettorali. Sondaggi dei telegiornali, dei programmi, sono in linea di massima
condotti secondo questa metodologia, sembra una cosa stratosferica, ma è molto
semplice. Una persona telefona, fa le domande, invece di immettere i dati sulla carta,
scrive direttamente sul computer la risposta. Più veloce, più economico,
l‟intervistatore telefona, meno invasivo per la persona, non si trova a dover accogliere
l‟estraneo. Però, evidentemente, ha anche degli svantaggi.
Non consente di dedicare molto tempo ad ogni intervistato. I sondaggi telefonici
vengono condotti, ma costano un euro cinquanta ad intervista. A loro non interessa
farle benissimo, ma averne tanti, prima rispondi meglio è.
Il vantaggio? Non devo fare la ricodifica dalla versione cartacea a quella elettronica.
Le domande di incrocio, quelle di verifica se la persona risponde a caso o no, in questo
caso hanno il controllo automatico. Se io prima rispondo che il rosso mi piace
tantissimo, e poi rispondo che non potrei mai indossare qualcosa di rosso, ecco che
magari si accende la lampadina sul computer che dice questo sta rispondendo in
maniera non coerente.
Si può cercare di ovviare al problema somministrato altre domande. Usando il
computer è anche possibile fare percorsi guidati in maniera più semplice. Lei è mai
andato a comprare un mobile negli ultimi 12 mesi? No, salta la tre. Se si, dove, cosa hai
68
comprato, quanto hai speso? Queste interviste strutturate su più livelli sono invece
molto più facili se il questionario non è cartaceo ma elettronico. È utile avere il
questionario elettronico perché a quel punto è impossibile saltare le domande. Può
succedere che sia fatto male dal punto di vista puramente tipografico e ci sia la
domanda in altro a destra alla quale non risponde nessuno perché non la vede nessuno.
Impossibilità ad usare tecniche di probing. Ci sono a volte esigenze per capire meglio
il perché delle risposte, perché hai risposto questo? Cercano di capire meglio l‟
opinione e pensiero dei rispondenti. Se la persona l‟ho davanti a me posso dedicare più
tempo alla persona.
Con quello che mi è costato almeno portare l‟intervistatore sino a casa del Tizio
almeno intervisto bene, non ci sto due minuti. È più il tragitto di andare da Genova
Centro a Molassana che il tempo di intervista effettivo. Nelle interviste Papi si
possono fare approfondimenti per comprendere meglio il pensiero delle persone.
Questo di solito non è di grosso interesse per le interviste Cati, veloci e rapide.
DIARIO o questionario auto compilato. Caro diario, oggi ho comprato 12 euro di
albicocche, 14 di ciliegie e 1 automobile. Mi serve per tenere traccia nel tempo degli
acquisti che faccio. Parlo di questo perché è l‟esempio più classico che si da di
questionario auto compilato.
C‟è un contatto iniziale con l‟intervistatore che spiega come funziona. Dopodiché, dopo
che l‟intervistatore ha spiegato come funziona il questionario, l‟intervistatore se ne va
a casa e non se ne sta una due settimane a casa dell‟intervistato giorno e notte, se ne
va, e poi spetta all‟intervistato andare a rispondere alle varie domande o a compilare le
differenti tabelle che ci sono.
I dati sono più accurati. Se io vi chiedessi quanto avete speso esattamente ieri,
avreste difficoltà. Ma se uno sa che per una settimana deve tenere gli scontrini e
segnarsi quanto spende per ciascun giorno nelle differenti voci di spesa si organizza e
non ha problemi di ricordo, NO effetto ricordo. Se uno si rende conto di aver
dimenticato qualcosa ha il tempo di correggere.
Ci sono però dei problemi. Se l‟Istat mi chiede di registrare per due, quattro
settimane tutte le spese che faccio, non è proprio un divertimento, magari c‟è
l‟effetto novità del primo giorno, poi però la sera uno è stanco, non ne ha voglia. Buona
collaborazione da parte degli intervistati e dev‟essere poco evasiva come cosa, periodi
di tempo limitati.
Esempio quadernetto primo giorno del libretto degli acquisti anno 2008. È un
quadernetto, un libretto, fascicolo con un po‟ di pagine colorate diversamente a
seconda del giorno e a seconda della settimana. Vedete, per esempio, rilevazione sui
consumi delle famiglie, libretto degli acquisti 2008, numero verde se avete dubbi e un
po‟ di disegnini molto scenografici.
Pane cereali; pane grissini cracker. Codice, 1-1 spesa in euro. Giorno per giorno,
indicando la data, si mette quanto si spende per ciascuno di questi alimenti. Pane
cereali, dolciumi.
69
Simile è l’indagine sull’uso del tempo. Cosa avete fatto nelle varie giornate. Tra le 7 e
7e10 mi sono svegliato, dopo dieci minuti lavato, svegliato mio figlio, preparato
colazione, fatta colazione, lavato i piatti. È una noiosata, tenete conto che si deve
ricodificare tutto. Cosa sta facendo? Indichi l‟attività che svolge ad intervalli di
tempo dieci minuti.
Cos‟altro sta facendo? Indichi l‟attività contemporanea più importante: ho ascoltato la
radio, ho letto il quotidiano. Se voi fate una attività per più tempo, non dovete
scrivere: ho lavorato, ho lavorato. Tirate la riga. Attenzione a non indicare più di una
attività sullo stesso riquadro. Ricordi di distinguere la occupazione principale dal
secondo lavoro, indicando lavoro principale-altro lavoro.
Dove si trova o come si sta spostando. Dove sono? A casa mia, sto facendo colazione e
svegliando mio figlio. A casa mia ma potevo anche essere in albergo. A piedi o mi
sposto in autobus. Poi in ufficio, trattare una riga verticale o usare le virgolette. Non
solo, poi voglio sapere se sei da solo, col padre, la madre, coi figli, col marito, con
l‟amante. Tracciare la linea verticale per indicare che sono da solo o con altre persone.
Con familiari meno di dieci anni, conviventi dieci anni e più, familiari non conviventi,
altre persone che conosco.
La collaborazione da parte del rispondente è necessaria e i motivi sono piuttosto ovvi.
Vediamo che le attività di campionamento possono esprimersi attraverso due tipologie
di errori. La rilevazione può essere soggetta ad un errore. Ogni campione è diverso
dagli altri, se ad ogni campione corrispondono dati diversi, ci troviamo di fronte ad una
fonte di variabilità che non è la variabilità naturale, ma la variabilità campionaria, di
cui abbiamo già parlato a inizio del corso.
Dal momento che ad ogni campione corrispondono valori diversi le stime sono diverse.
Abbiamo la varianza degli stimatori.
Questa sfera di errori, legati alle procedure casuali di selezione delle unità del
campione è chiamata fase o parte di errore campionario, legato alle attività di
campionamento. Tutti gli errori che derivano da fenomeni di rilevazione, crocette
messe nelle caselle sbagliate, dati mancanti, input sbagliati dei dati, se copio un
questionario che è stato compilato con carta e penna e lo copio sbagliato, non è un
errore campionario, ma è un errore non campionario.
Se faccio un errore nel sommare i dati, faccio per esempio reddito medio dei maschi e
invece sto facendo reddito medio delle femmine, quello non è un errore campionario,
ma materiale dovuto alla fase di elaborazione dei dati, è un errore non campionario
anch‟esso. Lo stesso qualsiasi tipologia di errore che possa emergere nella fase di
diffusione dei dati è un errore non campionario.
Successivamente, andremo a vedere gli aspetti relativi alla costruzione del
questionario e vedremo nel dettaglio i concetti di errore non campionario.
70
LEZIONE 7
30/10/12
Pre appello circa il 19 DICEMBRE
INDICI ED INDICATORI STATISTICI
Parte prima: Introduzione e primi esempi
Visto che ci sono ancora dei problemi, abbiamo creato una cartella sull‟aulaweb
dell‟anno scorso.
Siamo arrivati ad una metà abbondante del percorso che volevamo fare assieme.
Abbiamo parlato di fonte statistica ufficiale, dato ufficiale e amministrativo. Ora
iniziamo a guardare i metodi di analisi e sintesi dei dati. Per fare questo, andremo ad
analizzare gli indici e gli indicatori statistici, vedremo la differenza tra indice ed
indicatore.
Stamattina, mentre mi stavo preparando per venire qui, ho visto che sono stati
pubblicati gli ultimi risultati sull‟ indice di disoccupazione in Germania. Cosa è un
indice? Una misura che serve a riassumere il comportamento di un certo fenomeno. Dà
l‟indicazione del fenomeno.
Che differenza c‟è tra indice e indicatore? Cominciamo oggi a parlarne. Verso la fine
del corso si parlerà di alcuni indici particolari: indici dei prezzi al consumo. Interverrà
a dicembre, il primo o il secondo martedì, una unità del personale del comune, che vi
spiegherà con gran dettaglio quali siano le procedure che il comune segue nella
rilevazione dei prezzi.
L‟inflazione, il tasso di inflazione a livello nazionale, è un aggregato delle variazioni di
prezzo che si misurano a livello locale. Le strutture che sono delegate alla rilevazione
dei prezzi sono gli uffici statistici comunali, secondo uno schema stabilito dal
programma statistico nazionale nell‟ambito del Sistan.
Statistica: l‟abbiamo già detto tante volte, non ha origine chiara e ben definita. Può
essere legata a status, posizione attuale, lo stato delle cose, stadera bilancia in latino,
stat città. Più in generale è ricondotta alla parola stato, perché misura queste grosse
misure dello stato inteso come stato o come nazione. La parola statistica fa
riferimento al numero residenti, numero di famiglie, numero di abitazioni, numero di
ovini caprini bovini, fa riferimento anche a tutti i movimenti turistici in ingresso ed in
uscita dal paese, le strutture alberghiere.
Statistica, differentemente da quanto visto nella parte di inferenza in statistica 1,
non rappresenta necessariamente l‟insieme di metodi e tecniche per analizzare i
campioni, ma rappresenta un insieme di tecniche di sintesi di grandezze per il paese. È
la definizione storica di statistica, è la vecchia statistica, quella istituzionale.
C‟è chi l‟ha definita come l‟altra faccia della politica: la politica dovrebbe indicare
come un paese andrebbe governato, la statistica dice come il paese viene governato,
71
quali sono i grandi numeri. Oggi la parola statistica non ha più significato di
misurazione delle grandezze dello stato, l‟abbiamo già accennato, in realtà si parla di
statistica con sondaggi di opinione, interessi sui farmaci, l‟analisi dei mercati
finanziari, anche le previsioni del tempo. Se prendete un qualsiasi programma su
internet che vi dia le previsioni del tempo vi danno: probabilità di pioggia 40%.
Secondo me è abbastanza confuso. Pioverà il 40% della giornata o con la probabilità
del 40% verrà a piovere? Non è chiaro cosa si intenda con probabilità di pioggia.
Queste metodologie richiedono metodologie statistiche.
La statistica, sembra strano dirsi, ma ormai, per molti versi, si trova ovunque, si trova
in qualsiasi situazione in cui vi siano dei dati da analizzare. Per alcuni versi anche il
trattamento informatico dei dati è statistica. Tutte le analisi dati sono statistica.
Anche tutte le analisi fatte in azienda sono in realtà poi analisi di tipo statistico. In
alcuni casi prendono nomi differenti. Non so se farete controllo di gestione: si parla di
indici di bilancio e si ottengono delle percentuali, si dà un significato sottostante ad
una metodologia statistica. La statistica è qualsiasi analisi dati.
Qualsiasi tipologia di analisi dati rientra nella statistica. Però, noi abbiamo parlato nel
corso di statistica economica come un corso di statistica ufficiale, anche se la
statistica ufficiale richiede alcuni aspetti inferenziali. Non possiamo pensare che la
statistica ufficiale sia solamente analisi censuaria, ci sono anche analisi campionarie.
L‟obiettivo dell‟analisi della statistica economica e sociale è di ordine macro. Gli
aggregati che si vanno a studiare sono solitamente macroeconomici.
La produzione statistica ufficiale è quella che viene utilizzata per le grandi decisioni
di politica economica ed economia monetaria. La statistica ufficiale serve per
prendere decisioni. La statistica ha l‟obiettivo di aiutare un decisore: dirigente
d‟azienda, revisore contabile o sia governatore BDI-BCE. Il grado di complessità dello
strumento varia a seconda della complessità dei dati e della decisione. Calcolare gli
indici di bilancio è semplice, CCN è una formula da seguire con le poste di bilancio. Non
ci sono grandi analisi da fare, molto spesso non è considerata statistica se non
l‟applicazione di una formula.
È chiaro che una decisione di politica economica, decidere di alzare, introdurre l‟IMU,
abbassare l‟IVA, sono analisi che richiedono simulazioni di scenario. Cosa
succederebbe se facessimo questo o quest‟altro? Devo avere aggregati di dati
sottostanti che ci permettano di prendere decisioni.
Lo stesso avviene a livello locale. Ne abbiamo parlato tante volte: se si vogliono
attuare particolari politiche sociali nell‟ambito di regione provincia e comune, bisogna
avere alla mano un po‟ di numeri per evitare di andare a disperdere l‟attività e le
risorse del comune in maniera tale da cercare di focalizzarle nei luoghi e verso le
persone che effettivamente ne hanno bisogno. A nessuno verrebbe in mente di aprire
una mega struttura di asilo nido nell‟entroterra ligure sperduto nei monti. Meglio farlo
dove i bambini ci sono. Ci sono situazioni in cui il contesto nel quale prendere le
decisioni non è chiaro.
72
La statistica ufficiale serve a fornire delle informazioni per i decisori. Abbiamo le
decisioni come fine ultimo della statistica, e della statistica ufficiale. Attenzione: la
statistica non si può sostituire al decisore. Il decisore (PDC, ministro dell‟economia,
assessore comunale o regionale, direttore di una azienda ospedaliera, responsabile di
un certo numero di asili nido) deve cercare di individuare la soluzione migliore sulla
base degli elementi certi che ha a disposizione. Può trarli dalla propria esperienza ma
anche dai database amministrativi di cui abbiamo parlato sino ad oggi. La statistica
non ha uno scopo autoreferenziale di piacersi e produrre tabelle e dati, ma ha lo scopo
di fornire le basi per prendere le decisioni.
Ve lo dico già, in generale in Italia c‟è una particolare resistenza nei confronti del
dato statistico, il dato statistico non mente. Ci sono modi per mentire con la
statistica. Ma se i dati vengono raccolti e analizzati nel modo giusto non mentono. Se
la politica ha o meno avuto successo i dati non mentono.
C‟è una resistenza a livello italiano. La cultura italiana è di tipo umanistico letterario.
Ci sono persone quasi orgogliose che in televisione dicono che non conoscono il
teorema di Pitagora. Se una persona non sa chi ha scritto l‟Iliade o l‟Odissea è una
vergogna. Non conoscere le basi della matematica, la differenza tra una stella e un
pianeta, allora quello non è grave! Se avete velleità più scientifiche metteteci una
croce su, la cultura italiana è prevalentemente umanistica.
Tant‟è vero che la statistica viene sempre utilizzata poco, la sensibilità nei confronti
del dato è scarsa. Diversamente dai paesi anglosassoni o del nord Europa, in cui le
decisioni vengono fortemente effettuate sulla base dei dati. Ci sarebbe molto da dire
su questo, ma non apriamo il capitolo.
Guardiamo la complessità dell’informazione statistica. Il mondo corre sempre più
veloce. Lo sentiamo dire spesso, l‟abbiamo già detto sulla questione della pertinenza e
tempestività dell‟informazione statistica. Abbiamo visto le caratteristiche del dato
statistico: accurato, pertinente e tempestivo. Avere oggi i dati di tre anni fa serve a
poco. C‟è bisogno di avere informazioni sempre più tempestive.
Non so se avete visto, credo che vi sia sfuggito, nel decreto sviluppo di Monti è stato
deciso che l‟Italia userà il sistema rolling census francese. Le informazioni sono
campionarie aggiornate ogni anno con rotazione quinquennale dei comuni che vengono
campionati. Quel sistema verrà realisticamente adottato anche in Italia.
Le decisioni devono essere prese sempre in tempo. Abbiamo un mondo che cambia
velocemente. I dati che abbiamo rilevato non si riferiscono più alla popolazione di
adesso.
Trovate il dossier della Caritas che dice che in Italia 5.000.000 di immigrati regolari
tra cui 2.000.000 nella CE. I dati li prendo oggi e tra sei mesi non valgono più. La
produzione statistica ufficiale, anche l‟Istat, stanno introducendo nei loro dati anche
un aspetto previsivo. Vanno a cercare di prevedere come sarà l‟inflazione,
disoccupazione, prodotto interno lordo di qui a tra sei mesi in modo da dare al
decisore pubblico la possibilità di prendere decisioni non a posteriori ma possibilmente
ex ante, in modo tale da anticipare la tendenza e correggere la rotta.
73
Non possiamo
permetterci di sbagliare nel prendere le decisioni. Possiamo
permettercelo, tutto dipende dall‟effetto della nostra decisione. Se si tratta di aprire
o meno un punto vendita possiamo ancora gestirlo. Decidere se uscire o meno dall‟euro,
o prendere una azione piuttosto che un‟altra di politica economica, sono terreni minati
con i mercati finanziari.
Dall‟altro punto di vista abbiamo sempre più informazioni disponibile, abbiamo i
database amministrativi. Bisogna: analizzare i dati raccolti, trasmettere
l‟informazione contenuta dentro di essi e prendere le decisioni. Questo vale si a livello
di statistica ufficiale che di statistica per le decisioni aziendali. Anche per decisioni
di marketing o strategia d‟azienda è chiaro che questo deve essere fatto.
Vediamo un esempio di come è cambiata la complessità dell‟informazione. Prendiamo le
domande che erano presenti, il numero dei questi, che erano presenti nei questionari
dei censimenti. Nel 1861, primo censimento italiano, avevamo 13 domande: 9 dati
anagrafici, 1 famiglia alloggio, 2 istruzione, 1 occupazione.
Col passare degli anni le domande sono aumentate. Se vedete la barra, l‟istogramma, il
diagramma a barre è tanto più lungo quanto più lunghe sono le domande. I colori
differenti fanno riferimento alle domande. I dati anagrafici fanno da padrone dei
questionari sino al 1936 e il numero di domande è rimasto fluttuante tra il dieci e
venti con sforamento delle venti nel 1921 e 1931. Tra quei due anni, nel 1926 abbiamo
l‟istituzione dell‟Istat.
Nel dopoguerra le domande sono cresciute moltissimo. Quello che poi è diventato
interessante, è che in linea di principio le domande relative ai dati anagrafici sono
rimaste le stesse se non addirittura sono diminuite. Potendosi avvalere di dataset
amministrativi, negli anni ‟80 e ‟90 c‟è stato un minor bisogno di andare a rilevare
direttamente questo fenomeno. Sono aumentate molto le domande relative a famiglia
e alloggio. Da una domanda sino al 1936 a 8 a 19 sino a 22. Sono cresciute, anche se in
modo meno forte, le domande relativamente all‟istruzione 3-3-5-4-4.L‟occupazione è
diventa un po‟ più interessante dal punto di vista di indagine.
Questionari del 2001 e 2011 sono aumentati moltissimo. Siamo partiti con 13 domande
nel 1861 e, dopo 15 censimenti, siamo arrivati ad oltre settanta domande. È evidente
che il bisogno informativo si è reso più stringente. Se hai bisogno di più informazioni
rilevi più dati. Vediamo che il settore in cui sono cresciute di più le domande è
l‟istruzione anche se l‟occupazione è cresciuta molto. Ci siamo stabilizzati dal secondo
dopoguerra riguardo al numero di domande su famiglia e alloggio. Anche le domande sui
dati anagrafici si sono rese abbastanza stabili ma sono aumentate per rilevare meglio
la componente straniera della popolazione.
Cosa è la comunicazione statistica? Da un lato ho dati, tabelle e grafici. Di solito
vengono pubblicate sui libri, internet e li muoiono, se nessuno le va a prendere.
Produrre statistiche ufficiali in senso stretto significa produrre tabelle. Le tabelle da
sole non sono informazione. È come comprare un libro pensando di averlo già letto. È
diverso. A me capita di trovare un articolo scientifico interessante, già il fatto di
stamparlo, fotocopiarlo e pinzarlo mi dà l‟idea di averlo già letto, non è così.
74
Con questi dati cosa dobbiamo fare? Darli agli amministratori e dirigenti che devono
prendere decisioni. Il lavoro dello statistico non è quello di produrre tabelle. Non è il
lavoro che faccio io. Non c‟è un unico statistico che faccia tabelle. 36.03 Deve
sforzarsi di riassumere i dati, gli aspetti essenziali delle tabelle, dati e grafici, e
metterli a disposizione dei dirigenti che devono prendere le decisioni. Possono essere
sia dirigenti pubblici sia dirigenti d‟azienda.
Poi devono essere trasferiti ai giornalisti. Alla radio si danno informazioni a riguardo
della popolazione straniera, si dice come sta andando il paese, come si fa a diffondere
un documento nel modo più veloce? Su internet potenzialmente lo può vedere chiunque.
Anche attaccare un poster per strada potenzialmente può vederlo chiunque. È chiaro
che i giornalisti non riportano mai la tabella, ma quello che interessa sono i pochi valori
del fenomeno.
Lo stesso i cittadini. Conoscenza è democrazia. Poter avere i dati sui dati delle
amministrazioni, sui bilanci di aziende, enti pubblici, sui bilanci dei partiti come
vengono spesi i soldi è una forma di controllo sugli organi di governo
dell‟amministrazione pubblica. Conoscenza dei dati come forma di democrazia.
C‟è una tenenza generale, a livello globale, di rendere disponibili i dati come nuova
forma di democrazia partecipativa. Dai dati sono fonte di informazione. Dai dati
giudico l‟operato delle amministrazioni. È chiaro che non tutti riusciranno a capire cosa
c‟è all‟interno dei dati. Se sono disponibili, un giornalista può tirare fuori informazioni
interessanti e derivare giudizi sull‟operato dell‟amministrazione.
Questa tipologia di diffusione dei dati in maniera gratuita è chiamata open data. Ci
sono tantissimi siti che parlano di open data. Sul sito dell‟Inps trovate open data. C‟è
un processo a livello globale di avvicinamento dei cittadini al dato. Sebbene ci sia, in
modo particolare in Italia, questa riluttanza di fronte al dato, i dati sono oggettivi
essi sono importati.
Bisogna sintetizzare l‟informazione in pochi valori chiave per farlo costruisco indici e
indicatori. Spesso i termini indici ed indicatori vengono usati come sinonimi, c‟è una
differenza, anche se nel prosieguo li utilizzeremo come sinonimi.
Indice viene dal latino index, qualsiasi cosa di utile ad indicare. Indicatore, indicator è
ciò che indica. La parola indice, già utilizzata dal „700, siamo sempre li come periodo.
La statistica ufficiale nasce nel „700, ha di fatto molti significati. Misura di sintesi
delle proprietà di una distribuzione: reddito medio, tasso di disoccupazione,
aspettative di vita. oppure può essere un numero puro non dipendente dall‟unità di
misura dei dati: indice dei prezzi al consumo alla produzione, indice della produzione
industriale. Questi li andremo a vedere nella fase conclusiva del corso.
Il reddito medio è un indice di ricchezza. Qual è il reddito medio degli italiani? Ci fa
capire come è la situazione. Posso anche dire qual è la percentuale di italiani che sono
al di sotto di una soglia, che definiamo reddito di pura sussistenza. Aspettativa di
vita? Gli anni che la persona nata in un certo anno può aspettarsi di vivere.
Novant‟anni, un bimbo che nasce oggi ha aspettativa di
vivere novant‟anni.
Trentacinque anni invece per altri paesi più poveri.
75
Indicatore. Fa riferimento a qualcosa di più complesso. Un indice è un indicatore. In
realtà indicatore è un elemento di un insieme di indici, è qualcosa di più complesso, è
qualcosa di sistemico. È un sistema di indici che prende il nome di indicatori. Quando
parlo di misure indirette di fenomeni complessi, abbiamo un indicatore. È uno
strumento di valutazione complessa di un fenomeno a cui si riferisce un certo legame
con un referente concettuale che fa parte di un modello di ricerca e di uno schema
interpretativo.
Un indicatore rappresenta una statistica. A volte si parla di statistica come anche
come indicatore. Le statistiche sul commercio sono indicatori sul commercio, le
statistiche sulla disoccupazione sono indici e indicatori sulla disoccupazione, e così via.
Un indice diviene indicatore quando la sua definizione e misurazione è collegata ad un
obiettivo definito. Vediamo degli esempi.
Come misuro la povertà? Prendiamo l‟Africa. Posso misurarla in GDP (Gross Domestic
Product). Posso fare il PIL procapite, PIL diviso per il numero degli abitanti. Oppure
possiamo costruire un indice di povertà legato al grado di alfabetizzazione della
popolazione, vedo qual è la percentuale di persone che sanno leggere o scrivere,
oppure vedere l‟aspettativa di vita.
Queste mappe colorate, o graduate per livelli dell‟indice, sono colorate dal più chiaro
al più scuro. Il più scuro è il valore più basso. Bianco sono assenza di dati, marroncino
chiaro valori piuttosto alti, Sud Africa, gradazione più scura per indicare un fenomeno
più forte, intenso ma più basso. La povertà è più forte dove il reddito procapite è più
basso. La povertà è più forte dove la percentuale di persone che sanno leggere e
scrivere è più bassa, la povertà è più forte dove l‟aspettativa di vita è più bassa. Sono
misure e indici che singolarmente presi vanno ad analizzare aspetti differenti di un
fenomeno che possiamo collegare alla povertà.
Non ci dicono la stessa cosa, l‟informazione non è la stessa. Sono collegati al medesimo
fine, proviamo a ragionare in termini di povertà, ma non ci danno la stessa
informazione perché le tre mappe sarebbero colorate allo stesso modo. L‟informazione
di questi tre indici è differente.
Quali sono le caratteristiche che dovrebbe avere un indice per essere chiamato
indicatore? Esclusività. Dovrebbe essere non sostituibile con un altro indice per
indicare lo stesso fenomeno sociale. Due indici che ci danno la medesima
informazione? Posso vedere se c‟è un indice comune.
Sensibilità. Dovrebbe essere in grado di esprimere l‟intero fenomeno osservato e
registrare tutte le variazioni del fenomeno stesso. Ci deve essere un legame lineare
rispetto a ciò che viene misurato.
Univocità. Interpretabile in modo non ambiguo rispetto alle direzioni delle variazioni.
Se abbiamo una variazione negativa del reddito procapite? Dobbiamo aspettarci che
corrisponda una variazione positiva della povertà. Non dobbiamo avere indici che
abbiano una variazione non lineare.
Fedeltà. Dovrebbe imputare le variazione lungo il tempo a cambiamenti della realtà e
non alla qualità della misurazione. È evidente, definito lo standard l‟indice non
76
dovrebbe essere soggetto a variazioni non imputabili ad altro che alla variazione del
fenomeno sottostante.
Sintesi. Dovrebbe essere la sintesi di aggregazione di osservazioni parziali.
Finalizzazione dovrebbe essere correlato agli obiettivi dello studio.
Esaustività descrivere tutte le dimensioni considerate.
Significatività . Dovrebbe essere significativo relativamente alle unità territoriali
considerate.
Le tre entità che descrivono il concetto di indicatore sono :
- Comunicazione. Un indice è inutile se non trasmette informazioni. Se è difficile
non serve. Deve essere bello, chiaro che uno lo vede e capisce cosa sia. Deve
consentire la conoscenza da parte del fruitore dell‟indicatore.
- Semplificazione. Un indice che rende ancora più complessa la comprensione del
fenomeno è inutile. Deve attuare una riduzione della complessità del fenomeno a
vantaggio di una sua più facile comprensione. Ogni semplificazione, ogni sintesi
dei dati porta ad una perdita di informazione. Quando abbiamo visto a
statistica 1 la perdita di informazione, abbiamo parlato di perdite o misura del
danno. Ogni sintesi porta ad una perdita di informazione. Tuttavia, in generale,
è preferibile avere una modica perdita di informazione a vantaggio di una
maggiore capacità comunicativa, e avere una maggiore informazione.
- Quantificazione del fenomeno, per poter confrontare nel tempo l‟andamento di
questo indice e confrontarlo anche nello spazio.
Semplificare sempre? Ci sono due frasi, una assegnata ad Einstein: cercherò di
rendere il discorso il più semplice possibile ma non oltre. Al di sotto di un certo livello
di semplicità non posso andare sennò dico cose sbagliate. La seconda: non si può
ammorbidire troppo il ghiaccio sennò si va ad ottenere acqua calda.
Lo stesso per gli indici, giusto compromesso tra trasmissione e complessità delle
informazioni raccolte. Per giocare a calcio, per esempio, possiamo dire che la terra è
piatta. Per quello che dobbiamo fare, 150 metri di lunghezza del campo di calcio dire
che la terra è piatta va benissimo. Se dobbiamo fare un viaggio aereo no. Da Parigi a
NY non andate lungo il meridiano. Andate prima verso nord e poi si scende in giù. La
rotta ortodromica è più corta della lossodromica.
Gli indicatori possono non solo rappresentare un fenomeno, ma essere usati come
criteri e metodi per arrivare ad una valutazione. Servono per prendere decisioni di
politica e di gestione. Ecco che prima di decisioni, si va ad inserire una freccetta che
si chiama valutazioni.
Abbiamo la statistica ufficiale, da questa devo creare indicatori che permettano di
effettuare valutazioni e al termine di esse prendo le decisioni.
D‟altra parte, un singolo indicatore pur se collegato ad un particolare bisogno
conoscitivo, non è significativo in quanto fornisce una informazione utile per
descrivere fenomeni complessi. Ciascuno di essi assume significato solo se inserito ad
una struttura più ampia finalizzata alla conoscenza dei fenomeni di interesse.
77
È il classico problema dei KPI (Key Performance Indicator). Forse li avete sentiti
nominare in qualche altro corso. Si parla di deshboard di gestione aziendale. Dove per
deshboard si intende un cruscotto con un foglio, fatto in Excel, in cui avete fatturato
ultimo mese, ordini ricevuti nell‟ultimo mese, variazioni rispetto a ultimo mese, mese
precedente, merci in magazzino. Variazioni in un unico foglio in cui ci sono indici ed
indicatori in cui trovate i KPI. Si parla di sistemi concettuali. Adesso vedremo che si
usa un sistema complesso di definizioni e concetti che andiamo ad elaborare.
Modello concettuale. I fenomeni sono osservabili e misurabili dopo aver definito un
modello concettuale di riferimento. Se volete misurare l‟inflazione, la disoccupazione,
andamento economico. Cosa è? Variazione del PIL, variazione degli introiti fiscali,
variazione degli occupati e disoccupati.
Cosa voglio misurare? Bisogna definire una serie di concetti astratti che si chiamano
costrutti.
La definizione del modello concettuale è un momento complesso, richiede di
identificare e definire questi costrutti logici che derivano da astrazioni, dati dalle
teorie economiche. Se decido di analizzare il modello concettuale legato all‟andamento
economico, dovrò riferirmi ad una serie di teorie economiche che mi fanno entrare nel
modello gli indicatori delle quantità di interesse. Per esempio base monetaria e spesa
pubblica. Ci metto dentro una teoria monetarista con la base monetaria ed una
keynesiana con la spesa pubblica, per fare un esempio molto semplice.
Facciamo un esempio molto semplice. Di benessere parleremo a lungo parlando di PIL e
del benessere ecosostenibile. Cosa è il benessere sociale? ci sentiamo tutti bene? C‟è
benessere sociale. non funziona così. All‟interno del benessere sociale definiamo dei
costrutti, dei concetti astratti in modo tale che siano formulati e ipotizzati in maniera
tale che siano fondati nel mondo empirico. Benessere è quando c‟è benessere
economico, sanitario, alfabetizzazione, eccetera.
Possano essere misurati empiricamente, cosa non facile. C‟è un benessere psicologico
non facile da misurare empiricamente; riflettano la natura dei fenomeni considerati.
In particolare dobbiamo dare una attenzione all‟identificazione del livello di
omogeneità e dimensionalità del costrutto.
Per esempio status sociale, è un esempio di costrutto. Lo staus sociale è qualcosa che
è vago. Si compone, al suo interno, di una serie di variabili che possiamo chiamare
variabili latenti. Ciascun costrutto è definito da uno o più aspetti
generali
rappresentati dalle variabili latenti che esprimono il concetto da misurare.
Se volessimo identificare un costrutto status sociale, cosa descrive lo status sociale?
L‟istruzione, professione e altre cose. Lo status sociale non è solo una questione
reddituale. La variabile latente rappresenta l‟aspetto da rilevare per avere una visione
complessa del costrutto. Ho il modello grosso, sottostanti i vari costrutti e all‟interno
di ciascun costrutto le singole variabili latenti. Se volete pensare ad un albero, ho una
cosa del genere. Ho il modello, al di sotto ho una serie di costrutti, per esempio
quattro, e poi ciascun costrutto è definito dalla frangia di un tappeto, cioè dalle
singole variabili latenti. Mettendo tutto insieme arriviamo al famoso modello.
78
L‟identificazione delle variabili latenti dev‟essere basata su premesse e presupposti
sia teorici che empirici e richiede un lavoro raffinato. La definizione delle variabili può
aumentare in modo significativo la potenza del costrutto sia a livello teorico che
empirico.
Cosa potremmo usare come indicatore per il grado di alfabetizzazione? Anni di
scolarità o titolo di studio. Vediamo l‟insieme.
Abbiamo il modello concettuale, la teoria. Il modello macroeconomico che spiega il
benessere economico. Il modello concettuale che consente di definire il modello
concettuale ed i costrutti ad esso connesso, benessere sociale. poi ho i concetti
astratti che sono molto generali, detti anche costrutti. Sono le aree di indagine, detti
domain che caratterizzano il fenomeno da studiare, per esempio lo status sociale. Poi
le variabili che definiscono i costrutti, istruzione e condizione professionale. Se
prendo la variabile istruzione, può essere misurata attraverso vari indicatori che
possono essere per esempio il titolo di studio e gli anni di scolarità..
Avete il modello che è benessere sociale, tanti concetti astratti, tra cui lo status
sociale che può essere misurato attraverso tante variabili, ciascuna variabile
misurate attraverso un indicatore. Da livello elementare di indicatore sino a quello
generale del costrutto. È qualcosa di complesso.
Parliamo di un indice, che potrebbe essere chiamato indicatore. ISU (Indice dello
Sviluppo Umano), esiste dal 1990 è usato per misurare lo sviluppo umano dei paesi.
Anche noto come HDI, è stato utilizzato nel 1990 per il primo rapporto sullo sviluppo
umano delle nazioni unite. Li vedete il rapporto 2011, non so se è già uscito quello del
2012.
In tale rapporto lo sviluppo umano è definito come il processo di ampliamento delle
scelte delle persone (cercate di ricondurvi al concetto di modello), sottolineando come
le scelte e opzioni base di cui un essere umano deve poter disporre siano quelle di una
siano vita lunga e sana, acquisizione di conoscenze, accesso ad un reddito
sufficientemente elevato a consentire un dignitoso tenore di vita. Un paese è
sviluppato non se è ricco, ma se chi vi abita può vivere a lungo, vivere con un reddito
che consenta di avere un dignitoso status di vita e permetta studiare e avere un buon
grado di conoscenza e non di ignoranza.
Abbiamo definito il modello e i nostri costrutti. Il modello è il processo di
ampliamento delle scelte delle persone che si sviluppa secondo queste tre dimensioni:
vita lunga e sana (abbastanza vago), acquisizione di conoscenze, reddito elevato. Siamo
a livello dei costrutti. Poi abbiamo le nostre variabili, possono essere di vario tipo.
Il rapporto propone l‟adozione di un nuovo indicatore che tenga conto di tutte e tre le
dimensioni dello sviluppo sopra individuate, speranza di vita istruzione e reddito. Cosa
propone? Di utilizzare, per la vita lunga e sana la speranza di vita; capacità delle
persone di formarsi l‟alfabetizzazione; per la ricchezza il logaritmo del prodotto
interno lordo procapite, dando un‟importanza meno rilevante alla ricchezza. In questa
ipotesi si pensa che l‟utilità marginale del reddito sia decrescente (in termini
economici).
79
Ho il PIL reale di tutti i paesi, ne calcolo il logaritmo e da qui ho la variazione di 1000
euro che pesa di meno di una variazione di 100 euro. In proporzione 1000 su cento è 10
volte ma il logaritmo di 1000 diviso il logaritmo di 10 non è 10.
Lo sapete come è fatta la funzione logaritmo? È fatta così. Qua abbiamo 1. Se avete
il PIL pro capite, se questo è per esempio qua ho 1000 e qua 100, questa è un dieci
volte. Il logaritmo è minore di dieci volte. Specifica che l‟utilità marginale del reddito
risulta essere decrescente quanto più uno è ricco tanto meno ha bisogno di soldi
aggiuntivi. Per chi è povero un euro è molto più importante rispetto a Berlusconi.
L‟ISU calcola per ciascuna delle tre variabili un indice. Poi va a normalizzarli secondo i
valori e il criterio che abbiamo visto nel corso di statistica 1 e li combina tutti
assieme.
Vediamo un esempio. Lo Zimbaue ha un valore 12, USA 41. Zimbaue 12 valore minimo,
USA 41 valore massimo. Supponiamo che l‟Italia abbia 34. Come si fa a normalizzare
un indice? Dovete ricordarlo da statistica 1. Prendo il rosso e il verde, differenza tra
Italia e Zimbaue 34-12 diviso 41 meno 12. L‟Italia è al 75% del valore della variabile.
Prendo l‟indice di speranza della vita italiana, l‟indice di alfabetizzazione dell‟Italia,
l‟indice riguardo al PIL procapite dell‟Italia e faccio una media ponderata in cui ogni
indice pesa uno, in realtà media aritmetica.
Questa è stata una scelta molto discussa. Io prendo un indice di alfabetizzazione di
tutti i paesi, la ricchezza di tutti i paesi, la speranza di vita di tutti i paesi. Poi
trasformo questo in un indice che va da 0 a 1, da 0 a 100%. 0 se sono sfortunato e 1 se
sono fortunato. Prendo i valori e calcolo la media aritmetica. La logica è che, condizioni
di vita accettabili, vita lunga e sana e alfabetizzazione sono tre aspetti della dignità
umana che hanno lo stesso peso, non ce ne è uno che sia il più importante, allora
vengono messi sullo stesso piano. Poi si può dire: è più importante la vita lunga, è una
opinione. Il problema della costruzione di questi indici di sintesi ricade qua. Se ho
tanti indicatori come li combino in un unico indice? A volte non è semplice, ci sono
gruppi di lavoro, si discute, si parla e si arriva ad un accordo.
L‟indice ISU ha suscitato grande interesse tra i politici, gli operatori dello sviluppo, gli
studiosi, la stampa e l‟opinione pubblica. In particolare ciò che ha colto particolare
interesse è che sia una media non ponderata, tutti compreso uno, di un paese nella
scala della speranza di vita. La risposta è che la somma dei tre indici non è
preponderata perché tutte e tre le caratteristiche hanno lo stesso peso.
Quello che risulta interessante, è che se noi prendiamo il 20% dei paesi più ricchi,
scusate questo 20% della popolazione più ricca al mondo ha l‟87% del reddito
mondiale. Se siamo 7 miliardi di persone al mondo, 1 miliardo e quattro messe assieme
fanno l‟83% della ricchezza mondiale. Il quinto più povero della popolazione, 1 miliardo
400.000 ha reddito complessivo dell‟1, 4 rispetto a tutto il reddito mondiale.
Queste misure di disuguaglianza economica, che voi avete un pochino visto utilizzando
l‟indice di concentrazione del Gini, ricadono qua dentro. Perché Gini, italiano, primo
presidente dell‟Istat aveva sviluppato l‟indice? Per misure di disuguaglianza sociale.
80
Posso ragionare in termini di misura dell‟indice del Gini a livello di concentrazione del
reddito mondiale.
Inoltre, se vado a fare una rappresentazione dell‟ISU a livello planetario e indico dove
sono i posti con ISU più alto, trovo USA, Canada Francia Irlanda paesi Scandinavi e
Islanda e poco altro nelle fasce più alte. Poi Spagna, Italia Germania eccetera, poi i
posti Russia, Cina e così via, tutti gli altri paesi.
Così ho costruito un indicatore di sintesi dei tre indice singoli: alfabetizzazione,
reddito procapite (logaritmo del reddito procapite) eccetera. Un indice di questo tipo
è interessante da studiare nella sua evoluzione temporale. Nel grafico c‟è la serie
storica dell‟ISU di Zimbaue e Mozambico da 1970 a 2010, in realtà è stato calcolato
retroattivamente, visto che è nato nel 1990.
Lo Zimbawe è caratterizzato da un trend crescente per poi andare a diminuire
fortemente. L‟indice del Mozambico va a crescere. Se voi avete un indice così fatto,
ISU = I1+I2+I3 diviso tre, se ognuno di questi indici va da zero ad uno, l‟ISU non può
che andare da zero a 1. Zero se tutti e tre gli indicatori valgono zero, e uno se tutti e
tre valgono uno. Mozambico 38% del massimo teorico, dove il massimo teorico risulta
quello del paese messo megloi.
Abbiamo rappresentazione temporale. Se voglio fare un confronto spaziale, uso un
diagramma a punti (come a statistica1) e vedo la relazione tra sviluppo umano e
tonnellate di CO2 prodotte per persona. sono dati del 2003, non ci interessa averli
aggiornati, servono solo per vedere come sono sistemati.
Abbiamo paesi con sviluppo umano alto, Norvegia Svezia Svizzera e Francia, e paesi
con tonnellata di C02 prodotto per persona molto alto. Abbiamo paesi come Uruguay e
Costa Rica C02 bassa e sviluppo umano abbastanza elevato.
Non dovrebbe stupire più di tanto che ci sia una relazione tra l‟ISU e le tonnellate di
di CO2 prodotte. Le tonnellate di C02 prodotte vengono dalle industrie, dal traffico,
dalle macchine. I paesi sviluppati e più forti economicamente hanno produzione di
CO2. Non c‟è da stupirsi che i paesi più ricchi con PIL più alto e PIL pro capite più alto
hanno un ISU più alto, perché l‟ISU include per un pezzo il PIL. Non è una magia che ci
sia questa relazione.
Guardiamo ancora l‟ISU per l‟Italia. Regioni con ISU più alto sono Piemonte ed Emilia
Romagna. Tutto il Nord si sviluppa bene, non è molto alto il Trentino Alto Adige, e il
sud sviluppo umano più basso. Stiamo parlando di .88 .91.
Per oggi va bene così. Martedì prossimo andremo avanti con indici ed indicatori e poi
PIL e indici di benessere.
81
LEZIONE 8
06/11/2012
DAL PIL AL BES
LA MISURAZIONE DELLA RICCHEZZA DEL BENESSERE
L‟ultima volta abbiamo discusso di che differenza ci sia tra un indice ed indicatore.
Abbiamo parlato di modelli, costrutti, variabili latenti e come l‟inserimento in un
organico di tanti indici ne rappresenti poi un indicatore.
Iniziamo oggi un nuovo argomento che occuperà due lezioni: la misurazione della
ricchezza. Misurare la ricchezza di un paese è uno dei compiti più difficili e
importanti della statistica ufficiale. L‟abbiamo già detto tante volte, la statistica
economica, la statistica sociale e ufficiale, ha l‟obiettivo di effettuare misurazioni sui
grandi aggregati di un paese e misurare la ricchezza è uno degli aspetti più
interessanti. Pensate ai singoli individui, alle singole aziende: come si misura la
dimensione dell‟azienda? In base al fatturato, non agli utili.
Lo stesso dicasi per un paese. Come lo dimensiono? Per la popolazione, come l‟azienda
può essere dimensionata per il numero di addetti. Però si può misurare anche in
relazione alla ricchezza prodotta ogni anno.
La statistica, nella sua concezione più antica, è la scienza che misura le grandezze di
un paese. Una delle più importanti è evidentemente la ricchezza. Ma che cosa è la
ricchezza? È una domanda che prima dobbiamo porci sulla base dei discorsi anche
fatti l‟altra volta. Prima iniziamo ad individuare il contesto per avvicinarci alla
misurazione. Non diciamo il PIL è questo prendetelo per dato, costruiamo il
ragionamento che ha portato alla costruzione del PIL.
“La ricchezza delle nazioni” che penso abbiate sentito nominare come titolo di un
libro, o “Indagine sulla natura e le cause della ricchezza delle nazioni”, titolo
completo, è un libro che è stato scritto nel 1776 da Adam Smith, considerato uno dei
padri della economia politica moderna. È il famoso autore della fabbrica di spilli. È
anche l‟anno della dichiarazione di indipendenza americana.
È un libro che pone le basi della moderna economia politica. Se lo cercate in libreria
costa una decina di euro, non ci sono più i diritti d‟autore. “La ricchezza di una nazione
non deriva dalla quantità di risorse naturali o metalli preziosi di cui essa può disporre,
(non definisco ricco un paese che ha miniere di diamanti, o d‟oro o uranio o petrolio) né
è generata solo dalla terra (non conta solo la produzione agricolo, considerate anche il
tempo), ma dal lavoro produttivo in essa svolto, e dalla capacità produttiva di tale
lavoro”.
Se vado a vedere la Groenlandia o l‟Antartide trovo grandissime risorse naturali non
sfruttate per varie ragioni ma non per questo sono delle potenze economiche a livello
mondiale. La ricchezza delle nazioni, partendo dalla definizione di Smith, non è la
misurazione della ricchezza potenziale ma quello che viene effettivamente prodotto
nel paese.
82
Oggi la posso definire come “il valore totale dei beni e servizi prodotti in un Paese in
un certo intervallo di tempo (solitamente un anno) e destinati al consumo
dell‟acquirente finale, agli investimenti e alle esportazioni”.
Abbiamo già dato macroeconomia. Un paese, una nazione, è molto ricco, non se ha
molto denaro, ma se possiede molti beni e questi beni sono stati prodotti. Avere
solamente tanti prodotti bancari non rende un paese ricco, si ha tanta liquidità, ma se
vedete la Svizzera ha depositi bancari altissimi ma non la rendono un paese
particolarmente ricco. Può essere ricca per le attività economiche connesse a queste
risorse finanziarie.
Una delle formule più importanti della teoria economica è la identità keynesiana. Y=
C+I+NX+G-T. NX sono le esportazioni nette.
- Y ricchezza prodotta nel paese in un anno (PIL/GDP, gross domestic product)
- C sono in consumi finali delle famiglie (quanto le famiglie spendono)
- I sono gli investimenti delle aziende per la loro crescita, comprare nuovi
macchinari
- Nx esportazioni nette: esportazioni meno importazioni. Esportazioni in senso
positivo, mi entra ricchezza nel paese. Meno importazioni è una ricchezza che
esce proprio a seguito del processo di importazione
- G spesa pubblica, va ad aumentare il reddito complessivo. Attraverso la spesa
pubblica lo stato da soldi alle aziende, ai privati, agli operatori economici che
possono produrre e consumare
- Meno T è la tassazione, parte di reddito sottratta agli agenti economici a
seguito della tassazione
È inutile che parliamo di risparmio, sapete che rientra indirettamente in questa
equazione. Tra l‟altro Keynes ha anche scritto un trattato di probabilità. È evidente
che il PIL costruito attraverso l‟identità keynesiana, noi ragioneremo su questa
identità, valuta la ricchezza di una nazione solamente in relazione al valore in denaro
delle transazioni o di quanto prodotto.
È quindi una valutazione strettamente quantitativa , non qualitativa della ricchezza
delle nazioni. Ha il pregio di essere fortemente utilizzato ed evoluto, sostanzialmente
perché l‟introduzione a livello mondiale del PIL risale al dopoguerra con gli accordi di
BW. Si decide di usare il PIL come misura della ricchezza del paese. È ormai un
elemento diffuso, comune che se parlate ai genitori di prodotto interno lordo più o
meno sanno di cosa si tratti. È un concetto che chiunque ha acquisito.
Tuttavia ha anche dei limiti. In questa presentazione, oltre vedere le caratteristiche
principali del PIL vedremo i limiti. Quello che ha di bello, è che a partire dal secondo
dopoguerra è iniziato ad essere misurato in tutto il mondo, e consente di fare
raffronti spaziali, tra paesi, e temporali in anni differenti.
Per esempio, vediamo un confronto spaziale. Ho dei dati che vengono dal FMI e si
riferiscono al 2010. Un po‟ vecchi, ma non è importante per quello che ci interessa.
83
Vediamo che il PIL mondiale inteso in milioni di dollari è di 74 milioni di milioni di
dollari, o 74 mila miliardi di dollari, cioè 74 triliardi di dollari.
Il famoso G7, la struttura dei grandi 7 che si sta man mano allargando sempre di più,
rappresentava nel 2010 il 40% della ricchezza mondiale. Su 74 milioni di milioni di
milioni di dollari, 29 mila erano del G7. L‟UE rappresenta il 20% della ricchezza
mondiale, mentre la zona Euro il 15% della ricchezza mondiale. Gli USA da soli pesano
quanto l‟intera UE. La Cina da sola pesa all‟incirca come la zona euro. Questo per
iniziare a capire, a livello mondiale, dove avviene la produzione di ricchezza, dove per
produzione di ricchezza intendiamo qualcosa di ben preciso.
In linea di principio, su all‟incirca 200 paesi che possiamo identificare al mondo, quelli
che sono al di sotto del 15esimo producono meno dell‟1% della ricchezza mondiale. Se
volessimo fare una somma siamo 20-40-49-55-60-65-70. I primi 15 paesi producono
circa il 70% della ricchezza mondiale.
Se ci fosse una equa distribuzione della ricchezza del mondo, se noi avessimo 200
paesi nel mondo, ogni paese dovrebbe produrre lo 0,5% della ricchezza mondiale. Le
motivazioni che hanno spinto Corrado Gini a produrre la spezzata di concentrazione
erano ragioni di questo tipo. Se fossimo in una condizione di equi distribuzione della
ricchezza nel mondo noi avremmo una spezzata di concentrazione di questo tipo. Noi
ci troviamo ad avere una spezzata di concentrazione in linea di massimo di questo tipo.
Questa area, di concentrazione, ci dice quanto siamo lontani dalla equi distribuzione.
In questi contesti si usa molto la misura di concentrazione del Gini. Si tratta di capire
quanto è forte la disuguaglianza economica tra paesi. Allo stesso modo si può
individuare la disuguaglianza economica tra individui.
Se volessimo fare una valutazione di tipo temporale potrei studiare il fenomeno come
serie storica, ne parleremo a fine corso. Posso vedere le crescite. Ad esempio ho un
grafico Eurostat in cui ho il GDP, PIL, per 5 economie dell‟area euro: Germania, Regno
Unito, Spagna, Francia e Italia. Si può vedere come ci sia una correlazione tra gli
andamenti. Inghilterra è meno coordinata con i paesi dell‟area euro per le ragioni del
fatto che la sterlina non è entrata nell‟area euro e le fluttuazioni economiche agiscono
diversamente tra i paesi dell‟area euro e i paesi che non lo sono. In questa finestra
temporale l‟euro ancora non c‟era, ma l‟Inghilterra ha sempre fatto storia a sé.
Un‟altra tipologia di confronto che si può fare è questa. Prendo una cartina, e andare a
rappresentare un pallino di dimensione differente in relazione alla dimensione del PIL.
Questo grafico l‟ho ottenuto facilmente utilizzando un software gratuito disponibile
su internet che permette di evidenziare in colori differenti i paesi a seconda del
continente, i pallini sono tanto più grandi quanto più è forte l‟intensità del fenomeno.
Gli USA sono giallo grosso, la maggior parte della ricchezza USA è della California,
stato americano con PIL più alto, i paesi UE sono abbastanza evidenti mentre l‟Africa
è caratterizzata da pallini piccoli, poi Giappone e Cina.
Come si calcola il PIL? Il PIL, di base, è fondato sulla identità keynesiana. Nella
pratica come facciamo a misurarlo? È una procedura complicata. In linea di massima, le
operazioni che vengono effettuate riguardano sia il valore dei beni materiali (case e
84
appartamenti prodotti ogni anno) sia il valore dei servizi. Le case costruite vengono
costruite nel PIL solo nell‟anno in cui vengono costruite. È come se il PIL fosse
fatturato dell‟azienda Italia. Nel fatturato di un anno metto le fatture attive fatte
nell‟anno, ogni anno si riparte da zero.
Cosa inseriamo dentro il PIL? Il valore di ogni bene o servizio dato dal suo prezzo di
mercato. La somma di tutti questi valori genera il prodotto interno lordo.
Ci sono però tutta una serie di servizi che non sono destinati alla vendita ma devono
avere una valorizzazione economica. Per esempio il mio stipendio, la difesa militare, la
polizia, le strutture legate alla vita sociale, i magistrati, queste voci non è che non si
possano non considerare, rientrano nella spesa pubblica.
Vengono inserite all‟interno del conteggio del prezzi politici, al prezzo di costo, ai
prezzi di produzione. Insegnanti forze dell‟ordine, giudici, amministratori locali, le
varie strutture statali e parastatali che si devono dare, eccetera.
In questo caso si ritiene che il valore della produzione sia equivalente al suo costo. Il
valore della mia produzione è equivalente allo stipendio che io prendo. Il valore del
lavoro del poliziotto è pari al suo stipendio. Il valore di un militare che muore da
qualche parte è uguale al suo stipendio. È un qualcosa di opinabile, ma si definisce il
criterio di base.
Ci sono poi aggregati che sono diversi dal PIL, prendono un nome che è diverso dal PIL.
Si parla di PNL (prodotto nazionale lordo) PIL procapite e PIN (prodotto interno
netto). Si tratta di prendere il PIL e sottrarre alcuni pezzettini. Un po‟ come anche
col calcolo degli indici di bilancio.
IL PNL, per esempio, si ottiene sommando al PIL i redditi percepiti dalle aziende
italiane all‟estero, o anche dai soggetti, singoli persone:
- Profitti di filiali di imprese italiane all‟estero, per esempio il parmigiano che
vendiamo negli USA, le automobili che vendiamo in giro per il mondo,
- Rimesse degli emigrati
- Rendite da attività finanziarie acquistate all‟estero
Non andiamo a vedere solamente il prodotto creato in Italia, ma quella di pertinenza
dell‟Italia e tutti i flussi che in qualche modo arrivano in Italia, allegato all‟Italia,
incluso anche quello venduto all‟estero.
Il PIN si calcola sottraendo al Pil il valore degli ammortamenti, cioè gli accantonamenti
che le aziende fanno ogni anno per un certo numero di anni, a fronte degli acquisti di
immobilizzazioni in generale materiali, ma non necessariamente. Se una azienda fa un
acquisto di un grosso impianto, costruisce un magazzino o acquista nuovi macchinari
con un grosso investimento, sarebbe sbagliato imputare tutto il valore degli impianti
all‟anno in cui sono stati acquistati, ha senso andarli a suddividere su più anni, stesso
discorso vale anche per la ricchezza prodotta.
Il rapporto tra il PIL di un paese e i suoi residenti è il cosiddetto PIL procapite,
indicato come misura del benessere di un paese. C‟è differenza tra la graduatoria dei
paesi per PIL complessivo e per PIL procapite.
85
Quello che interessa maggiormente non è il valore assoluto del PIL, per carità è
importante, è la ricchezza prodotta, però quello che interessa è che la ricchezza
prodotta cresca. È come sempre il fatturato dell‟azienda. L‟obiettivo è cercare di
incrementare il fatturato. Portare a casa utile. Un paese deve cercare di accrescere
la propria ricchezza.
Quello che interessa di più non è il valore assoluto del PIL, di fatti in generale non
sentite mai dire il PIL italiano è stato, ma la sua variazione. Il PIL è cresciuto del 1% o
è diminuito di qualche percentuale.
La variazione del PIL è facile. Viene misurata in questo modo. Si prende la variazione
del PIL dal 2010 al 2011, la misuro prendendo PIL 2011 sottraendo PIL 2010 e
dividendolo per l‟anno base 2010. Se PIL 2011 è maggiore del PIL 2010 la differenza
positiva, se PIL 2011 è inferiore al PIL 2010 la variazione è negativa. La variazione
percentuale di questo risulterà essere un valore positivo negativo a seconda che il PIL
2011 sia superiore inferiore a PIL 2010. Ad esempio PIL 20‟0 1.7 miliardi di dollari e
PIL 2011 1.68, avremmo un calo dell‟1.2%. Sono interessanti le variazioni del PIL
perché in relazione alla variazione del PIL valuto l‟andamento dell‟economia, di un
paese.
Tenete conto che il PIL è solo la crosticina. Non c‟è la possibilità di affrontare tutte
le scomposizioni che vengono fatte all‟interno del PIL. Ci sono tecniche di analisi della
contabilità nazionale molto simili alle analisi di bilancio che si fanno per le aziende. Si
possono costruire indici ed indicatori sul bilancio dell‟economia nazionale, che prende il
nome di conti nazionali.
Definiamo RECESSIONE TECNICA, termine che si sente spesso, una fase che un
paese affronta quando per due trimestri consecutivi registra il PIL in calo rispetto al
trimestre precedente. Il PIL di un trimestre, il trimestre successivo è in calo e il
successivo ancora in calo, si parla di recessione tecnica. Parliamo di recessione in
senso stretto, perché si certifica una marcia indietro dell‟economia per sei mesi
consecutivi.
Il termine “recessione” viene però talvolta utilizzato anche in maniera impropria. Non
è esattamente corrispondente a questa definizione. In linea di massima si parla di
recessione quando la variazione del PIL è negativa. Tenete presente che l PIL non sarà
mai negativo, sono numeri grossi di ricchezza che non sarà mai negativo, la variazione
è negativa. Quando la contrazione limitata ad un solo trimestre si parla di solito di
crescita negativa, non necessariamente significa una fase di recessione.
Differente dalla recessione è la STAGNAZIONE. Situazione in cui la crescita del
PIL è molto bassa per periodi di tempo lunghi. Bassa, pari a zero o quasi pari a zero. Il
PIL in quei casi rimane pressoché costante. Non parliamo di stagnazione se ho crescita
del 0,1% per un trimestre, però la stagnazione si ha per lunghi periodi di crescita
praticamente nulla.
Diversa dalla recessione tecnica è la DEPRESSIONE. La grande depressione del
1929. Si indica un periodo in cui alla stagnazione dell‟economia si sommano aumento di
disoccupazione, bassi livelli di produzione, ribasso dei prezzi, e diffuso pessimismo da
86
parte degli operatori economici. La più famosa è quella del 1929. Altra fase di
depressione la sta attraversando il Giappone, fino ad una decina di anni fa era nel
pieno, con tassi di interesse bassissimi, i consumi non crescevano.
Ne parleremo brevemente: una delle peggiori situazioni è la DEFLAZOINE, ribasso dei
prezzi. Se so che l‟auto tra tre mesi costa meno di oggi posticipo l‟acquisto, non
consumo, i consumi sono la C dell‟identità keynesiana, il mio reddito diminuisce. Con una
deflazione, contrario dell‟inflazione, i consumi vengono posticipati.
La teoria economica suggerisce una legge: legge di Okun. Da non confondersi con la
curva di Philips, definisce una relazione tra crescita del PIL e tasso di disoccupazione.
Philips mette in relazione l‟inflazione con la disoccupazione.
La legge di Okun che prende il nome dall‟economista che l‟ha proposta negli anni ‟60,
permette di individuare quanto debba crescere il PIL per poter ridurre di un punto
percentuale il tasso di disoccupazione.
Ad esempio, preso dal libro di Blanchard, Macroeconomia. Questa legge di Okun
identificava variazioni del PIL del 2,5% negli anni ‟60-‟60 degli USA per ridurre la
disoccupazione; 3,7% Germania, 5,88% GB e 6,66% il Giappone. Dipende da tanti
fattori. Come tutte le leggi economiche bisogna prenderle con le molle. Anche la curva
di Philips non è una legge deterministica o universalmente valida. Ci sono periodi
storici in cui funziona e periodi in cui non funziona, paesi in cui funziona e paesi in cui
non funziona. Non sono meccanismi perfetti. Questo spiega come una legge abbia dei
coefficienti diversi a seconda di
paesi nello stesso periodo storico o abbia
coefficienti così diversi in periodi storici differenti ma nello stesso paese.
Vedi la GB. Nel 1960-80 servivano 5,88 punti di PIL per ridurre la disoccupazione di
un punto. Nel 1981-1994 no, ne serviva di meno. Le ragioni sono tante, sono anche
valutazioni di struttura del mercato del lavoro, di flessibilità o rigidità.
Vediamo come il PIL rientri in contesti di tipo macro economico e di politica
economica. Per ridurre la disoccupazione dell‟1% negli USA era necessario incremento
di PIL del 2.12%. poiché il PIL è espresso dall‟equazione keynesiana, allora si possono
attuare manovre di politica economica volte a ridurre la disoccupazione.
Se ci fosse ancora il controllo del tasso di cambio svaluto il tasso di cambio. Si
riducono le importazioni, aumento le esportazioni, il PIL aumenta e la disoccupazione
dovrebbe scendere. Non è sempre così e non possiamo più farlo. Altri paesi (che non
sono nell‟Euro, Inghilterra) possono farlo. Oppure potremmo sostenere gli
investimenti delle aziende dando incentivi per nuovi impianti, innovazione tecnologica,
o aumento la spesa pubblica. Agendo su queste componenti un governo può cercare di
stimare gli effetti di manovra di politica economica su una variazione della
disoccupazione.
Arriviamo al punto. La statistica serve, tra le altre cose, ad aiutare il decisore
pubblico a scegliere la strategia migliore. Voi sapete anche che questo modello è
legato ad un insieme di coefficienti di elasticità. Ci saranno variazioni del PIL e del
reddito differenti a seconda dell‟elasticità, del reddito agli investimenti consumi,
esportazioni nette, spesa pubblica e tassazione. È meglio aumentare la spesa pubblica
87
o diminuire la tassazione? Dipende da come è la risposta che si ottiene ai fini del
reddito. Questi aspetti possono essere studiati nell‟ambito del modello econometrico.
L‟econometria studia modelli di questo tipo e permette di fare le scelte più opportune
in relazione ai coefficienti dei modelli.
Il PIL è uno strumento largamente utilizzato, specialmente dagli anni ‟60 in poi, ma
anche prima, già dai tardi anni ‟40. Però presenta dei problemi. Pensare di misurare la
ricchezza di un paese solamente in termini monetari, al di là di discorsi qualunquistici
è limitante.
È interessante un discorso di Robert Kennedy, fratello di Kennedy poco prima che lo
uccidessero. Parlando all‟università del Kansas, dice si, noi usiamo il PIL come misura
della ricchezza. Ma vediamo bene cosa ci mettiamo dentro: pubblicità delle sigarette,
costi per guarire i tumori, la produzione delle pistole per difendere le nostre case,
spese di sicurezza, lucchetti finestre e porte blindate. È giusto inserire nel PIL tante
voci che non c‟entrano con vera ricchezza e vero benessere?
Ecco che nel 1968, negli USA era usato già da un bel po‟, ci si inizia a porre una
domanda fondamentale: il PIL oltre ad essere una misura della ricchezza prodotta che
risponde ad una serie di valutazioni economiche e finanziarie del paese, è anche una
misura di benessere del paese oppure no? “Non troveremo mai un fine per la nazione,
né una nostra personale soddisfazione nel mero perseguimento del benessere
economico nell‟ammassare senza fine beni terreni.
Non possiamo misurare lo spirito nazionale sulla base dell‟indice Dow Jones, né i
successi del paese sulla base del PNL o PIL. Il PIL comprende anche l‟inquinamento
dell‟aria e la pubblicità delle sigarette, le ambulanze per sgombrare le nostre
autostrade dalle carneficine del fine settimana.
Il PIL mette nel conto le serrature speciali per le nostre porte di casa, le prigioni per
coloro che cercano di forzarle. Programmi di televisivi che valorizzano la violenza per
vendere prodotti violenti ai nostri bambini. Cresce con la produzione di napal missili e
testate nucleari, comprende anche la ricerca per migliorare la disseminazione della
peste bubbonica, si accresce con i palpaggiamenti che la polizia usa per sedare le
rivolte e non fa che aumentare quando sulla loro cenere si ricostruiscono i bassifondi
popolari.
Non tiene conto della salute delle nostre famiglie, della qualità della loro educazione,
educazione, o della gioia o dei momenti di svago. Non comprende la bellezza della
nostra poesia o la solennità dei valori familiari, l‟intelligenza del nostro dibattere,
l‟onestà dei nostri pubblici dipendenti.
Non tiene conto né della giustizia dei nostri tribunali né dell‟equità nei rapporti fra
noi. Non misura nostra novizia né il nostro coraggio, né la nostra saggezza né la nostra
conoscenza… misura tutto in breve, tranne ciò che rende la vita degna di essere
vissuta. Può dirci tutto sull‟America ma non se possiamo essere orgogliosi di essere
americani”.
PIL è la base di molte considerazioni: rientrano dentro tutte le attività, prodotti e
servizi, ma si confronta con dei grossi problemi.
88
I limiti principali del PIL quali sono?
- Ignora ogni cosa che accade al di fuori del regno degli scambi monetari. Il
baratto non è considerato nel PIL. La solidarietà umana non è considerata
all‟interno del PIL, e quindi non tiene conto dei costi sociali ed ambientali. Se
sfrutto i lavoratori del luogo come fossero schiavi non compare da nessuna
parte. Le condizioni di vita dei lavoratori non rientrano.
- I costi del declino sociale (es. crimine) e dei disastri naturali vengono
considerati come guadagni economici. Gli alluvionati che hanno dovuto ri fare
casa, negozio, prendendo a prestito denaro per riaprire il negozio, comprando di
nuovo frigoriferi, affettatrici, forni eccetera, questo è una crescita del PIL,
siamo più ricchi dopo l‟alluvione dell‟anno scorso. È un po‟ assurdo.
- ad esempio il crimine accresce negli USA il PIL di diversi miliardi di dollari, per
le misure di sicurezza, la protezione del territorio, la detenzione, il
risarcimento danni, le spese mediche ei funerali. Tutto relativo al crimine, non
in funerali dell‟anziano che muore. È evidente che esulando dal contesto
economico, cioè se non consideriamo l‟aspetto monetario del crimine,
certamente non è benessere. Il Pil può essere un buon indicatore della
ricchezza prodotta, non è perfetto. Ci sono aspetti formali e sostanziali che
non rendono il PIL la misura precisa del benessere del paese.
Inoltre, se noi andiamo ragionare sulle miniere d‟oro di diamanti, di carbone, il legno,
se noi deforestiamo l‟Italia per dieci anni, per dieci anni le nostre industrie che fanno
legna fatturano. Vendono, vendono all‟estero, e gli altri dove finiscono?
Depauperamento delle risorse naturali rientra nel PIL? No, sono difficili da
contabilizzare. Il Pil è come una posta di bilancio, non guarda cosa c‟è dietro.
Rientrano tutte le esternalità negative, dovreste conoscere da corsi di scienza delle
finanze, economia dell‟ambiente. Grosso problema di internalizzazione delle
esternalità. Cosa è l‟esternaltià? Io costruisco l‟industria di prodotti chimici, mi faccio
ricco scaricando nell‟aria e nei fiumi gli scarti industriali. Esternalità negativa, non
dipende dal fruitore ma dal produttore, è negativa perché produce degli svantaggi.
Esternalità positiva? Se io canto e il vicino dice che bella voce!
Le esternalità negative, come l‟inquinamento ambientale, acustico, danno luogo ad un
duplice effetto; da un lato non vengono contabilizzati né come mali in sé né come
perdite di benessere. Apro una discoteca in centro storico, all‟aperto, faccio soldi ma
fuori non dormono più: estesternalità negativa.
Ci sono in realtà dei modi per risolvere questo problema delle esternalità?
Internalizzazione delle esternalità. Inquini? Paghi in proporzione a quanto inquini o
metti filtri per ridurre l‟inquinamento. Tutto questo rientra nel gioco del PIL.
Vengono ignorate tutte le economie che non sono dette di mercato. Il PIL non tiene
conto del baratto, delle attività delle casalinghe o dei casalinghi, delle nonne che
tengono i nipotini, zii nonni che tengono i nipotini, del volontariato. Attività che non
avendo un costo di produzione formalizzato, non rientrano all‟interno del PIL. Tutte le
89
attività che non producono bene di consumo
oggetto d‟acquisto, vengono
contabi.ilzzate al costo di produzione. se questi servizi sono offerti a costo zero ecco
che nel PIL ci entrano con valore zero. Eppure sono di valore: se una nonna tiene il
nipotino tutti i pomeriggi perché i genitori lavorano, è ben diverso che pagare una
baby sitter o un asilo. Attività quantificabile ma non rientra nel PIL.
Questo grafico (22), mette su uno scatterplot il PIL complessivo e il totale annuo in
tonnellate di C02. C‟è una bella correlazione positiva. Total GDP us dollar aggiustati
per l‟inflazione. 100 milioni un miliardo eccetera. In inglese miliardo è billion. Siamo su
un mondo ancora legato inevitabilmente alla produzione industriale: macchine,
riscaldamento. Siamo basati ancora sul petrolio per molti versi. È inevitabile che a
maggior produzione corrisponda un maggior numero di emissione.
Ci possiamo aspettare: sono più ricchi hanno produzione inferiore. Più ricchi?
Produzioni meno inquinanti. Inquina di più chi è più numeroso. L‟elemento numero di
abitanti di un paese conta 20%. L‟elemento principale relativo alle emissioni di CO2 è
la ricchezza. Ci sono evidenti problematiche.
USA Giappone, Italia. Non siamo messi male in quanto ad emissioni di CO2. India,
Russia, Cina, è evidente che da questo punto di vista il PIL non è poi un indicatore così
perfetto.
Lavoro nero non è considerato. La corte dei conti ha detto che in Italia conta il 20%
del PIL, notizia di qualche mese fa. Le transazioni che non rientrano nel PIL sono di
diverso genere: transazioni che violano la legislazione legale. Lavori importanti:
imbianchino, falegname, idraulico ed elettricista, sono tipiche attività svolte a
domicilio senza che ci sia un registratore di cassa che possa essere controllato in
diretta dalle finanze.
Transazioni illegali: droga, scommesse clandestine, prostituzione, estorsioni,
riciclaggio, vendita di merci contraffatte, vendita di CD e film scaricati illegalmente
da internet, lo scaricamento di materiale protetto da copyright da internet è
elemento diffusissimo che non rientra nel PIL, consideriamolo furto, violazione di
copyright.
Il problema principale nel calcolo del valore dell‟economia sommersa è che questa non
rimane costante nel tempo. Se sapessimo che l‟economia sommersa è il 22,18% del
PIL, è un problema dell‟agenzia delle entrate. Se devo misurare il PIL e quello è il
conto, aggiungo un 22% e siamo contenti, il problema è che varia. Per misurare l‟entità
del sommerso sarebbe facile se fosse costante.
Il PIL che è così bello, presenta qualche problema a livello di confrontabilità sia
spaziale che temporale. Essendo composto dalla somma dei valori di beni e servizi
prodotti in un paese, può variare nel tempo: possono variare nel tempo anche i prezzi.
Lo stesso prodotto di oggi tra cinque anni non è più venduto. Si è fulminato il monitor
dell‟ufficio, devo prendere un monitor sostitutivo, stavo guardando quelli dei miei
colleghi che bello, l‟ho preso quattro anni fa ma non esiste più. Un monitor che costava
150 euro cinque anni fa, oltre a non esistere più, se oggi esistesse costerebbe 50. Ha
caratteristiche tecniche molto differenti. Questi sono fenomeni legati alla
90
disinflazione tecnologica. Oggi un televisore LCD costa molto meno di 1000 euro,
anche di quelli grossi, a parte la Apple, con la quale non ci sono speranze!
Come posso fare a confrontare il PIL nel tempo? Ci sono in linea di massima due
approcci. Uso il PIL a prezzi costanti, prendendo un riferimento di un prodotto e
definendo lo stesso prezzo per prodotti che come caratteristiche magari sono simili.
In quel senso, a parità di prezzi, la variazione del PIL è data dalla variazione delle
quantità. Se noi avessimo due beni, se un paese producesse solo pane e salame, l‟acqua
è gratis e avessimo 10-10-20-20-20-30 e il prezzo per il pane fosse sempre 1 e per il
salame fosse 5, avremmo 10-20-30, 50-100-150, il PIL è dato da 60, qua 120 qua
sarebbe 180. Questa crescita del PIL sarebbe legata ad una variazione della quantità
prodotta, e non del prezzo. Ma se il prezzo del prodotto variasse nel tempo, come in
realtà è, c‟è una componente di variazione del PIL determinata dall‟inflazione.
Se anziché avere pane e salame 10 10 20 20 30 30, avessi pane salame 10-10-10-1010-10-10 e il prezzo del pane fosse 1-2-3, il prezzo del salame fosse 5-6-7, avremo
10+50=60, 20+60=80 e 30+70=100. Il PIL sarebbe 60-80-100. A parità di quantità
prodotta il PIL salirebbe per una ragione puramente inflazionistica.
Nella realtà la situazione è intermedia: ho l‟inflazione che determina aumento dei
prezzi e determina anche un aumento del PIL ed un aumento della quantità prodotta,
che determina un incremento del PIL. Per tornare al caso del Giappone, una deflazione
comporta una riduzione dei prezzi e quindi anche una riduzione del PIL, per il fatto
che vendo una stessa quantità ad un prezzo inferiore.
Per esempio potrei utilizzare i prezzi 2005, vedere come cambia il PIL usando solo i
prezzi del 2005 per i beni e l‟andamento del PIL dipende solamente dalle quantità
quantità, oppure usare i prezzi attuali.
La differenza tra questi due fenomeni, tra questi due elementi è l‟inflazione. In linea
di massima ottengo questo risultato. Ho un PIL che può essere calcolato a prezzi
attuali, correnti, col prezzo effettivo di vendita del bene quando è stato venduto, è la
linea blu. Poi, possiamo usare dei valori che sono calcolati sulla base di un prezzo che è
costante. La differenza è l‟effetto dell‟inflazione.
Per assurdo, se l‟inflazione fosse molto forte, potrei avere un andamento PIL a prezzi
correnti crescente e un andamento del Pil a valori costanti decrescente, in realtà una
diminuzione della produzione effettiva del paese, ma un incremento del valore
monetario del paese.
Anche per quanto concerne i confronti internazionali il PIL presenta dei problemi.
Ogni paese adotta particolari criteri per la valutazione del PIL. Il PIL calcolato in
Italia, Francia, USA, Gabon, Sud Africa, non è proprio lo stesso, sebbene si
assomigliano per molti versi.
Non è possibile confrontare direttamente il Pil fra più paesi, se ci sono più persone ci
si aspetta che il paese sia più ricco. Bisogna allora calcolare il bisogna calcolare il PIL
procapite, l‟avevamo accennato prima.
Un ulteriore problema è dato dal tasso di cambio. Se misuro il PIL in euro e gli USA lo
misurano in dollari, nello cambiare da una valuta all‟altra devo adottare un tasso di
91
cambio. Se è favorevole a noi gli USA avranno PIL più basso, se è favorevole negli
USA noi avremo un tasso di cambio più alto. Non è la stessa valuta, sono diverse. Se un
euro vale 1,8 dollari è un discorso; se un dollaro vale 1.8 euro è un altro discorso..
Cosa succede? Che molto spesso, il PIL pro capite, per singola persona, per mitigare il
fatto che i paesi abbiano una divisione differente dal punto di vista di unità
differenti, si utilizzano valutazioni a PPA PPP, Parità di Potere di Acquisto. Cerca
un raccordo tra due valute utilizzando un bene in comune. Un classico esempio è il
panino Bic Mac di Mc Donald.
Quanti Big Mac può comprare un italiano medio, un francese? L‟Italiano compra 120
panini e il francese solamente 60, allora l‟italiano è ricco il doppio del francese
secondo la parità di potere di acquisto. Oppure una automobile, i-phone, o birre medie,
come è stato fatto il confronto in una rivista a seguito dell‟Oktober fest tedesco. A
partire da questo raccordo, vengono ricalcolati gli altri prezzi di beni e servizi che
compongono il PIL. Ricalcolo tutto sulla base del panino di Mc Donald. Una Ferrari
quanti panini vale in Italia o Francia? Partendo da questo punto di congiunzione tra le
due valute con i due poteri d‟acquisto viene ricalcolato tutto. È una procedura
complicata e laboriosa.
Inizierei una serie di valutazioni su misure alternative del PIL. C‟è un grosso numero
di misure alternative al PIL che non hanno raggiunto neanche un millesimo della
popolarità del PIL. È talmente legato alla società moderna, che per quanto sia pieno di
difetti non è eliminato.
- Genuine Progress indicator, indicatore di progresso genuino;
- Indice della libertà economica;
- Human Development Index;
- Indice di Benessere equo e solidale, di cui parleremo la prossima settimana
Guardiamo i primi tre dicendo che HDI l‟abbiamo già visto. Metteva insieme i dati
sull‟alfabetizzazione, speranza di vita e prodotto interno lordo procapite.
GPI o indicatore del progresso autentico, misura l‟aumento della qualità della vita di
una nazione, evidenziando l‟incremento della produzione di merci e l‟espansione dei
servizi che hanno realmente generato benessere.
È un indice piuttosto complesso, ci sono dentro una carrettata di variabili. Sono più di
venti componenti per la maggior parte intangibili. Il risultato interessante di questo
indicatore, di cui vedremo le componenti principali, è che se negli USA il prodotto
interno lordo è quadruplicato dagli anni ‟50 ad oggi, il GPI è cresciuto del 45% tra gli
anni 50 e 60, mentre il tasso declino procapite è stato 1, 2, 6% negli anni ‟70-„0-‟90.
Il GPI dice che se il PIL negli USA ha avuto questo andamento, il GPI ha avuto un
andamento così.
Si è arrivati ad un punto in cui la produzione di un paese non è più rivolta al benessere
della cittadinanza, della popolazione residente. Si sta riducendo la produzione di beni
e servizi che portano ad un effettivo benessere. di fatto la produzione del benessere
si è arrestata negli USA.
92
È composto da:
- Consumi personali ponderati in base all‟indice di distribuzione del reddito
- Valore del lavoro domestico e della genitorialità (problema estremamente
importante e forte in questi ultimi periodi)
- Valore dell‟istruzione superiore
- Valore del volontariato
- Servizi di beni durevoli di consumo
- Servizi di autostrade e strade
- Costo del crimine
- Perdita di tempo libero
- Costo della disoccupazione
- Dei beni durevoli di consumo
- Pendolarismo
- Abbattimento dell‟inquinamento domestico
- Incidenti automobilistici
- Inquinamento acque
- Inquinamento atmosferico
- Inquinamento acustico
- Perdita delle zone umide
- Perdita di terreni agricoli
- Perdita della superficie boschiva e danni forestali
- Esaurimento delle risorse energetiche non rinnovabili
- Danni da emissione di anidride carbonica
- Costo dello strato di ozono
- Investimenti di capitali
- Prestiti esteri
In linea di massima sono queste le variabili che vanno dentro questo indicatore. Si
sommano, si sottraggono e si ottiene l‟indicatore del progresso autentico. Quanto più
quelli in verde crescono tanto più la crescita del progresso è forte, tanto più crescono
quelli in rosso e tanto più l‟indice è negativo.
Altro indicatore utilizzato abbastanza spesso, è l’indice di libertà economica. È stato
sviluppato da una fondazione e dal WSTREET journal. È basato su dieci fattori,
ciascuno con un punteggio che va da zero a cento, servono a misurare la libertà
economica del paese. Un gruppo di esperti guardano Italia, Francia, India e Cina, per
ognuno di questi fattori vanno a dare un punteggio compreso tra 0 e 100 sulla base di
dati disponibili presso le principali organizzazioni sovranazionali: WB-IMF.
1. Libertà negli affari
2. Nel commercio
3. Monetaria
4. Spesa pubblica
93
5. Fiscale
6. Diritti di proprietà
7. Libertà di investimento
8. Finanziaria
9. Dalla corruzione
10. Del lavoro
Ognuna di queste dimensione viene votata e si fa una media. Il risultato è una mappa e
poi un dossier per ciascun paese. I paesi veramente liberi sembrano: Australia Nuova
Zelanda Svizzera. Poi principalmente liberi Canada USA, Gran Bretagna, Germania,
Austria, Belgio, Lussemburgo, Svezia, Finlandia, Estonia, Irlanda, Islanda Cile,
Giappone Taiwan e le varie cittadine stato.
L‟Italia è principalmente non libera, siamo al di sotto del punteggio mediano e paesi
depressi una linea verticale dalla Libia sino allo Zaire.
L‟Italia ha un punteggio di 58,8 con trend negativo. Siamo esattamente 92 esimi, tra
lo Zambia e il Turkmenistan.
Questa è la valutazione sul documento 2011, ancora quello vecchio. Si parla di
Berlusconi, scandali sessuali. Per ciascuna delle dieci dimensioni viene dato il
punteggio. Siamo messi particolarmente male nello spending del governo, dove siamo
messi bene è la libertà di commercio 12esimi e 23esimi sulla libertà monetaria. Ci sono
un po‟ di queste considerazioni, è liberamente scaricabile da internet. Abbiamo un
trend negativo dal 2008 al 2011.
La prossima volta parliamo di benessere equo e sostenibile, un indice che sta cercando
di sviluppare l‟Istat sulla base di alcune considerazioni che si stanno facendo a livello
internazionale, e sul lavoro di una commissione voluta da Sarkozy voluta dal premio
nobel dell‟economia Stigliz.
LEZIONE 9
13/11/2012
Ho aggiornato il materiale su aula web. Oggi continuiamo e concludiamo il discorso
sulle misure del benessere come misure alternative al PIL. Abbiamo visto il PIL la sua
origine e il suo calcolo. In linea di massima possiamo dire che fa riferimento alla
identità keynesiana. Calcola la ricchezza di un paese in relazione alla produzione che
nel paese avviene.
Sebbene sia una misura di ricchezza molto utilizzata per molti versi risulta essere
incompleta, va a misurare qualcosa di prettamente monetario ed economico quando ci
sono altre attività e misure che hanno la dignità di essere considerate vere e proprie
misure del benessere.
Negli ultimi decenni, sta prendendo piede la definizione di misure di affiancamento al
PIL che vadano a colmare le lacune che ha il PIL. Il PIL non tiene conto di alcune
misure di genitorialità: dei nonni che si prendono cura dei nipoti, così come qualsiasi
94
scambio che non da luogo ad uno scambio non monetario, non viene considerato
all‟interno del PIL, ad esempio il volontariato.
Contiene componenti non necessariamente legate al benessere. Per esempio quel
denaro che nasce a seguito di diminuzioni effettive di benessere (mercato legato al
contrasto, criminalità) rientra nel PIL a pieno titolo. Non c‟è correlazione tra
criminalità e PIL, così come disastri naturali o l‟impoverimento delle risorse naturali
che vanno registrati come variazioni positive del PIL. La valutazione della ricchezza
naturale di un paese, il depauperamento delle risorse non rientra nel PIL. Il PIL non si
rivela essere uno strumento completo per misurare il benessere di un paese.
Sono state proposte altre misure di benessere attraverso indici ed indicatori.
Abbiamo visto, nella presentazione precedente, lo HDI, l‟indice di sviluppo umano.
Considera non il PIL, non lo considera pienamente ma considera anche degli altri indici,
quali il tasso di analfabetismo adulto e l‟aspettativa di vita, il terzo elemento del HDI
era il PIL pro capite.
Abbiamo visto altri indici, tra cui l‟indice di sviluppo genuino in cui rientrano tante
variabili positive e negative a a seconda che portino ad un incremento del benessere
collettivo. Abbiamo visto in conclusione un altro indice, sviluppato da una fondazione e
dal NYT che era l‟indice di libertà, in realtà indice composto di dieci misure di libertà
assegnate attraverso specie di pagelle.
95
DAL PIL AL BES:
Le misure del benessere: Nuove tendenze internazionali
Il BES e le 12 dimensioni del benessere
Adesso vediamo questa nuova presentazione. Parliamo oggi non del PIL quanto
piuttosto delle misure del benessere. Vedremo le nuove tendenze nazionali ed
internazionali in merito alle misurazioni del benessere. in particolare ci soffermeremo
su una misura sviluppata in Italia. È da metà del 2011 che se ne parla ed è un tema di
abbastanza attualità.
Le tappe per dimenticare il Pil sono tante. È difficile credere che venga abbandonato
come misura di per sé, è troppo comune e diffuso ad ogni livello. Anche i cittadini che
non hanno fatto studi di natura politica ed economica non hanno grossi problemi a
inquadrare il concetto di PIL, variazione percentuale del PIL e il concetto tra PIL e
disoccupazione. È un concetto che fa parte della cultura popolare.
Nel primo forum mondiale dell‟OCSE, (Statistics Knowledge and Policy) su queste
tematiche, stato tenuto a Palermo nel 2004, si è cominciato a discutere di un sistema
di indicatori a livello ufficiale, di statistiche ufficiali, che permetta di valutare non
solo la ricchezza ma il benessere generale e il progresso. È chiaro che, lo vedremo
anche per il caso italiano, dobbiamo vedere come definiamo il benessere. Cosa è il
benessere? quando sono ricco, sto bene, riesco a studiare ,non ho malattie, mi sento
realizzato? Ci sono tante componenti che entrano a far parte del benessere. L‟Istat
ne ha individuate 12.
A Istanbul nel secondo forum mondiale dell‟OCSE vengono messe nero su bianco le
indicazioni per indicare il benessere e il progresso che possano orientare le decisioni
politiche dei governi. La statistica ufficiale serve per prendere decisioni: misure,
indicatori e indici servono per dare valutazioni ai governi e per fare raffronti spaziali
e temporali.
In tempi più recenti, fine 2007, abbiamo altre iniziative con questo scopo. Viene
costituito un progetto specifico, Global Project on measuring the progress of
societies, vi aderiscono varie istituzioni. E poi nel 2007 arriviamo a prime attività
specifiche legate all‟UE.
Beyond GDP è un gruppo di lavoro della commissione sviluppato per riuscire a costruire
una integrazione del PIL da produrre entro il 2009. Nel 2009 abbiamo il famoso G20
Aquila in cui ci sono orientamenti generali a prendere in considerazioni anche
dimensioni sociali ed ambientali dello sviluppo economico. C‟è stata una attività di
discussione e proclami per fare, anche se in realtà poi dal punto di vista pratico non si
è fatto tantissimo.
Arriviamo al settembre 2009, data estremamente importante per quel che riguarda il
benessere equo e sostenibile. Nel 2008 Sarkosy ha istituito una commissione Stigliz
(coordinatore della commissione), con Sem e Fitoussi, che aveva il compito e lo scopo
di dare un orientamento a queste intenzioni di costruzioni di indici ed indicatori. Si è
96
parlato tanto, c‟è stata tanta volontà di creare indici di benessere sociali ma di fatto
dal punto di vista concreto non si era riuscito a concludere molto. Quello che andremo
a discutere da qui in poi nasce da questa documentazione che è la relazione della
commissione Stigliz.
Nel 2009 si è ancora discusso sempre nel forum mondiale dell‟Ocse di questi
argomenti e sono state discusse le conclusioni della commissione Stigliz. Sono state
accolte e abbracciate da tutti, ministri e rappresentanti dei governi del mondo,
università, istituti di statistica, organizzazioni non governative e istituzioni sovra
nazionali banca mondiale, ONU e commissione europea. Dopo tanti anni sono state
costituite delle linee guida generali abbastanza concrete.
Cosa dicono queste linee generali? Guardiamo quello che voleva la CE e poi guardiamo
che cosa sono le 12 raccomandazioni date dalla commissione Stigliz. La CE aveva
indicato 5 indicazioni pratiche su come costruire il sistema di indicatori. Sosteneva,
accogliendo quello che era stato detto, che fosse opportuno completare il PIL con
indicatori ambientali e sociali. Questo non è nulla di nuovo. Quando ero studente,
studiavo indicatori PIL che includessero indicatori ambientali. Non è nulla di nuovo,
sono considerazioni già presenti nella letteratura economica.
Fornire informazioni quasi in tempo reale a sostegno del processo decisionale. Parola
d‟ordine: tempestività. È inutile avere dati che arrivano in ritardo. Se l‟informazione
non è tempestiva non siamo in grado di prendere decisoni sulla base delle informazioni
che ci vengono trasmesse. Ozono web è ad esempio uno strumento con cui l‟agenzia
europea dell‟ambiente fornisce dati sulle concentrazioni nocive di ozono. Non si
arriverà mai in tempo reale.
Ottenere informazioni più precise tra distruzioni e diseguaglianze. PIL e PIL pro
capite non forniscono indicazioni nella distribuzione della ricchezza di un paese.
L‟abbiamo detto velocemente altre volte. L‟ho detto quando parlavamo della
concentrazione della ricchezza del PIL nelle mani di pochi. Lo facevamo in
considerazione dei paesi. Lo stesso vale per la popolazione di un paese. Un PIL
procapite elevato non significa che non ci siano poveri, non significa che non ci siano
disuguaglianze sociali. Può essere che ci sia meno disuguaglianza sociale in paesi poveri
e piuttosto che in paesi ricchi.
Elaborare una tabella europea di valutazione dello sviluppo sostenibile. Entro fine
2009 la CE intende presentare una visione pilota della tabella di valutazione dello
sviluppo sostenibile. È stato fatto qualcosa ma poco. Estendere i conti nazionali alle
questioni ambientali e sociali, appuntamento nel 2013 in modo che i paesi hanno
accanto ai conti nazionali una contabilità economico ambientale integrata. Conti fisici
ambientali per il consumo di energia, produzione e trattamento di rifiuti, conti
monetari per le sovvenzioni ambientali. Vedremo se riusciremo ad avere tutto.
Queste sono le raccomandazioni della CE. Vediamo quali erano le raccomandazioni della
commissione Stgliz che arriva a dare indicazioni più tecniche.
Le indicazioni della CE sono molto generali. La Stigliz va a dare indicazioni più aderenti
alla singola realtà. Per valutare il benessere materiale devo:
97
1) Analizzare redditi e consumo piuttosto che la produzione. questa è una prima
considerazione differente rispetto al PIL. Il PIL è prodotto e fa riferimento alla
produzione. la prima cosa è: per valutare il benessere materiale, significa che ho
definizione di benessere materiale e non materiale, non devo guardare la produzione
ma i redditi e il consumo:
2) impostare la analisi dal punto di vista delle famiglie, non delle industrie.
Prendendo in considerazione tasse, prestazioni sociali e servizi forniti dallo Stato,
come sanità ed istruzione che avevamo visto essere valutati esclusivamente al prezzo
di produzione o di costo. Si mettono in luce alcuni aspetti critici;
3) considerare il patrimonio delle famiglie distinguendo tra chi spende tutto per
consumi, accrescendo il benessere immediato, e chi invece risparmia per il benessere
futuro. C‟è già una questione di prospettiva temporale. Il PIL è una visione stock
relativa al singolo anno. Non si hanno prospettive nel PIL.
4) dare più importanza alla distribuzione dei redditi, dei consumi e della
ricchezza, non ricorrendo quindi a medie matematiche, che non tengono conto della
differenza di reddito tra più ricchi e più poveri.
5) estendere gli indicatori delle attività non legate direttamente al mercato.
Altra considerazione. Il PIL include solo ciò che è soggetto a contrattazione sul
mercato e di tipo economico. Attività come fare le pulizie di casa o accudire neonati,
fanno parte della produzione economica di una famiglia, ma che non vengono prese in
considerazione dalle statistiche se non svolte da personale salariato. Ci sono tutti
quegli aspetti che non erano incluse nel PIL.
6) migliorare la valutazione di sanità educazione e condizioni ambientali
mediante calcoli oggettivi e strumenti a carattere soggettivo, usare anche dei
sondaggi
7) valutare in maniera esaustiva le ineguaglianze rispetto alla qualità della vita
calcolando le differenze tra persone sessi e generazioni. Particolare attenzioni alle
condizioni di vita degli immigrati
8) realizzare indagini per capire come le evoluzioni in un settore della qualità
della vita abbiano ripercussioni su altri
9) gli istituti di statistica dovrebbero fornire le informazioni per aggregare le
diverse dimensioni della qualità della vita per creare una misura sintetica.
10) gli studi di statistica dovrebbero anche cercare di integrare alle inchieste
sulle qualità della vita dati sulle evoluzioni effettuate dal cittadino nel corso della
propria esistenza
11) valutare la sostenibilità del benessere. l‟indice dell‟Istat è benessere equo e
sostenibile
12) stabilire indicatori precisi che quantificano le pressioni ambientali
Per il 9 e 10 il problema non è irrilevante. L‟Istat considera dodici misure del
benessere, per esempio il benessere fisico. Come lo misuro? Per esempio con
questionari, ti senti fisicamente bene, avresti bisogno di altro supporto sanitario? Le
98
domande devono essere consolidate in un unico indice di sintesi. Il problema che nasce
nella costruzione di questi indici, è che si tratta di indicatori in cui identifico il
costrutto benessere, devo identificare le variabili latenti (12 dimensioni) e all‟interno
di ciascuna dimensione prendo i vari indicatori. Per l‟istruzione? Numero di anni di
studio, risultati a test psicoattitudinali.
Vado a rilevare il benessere utilizzando 120 indicatori i differenti che devono essere
fusi in un unico indice, che sia questo indice di benessere, è una procedura piuttosto
complicata.
Vediamo i primi passi, percorsi per la costruzione di indici di benessere. Una delle
indagini che si usa in Italia è quella sulla qualità della vita fatta dal Sole 24 ore che
pubblica annualmente i risultati a livello di ogni singolo comune o città relativamente a
sei domini, ambiti:
- Tenore di vita
- Affari e lavoro
- Servizi ambiente e salute
- Ordine pubblico
- Popolazione
- Tempo libero
Rispetto a questa graduatoria Genova si posiziona al 25esimo posto. Questa non è
l‟unica indagine che viene fatta. Dal 2003 il QUARS, una struttura che valuta la
qualità della vita a livello regionale, pubblica lo studio a livello regionale e calcola 41
indicatori raggruppati in 7 domini:
- Ambiente
- Economia e lavoro
- Diritti e cittadinanza
- Salute
- Istruzione
- Pari opportunità
- Partecipazione
È un altro studio che viene fatto in maniera disorganica. C‟è una coerenza interna. La
scelta, l‟organizzazione e lo studio di questi indici avviene in maniera indipendente dal
contesto internazionale. Lo sforzo che ora si sta cercando di fare è costruire
indicatori di benessere che abbiano una qualche confrontabilità internazionale anche
se è difficile.
C‟è una valanga di esperienze settoriali e territoriale. Lega Ambiente pubblica
Ecosistema urbano (aria acqua trasporti rifiuti, trasporto mobilità). Rilevazione istat
sui dati ambientali delle città, poi fondazione (fondazione Singola) che ha creato il
PIQ, scomponendo le quattro componenti: captale umano, conoscenza e costruzione
della domanda, sviluppo del prodotto o servizio e presidi delle reti e relazioni nazionali
ed internazionali. Ci sono la Confartigianato e tutta una serie di enti locali, Ires in
99
Piemonte, camera di commercio di Venezia, ufficio statistico della provincia di di
Pesaro Urbino, rapporto sulla economia sociale di Sardegna.
Ci sono indici ed indicatori che vengono organizzati, stimati, raccolti e gestiti da
strutture differenti. Sono molto interessanti, per molti versi sono disorganici.
Possiamo avere una certa serie storica, confrotnabilità territoriale per ambiti locali,
ma si perde una confrontabilità a livello nazionale, hanno una validità territoriale
abbastanza limitata.
Abbiamo anche altri, associazione italiana sugli studi sulla qualità della vita, bilanciamo
il futuro.
Arriviamo al progetto italiano nel senso di livello nazionale. Il cosiddetto BES. Sul sito
indice dell‟Istat trovate il logo del Benessere Equo e Sostenibile. Trovate anche in
parte il materiale che ho citato in questa piccola presentazione.
Il Benessere equo e sostenibile nasce da CNEL e Istat. Trae ispirazione dalla
commissione Stigliz. Lo scopo, a livello internazionale, sarebbe quello di cerare
indicatori di benessere che possano essere confrontabili a livello spaziale e temporale.
È in linea col dibattito internazionale secondo il quale per valutare il progresso di una
società vanno usati parametri non solo economici ma anche sociale ed ambientale,
corredati da misure di equità e sostenibilità. Il comitato di indirizzo sulla base delle
categorie suggerite da Ocse e Stigliz e e i risultati delle multi scopo 2011 ha definito
dodici dimensioni del benessere.
Se andiamo a vedere le indagini multi scopo delle famiglie che vi ho citato nell‟ambito
del corso, ci sono alcune domande. Per esempio la 27.5, utilizzando un punteggio da uno
a dieci, può indicare quanto sono importanti questi aspetti?
- Avere un lavoro dignitoso di cui è soddisfatto
- Essere in buona salute
- Sentirsi sicuri nei confronti della criminalità
- Avere un reddito adeguato
- Servizi di pubblica utilità accessibili e di buona qualità.
Rispetto a questi aspetti, quanto li ritiene importanti?
- Vivere in una società in cui ci si possa fidare degli altri
- Buon livello di istruzione
- Tempo libero adeguato e di buona qualità
- Istituzioni pubbliche in grado di svolgere bene le loro funzioni
- Buone relazioni con amici e parenti
Quanto sono per lei importanti questi aspetti?
- Essere felici in amore
- Il presente e il futuro delle condizioni dell‟ambiente
- Partecipare alla vita della comunità locale attraverso strutture politiche e
associative
- Poter assicurare il futuro dei figli dal punto di vista economico e sociale
100
-
Poter influire sulle decisioni dei poteri locali e nazionali
Queste sono per esempio alcune domande che sono state poste e servono a capire
quali sono le definizioni di benessere che una persona ha. Possiamo mettere 10 a tutto
ma ci sono alcune cose essere più o meno importanti.
Basandosi su questo e su altre indagini, si è cercato di capire quali siano i punti più
importanti che identificano la felicità, ma soprattutto il benessere: benessere e
felicità sono due cose diverse, il benessere per un cittadino italiano. Non
necessariamente deve coincidere con quello di altri cittadini. È chiaro che le
componenti che entrano a costituire il concetto di benessere possano essere
differenti a livello territoriale.
L‟approccio si basa sulla premessa che il benessere è legato a tempi luoghi e culture e
non può essere definito univocamente. Per raggiungere una misura condivisa a livello
nazionale è fondamentale un confronto e dialogo tra diversi attori. Che in Italia tutti
sono mammoni può essere vero. Se confronto la coesione familiare italiana, e il fatto
che il 90% dei figli vada a vivere in un raggio di due chilometri dalla casa dei genitori,
mentre in America i figli vadano a lavorare in altre città, la visione di ruolo della
famiglia nel benessere è diversa. Non si può pensare che la coesione fisica e familiare
possa essere un elemento importante di benessere sia in Italia che negli USA. Lo
stesso dicasi nel nord, dove la visione che ho di famiglia è differente.
Febbraio 2011 l‟Istat ha realizzato la prima rilevazione statistica su un campione
rappresentativo di 45 mila persone dai 14 anni in su. Detto ciò è stato messo su un sito
web che si chiamava www.misuredelbenessere.it, chiedeva alle persone di contribuire
esprimendo la loro opinione in base alle varie dimensioni del benessere che erano state
individuate. Da ottobre 2011 a febbraio 2012, qualcosa che non si è conclusa neanche
un anno fa, i cittadini sono stati invitati a rispondere online ad un questionario per
esprimere le proprie opinioni sul set delle 12 dimensioni che sono state individuate.
Era un‟auto selezione del campione. La rappresentatività del campione in queste
condizioni è abbastanza debole. Se una persona decide di entrare a far parte del
campione è una persona che ha attitudini particolari rispetto all‟argomento e non
necessariamente il campione è rappresentativo della popolazione italiana.
12 dimensioni che sono state individuate sono queste:
1) Ambiente
2) Salute
3) Benessere economico
4) Istruzione e formazione
5) Lavoro e conciliazione tempi di vita
6) Relazioni sociali
7) Sicurezza
8) Benessere soggettivo
9) Paesaggio e patrimonio culturale
10) Ricerca e innovazione
101
11) Qualità dei servizi
12) Politica e istituzioni
Queste dimensioni condividono qualcosa col PIL ma in buona parte no. Questo
questionario che chiedeva opinioni su queste dimensioni è stato compilato da 2.518
persone, servono a dare un orientamento. Il 90% era di età compresa tra i 25 e i 64
anni e ben 2/3 avevano un livello di istruzione piuttosto elevato. È interessante capire
chi è che risulta essere interessato alla costruzione di indici di questo tipo.
Quasi la metà risiede in una regione del Nord, 1/3 in una del centro e il resto nel
meridione. Questi sono i risultati che sono stati dati. È un grafico abbastanza curioso.
È un istogramma di base, ma le barre hanno lunghezza uguale, fanno 100% tutte. È un
grafico che si usa molto. La barra colorata di scuro rappresenta coloro che hanno
considerato la salute come qualcosa di estremamente importante o prioritario nella
valutazione del benessere. Più chiaro è quelle persone che non hanno considerato tale
elemento determinante per la definizione di benessere.
Se volessimo dare una classifica delle dimensioni più importanti identifico la salute
come definizione prioritaria della dimensione del benessere. Ambiente al secondo
posto, istruzione formazione, qualità dei servizi, lavoro conciliazione e tempi di vita, il
benessere economico non è la più selezionata. Il benessere economico è importante ma
non è la più importante tra coloro che hanno risposto.
Questi vanno presi con le pinze. Se hanno risposto giovani di un certo livello culturale
è probabile che abbiano anche un lavoro sufficientemente retribuito e non
concepiscono il benessere economico come una mancanza. Quando uno non ha soldi
diventa quello il problema principale, bisogna vedere le caratteristiche dei rispondenti.
C‟erano poi altre definizioni del benessere. Una delle più interessanti era l‟ equità e la
giustizia sociale politica e partecipazione dei diritti a scalare altre opzioni. Se
andiamo a distinguere tra maschi e femmine, maschi chiaro e femmine scuro, vediamo
che l‟equità e giustizia sociale più importanti per femmine piuttosto che per i maschi.
Benessere psicologico e lavoro e conciliazione dei tempi della vita, forse perché tutte
le donne hanno da stare con i figli. I maschi hanno più bisogno di relazioni sociali,
benessere fisico salute e percepiscono come più importante rispetto alle femmine il
benessere economico. C‟è anche una differenza nel benessere tra maschi e femmine.
Ancora questo, aspetti che caratterizzano l‟Italia in positivo o in negativo, sono
domande pericolose, possono avere validità limitata nel tempo. Cosa caratterizza
l‟Italia verso l‟interno e esterno? Patrimonio artistico e culturale per moltissimi,
paesaggistico per tantissimi, alimentazione, quando l‟italianità, il welfare e sanità in
maniera ridotta.
La descrizione dell‟indice è qualcosa di molto difficile. Non esiste nessuna sacra
scrittura che esista un indice di benessere che si fa in questo modo. Siete abituati a
dire: la varianza si calcola in questo modo, la dimostrazione di un teorema è questa.
Quando bisogna costruire l‟indicatore è complicato.
102
Nel PIL è facile, nasce da un modello economico che ha la sua logica. Con la
costruzione di un indicatore di questo tipo è molto complicato, non esiste alcun
modello che ci dica se stiamo andando o no nella direzione giusta. In linea di massima,
dallo studio dell‟Istat si può costruire questa mappa semantica, andare a vedere con
cosa è collegata la parola benessere secondo gli italiani.
In linea di massima si dice che il benessere dovrebbe essere un fine della politica.
Dovrebbe orientare le politiche ai bisogni degli individui. Benessere significa buoni
servizi, non c‟è benessere senza equità, benessere è un benessere collettivo. Significa
coesione sociale, benessere non è solo crescita economica, è un investimento che può
ridurre la spesa sanitaria.
Queste sono le parole che si sono più fuse di più col concetto di benessere al termine
di una indagine. La visone di benessere degli italiani era legata a queste concordanze.
La mappa semantica si utilizza molto nello studio dei testi. Se voi volete studiare con
che cosa è collegata la parola amore a tutte le poesie italiane prendete amore e
trovate tutti i collegamenti.
La usano molto gli psicologi. Cosa significa
partecipazione, precisione. Dà l‟idea di cosa significhi benessere, quali siano i concetti
che ruotano attorno al benessere nella testa degli italiani.
Vediamo ora le 12 dimensioni del benessere. Le dimensioni del benessere sono quelle
variabili latenti di cui parlavamo l‟altra vota. Grossi aggregati che vanno fusi nel
costrutto che avevamo definito essere benessere.
1. Ambiente. L‟ambiente nel quale si vive condiziona fortemente il benessere dei
cittadini. L‟ambiente deve essere considerato il nostro capitale naturale che
influenza il benessere umano in molteplici domini, sia direttamente attraverso
le risorse, sia indirettamente attraverso i servizi. La più avanzata conoscenza
scientifica e la cresciuta coscienza ecologica hanno messo in luce come le
tipologie di produzione e consumo, l‟uso di risorse ed energia, l‟offerta di servizi
eccetera possano modificare le condizioni dell‟ambiente in misura rilevante. Il
dominio o dimensione si basa su indicatori che forniscono la valutazione dello
stato dell‟ambiente in Italia, dei servizi eco sistemici, della qualità percepita e
misurata dell‟ambiente in cui vivono i cittadini, con particolare riferimento
all‟ambiente urbano. Indicazioni generali, su queste possiamo essere d‟accordo.
La parte difficile è dire: definisco questa la dimensione del benessere, voglio
costruire un indice o indicatore, visto che è un sistema, che misuri la dimensione
del benessere. Come posso fare? È stato aperto un grosso tavolo di lavoro, in
cui si è detto: cosa aveva suggerito Stigliz e gli altri per valutare l‟ambiente?
C‟è per esempio metri cubi acqua utilizzata dalla popolazione in un determinato
comune. Perché? La risorsa idrica è una risorsa scarsa, se ne uso troppa
consumo eccessivamente queste risorse. Avere l‟acqua disponibile è allo stesso
tempo qualcosa di importante. Se consumo poca acqua può anche darsi che non
sia legato al fatto che io sia risparmioso, ma che come a Palermo ci siano alcuni
quartieri che un giorno a settimana non hanno acqua, consumano meno. Un
indicatore di quel tipo che è preso in considerazione ha i suoi pro e contro.
103
Quantità di spazzatura prodotta. Tanta spazzatura? Significa che sto
consumando troppo, io dovrei differenziare la mia produzione. Ci
sono
tonnellate di spazzatura raccolta e quanto e bisogna anche guardare quanto è la
raccolta differenziata. Viene sufficientemente seguita? È un indicatore che
potrebbe essere anche bello. Immagino di mettere questo, consumo dell‟acqua e
quantità di C02 che viene emesso nell‟aria o Pm 10, polveri sottili, prodotte dalle
automobili e sistemi di riscaldamento, provocano i tumori, e quando viene
superata la soglia bisogna bloccare il traffico sennò diventa troppo pericoloso.
Produzione di PM10 come la considero? Numero medio di PM10 nell‟aria nel
corso dell‟anno. Posso anche considerare il numero di giorni in cui viene superata
una certa soglia e quindi diventano giorni di rischio. Immaginiamo di scegliere
come indicatore quello dei giorni di superamento della soglia di rischio di PM10.
Ci troviamo di fronte ad una misura in metri cubi, l‟acqua che viene consumata
nel corso d‟anno in un comune, poi le tonnellate di spazzatura che vengono
prodotte e dei conteggi: giorni in cui supero i PM10. Ho tre indicazioni. Quanto
è poco quanto è tanto? Quanti sono i metri cubi che dovrebbe consumare una
città per persona per dire che sta rispettando l‟ambiente? Quanto dovrebbe
produrre una città pro capite di spazzatura all‟anno? Quanti giorni? Zero
dovrebbero essere i giorni in cui si supera la soglia di PM 10. Effettivamente,
quanto è un numero di giorni di superamento della soglia del PM 10 che
rappresenta un malessere per la città? 1-2-5? Non è facile dirlo. Dal punto di
vista pratico, se sono definite le dimensioni, diventa complicato riuscire a
costruire un indice unico. A questo punto vorrei dire: Genova o la Liguria come
indicatore di benessere della dimensione ambiente ha 89, Milano 73. Genova a
89 sta meglio di Milano. Come arrivo a 89? come arrivo a costruire l‟indice?
Sono problemi difficili. Giovannini, presidente Istat e tanti uffici del comune, si
chiedono quali sono gli indici per costruire una misura unica del benessere in
termini di ambiente? Come faccio a rilevare queste informazioni? È facile dire
abbiamo l‟Arpal, agenzia regionale per l‟ambiente, che ha le centraline dislocate
per Genova. Ci dice quanto PM 10 è stato rilevato ogni giorno. Oppure anche
prendo il numero di giorni in cui è stato superato il limite. Ma i metri cubi di
acqua consumati a Genova non è facile averlo. Una volta all‟anno viene qualcuno a
vedere quanti metri cubi sono stati presi, poi c‟è l‟acqua persa nel tragitto,
presa nei pozzi o dalle fonti, che non viene contabilizzata in nessun modo. Ci
sono problematiche non indifferenti. Stiamo parlando di ambiente. Tra gli altri
indici che ci sono abbiamo percentuale di territorio comunale con parchi
naturali. Se hai dei parchi naturali l‟ambiente è tutelato. Se io non ho nessun
parco, ho zero, in Valle D‟Aosta hanno tanto, cosa mi serve un indicatore che
rimane fermo per dieci quindici anni? Un parco naturale o marittimo, può essere
un indicatore della cura dell‟ambiente, ma poi non posso fare i confronti nel
tempo, rimangono stabili. Un indicatore deve avere un po‟ di mobilità. La
104
disoccupazione ha senso andarla a guardare. Non guardo la ricchezza dei paesi
in relazione alla loro superficie, che è sempre la stessa.
2. Salute. È una dimensione essenziale del benessere individuale. Ha conseguenze
che impattano su tutte le dimensioni della vita delle persone e in tutte le sue
diverse fasi modificando le condizioni di vita e condizionando i comportamenti,
le relazioni sociali opportunità e prospettive dei singoli. Riconoscendo la
caratteristica multi dimensionale l‟OMS definisce la salute come la capacità dei
soggetti di essere in equilibrio con sé stessi, col proprio contesto e di godere di
un completo benessere fisico mentale e sociale, non solo come assenza di
malattia. E poi ci sono una serie di altre cose. Come facciamo a misurare la
salute degli italiani? Non è facile. Idea è stata prendere le cause di morte più
comuni per varie fasce di età. Mortalità infantile, incidenti stradali per i
ragazzi, giovani fino ai 35 anni, morte per malattie cardio vascolari nella
popolazione più adulta e anziana, nella popolazione anziana e malati di Alzaimer,
ritenendo questi indicatori per la salute del paese. Se diminuiscono gli incidenti
stradali e muoiono meno ragazzi nelle strade, l‟idea è che la principale causa di
mortalità vada a ridursi.
3. Benessere economico. Non è la semplice misurazione della capacità del sistema
italiano di crescere, ma anche della sua capacità di trasformare la crescita
economica in un aumento di equità e sostenibilità, attraverso un‟analisi del
sistema economico, delle politiche redistributive e loro effetti sulle famiglie.
4. Istruzione e formazione. Quanti anni studiamo? Qual è la percentuale di
laureati o diplomati all‟interno di una fascia di età.
5. Lavoro e conciliazione dei tempi di vita. Obiettivo di questo dominio è sia
misurare la partecipazione al mercato del lavoro sia la qualità del lavoro,
qualificando i diversi segmenti di occupazione in relazione alla stabilità del
lavoro, reddito competenze e conciliazione degli orari e tempi di lavoro e
personale femminile
6. Relazioni sociali. Intensità delle relazioni sociali che si intrattengono non solo
influiscono sul benessere ma rappresentano una forma di investimento e può
rafforzare gli effetti del capitale umano e sociale. Gli indicatori considerati
riguarderanno anche la fiducia inter personale.
7. Sicurezza. Essere vittima di un crimine può comportare perdita economica,
danno fisico o danno psicologico dovuto al trauma subito. La paura di essere
vittima di atti criminali può influenzare molto le proprie libertà personali, la
propria qualità della vita e sviluppo del territorio
8. Benessere soggettivo. Queste informazioni soggettive forniscono il benessere
percepito dalle persone rilevando opinioini soggettive sulla propria vita.
9. Paesaggio e patrimonio culturale
10. Ricerca e innovazione
11. Qualità dei servizi
12. Politica e istituzioni
105
Siamo in questa situazione. Il PIL è uno strumento importantissimo come statistica
economica, rappresenta l‟aggregato principale di macro economia. Ma presenta grossi
limiti. Negli ultimi anni, a partire dal 2011, da quando Giovannini diventa presidente
dell‟Istat si è lanciato in maniera intensa su questo progetto perché lo vuole
concludere, si è cercato di costruire indici alternativi per il benessere equo e
sostenibile. Il problema fondamentale che c‟è, questo discorso lo concludiamo la
prossima settimana, è che c‟è uno scollamento forte tra teoria ipotesi, grosse
descrizioni delle dimensioni del benessere e loro effettivo calcolo.
Abbiamo una idea chiara di cosa vorremmo misurare ma non so molto bene come
misurarlo, è qualcosa di difficile. In questo momento stiamo parlando di qualcosa di
attualissimo. In questi giorni, mesi si parla di questo. Ogni mese ci sono riunioni, gruppi
di lavoro su questi argomenti che stanno cercando di venire a capo su questo problema.
L‟obiettivo sarebbe quello di riuscire a costruire un indice di benessere equo e
sostenibile, concordato sulla base delle ipotesi formulate dalla commissione Stigliz,
d‟accordo con quanto è stato rilevato sugli italiani, possibilmente usando dati
amministrativi. I dati amministrativi non hanno costo. Sono i dati delle amministrazioni
pubbliche o possono essere dati che con convenzioni si prendono da privati. Il consumo
di acqua si può provare a recuperare da aziende che la distribuiscono. Altre cose
risulta difficile da pensare da rilevare con dati amministrativi, come per esempio il
benessere soggettivo che dev‟essere per forza raccolto con indagini campionarie.
In questo momento sono state definite le 12 dimensioni e proposti, per ciascuna
dimensione un certo numero di indici, nell‟ordine degli 8-11 indici o indicatori. Ciascuno
di questi indici è stato scelto perché ha una qualche caratteristica di interesse.
Malattie dell‟infanzia: se queste si riducono, la salute dei bambini migliora. Come
rilevare i dati? C‟è una tabella in cui c‟è scritto misura del benessere, ogni quanto
viene aggiornato il dato e dove si può recuperare? L‟Istat fa il punto della situazione.
Fa delle indagini. Alcuni dati si possono recuperare sull‟indagine multi scopo delle
famiglie, però ce ne sono altri che non si possono raccogliere, per esempio PM10 non
ha dati su traffico, superamento di PM10.
Attualmente, c‟è questa tabella in cui abbiamo indice, chi produce il dato e con che
periodicità il dato viene prodotto. Se fosse prodotto ogni 5 anni questo dato non
avrebbe interesse da essere rilevato. La prossima volta guardiamo una o due
dimensioni, non molte di più, quello che vi voglio trasmettere è il concetto e la
difficoltà che c‟è nella costruzione di questi e indicatori, guardando la descrizione di
indici ed indicatori e guardando questa tabella.
106
LEZIONE 10
20/11/2012
Abbiamo guardato tanto queste fonti statistiche ufficiali ed enti produttori di dati.
Abbiamo anche detto quanto sia importante costruire insiemi di dati analizzabili nel
tempo in maniera tale da costruire quelle che abbiamo detto essere le serie storiche.
107
INTRODUZIONE ALLE SERIE STORICHE:
L‟APPROCCIO CLASSICO
Iniziamo un piccolo ciclo di lezioni sulle serie storiche guardando due impostazioni di
queste analisi: analisi classica delle serie storiche, la seconda è l‟analisi moderna.
Iniziamo con la analisi classica, è anche quella più semplice. La classica è una tipologia
di analisi più semplice che ricorda molto gli esercizi di statistica 1 in cui la variabile
indipendente era una variabile di tempo.
Adesso iniziamo a vedere l‟approccio classico all‟analisi delle serie storiche, faremo un
intermezzo con le procedure di destagionalizzazione, per poi arrivare all‟approccio
moderno. Dopodiché arriveremo alla fine del corso parlando di indice dei prezzi al
consumo con l‟intervento del personale del comune di Genova.
Abbiamo già accennato il concetto di serie storica. Per poter condurre una analisi
economica di un fenomeno nel tempo è necessario riuscire a ricostruire una serie
storica. Dobbiamo essere in grado di misurare lo stesso fenomeno nel tempo ad
intervalli regolari. È anche importante che la modalità di misurazione del fenomeno sia
omogenea, perché se va a cambiare la base di riferimento per il calcolo della serie
storica, vediamo che il confronto temporale non regge e non è possibile condurre una
analisi che abbia un senso.
Qual è la definizione? Si definisce serie storica una successione ordinata rispetto ad
un indice coincidente con la misura del tempo, una successione ordinata di un
medesimo fenomeno rilevato nelle medesime condizioni. Perché è ordinata? Perché è
importante l‟ordine con cui queste misurazioni vengono effettuate nel tempo.
In generale i dati vengono definiti in un periodo limitato, da una data di inizio t e fine
T. Con la lettera t indico un pedice, cioè un valore che mettiamo in basso a destra,
della serie storica, che è il nostro indice che misura la successione, l‟ordine temporale
delle misurazioni. X1 x2 x3 x4 sono le misurazioni del fenomeno in 4 istanti differenti,
dove x4 è successivo a x3, x 3 è successivo a x2 che a sua volta è successivo a x1.
La serie storica ha un termine e ha un inizio. Pensate per esempio a tutte le serie
storiche che vedete nei mercati finanziari. L‟andamento di un titolo, del tasso di
cambio, lo spread sono serie storiche: misurazione di un certo fenomeno (valore di
mercato di un titolo) che deve essere fatta ad intervalli regolari di tempo. Potremmo
parlare tanto di mercati finanziari, è un classico ambiente di analisi delle serie
storiche, ma adesso rimaniamo su discorsi più generali.
Facciamo l‟esempio di come l‟ignorare la dimensione temporale possa portare a delle
valutazioni contro intuitive o inesatte. Si considerano i seguenti dati che considerano
l‟intensità del traffico, numero di incidenti e il loro rapporto come misura del rischio
di incidente. All‟ora zero intensità di traffico 90, misurata per esempio col numero di
automobili che transitano in un dato chilometro, il numero di incidenti rilevati sulla
rete autostradale, una cosa di questo tipo, e il livello di rischio dato dal rapporto tra
l‟intensità del traffico e il numero di incidenti.
108
Immaginiamo di non sapere che 0,1,2,3,4,5 siano delle successioni temporali, delle ore
che mi possano rappresentare un indice di lettura del fenomeno. Se mettessi i dati
sullo scatterplot o diagramma a punti, e metto insieme numero di incidenti e intensità
del traffico, troverei correlazione piuttosto elevata, una retta di regressione con una
buona bontà, ro quadro 0,63 che stabilisce che quando c‟è tanto traffico ci sono meno
incidenti, o che quando c‟è poco traffico, intensità del traffico bassa, ci sono tanti
incidenti.
Sarebbe a dire che quante più automobili circolano, tanto minore è la possibilità che ci
siano incidenti. Questo sembra strano: se ci sono poche macchine, che si vadano a
cozzare l‟una con l‟altra dovrebbe essere minore. no, questo risultato è sbagliato. Non
considero il fatto che c‟è una relazione tra queste due variabili e un altro fenomeno,
ora del giorno.
Se noi andiamo a rappresentare su un grafico le ore nell‟asse delle ascisse od
orizzontale, ed in ordinata andiamo ad indicare i valori di traffico e gli incidenti e
l‟indice di rischio, usando due scale diverse, a sinistra trovo i valori di traffico e
numero di incidenti, dove il traffico è il rosso (c‟è un errore di colorazione), il numero
di incidenti è il blu, l‟indice di rischio è il verde, noi vediamo che in realtà, durante le
ore notturne, abbiamo livelli di traffico più bassi, linea rossa, abbiamo dei livelli di
incidenti più alti, mentre abbiamo una misura del rischio, data dal rapporto tra la blu e
la rossa, più alta rispetto alle ore del giorno.
Se vedo l‟andamento del traffico, il traffico ha un andamento basso nelle ore
notturne, inizia a cresce nelle ore della prima mattina, quando le persone iniziano a
lavorare, ha un punto di flesso tra le 12-13 quando le persone si fermano per mangiare,
riprende nel primo pomeriggio per andare a calare in tarda serata: questo è il classico
andamento orario del flusso veicolare o di attività sociale.
Se andate a vedere il numero di scippi e borseggi ha lo stesso profilo orario, anzi nella
fase centrale della giornata ha dei cali: le ore maggiori di scippi e borseggi sono le ore
di prima mattina e serali, quando le persone escono per fare la spesa e quando tornano
a casa.
Il blu, numero di incidenti che vengono misurati per ciascuna fascia oraria, ho tanti
incidenti nelle ore notturne, ci sono i colpi di sonno, ci si addormenta, abbiamo un picco
di incidenti nella notte e verso l‟alba, attorno alle cinque, in quest‟ora ho meno
incidenti, e poi dopo aver mangiato ci viene l‟abbiocco e abbiamo gli incidenti perché i
riflessi si rallentano, viene il colpo di sonno a seguito della pennichella pomeridiana.
Però vediamo che in realtà non c‟è questo andamento di correlazione tra incidenti e
traffico. Il problema è legato al fatto che quando noi abbiamo tanti incidenti c‟è poco
traffico quando abbiamo pochi incidenti c‟è tanto traffico.
La determinante livelli di traffico su incidenti non è così forte. È più importante, come
causa di incidentalità, la componente oraria: la stanchezza del guidatore. È evidente
che in un caso del genere utilizzare lo scatterplot visto prima per spiegare la
relazione tra incidenti stradali e intensità del traffico non è adeguato, non ho
109
considerato l‟elemento temporale, che è fondamentale. Sono contesti in cui la variabile
tempo diventa una variabile esplicativa importante per descrivere il fenomeno.
Vediamo un po‟ di esempi:
- Rapporto in percentuale tra debito e prodotto interno lordo italiano dal 1970 al
2009. È la stessa quantità rilevata ad intervalli annui. Bisognerebbe poi capire
rispetto a che data, potrebbe essere al 31/12 o rispetto al valore medio
dell‟anno. Il PIL è quello, il PIL annuo è un valore ben preciso, ma il debito varia
nel corso dell‟anno, il numeratore può variare. Se scelgo di prendere il debito
pubblico medio annuo o il massimo che raggiungo nell‟anno, devo conservare la
scelta negli anni che si susseguono;
- TSE MIB dal 2004 al 2010, indici di borsa. Gli indici di borsa, i titoli azionari,
sono i classici esempi di serie storiche finanziarie. Quella di prima è una serie
storica economica, questa è finanziaria. Non so se seguiate i corsi sui mercati
finanziari: qualcosa sui mercati finanziari fanno Sciutti e la Resta, nell‟ambito
dei mercati finanziari lo studio delle serie storiche è importante per varie
ragioni. Avete mai sentito parlare di analisi tecnica? È una metodologia di analisi
che studia graficamente i grafici delle serie storiche. Individua, congiungendo
tutti i minimi le basi, le resistenze, i trend di crescita e decrescita, cerca le
figure delle serie storiche, testa e spalle, e così via, analizzando solamente
l‟andamento delle serie storiche.
- Le vittime per crimine violento per età. Un tasso calcolato per 1000 persone su
popolazione con età superiore da 12 anni. Il tasso dal 1985 in poi è andato a
crescere per 12-15 16-19 20-24. Si può dire che negli ultimi 15-20 anni sono
aumentate le vittime per crimine violento nelle fasce di età più giovani. In linea
di principio rimangono stabili le altre. Questo è un esempio di interpretazione
che si può dare alla serie storica, le tendenze.
- Altra serie storica, sulle vendite di X box. È una console per video giochi. Più
famosa la Play Station, Play Station 2-3, questa è la prima X box. Esiste anche
la X box 360. Sono tutte serie storiche delle vendite mensili. Cosa sono quei
picchi che vediamo nel grafico? Sono i vari Natale. A natale si vendono le
console perché vengono regalate, o i ragazzi lo chiedono per regalo di natale.
Le serie storiche possono essere: economiche, finanziarie, di fenomeni sociali, anche
serie storiche dei prezzi al consumo, di vendite. Serie storica è tutto ciò che viene
rilevato ripetutamente nel tempo ad intervalli regolari. Abbiamo visto serie storiche
annuali, in questo caso abbiamo serie storiche mensili, anche trimestrali
quadrimestrali, semestrali e così via.
In linea di massima, quello che si vuole fare nell‟analisi delle serie storiche è costruire
un modello che permetta di sintetizzare l‟andamento della serie storica. Si vuole
cercare di esprimere un modello statistico, immaginate modello di regressione, che
sintetizzi l‟evoluzione della serie storica, del fenomeno nel tempo.
110
Esistono due approcci: il primo è l‟approccio classico, che andremo a vedere
inizialmente, che ipotizza che i valori osservati di un fenomeno al tempo t siano
spiegabili attraverso una componente deterministica, che per esempio può essere
espressa attraverso una retta o parabola di regressione, più una componente residuale
che non riusciamo a spiegare: è un po‟ il concetto di varianza spiegata e residua della
retta di regressione. Ipotizzo che il fenomeno inflazione segue un andamento
deterministico e un valore casuale che non permette di individuare perfettamente i
valori dell‟inflazione sulla base del modello formulato.
Modera? Considera la serie storica come una realizzazione discreta di un processo
stocastico. Significa che il valore della serie di oggi è uguale a quello di ieri più una
componente casuale che è strutturata in qualche modo. C‟è una relazione tra il valore
di oggi, di ieri ed una qualche componente residuale che può essere più o meno
importante. Dato che l‟impostazione moderna è stata individuata dopo, è la più
difficile, vedremo di accorciarla un pochino rispetto all‟anno scorso.
Approccio classico è molto semplice, quasi banale. Abbiamo una serie storica che può
essere qualsiasi cosa. Non è importante sapere cosa sia x in questo grafico, può essere
PIL, come possono essere vendite di frullatori, come possono essere i tassi di
mortalità di bambini rispetto ad una certa malattia. Noi abbiamo X fenomeno che
cerco di studiare e T, dove t è tempo. L‟analisi classica delle serie storiche è uni
dimensionale, esprimo il fenomeno che sto studiando x in funzione del tempo. Andrò a
costruire modelli di dipendenza funzionale, rette e parabole, ma non solo.
Come vedete, questo modello ha una caratteristica parabolica. La logica della analisi
classica delle serie storiche è riuscire ad introdurre un modello funzionale, per
esempio una parabola che vedete rappresentata in rosso, che vada a cogliere la
tendenza generale di un fenomeno nel tempo. A cosa serve questo? Per cercare di
formulare previsioni per la serie storica per il futuro. Non solo. A livello econometrico,
cosa che studierete in altri corsi, interessa costruire un modello di serie storica e
regressione in cui oltre al tempo inserisco altre variabili. A quel punto interpereto la
variazione del fenomeno x nel tempo e in relazione alle altre variabili nello stesso
istante temporale.
Nell‟approccio classico, la analisi condotta per le serie storica è cosiddetta TRENDCICLO. Si ritiene che il fenomeno xt sia legato ad una componente di trend e di ciclo
economico più una componente di errore. Per procedere si scompone la componente di
errore o di regressione sino a quando non è spiegabile attraverso un modello
deterministico, cioè una funzione.
Avevamo visto che la serie storica precedente, come cuore, può essere espressa
attraverso la funzione indicata in rosso che rappresenta il nostro trend o la nostra
tendenza di fondo. Si usa molto la parola trend, i fagiolini sono dati in trend negativo.
Il trend è la tendenza, non significa che l‟andamento della serie storica è esattamente
coincidente con il trend, ma significa che la serie storica segue questo cuore rosso,
cioè la tendenza di fondo. Se voi avrete un gruppo di persone che va in una direzione,
111
avrete la linea della direzione e il verso, e le persone che vanno attorno a quella
direzione. Trend è in linea di massima la direzione verso cui è andata la serie storica.
A questo punto, una volta individuato l‟elemento di fondo come il trend, ci si chiede:
questa serie storica che ha avuto questo comportamento così deterministico,
spiegabile attraverso una funzione ben precisa, ha altri elementi che possono essere
descritti in maniera altrettanto descrittiva?
Noi possiamo individuare il numero di persone che vanno a Limone Piemonte per
vacanza. Quello può essere il numero di persone che ogni mese od semestre sono
andate a Limone Piemonte. Ho ancora una oscillazione regolare attorno a questo trend.
Oltre alla tendenza pluriennale, che potrebbe essere il trend rosso, ci sono oscillazioni
che potrebbero essere legate ai fenomeni stagionali. A Limone Piemonte ci si va in
estate ed in inverno, o per le festività, come nella maggior parte dei posti di
montagna.
La serie storica, artificiosa, non è una serie storica reale, presenta una evidente
stagionalità. C‟è una oscillazione, ogni tanto è sopra è sotto, ritorna sopra poi sotto,
eccetera, della linea nera attorno alla linea rossa. Questa componente la potremmo
andare a definire come stagionalità. La serie storica è la nera, mostra una evidente
stagionalità dovuta per esempio alle stagioni naturali, stagionalità è legato proprio alla
parola stagione, ai cicli giorno notte, che un trend parabolico non riesce a cogliere.
Cosa si fa? Individuiamo e vediamo che la componente deterministica che abbiamo
trovato inizialmente, il trend parabolico, è un elemento deterministico che non coglie
la componente stagionale. La componente stagionale deve essere aggiunta alla
componente trend per esprimere questo altro elemento periodico e quindi
deterministico della serie storica.
Cosa si fa? Prendo la serie storica, xt, elimino il valore teorico della retta di
regressione, e calcolo gli scarti tra la nera e la rossa, e ottengo una rappresentazione
dei residui. Et è il residuo di regressione, essendo xt il valore della serie storica al
tempo t, e Tt il valore del trend, linea rossa, al tempo t. Et è la distanza dalla nera alla
rossa per ogni istante temporale della serie storica. Tt è il trend,la rossa, mentre xt
è la serie storica. Et è la differenza tra la linea nera, serie originale o grezza che
abbiamo osservato, e la linea rossa, trend parabolico che abbiamo individuato prima.
Facendo tutte le differenze, cosa otteniamo? Che la nera un po‟ oscilla attorno alla
rossa. Se sottraggo dalla nera la rossa, tolgo il trend parabolico all‟intera serie
storica. Quello che rimane è solo il residuo della serie storica dal trend. Se facciamo
quelle differenze, la serie storica diventa così. Sono tutte le oscillazioni che noi
abbiamo attorno alla serie storica.
Per esempio. La serie è fatta così e questo è il trend. Facendo questa operazione xt
meno Tt, per ogni istante temporale prendo lo scarto tra la serie storica e il valore
sulla parabola di regressione. Se rappresento tutti questi scarti ottengo quello. È
come se prendessi lo spaghetto, la rossa, lo tiro e vedo gli scarti che si hanno tra la
serie storica e la parabola. È il grafico dei residui della serie storica dal trend
parabolico.
112
Questo residuo ha un andamento che presenta la componente di periodicità, che
chiameremo stagionalità. Vedete come crescita e decrescita si alternano con una
buona regolarità, non in maniera perfetta. Allora cosa posso fare? Inserire all‟interno
di questo elemento ondulatorio un modello periodico, in questo caso è la funzione seno,
trigonometrica, da zero sale raggiunge massimo, scende raggiunge il minimo e torna al
punto di partenza. Il seno è una funzione periodica perché oscilla tra due valori
all‟infinito.
Ecco che, a questo punto, individuiamo una seconda componente deterministica, che è
questa componente stagionale. Se questa componente stagionale è l‟ultima componente
deterministica, siamo riusciti a scomporre la serie in una componente deterministica,
trend parabolico più componente stagionale e residuo, che è una componente non
deterministica. I residui del modello rappresentano la componente accidentale, non
prevedibile, non modellizzabile, perché totalmente casuale.
I residui di regressione devono essere de strutturati, cioè non devono avere
comportamenti regolari, devono essere incorrelati, non devono rappresentare alcun
trend, devono essere una componente puramente casuale. Se prendessimo quello che
abbiamo visto prima, serie storica senza il trend, detrendizzata, e se togliessimo
anche la componente ciclica, otteniamo le oscillazioni della serie storica attorno alla
componente trend e stagionale. In qualche modo scrivere trend più parte stagionale
equivale a descrivere una serie storica con questo andamento. Attorno a questo
modello deterministico avremo poi le oscillazioni della serie storica, e deriveremo di
nuovo dei residui di regressione.
Torniamo indietro, è facile ma importante. L‟approccio classico all‟analisi delle serie
storiche è un approccio che intende prendere una serie storica e scomporla in
componenti. Queste componenti saranno in linea di massima tre:
- Trend – ciclo, vedremo cosa si intende;
- Stagionale;
- Residuale
La componente trend è la componente che deve cogliere, esprimere, la tendenza di
fondo del fenomeno. È di solito un modello lineare di primo, secondo terzo grado,
difficile andare ai gradi superiori, e quindi rappresenta la tendenza di fondo della
serie storica.
Questa serie storica ha una tendenza di fondo esprimibile attraverso questa parabola.
Tuttavia, se noi facciamo una analisi attenta della serie storica e di come la rossa
passi attraverso i punti della serie storica, possiamo vedere che la rossa non coglie
perfettamente l‟andamento della serie storica, se fosse un modello perfetto le linee
nere e la linea rossa sarebbero coincidenti, ma non è così.
Esiste un residuo di regressione. Il nostro obiettivo è esprimere attraverso formule e
modelli, quanto più possibile, l‟andamento della serie storica. Attraverso la formula
abbiamo tolto la tendenza generale della serie storica. Però c‟è questa oscillazione
113
della nera attorno alla rossa. Questo residuo potrebbe ancora essere strutturato.
Potrebbe avere elementi esprimibili attraverso una funzione matematica.
Dal momento che ho individuato all‟interno della nostra serie storica questo trend,
allora lo mettiamo da parte e ci focalizziamo solo su quello che non abbiamo avuto
modo di vedere bene. Capito questo, sottraggo il trend a tutta la serie storica e
individuiamo tutta la componente di variabilità della serie storica, l‟andamento della
serie storica che non è espresso dalla rossa. Ci focalizziamo esclusivamente su quello
che non abbiamo capito o il cui andamento no è stato modellizzato.
Facciamo lo zoom sull‟oscillazione tra la nera e la rossa. La rossa è una componente
fondamentale della serie. Per fare questo utilizziamo le differenze tra la serie storica
e il trend. Chiamiamo questa quantità errore. Perché? Non è un errore perché abbiamo
sbagliato qualcosa, è la parte di serie storica che non è possibile prevedere utilizzando
il trend. In particolare, vedo che la componente si presenta con una certa periodicità
attorno alla linea rossa. Lavoro sulla differenza x-t, e vedo che l‟errore è una
componente con forte periodicità. L‟obiettivo è dire: se c‟è un‟altra componente
modellizzabile attraverso una formula matematica, io la modellizzo. Introduco per
esempio una componente periodica che mi consente di descrivere meglio di quanto
potesse fare il trend, la tendenza della serie storica. Anziché avere un trend
parabolico puro e semplice ho un trend parabolico accompagnato da un andamento
parabolico periodico.
Questo lo portiamo avanti all‟infinito, nella pratica ci fermiamo qua, le componenti
sono di questa natura. Possiamo andare ulteriormente avanti. Siamo sicuri che
utilizzando il trend parabolico e inserendo una funzione periodica di questo tipo, siamo
arrivati ad esprimere completamente il modello deterministico che sottostà ai nostri
dati? Ho individuato il miglior modello possibile?
Per fare questo analizzo i nuovi residui. Serie storica meno trend, a questi valori
sottraiamo il valore della rossa. Andiamo a vedere il residuo della nera rispetto ad un
modello oscillante di questo tipo. Diremo, va bene: abbiamo completamente descritto il
fenomeno che stiamo studiando, se la componente di errore, quindi questo residuo dal
modello presenta alcune caratteristiche piuttosto importanti: se i residui non
presentano comportamenti regolari, vedremo degli esempi, per esempio un residuo di
questo tipo presenta una componente regolare, sale scende, sale scende, non è un
residuo destrutturato, devono essere incorrelati, ne parleremo, non devono
presentare alcun trend e devono essere una componente puramente casuale. L‟analisi
dei residui è una parte molto delicata, ne parleremo ancora per chiarire i concetti.
Possibilmente, devono avere una varianza costante nel tempo, su questo ci torneremo
tra due lezioni. Quello che vogliamo dire è: questa è la serie che oscilla. Voglio
trovare una funzione che passi attraverso la serie storica e mi colga il trend e la
stagionalità. Se il modello è buono, può essere così assunto a sintesi della serie
storica.
Se il mio modello è buono, quanto più è piccolo il residuo, l‟errore, tanto migliore sarà
la mia capacità esplicativa. Facendo un pochino un salto indietro alle cose viste a
114
statistica 1, se noi avevamo la bontà del modello, questa era la varianza spiegata dal
modello sulla varianza totale. Quanto più il mio errore è piccolo, tanto più la varianza
residua dal modello è piccola.
Lavorare sulla componente di errore, cercando di eliminare, sottrarre alla componente
di errore ciò che è deterministico, mi serve per costruire il miglior modello possibile
per sintetizzare l‟andamento della serie storica nel tempo.
Questo è il risultato finale al quale arriviamo utilizzando l‟approccio classico
nell‟analisi delle serie storiche. Otteniamo una serie di osservazioni che già ad una
prima ispezione visiva si presenta destrutturato. Vedremo poi le tecniche per
analizzare i residui. Rispetto ai residui che abbiamo visto prima, questi si presentano
non strutturati. Se troviamo una componente per la quale non riesco a trovare la
causa, o una relazione spiegabile attraverso una funzione del tempo, allora diciamo che
quelli sono residui non prevedibili. È qualcosa al di là della nostra capacità di
previsione. Se un mese piove o un giorno c‟è sciopero dei treni, non posso costruire un
modello che includa la probabilità di pioggia o di sciopero dei treni per le persone che
andranno a Limone.
Esistono concause che fanno si che il modello esplicativo della serie non sia di fatto
perfetto, ma ci sta, è accettabile. L‟importante è che questa componente che io
ritengo essere non prevedibile, e quindi totalmente casuale, sia la più piccola possibile.
Tempo fa, mi hanno invitato ad una trasmissione a Bolzano alla radio rai come esperto
di probabilità e statistica. Era sul gioco d‟azzardo e sul caso. Con grande ingenuità il
presentatore mi chiede: cosa è il caso? Non ha una definizione, non esiste una
definizione. È qualcosa di molto affascinante. Per caso si può definire tutto ciò che
può essere pensato in tanti modi. Cosa è questo residuo? Non lo so.
C‟è variabilità nella serie storica e non so dire perché esista. Perché se tiro un dado
una volta esce 1 e una volta 6, è un caso, non c‟è una giustificazione vera e propria. Lo
stesso per le serie storiche: perché a volte la produzione industriale è più alta o più
bassa rispetto al modello, o perché il prezzo del pane è più alta o più basso? In quel
periodo il grano aumenti, c‟è stata siccità in Brasile, perché è aumentato il prezzo del
petrolio e tutto è diventato più caro, ci sono talmente tante concause che alla fine
messe assieme diventano un brusio non capibile.
Io voglio prendere una serie storica: la prendo, la affetto, prendo il trend e la
stagionalità, se ci sono altri pezzi che so spiegare il perché lo metto nel modello, e
quello che non so più spiegare è qualcosa di inspiegabile, è puro caso. Non esiste alcuna
possibilità di modellizzare ciò che è puramente casuale. Non esiste modello che mi
dica i prossimi sei numeri del Superenealotto. Non esiste alcun modello che mi dica se
tiro la monetina se esce testa o croce. Prendo una serie storica e cerco di capire ciò
che è esprimibile attraverso funzioni in relazione al tempo. Sino a qua riesco ad
arrivare. Prendo T ed S, oltre a quello non riesco ad andare, perché tutto il resto è
puro caso.
Questo è l‟approccio classico: cercare di ricondurre una serie storica ad una serie di
formule in funzione del tempo e avere un residuo di questo modello puramente casuale.
115
Diversa è la ciclicità, ne parleremo dopo. Immaginate che il trend includa anche il
concetto di ciclicità. Eliminiamo i modelli decompositivi, se è necessario le
spiegheranno ad econometria, arriviamo ai cicli.
Che differenza c‟è tra ciclo e stagionalità? Un ciclo è per esempio, il ciclo economico.
Il ciclo economico è una alternanza di fasi di espansione e di depressione, fasi di
crescita e depressione che è ricorrente (cioè si susseguono nel tempo) ma non è
periodico. Se prendete le temperature dell‟aria a Genova a seconda degli anni la
temperatura aumenta e diminuisce: d‟estate aumenta e d‟inverno diminuisce. Una
stagionalità è qualcosa di periodico: un ciclo di dodici mesi, con picco positivo nello
stesso periodo, e il picco negativo o anti picco nello stesso periodo degli anni
precedenti. La stagionalità ha andamento periodico di periodo predefinito.
Il ciclo no. Ha fasi di espansione e contrazione. La durata di queste fasi può essere
molto differente tra di loro. Si vorrebbe che la fase di contrazione non ci fosse mai.
Si vorrebbero fasi di crescita economica molto più lunghe e intense rispetto alla
depressione economica. Si parla spesso di 20 anni di crescita e 5 di decrescita. C‟è una
differenza ben precisa tra ciclo e stagionalità.
Non è chiara la differenza tra trend e ciclo. Sono un tutt‟uno, molto legati tra di
loro. La serie storica vista prima, cosa è? Può essere un trend lineare al quale
possiamo aggiungere una componente ciclica, ma non lo so: diventa una discussione
accademica sulla quale concludiamo poco. L‟obiettivo molto spesso è esprimere trend e
ciclo in un tutt‟uno. Anziché parlare di trend ciclo e stagionalità come tre entità
separate, si parla in generale di di trend-ciclo tutt‟uno e di stagionalità separata dal
trend-ciclo o ciclo-trend. Anche se fosse possibile separare ciclo e trend è di
interesse lo studio di correlazione tra fenomeni permanenti e fenomeni transitori.
Diviene importante depurare la serie storica dagli effetti stagionali, si ritiene che
divenga più agevole individuare e interpretare i movimenti ciclici e valutare le
inversioni di tendenza.
Andare a sciare è una componente stagionale. Vado a sciare quando c‟è la neve,
pensiamo al nostro Limone Piemonte. È inutile che voglia andare a interpretare la
attrattività turistica di Limone Piemonte sulla base delle stagioni, è qualcosa che non
dipende da me, non dipende da Limone, non dipende dalle strutture sciistiche di
Limone o quelle per le vacanze estive. Il ciclo stagionale è quello che è. Dal punto di
vista economico ma anche aziendale, non è che si possa fare molto sulla stagionalità.
Io posso vendere ombrelli, li venderò di più nei mesi piovosi. Ma non posso valutare
tanto le mie vendite sulla base dell‟andamento stagionale. Quello li è qualcosa che
subisco, che non posso controllare. È interessante vedere come vanno le vendite
rispetto magari all‟anno scorso. Diventa però anche difficile fare dei confronti.
Prendiamo la serie storica delle X BOX viste prima. È un trend crescente,
decrescente, cosa sta succedendo? Non è così facile capirlo con una componente
stagionale così forte. Si preferisce molto spesso eslcludere la componente stagionale
nel caso dell‟Xbox può avere anche un significato. In questo caso per questi marchi e
prodotti vale anche un 70% del mercato dell‟anno, però a volte la componente
116
stagionale o anche chiamata calenderiale, legata al calendario, con i periodi anche
pasquali eccetera, sporca la mia serie storica, non mi rende facile una lettura nitida
dell‟evoluzione del fenomeno. Molto spesso si preferisce cercare di andare a eliminare,
ma non perché non abbia senso ma perché non controllabile, la componente stagionale.
Si parla in senso proprio di metodi di destagionalizzazione delle serie storiche. Ci
sono anche in questo caso una miriade di metodi per la destagionalizzazione delle serie
storiche. Ne vedremo due, uno molto usato anche nell‟ambito dei mercati finanziari.
Per fare una precisazione, non sarò un nobel, ma se effettivamente ci fossero miei
colleghi che sapessero, trovassero modi per guadagnare certamente in borsa non ci
sarebbero neanche più gli statistici, saremmo tutti a guadagnare soldi e vivere alle
Bahamas.
Di fatto metodi statistici che permettano di dare una previsione esatta dei mercati
finanziari non esistono. Se muore di infarto Marchionne domani mattina, quello li il
modello statistico non ve lo da. Se Monti dice una cosa piuttosto che un‟altra o
Berlusconi fa o meno altre robe sono fenomeni prevedibili che non può avere dentro e
non mette dentro. Ci sono imperfezioni nel mercato finanziario nostro e mondiale che
i metodi statistici fanno poco, funzionano sino ad un certo limite.
La componente di errore non prevedibile è molto grossa. L‟eta quadro, la bontà del
nostro modello è molto bassa. Per togliere la stagionalità, immaginate qualcosa con
questo andamento, cosa può essere? Questo è il mese di agosto, di nuovo agosto e di
nuovo agosto. Questo è il classico caso di indice di produzione industriale: ad agosto la
Fiat chiude, tutti al mare e la produzione industriale diminuisce. Ha un senso questo
crollo? Si, ha senso perché le attività industriale chiudono, non è che la Fiat vada a
mezzo servizio ad agosto, la produzione industriale viene sospesa, è un elemento di
disturbo della serie storica.
Il primo metodo che si viene utilizzato, è il metodo X-11 sviluppato dal bureau of
Census americano negli anni ‟60, è una procedura interattiva che pensa di utilizzare
una serie di medie mobili, vedremo poi come funzionano.
Il secondo approccio è più complesso che ipotizza dei modelli sottostanti, non
discuteremo del model based. Ci troviamo di fronte ad una serie storica, questa che è
la serie storica dell‟indice generale della produzione industriale, dove 100 è il valore
medio dell‟anno 2000, mese per mese abbiamo i valori della produzione industriale.
Vogliamo cercare di individuare una tendenza di fondo di questa serie storica. Se noi
calcolassimo una retta di regressione su questi dati, otterremmo una pendenza
negativa. Lo vedo dal fatto che la serie va in giù. Dove dovrebbe essere questa serie
storica? Se lo calcolassimo verrebbe in mezzo, i valori sono molto bassi, ci danno
fastidio, sporcano la serie storica, sporcano la nostra analisi.
Vogliamo andare a destagionalizzare la serie storica. La stagionalità più evidente è
quella degli anti picchi dei valori di agosto, un pochino dopo la metà, se fosse la metà
sarebbe giugno luglio, siamo verso la destra di ciascun anno quindi agosto. Se vedete,
l‟andamento della serie storica si ripresenta sempre con certa periodicità. Ho
novembre - dicembre – novembre dicembre, novembre -dicembre più alto, poi
117
cresciuto eccetera. La stagionalità più evidente quella di è agosto. Anche negli altri
mesi c‟è una certa periodicità nell‟ordine dei valori. Qual è il mese più alto, più basso
eccetera.
Quello che si vuole fare con la destaginoalizzazone è costruire una serie di questo
tipo, quella tratteggiata, chiamata serie destagionalizzata che cerca di compensare
gli elementi stagionali, eliminarli, e cercare di individuare il comportamento della
serie storica senza l‟effetto della stagionalità, cosa che non è facile.
La destagionalizzazione è una procedura che ha come obiettivo la costruzione di una
serie storica che non includa al suo interno l‟effetto di stagionalità. Non si esprime
solamente con i crolli della produzione ad agosto, ma la si può riscontrare anche in
altri mesi con altri andamenti.
Se guardate la serie storica, in fin dei conti, se andate a vedere i picchi, è un po‟ in
decrescita. Anche qua, se provate a passare le dita sulla serie storica, questa si
stringe e va a scendere. La serie storica destagionalizzata tende a declinare, un po‟
quello che abbiamo detto a parole. Vogliamo costruire un modello che svolga questo
andamento.
Allora come facciamo? Utilizziamo delle medie mobili. Oggi ne parlo un po‟. Se lo
trovate difficile ripartiamo da qua. È chiacchieroso, per i non frequentanti. Le medie
mobili sono qualcosa di semplice.
È una media calcolata su una finestra temporale di ampiezza di ordine k. Per esempio:
se io prendo la produzione industriale italiana di gennaio febbraio marzo, poi febbraio
marzo aprile, marzo aprile e maggio, e ne calcolo una media per ciascuno di questi tre
mesi, sto facendo una media mobile. Apro una finestra di ampiezza prefissata, per
esempio tre mesi, calcolo la media sui primi tre mesi, shifto verso destra di un mese,
esce gennaio e rimangono febbraio marzo e aprile, il calcolo successivo, la media
successiva esclude febbraio e include maggio. Si chiamano medie mMobili perché sono
medie calcolate su finestre mobili che si vanno sempre a sovrapporre in parte. Il
movimento dei valori calcolati è molto morbido.
Questa è la formula difficile della media mobile che vedete da soli. È facilissimo. Ho
tempo, mesi settimane. 1-2-3-4-5-6-7-8 mesi. Calcolo la media mobile di periodo 3. 41-7 e ne calcolo la media e la metto in corrispondenza di due. 4+1+7 diviso tre =
quattro; prima media mobile per uno due tre. La seconda sarà 1-7-10, anziché
prendere 1-2-3, avrò 1+7+10 diviso 3 =6. Otto sarà la media di 3-4-5 , cioè 7+7+10 =
diviso 3 fa otto. Poi 10-7-13 diviso 3 = dieci.
La media mobile è calcolata su valori di una finestra ben definita di ampiezza
prefissata. Poi la trascino verso destra sino a quando non ho più numeri per calcolare
la media mobile. La media mobile non è più calcolabile. Non ho tanti termini di media
mobile quante sono le unità temporali. Se arrivo in corrispondenza di 7, 13 è la media
mobile su 13-16-10 poi su 8 ci manca il valore di 9, non posso calcolare. Non si calcola
su valori parziali, non si calcola proprio.
Ecco che per esempio avete la serie storica originale che vedete li e in rosso la media
mobile calcolata sui valori li vicini. Questo puntino 4, il primo puntino rosso, è la media
118
calcolata su questi tre valori, questo valore è la media calcolata su questi e così via. La
media mobile è una media locale, si chiamano medie locali, medie calcolate su valori in
un intorno, in questo caso di tre unità, che può essere più o meno ampio.
Una media mobile ha una azione spianante, è un po‟ un ferro da stiro, tende a ridurre
le irregolarità di tipo casuale, ricostruisce la tendenza di fondo. La media mobile molto
spesso è utilizzata come approssimazione del trend Al posto di retta o parabola di
regressione, calcolo la media mobile che ha proprio il compito di ripulire il trend. D‟ora
in avanti parleremo di medie mobili semplici, che vengono calcolate sulle unità vicine e
medie in cui ciascuna unità ha lo stesso peso. Se ipotizzo che il trend sia lineare può
essere approssimato in questo modo.
Vediamo ancora questo esempio. Questo è l‟andamento del PIL trimestrale italiano dal
2001 al 2010. Abbiamo il bitorzolo 2006-7-8 e poi il crollo in corrispondenza della fine
2008. Proviamo a calcolare le variazioni percentuali. Si preferiscono molto spesso non
i valori assoluti, ma variazioni percentuali. Su questo si calcolano poi le medie mobili e
dopo un paio di passaggi si ricostruisce l‟andamento della media mobile.
Ripercorriamo il percorso. Serie storiche: approccio classico è di tipo regressivo, si
vuole costruire un modello di tipo statistico per esprimere l‟andamento della serie in
funzione del tempo, si va avanti fino a quando i residui non sono completamente
destrutturati, sino a quando non sono pienamente casuali. Le componenti che
determinano l‟approccio classico sono: trend-ciclo, assieme perché difficili da
scorporare dal punto di vista concettuale ed economico, e la stagionalità.
Differenza tra ciclo e stagionalità: il ciclo non presenta periodicità, è caratterizzato
da crescita e contrazione di periodicità non costante. La stagionalità è comune a
tante serie storiche non interpretabile, è qualcosa che non dipende da noi. Si
sviluppano serie di analisi di destagionalizzazione come il metodo X-11 che vedremo la
prossima volta, metodo molto complesso ma il primo dei quali è l‟utilizzo delle medie
mobili, medie di valori della serie storica, calcolate su finestre ad ampiezza fissa,
finestra che scorre lungo l‟arco temporale e abbiamo medie locali calcolate per
ciascuna di queste finestre. Ha effetto di lisciamento su tutta la serie storica
riducendo quindi la componente stagionale.
LEZIONE 12
27/11/2012
Martedì viene il responsabile delle statistiche economiche del comune di Genova, il
dottor Profumo, parlerà rilevazione della rilevazione i prezzi e come si costruiscono gli
indici di prezzi al consumo. È un intervento molto importante, vi fornirà un plico di
slides, che sono parte integrante del programma. La volta successiva dovremo avere
l‟intervento di un professionista nell‟ambito del trasporto del cotone, ci spiegherà
alcune cose sul mercato del cotone, analizzando alcuni aspetti di settore macro
economico, poi siamo arrivati alla conclusione del programma. La prossima è il 4 e
abbiamo Profumo, l‟11 c‟è Parisi, e poi ci sarebbe il 18, probabilmente annullerei quella
lezione.
119
In linea di massima vediamo dove arriviamo e il programma in forma di slide mie sarà
concluso. Vi predispongo un elenco di possibili domande teoriche dominanti, a livello di
esercizi vedremo veramente poche cose. Per la data esatta del pre appello facciamo il
18 dicembre.
Avevamo concluso, dopo aver parlato di serie storiche, analizzando il problema di
stagionalità, quella componente sistematica o periodica che va a colpire le nostre serie
storiche e che dobbiamo cercare di eliminare.
Un approccio che avevamo considerato era quello delle medie mobili. Su queste slide
che vi caricherò oggi, avevamo detto che le medie mobili sono dei filtri per cercare di
cogliere la componente di fondo, cioè il trend al netto di questo fenomeno di
stagionalità.
Le medie mobili hanno una formulazione di questo tipo. Una media mobile è una media
ponderata delle unità dei valori osservati in una finestra di tempo di ampiezza fissa.
Le medie mobili sono delle medie calcolate sui valori della serie storica in un periodo di
tempo ben stabilito, per esempio una media mobile calcolata su sei mesi, è una media
mobile che rappresenta e calcola il valore della serie storica su sei unità temporali
consecutive: gennaio febbraio marzo aprile maggio giugno. Nell‟unità successiva,
febbraio marzo aprile maggio giugno luglio.
È una somma ponderata dei valori della serie storica corrispondenti ad istanti
temporali intorno a t, cioè dei dati tra t –q1 a t+q2, con opportuni valori dei
coefficienti di ponderazione cj.
Io posso dare la stessa importanza nel calcolo della media mobile a tutte le unità della
finestra temporale. Se calcolo il valore medio di un titolo nel suo valore di chiusura,
posso calcolare la media dei valori del primo secondo terzo quarto e quinto giorno, a
cinque termini, o posso dire che i valori più recenti sono più importanti dei valori
vecchi. Potrei pesare maggiormente i valori più prossimi ad istante t e pesare di meno i
valori più vecchi. In generale, la media mobile viene calcolata con una finestra
temporale che rispecchia il periodo del nostro fenomeno stagionale.
Se ho per esempio un fenomeno con ciclo 12, per esempio la stagionalità tipica
dell‟anno solare, allora la media mobile da utilizzare è di periodo 12. Se i dati che ho
sono di tipo trimestrale, e quindi abbiamo 4 trimestri, la media mobile da usare è in
generale una media mobile di ordine quattro.
Se c‟è un mese, come avevamo nel caso della produzione industriale, che ha un valore
particolarmente diverso dagli altri, particolarmente basso, se noi utilizziamo una
media mobile di ampiezza 12, questo mese anomalo, è sempre incluso in qualsiasi media
mobile. Se noi andiamo da gennaio a dicembre il valore è incluso, da febbraio a gennaio
è incluso, da febbraio a marzo è incluso, se andiamo a luglio, da luglio ad agosto uno dei
valori più bassi è all‟interno di questa finestra, e quando trasliamo ancora di una unità
esce dall‟estremo sinistro ed entra dall‟estremo destro. Uno dei picchi o anti picchi è
sempre incluso all‟interno della finestra mobile che utilizziamo per le medie mobili.
120
Abbiamo visto brevemente un esempio di media mobile, che è uno strumento molto
semplice. La media mobile è la media su unità consecutive della serie storica.
L‟ampiezza della finestra è fissa, per esempio ampiezza tre, vengono chiamate medie
mobili perché i valori che vengono considerati per il calcolo della media mobile
cambiano al variare del tempo, la media mobile si adegua piano piano all‟andamento
della serie storica, facendo una media locale dei valori che sono stati osservati. La
media mobile si accompagna piano piano ai valori della serie storica originale.
Il risultato è per esempio questo. Una serie storica che presenta una stagionalità di
ordine tre, in linea di massima, riduce le oscillazioni che vedete qua passando in mezzo
alla serie storica e avvicinandosi a quello che potrebbe essere un trend lineare. Se
calcolassimo una retta di regressione su quei dati, il trend potrebbe essere molto
vicino alla media mobile.
La media mobile è in realtà molto più flessibile rispetto ad una retta di regressione.
Una media mobile consente di seguire tutto l‟andamento della serie anche se
l‟evoluzione non è strettamente lineare, anche se il trend non è strettamente o
parabolico.
Se noi avessimo una serie storica che fa così, questi sono i valori tipici dei mercati
finanziari, la media mobile avrebbe un andamento di questo tipo, è una forma di
lisciamento della serie storica. Segue in maniera dolce la serie storica,l‟andamento
globale e il trend, ma non ha la rigidità ne di una retta né di una parabola di
regressione. Quale modello parametrico consentirebbe di spiegare questo trend di
serie storica? Una retta probabilmente verrebbe così, inadeguato, parabola
inadeguata. La media mobile viene utilizzata per andare ad effettuare dei lisciamenti
della serie storica cogliendo la tendenza generale ed eliminando le oscillazioni più
frequenti, intervalli più brevi, ed eliminando anche componente di stagionalità.
La media mobile ha una azione spianante, detta anche di lisciamento, rende più liscia la
descrizione della serie storica. La media mobile è uno strumento che guarda al
passato. Per poter calcolare la media mobile devo avere già osservato tutti i valori.
Non devo calcolare una media mobile quando ci mancano dei valori del futuro. La media
mobile è calcolata sulle ultime k unità osservate. Non ha una grandissima capacità
preditiva se non ragionandosi sopra anche con strumenti piuttosto sofisticati. Ha una
caratteristica principalmente descrittiva.
Non parliamo di mercati finanziari e così non facciamo. Ma qui si usa confrontare
l‟andamento delle medie mobili a breve e a lungo, a 7 giorni e medie mobili a 15 giorni.
I dati finanziari dopo 15 giorni sono privi di qualsiasi senso. A seconda dell‟andamento
che hanno queste due medie mobili, per esempio la media mobile a lungo e a breve, se
la breve interseca quella a lungo dal basso verso l‟alto significa una certa cosa, se sono
invertite significa altro: ci sono fasi alziste e ribassiste del titolo. La media mobile è
utilizzata con degli strumenti di analisi tecnica.
Qua volevamo vedere un esempio di destagionalizzazione su questa serie, PIL
trimestrale italiano da 2001 a 2010. PIL italiano da 2001 a 2010 in milioni di euro.
Consideriamo, molto spesso non interessa e l‟avevamo già detto parlando di PIL, il
121
valore assoluto del PIL quanto piuttosto la variazione percentuale, consideriamo qual è
l‟andamento delle sue variazioni percentuali anno per anno della serie precedente, dove
per variazioni percentuali intendo valore PIL t meno valore PIL nel trimestre t meno
uno, diviso il PIL del t-1.
Il primo trimestre per il quale possiamo avere il risultato sarà per forza il secondo
trimestre 2001, faremo PIL secondo trimestre 2001-PIL primo trimestre 2000 diviso
pil primo semestre 2000 per 100. Ottengo la variazione percentuale PIL trimestre su
trimestre. Il nostro obiettivo è cercare di costruire una media mobile che sia morbida
e che cerchi di riprodurre la tendenza di fondo di questa serie. In questo modo
cerchiamo di ricostruire il trend generale della serie storica. Per fare questo si usa
una media mobile a tre periodi e si indica q = 1, perché è t più o meno q, quindi t è a tre
periodi.
La media mobile è data dalla somma di xt t+q per q che varia da meno k a k. Ho
cambiato un po‟ la notazione ma è la stessa cosa. È un modo difficile per scrivere
quanto detto.
Noi abbiamo t , t meno 1, t più uno, t meno due, t più due. Possiamo scrivere allora t più
q e t meno q. avremo i corrispondenti valori xt meno q, xt meno due, xt meno due, xt,
xt più 1, xt più due, xt più q. La media mobile è la media di questi valori.
Quindi, in formule, vedi il foglio a quadretti a fianco. È più difficile a spiegarsi che a
farsi. Sono medie ad ampiezza fissa che vanno avanti indietro, avanti indietro. Quello
che vediamo li non sono altro che medie mobili calcolate per tre periodi, quindi di
ordine uno, che sono state centrate all‟interno dell‟intervallo. Notate che le medie
mobili possono essere rappresentati in due modi:
posso disegnare la linea nell‟ultimo istante temporale di cui si fa riferimento come
dato nel semestre 2-3-4, posso decidere se mettere il segno nel trimestre tre o nel
trimestre quattro. Anche se sarebbe più corretto mettere il trimestre 4, perché è
l‟ultimo anno a disposizione, è preferibile come effetto grafico di interpretazione del
trend metterlo al centro, in modo tale che la serie risulti ben centrata sulla serie
storica originale.
Se posizionassi la serie storica nel periodo 4? Sarebbe tutto traslato a destra di una
casella, di una unità. Cambia poco ma il risultato è più vicino alla serie storica originale.
Notate ancora che la serie può essere calcolata solamente se i dati sono disponibili.
Perdiamo due osservazioni: una qua, ci manca il dato della variazione percentuale del
primo semestre, posso solo partire da qua, ho l‟andamento e lo stesso problema si
presenta alla fine, ci manca il dato della variazione percentuale del quarto trimestre.
Le medie mobili hanno una finestra di possibili valori più ristretta rispetto alla serie
storica originale.
I residui tra la serie storica e il modello a medie mobili non mostra un trend
apparente, ma sembra che la variabilità della distribuzione aumenti a partire dal 2005.
Sino al 2005 la serie storica originaria, della variazione percentuale del PIL
trimestrale è abbastanza tranquilla. Dopo il 2005 balzi in basso o in alto, dovuta a
quella che si chiama volatilità della serie storica.
122
Potrebbe essere ragionevole pensare di utilizzare una media mobile di un ordine
superiore, per esempio una media mobile a cinque termini, cioè di ordine tre.
Utilizzando una media mobile di cinque termini si ha una finestra temporale più ampia,
e quindi la oscillazione locale va ad influire di meno sull‟andamento della serie storica.
Aumentare il numero di elementi che vengono utilizzati per calcolare la media mobile,
stabilizza l‟andamento, il profilo della media mobile. Se per assurdo utilizzassimo una
media mobile di ampiezza massima, calcolassimo la media su tutti i valori, otterremmo
la media di tutte le variazioni percentuali, avremmo un solo valore per tutti.. Quanto
più la finestra della media mobile è ampia, tanto più la media mobile risulterà essere
vischiosa nei movimenti. Una nuova unità pesa per un settimo, ho una media mobile di
ordine tre, quindi ho sette elementi. Un nuovo elemento che entra pesa per 1/7. Per
sei settimi la serie storica della media mobile sarà uguale ai valori che c‟erano
nell‟unità temporale precedente. La media mobile di ordine superire risulta essere più
lenta nel suo processo di adeguamento al trend, risulta anche meno sensibile alle
fluttuazioni locali che possiamoo avere nella serie storica.
Qui ho la media mobile di ordine uno, e quindi di tre elementi. La media mobile di
ordine zero non ha senso calcolarla, è la serie storica stessa, sarebbe xt. La media
mobile di ordine due è a cinque elementi, la media mobile di ordine tre è a sette
elementi, di ordine quattro è a nove elementi. Vedete come quanto più si aumenta il
grado della media mobile, tanto più questo trend risulta essere meno sensibile alle
oscillazioni locali dei dati.
Se andiamo a vedere i residui che possiamo ottenere, troviamo che: le medie mobili di
ordine minore vanno incontro a degli errori, degli scarti, che sono minori rispetto alle
medie mobili di ordine superiore.
Cosa sono i quattro grafici che vediamo? Gli errori. Qt meno la media mobile di ordine
1-2-3-4. Prendiamo il valore più basso: -1%. Se andiamo nella media mobile di ordine
due arrivo al meno 2%, ordine tre lo supero e di ordine quattro è ancora più grande.
Non deve stupire. Le medie mobili di ordine basso danno più importanza ai valori locali
recenti, vicini, di quanto facciano le medie mobili di ordine superiore.
La media mobile di ordine uno utilizza tre osservazioni vicine. Ogni nuova osservazione
che entra nella media di ampiezza 3 pesa 1/3, mentre nella media mobile di ordine
quattro, con un totale di nove osservazioni che entrano nel calcolo della media mobile
di ciascuna casellina, ogni nuova unità pesa per un nono. Pesa poco, molto di meno.
L‟effetto memoria della serie storica rimane, viene trascinato e l‟andamento della
media mobile di ordine elevato è molto più lento. Se ci sono crescite rapide o
decrescite rapide della serie storica, la media mobile di ordine basso tende a coglierlo
subito, di ordine alto con più lentezza, ha questa memoria legata al passato..
In questo grafico vedo la serie storica del PIL utilizzando le varie medie mobili: di
ordine uno o utilizzando la media mobile di ordine quattro. Sembra cambiare poco, in
realtà un po‟ cambia. Mi serve per ragionare sugli ordini delle medie mobili
Ci sono alcuni problemi sulle medie mobili:
123
1. Deformano le fluttuazioni di periodo diverso da k, modificando in particolare i
punti di svolta (in genere, anticipandoli per le serie crescenti, posticipandoli per
quelle decrescenti). Se voi avete dei dati trimestrali, dovete utilizzare come
regola le medie mobili di numero di termini 4. Se avete dati annuali medie mobili
di numero di termini 12, se i dati sono semestrali si usano medie mobili di
numero di termini due.
2. L‟effetto Slutzky Yule,
3. Fanno perdere le osservazioni all‟inizio e alla fine della serie
4. Se non è dispari è facilmente centrata, altrimenti sono necessari dei pesi
particolari, se k è dispari i problemi di problemi di centralità della serie storica
possono non essere banali.
124
IL PROGRAMMA X11
Le medie mobili sono ancora utilizzate molto. Anche con Excel, se voi avete un grafico
messo come media mobile, in pochi clic potete ottenere le medie mobili. O anche
Yahoo Finance, o qualsiasi sito che abbia un minimo di strumento di analisi finanziaria
grafica, le medie mobili le trovate. Se prendete Milano Finanza, o altri giornali di tipo
econoimco finanziario troverete sempre la scheda di analisi tecnica con due medie
mobili: a breve e a lungo. Ci sono una serie di considerazioni che possono essere fatte
sul modo in cui si comportano congiuntamente le due medie mobili.
Le medie mobili le abbiamo anche viste in relazione alla stagionalità. Servono per
individuare un trend, che non sia necessariamente un lineare o parabolico. Il vantaggio
delle medie mobili come strumento di identificazione di un trend di una serie storica è
legato al fatto che non hanno sottostante la necessità di sviluppare alcun modello
parametrico. Non bisogna specificare una retta o parabola di regressione. Il problema
che può nascere è selezionare l‟ordine giusto delle medie mobili.
Le medie mobili servono e vengono utilizzate, ora un pochino meno, perché sono una
parte fondamentale del programma X11, programma di destagionalizzazione,
sviluppato dal bureau of census negli anni 1960. Ora il programma è usato meno, ci
sono state modifiche e migliorie nella metodologia, ma è un punto importante per
capire come trattare la destagionalizzazione.
In molti contesti, specie economici, è necessario riuscire a eliminare gli aspetti
superflui, estranei alle mere dinamiche economiche. A noi interessa focalizzare
l‟attenzione sui processi economici, non tanto che l‟agricoltura ha un ciclo legata alle
stagioni. È importante riuscire ad utilizzare questi dati che siano depurati dal
fenomeno della destagionalizzazione.
Introduzione. Il problema che abbiamo è questo. Ci troviamo di fronte a una serie
storica di qualcosa: PIL, produzione industriale. Quello che vogliamo è eliminare la
componente stagionale. Ci sarebbero tante cose da dire sulla analisi delle serie
storiche. Non so se avete capito ma il corso serve per darvi una infarinatura di tante
cose. Il problema di scegliere se destagionalizzare sulla serie grezza o sulle variazioni
percentuali, come abbiamo fatto col PIL come visto precedentemente, non è una cosa
così banale.
In linea di principio cercate di capire, se vi capiterà di fare una analisi di serie storica
per la vostra tesi, quale sia la scelta più opportuna. Molto spesso, le fonti statistiche
ufficiali producono dati che sono già destagionalizzati. L‟Istat per molte cose produce
una serie di dati grezzi e destagionalizzato. Ma almeno sapete cosa si intende per
destagionalizzazione.
La serie grezza dell‟indice di produzione industriale presenta una brusca caduta nel
mese di agosto per le ferie estive. Ciò rende difficile un confronto corretto tra mesi
contigui (nello specifico tra agosto e luglio), bisogna valutare nel tempo la serie
storica grezza ricorrendo a variazioni percentuali tendenziali, calcolate rispetto allo
stesso periodo dell‟anno precedente. In questo caso vado a lavorare sulle variazioni
125
della produzione industriale come tendenziali, non congiunturali, calcolate rispetto allo
stesso periodo dell‟anno precedente. La corrispondente serie destagionalizzata
mostra una dinamica molto più omogenea, era quella tratteggiata, pur presentando
reazioni significative dovute sia a fattori di natura ciclica sia alla presenza di una
componente regolare. La destagionalizzazione permette di interpretare
correttamente anche le variazioni percentuali congiunturali calcolate rispetto al
periodo immediatamente precedente.
Voglio capire come riuscire a costruire una serie storica di quel tipo. Avete anche
capito che la morbidezza della linea tratteggiata dipende da quante unità temporali
vado ad inserire nel calcolo della media mobile.
Quello che vogliamo fare è cercare di sviluppare una procedura che ci consenta di
procedere ad una destagionalizzazione della serie storica come questa. La procedura,
o programma x 11, è una serie di passi ben definiti che non comportano alcuna scelta
soggettiva da parte della persona che fa la destagionalizzazione.
Il programma X11 è un metodo sulla destagionalizzazione basato su filtro. La media
mobile è un filtro, perché è una elaborazione dei dati che vengono filtrati secondo una
perazione, della serie mensile dei numeri indici della produzione industriale.
Sviluppato dal Bureau of Census degli Stati Uniti è anche stato notevolmente
utilizzato in varie parti del mondo, anche dall‟Istat, anche se in tempi più recenti si sia
indirizzato su metodi di stagionalizzazione bastato sui modelli (X11 Arima, X12), la
metodologia X11 rimane piuttosto nota.
Il metodo x11 ha questi passi ben precisi e molto semplici:
- Si prende una stima iniziale mediante medie mobili del trend e si fa una stima di
componente di stagionalità lorda, vedremo cosa si intenda per lordo e netto.
- Stima della componente stagionale netta. Parto da una prima stima di
componente di stagionalità lorda, qualcosa che voglio eliminare.
- Stima iniziale della serie destagionalizzata
- Stima finale del trend- ciclo utilizzando medie mobili particolari di Henderson
- Stima finale dei rapporti lordi di stagionalità
Tutto questo ora non è chiaro. Questa è la produzione media giornaliera delle
industrie della estrazione di petrolio e gas naturali. Anno 1980 è l‟anno base come
valore pari a 100. Come leggo le tabelle? Quando trovo anno base = 100, vuol dire che
quello che mi trovo di fronte non sono valori assoluti, ma sono in realtà indici.
Nel gennaio del 1983, la produzione media giornaliera delle industrie era 128,4.
Significa che era il 28,4% superiore rispetto al valore medio del 1980. Se prendo
dicembre 1985 era il 44,4% superiore al valore del 1980. Fatto 100 la produzione
media giornaliera del 1980, la produzione di gennaio 1983 era 128,4, significa che la
produzione era il 28,4% superiore rispetto alla produzione media del 1980.
Questa è la serie storica, quelli sono i valori e questo è il grafico. Come vediamo c‟è
una prima fase calante, poi fase crescente che sembrerebbe essere abbastanza
126
lineare. Ci sono in realtà delle oscillazioni che sembrerebbero legate a componenti
stagionali.
Riguardiamo assieme i dati. Ho che il mese di gennaio e di dicembre sono, insieme a
novembre, i mesi con la produzione più alta, o rispetto alla parte centrale dell‟anno,
questo è vero. Giugno luglio agosto settembre hanno valori che sono, tranne l‟86, in
linea di massima più bassi rispetto ai valori dei mesi invernali, probabilmente perché
la produzione risente anche delle temperature e di utilizzo di gas e petrolio per i
riscaldamenti.
Quello che vogliamo fare è costruire una serie che non abbia stagionalità, una serie
storica che sia depurata da un effetto ciclico stagionale.
Fase 1. Nella fase 1, la serie storica viene inizialmente destagionalizzata usando una
serie storica a 12 termini. I dati che abbiamo a disposizione sono mensili, 12 sono i
mesi dell‟anno, immagino che la stagionalità sia di periodo 12, e la media mobile che
utilizziamo sarà di 12 termini. Notate che non è un ordine preciso, sarebbe 5,5. Non
avendo il valore centrale, essendo pari, la media mobili è difficile da definire come
ordine.
Questa procedura comporta la perdita di sei valori all‟inizio e alla fine della serie a
causa della finestra temporale su cui le medie mobili sono calcolate.
Che cosa succede? Prendiamo questi dati e calcolo le medie mobili di ordine 12. Prendo
la prima colonna e ne calcolo la media, e la mettiamo per esempio in corrispondenza di
luglio. Poi da febbraio 1983 a gennaio 1984, tutti questi valori ad eccezione del primo
e questo, e ne calcolo la media in corrispondenza di agosto. Poi da marzo a febbraio in
corrispondenza di settembre, e così via, da qua sino alla fine 1998. È chiaro che il
1998 si dovrà fermare a giugno, a questo punto avrò in giugno 1998 la media di tutti i
12 mesi del 1998.
Non avendo i valori del 1982 e non avendo i valori del 1989, è chiaro che queste due
parti non avranno dei corrispondenti di media mobile. Avremo la serie grezza ma non la
media mobile corrispondente. Il risultato è questo. Mancano i primi e gli ultimi valori
di queste medie mobili a 12 termini, perché non posso avere quelli ante cedenti a
gennaio 1983 e posteriori a dicembre 1988. Anche se la serie storica è vecchia, è
importante capire il metodo.
Dopo che abbiamo effettuato questo lisciamento della serie storica, anche nota come
perequazione dei dati grezzi, si calcola il quoziente tra dato grezzo e perequato,
eliminando il trend. Questa operazione sembra un po‟ strana, ma funziona. Calcolo il
rapporto esistente tra questa tabella, cioè il dato grezzo 13, e questa tabella, 16,
luglio 106,8. Faccio il quoziente tra questi valori e ottengo questi quozienti lordi di
stagionalità. Vedete come è meccanico, non stiamo dando interpretazioni. Prendo la
serie storica, ne facciamo un lisciamento attraverso media mobile di ordine 12, prendo
i valori coi quali ho la media mobile, prendo le prime e ultime sei osservazioni e faccio
rapporto tra serie storica originale e serie storica delle medie mobili di ordine dodici.
Si ottiene in questo modo un quoziente che ci dice qual è il rapporto tra la serie
grezza e la media mobile. Se il valore è al di sopra di 100, il valore grezzo è superiore
127
al valore lisciato. Se è al di sotto del 100, il valore grezzo è più piccolo del valore della
media mobile destagionalizzata. Se è uguale a 100 il valore reale grezzo e il valore
della media mobile sono uguali. Con questa operazione, si va di fatto ad eliminare il
trend che è stato individuato attraverso il modello media mobile di ordine 12, e il
risultato è questo.
Noi avevamo questa serie storica, calcoliamo la media mobile di ordine 12 per tutti i
mesi ad eccezione dei primi sei e degli ultimi sei, ottengo la cosa in cima a pagina 19,
molto liscia, sono 12, è un periodo lungo. Ogni nuova osservazione dà una informazione
che pesa un dodicesimo. È una serie storica, quella lisciata, che ha una memoria molto
lunga. È lenta a cambiare, ma mantiene un trend. Stavamo dicendo che ha un trend
lineare. Coglie un primo trend-ciclo, ricordo che trend e ciclo sono difficili da
separare.
Facciamo il rapporto tra serie storica vista prima con questa che inizia luglio 83 e
finisce a giugno 83. Prendo la serie storica solamente nei mesi dei quali ho le stime
iniziali trend-ciclo e faccio il rapporto. Tutti i mesi in cui questa linea è al di sopra di
cento, sono mesi in cui la serie storica originaria, i dati grezzi, sono al di sopra della
stima provvisoria iniziale del trend ciclo. Tutti quelli che sono al di sotto? Sono valori
che vengono sovra stimati dal trend-ciclo.
Se potessimo rappresentare assieme le due serie, avremmo la serie originaria che
passa attorno a quella lisciata, come avevamo visto prima. A volte la serie viene
approssimata per eccesso, a volte per difetto, attraverso il modello a media mobile.
Ma era quello che succedeva con la retta di regressione. Anziché calcolare i residui di
regressione come differenza tra i valori teorici e il valore reale, qui calcoliamo i
quozienti. Se voglio fare un piccolo confronto tra quanto facevamo prima nelle altre
lezioni e a statistica 1, se a statistica 1 parlavamo di errore come differenza tra il
valore reale e il valore teorico, l‟abbiamo usato anche nell‟ultima lezione quando
guardavamo gli scarti dalla sere storica, ora uso il quoziente dato da Yi diviso Yi*.
A questo punto andiamo ad eliminare di fatto quello che è il trend. C‟è una
dimostrazione, che possiamo saltare. Facendo il rapporto tra i valori reali e il valore
del trend ciclo si elimina il trend. Vedete come sono belli orizzontale. Li avevamo
chiamati residui di regressione, ma li abbiamo calcolati in questo secondo modo.
Adesso ci poniamo ancora un‟altra questione. Bene, vediamo se il nostro modello riesce
a cogliere bene le componenti stagionali o è tanto soggetto alle variazioni molto
diverse della serie storica.
L‟insieme dei rapporti lordi, qi o RL, viene corretto per ridurre la presenza di rapporti
di stagionalità anomali, cercando di far pesare meno i valori che si discostano molto
dalla media, e far pesare di più i valori che sono vicini alla media.
Io dico questo: se ci sono dei quozienti lordi, molto lontani da questo 100, questi
devono essere esclusi dalla costruzione del mio modello di trend, perché non c‟entrano
nulla, sono legati a fattori esterni. È un po‟ il discorso che facevamo parlando di serie
storica grezza della produzione industriale. Grossi crolli ad agosto, dicevamo va bene,
c‟è il crollo, però sappiamo bene qual è la ragione.
128
L‟idea di questo approccio è dire: i quozienti lordi non hanno tutti la stessa
importanza. Per me hanno più importanza quelli che sono vicini al 100. Man mano che ci
allontaniamo dal 100, hanno una importanza sempre meno rilevante. In questo modo
andiamo a dare meno importanza i valori estremi, anomali e legati probabilmente ai
fattori stagionali.
Cosa si fa? Prendiamo i rapporti lordi, quanti sono? 5 per 12 = 60. Di questi rapporti
lordi ne calcoliamo la media, supponiamo 100, non è detto che sia 100, lo supponiamo.
Questi 60 rapporti lordi calcolo lo scardo quadratico medio, facciamo 10. Lo scarto
medio dei rapporti lordi dalla media è 10, mediamente mi aspetto uno scarto di 10 dalla
media come rapporti lordi. Non è media aritmetica ma quadratica.
A questo punto ho i miei 60 rapporti lordi. RL 1-2-3-….-60. Ad ognuno di questi
assegno un peso a seconda del valore che assume. Allora dico: il mio rapporto lordo
risulta essere oltre più o meno 2,5 sigma dalla media, cosa è? Può essere minore di 2,5
per dieci, cioè 25, minore di meno 25 più 100, oppure maggiore di 25 più 100.
Posso avere il rapporto lordo che sia maggiore di meno più 2,5 sigma dalla media.
Significa minore di 75 oppure maggiore di 125. 75 è 2,5 per dieci, meno 25 più 100, o
125.
Oppure può essere compreso tra 75 e 85 (meno 15 più 100) oppure compreso tra 115 e
125.
Oppure il mio rapporto lordo può essere compreso tra 85 e 75. Cosa stiamo facendo?
Stiamo definendo tre fasce. Qui abbiamo il nostro tempo, qui ho i nostri rapporti
lordi, e qui la media del rapporto lordo. Ho la prima fascia: media del rapporto lordo
+1,5 sigma e -1,5 sigma. Se questo fosse 100, questo sarebbe 115 e questo 85. Questa
è una fascia che noi indichiamo con il numero 3.
Poi posso avere un‟altra fascia in cui ho media RL -2,5 sigma e media RL più 2,5 sigma.
Questa fascia va da 115 a 125 e da 85 a 75. Questa fascia la chiamiamo 2. Infine,
abbiamo tutto il resto che è la nostra fascia 1.
Di fatto, noi ci troviamo ad avere tre fasce. La fascia 3 dei valori vicini alla media. La
fascia due dei valori non proprio vicini alla media ma non proprio così lontani, e la
fascia uno dei valori lontanissimi dalla media.
A questo punto, ogni rapporto lordo si trova associato un peso. Se il rapporto lordo è
compreso tra la media dei rapporti lordi meno 1,5 sigma e più 1,5 sigma, cioè è in
fascia 3, il suo peso è pari a 1.
Se è invece in fascia due, compreso tra media RL meno 2,5 sigma e più 1,5 sigma, varia
da zero a 1 a seconda quanto sia vicino al valore di media RL meno 1,5 sigma e lo stesso
dall‟altra parte. I valori che invece sono al di fuori di questo range, hanno un peso pari
a zero.
In altri termini, se questa fosse la funzione del peso, andiamo a dare più importanza
per la definizione del nostro modello destagionalizzato ai valori centrali e meno
importanza dai valori lontani a quelli centrali. Tutto questo ovviamente è fatto col
computer, non è una cosa manuale.
129
Viene quindi calcolata la nuova media delle variazioni. Si vanno a ripesare tutti questi
rapporti, queste osservazioni. Si ricalcola la media delle variazioni da mese a mese del
trend-ciclo e si va a costruire un nuovo modello di trend basato su un coefficiente R.
Il coefficiente R è un rapporto che risulta da questa operazione. A seconda del valore
di questo coefficiente globale, è un numero solo su tutta la serie storica pulita, si
utilizzano medie mobili differenti. A seconda di quanto è eterogenea la serie storica
posso usare una media mobile di ordine 9,12 o 23.
Questo indice R, il cui calcolo ve lo vedete, è facile, è una misura di eterogeneità della
serie storica, di volatilità della serie storica e di importanza della componente
stagionale. Se la componente stagionale non è molto rilevante, si utilizza una media
mobile di 9 termini per identificare il trend della serie storica. Intermedia? 13
termini. Se il valore di R è al di sopra di 3,5 con forte variabilità della serie storica, è
un modello a 23 termini.
Il risultato finale è quindi una serie storica che non è depurata stagionalmente
utilizzando solamente una media mobile di ordine 12, ma è depurata usando una media
mobile il cui numero di elementi è determinato al termine di tutta la procedura, e
consente di eliminare dal calcolo della media mobile quei valori di disturbo che ci fanno
cadere la media mobile. Trovo il modo di ignorare i valori molto bassi. La serie storica
sulla produzione industriale ha salti in basso molto forti. Ora li taglio e non ho
problemi relativi alla stagionalità.
Il risultato finale è una serie storica che non è brutta come quella liscia, contiene una
sua variabilità generale ma risente molto meno delle componenti stagionali. La
destagionalizzazione, in particolare il metodo X11, è usato perché si ritiene che la
componente stagionale sia di disturbo per la compresione dei fenomeni economici.
È molto meccanica, abbiamo visto fasi. Serie grezza, lisciamento, quoziente,
ponderazioni, indice R, e a seconda del valore dell‟indice R ci dice quale media mobile
utilizzare.
È arbitrario considerare la serie storica aggiustata con una descrizione di ciò che il
fenomeno sarebbe stato se non avessero agito i fattori dai quali si vuol prescindere la
stagionalità. Non è fuori luogo ammettere che il risultato ottenuto possa valere come
una descrizione del fenomeno delle componenti che si presume esso rappresenti
qualora vengano utilizzate tecniche conformi all‟ipotesi assunta sul comportamento
interno alle componenti.
Non mettiamo la mano sul fuoco che la procedura funzioni, ma è una descrizione
dell‟andamento. Di nuovo le medie mobili nascono per finalità descrittive e di
comprensione, non tanto di previsione. I modelli visto sino ad adesso sono modelli di
tipo descrittivo, a posteriori, e non previsivo.
130
LEZIONE 13
4/12/2012
Vi presento il dottor Profumo, responsabile delle statistiche economiche del comune
di Genova, che farà un intervento sulla rilevazione dei prezzi andando molto nel
dettaglio tecnico. Il problema è che in molti corsi, incluso il nostro, è quello di perdere
un po‟ di vista l‟aspetto pratico.
Le statistiche che abbiamo visto, dell‟Istat e dell‟Eurostat, sembrano dei numeri che
non vengano prodotti ma nascano, e siano la verità. C‟è un procedimento di raccolta e
di elaborazione di questi dati estremamente complesso. Vediamo oggi gli aspetti
tecnici di questo elemento anche se ci saranno aspetti più generici: normativi e
metodologici.
Questo materiale verrà messo su aula web insieme al famoso esempio di domande
teoriche del compitino del 18.
È il mio primo intervento davanti ad una platea universitaria. Mi perdonerete se c‟è
qualche passaggio vuoto e momenti in cui devo pensare a quello che devo dire: non sono
abituato ad avere una platea di ascoltatori.
Noi siamo, come ufficio di statistica qui a Genova, una vera e propria direzione che
comprende 22-23 persone. Le persone che si occupano di statistica economica sono 8,
tra cui io. Io nel passato mi sono occupato anche di statistiche demografiche e sociali,
ho la conoscenza dei vari settori del nostro ufficio che si occupa di censimenti,
statistiche demografiche, rilevazioni presso le famiglie e rilevazioni dei prezzi.
Questo per dare un quadro di tutto quello che si fa in un ufficio di statistica
comunale.
La cosa importante da dire è, che parlando di rilevazione dei prezzi, si sentono in
giro tante opinioni. C‟è chi dice che la rilevazione dei prezzi e la diffusione dell‟indice
dei prezzi al consumo che avviene ogni mese, non sia del tutto attendibile. C‟è chi dice
che la rilevazione dei prezzi è incompleta, come vedremo interessa tutto il territorio
italiano, ma in certe zone ancora non è possibile effettuarla. Si sentono dire tante
cose, c‟è chi dice che l‟approccio metodologico può essere corretto e non produce un
indice dei prezzi attendibile.
Il mio compito è quello di parlare dell‟organizzazione dell‟‟ufficio, della organizzazione
della rilevazione, della metodologia in sé stessa per costruire un indice. Sarà un po‟
anche vostra cura trarre le conclusioni se, tutta questa metodologia, che sicuramente
è migliorabile, sia o meno corretta. A mio avviso si: come vedrete l‟‟approccio
metodologico è molto curato, va molto nel dettaglio, tutto quello che si sente in giro
dai giornalisti che vanno a fare le rilevazioni presso i negozi dicendo Milano è meno
cara di Genova, nello stesso negozio abbiamo trovato dei prodotti che costano meno,
queste cose lasciano quello che trovano, al di dietro non c‟è alcuna metodologia di
indagine accurata come quella che andremo a vedere oggi.
131
Il problema della costruzione di un indice dei prezzi, risale a molto tempo fa, alla
prima guerra mondiale, o comunque nell‟immediato dopoguerra, quando tutti gli
stravolgimenti economici che erano stati causati dalla prima guerra mondiale, avevano
determinato talmente evidenti squilibri tra i prezzi e i salari, che c‟era bisogno di uno
strumento che permettesse di misurare e di adeguare quelli che erano gli stipendi e i
salari di allora agli aumenti registrati nei prezzi al dettaglio. Da un centinaio di anni si
avverte l‟esigenza di avere un indicatore dei prezzi al consumo.
I comuni, a quell‟epoca, che avevano un ufficio di statistica adeguato a compiere
queste rilevazioni, provarono in parte ad effettuare queste rilevazioni. Era una
rilevazione che non era coordinata: ogni comune usciva con un dato che derivava da una
metodologia e da una rilevazione diversa. Non c‟era un ente centrale che imponesse a
tutti regole uguali e soprattutto facesse suo questi indici costruiti dai vari comuni per
poi sintetizzarli in un indice globale a livello nazionale.
Con la creazione dell‟Istat nel 1926, questo inconveniente è stato superato. L‟Istat
fece un po‟ da fulcro di tutti questi lavori costruiti dai singoli comuni e, soprattutto,
costruì una metodologia unica (un insieme di regole uniche) in maniera che tutti i
comuni si basassero su queste identiche regole per arrivare al dato finale della
costruzione di un indice dei prezzi.
Col tempo la metodologia si è affinata, fino ad arrivare ai giorni nostri. È recente una
forte correzione delle metodologie di rilevazione dei prezzi di qualche anno fa, in cui
molti prodotti che venivano rilevati trimestralmente, sono oggi rilevati mensilmente.
La metodologia è in continua evoluzione. Da un po‟ di anni a questa parte, a sua volta
l‟Istat stesso e tutti gli uffici centrali di statistica di tutte le nazioni europee sono
coordinate da Eurostat. C‟è un organo a livello europeo sovranazionale che coordina
tutti gli uffici centrali di statistica. A loro volta gli uffici centrali di statistica
coordinano tutti gli uffici comunali di statistica, UCS.
C‟è un organo nazionale, Istat, che coordina tutti gli uffici di statistica comunali. C‟è
un organo europeo, Eurostat, che a sua volta coordina tutti gli uffici centrali di
statistica a livello nazionale. Questo perché col trattato di Maastricht del 1992,
anche Eurostat ha pensato di costruire un indice dei prezzi a livello europeo, che
prima non c‟era. Per costruire un indice dei prezzi a livello europeo, tutti gli stati
membri dovevano uniformarsi ad un insieme di regole che fosse uguale per tutti.
Questo insieme di regole viene dettato da dei regolamenti europei, e viene poi
riproposto, trasmesso da Istat ai vari UCS, con delle leggi, con delle regole a livello
nazionale. Le prime cose che andremo a vedere, abbastanza velocemente, sono la base
normativa dell‟indagine sui prezzi, l‟insieme di regole che disciplinano proprio la
rilevazione dei prezzi al consumo.
La rilevazione dei prezzi riguarda leggi e regolamenti che costituistcono la base
normativa. Definiscono soggetti e funzioni. I soggetti sono l‟Istituto nazionale di
statistica, o meglio tutti gli istituti nazionali di statistica dei vari stati membri UE e
dei comuni. L‟indice dei prezzi nasce da un lavoro di equipe, di squadra, che ogni
comune fa con l‟Istat. Io come responsabile e i miei collaboratori dell‟ufficio di
132
statistica di Genova sentiamo quotidianamente Istat, se non siamo noi che chiamiamo
sono loro che chiamano o che ci scrivono, proprio perché la costruzione di un indice
che è assai complesso, comporta un continuo confronto tra gli uffici comunali e l‟Istat,
per cambiamenti, per correzioni e precisazioni. Quotidianamente noi siamo in rapporto
con l‟ufficio delle statistiche economiche centrale dell‟Istat.
Vediamo la base normativa. Questo vi stupirà, un po‟ meno rispetto a quello che vi ho
detto prima. Guardate quanto è vecchia la legge che conferisce all‟Istat la promozione
della costruzione dell‟indice dei prezzi, stiamo parlando di una legge del 1927. Non ci
sorprende più, l‟Istat è del 1926. Da un anno dopo la sua nascita, la legislazione si dà
da fare per far sorgere quell‟uniformità di regole che permettono una costruzione di
indici omogenei, come metodologia, per tutti i comuni.
Questo regio decreto del 1927 dice che gli indici vanno calcolati obbligatoriamente in
tutti i comuni con più di 100 mila abitanti, in altri scelti preferibilmente tra i
capoluogo di provincia, o comuni con più di 50.000 abitanti con uffici di statistica
idonei, questo è molto importante. Ancora oggi, non tutti i capoluoghi di provincia, non
tutti i comuni che hanno diverse migliaia di abitanti hanno uffici di statistica idonei.
Non metterei la mano sul fuoco su alcuni uffici di statistica di alcuni capoluoghi di
provincia, il problema è che non ce lo mette nemmeno l‟Istat. Molti capoluoghi sono
esclusi dalla costruzione dell‟indice, proprio perché non hanno conoscenze e personale
adeguato per formare un indice attendibile. Vedremo la copertura territoriale
dell‟indice e i capoluoghi di provincia che ne sono esclusi.
Più recentemente la legge 1975 modifica il regio decreto: è obbligatorio costruire
indice per i comuni che sono capoluogo di provincia e per quelli con più di 30.000
abitanti con un ufficio di statistica idoneo. Passiamo da 50.000 a 30.000 abitanti. Se
non avevano un ufficio di statistica idoneo, si presume che per i comuni con più di
50.000, ancora più difficilmente ce l‟abbiano quelli con più di 30.000.
Complessivamente nel tempo le cose sono andate migliorando, tant‟è vero che oggi solo
84-05 sono in grado di costruire un indice dei prezzi.
Il regio decreto, sempre la legge fondamentale per la costruzione dell‟indice dei
prezzi, dice tutta una serie di altre cose. È necessario conoscere le basi legislative
per la nascita dell‟indice. Dice che l‟Istat dirama le istruzioni affinché la raccolta
avvenga con criteri di uniformità e metodo, promuove i provvedimenti per
l‟organizzazione dei servizi di statistica locale e vigila sull‟esecuzione dei lavori
concernenti il calcolo degli indici.
La vigilanza, i controlli e le verifiche dell‟Istat sono veramente assidui. Tutti i giorni
siamo in contatto con uffici Istat. Nonostante Genova è un buon comune dal punto di
vista di costruzione dell‟indice, i controlli dell‟Istat sono ripetuti nel tempo e sono
capillari e assidui, vedremo cosa Istat controlla, anche giustamente. Se su 100
controlli 95 non hanno senso, perché le cose sono corrette, c‟è sempre una
percentuale inferiore in cui il comune può sbagliare e l‟Istat può correggere.
La legge dice inoltre che cì‟è l‟obbligo di costituire apposite commissioni, Commissione
di controllo della rilevazione dei prezzi al consumo, vedremo a cosa servono queste
133
commissioni. Servono semplicemente a validare l‟indice costruito dall‟ufficio di
statistica del comune. La commissione, vedremo come è composta, che valida questo
indice, non può cambiare i criteri metodologici fissati da Istat, ma può fare ulteriori
verifiche e ulteriori controlli.
Cosa succede in sostanza? Il comune di Genova lavora e costruisce un dato, un indice,
indice provvisorio dei prezzi. Istat non lo valida, lo controlla e lo verifica. Dice: va
bene, è corretto ma non sono l‟organo deputato a validarlo, che è invece la
commissione comunale di controllo. Solo dopo che la commissione di controllo lo ha
validato, l‟indice può essere diffuso, ovviamente il dato è provvisorio. Ci si riserva
ancora di compiere ulteriori controlli fino a che il dato non diventerà definitivo. Il
dato diventerà definitivo dopo una quindicina di giorni.
Il comune di Genova lavora, produce un indice provvisorio dei prezzi del comune di
Genova, diffuso in genere l‟ultimo giorno del mese. Venerdì‟ 30 il comune di Genova ha
diffuso l‟indice provvisorio della città, dopo che il dato è stato validato dalla
commissione regionale di controllo.
Dopo il dato non è ancora definitivo. Passano 15 giorni di controlli, non più operati dalla
commissione comunale di controllo, che ha validato l‟indice, anche con una funzione
puramente formale, ma lo ha fatto. I controlli vengono effettuati dall‟UCS, in
concomitanza con l‟Istat. Solo dopo che sono passate circa due settimane,
approssimativamente la metà del mese successivo, l‟indice diventa definitivo.
Attenzione, l‟indice può cambiare. Diventa definitivo ma può essere diverso da quello
provvisorio. Questi ulteriori controlli, che sono stati effettuati, possono aver portato
a delle variazioni talmente consistenti che hanno fatto cambiare l‟indice.
Una città che può aver fatto registrare in sede di indice provvisorio una variazione
congiunturale, cioè una variazione mensile rispetto al mese precedente, pari a mezzo
punto, 0,5 in più rispetto al mese precedente, in sede di indice provvisorio questo può
cambiare e può cambiare e diventare 0,4 o 0,6 in genere il cambiamento è di un
decimale, non può essere un cambiamento troppo evidente. Può accadere che in sede di
indice definitivo ci sia un piccolo cambiamento. Solo allora il dato diventa definitivo,
solo allora quel dato ha effetti legali e amministrativi validi. Quando il dato è
provvisorio, indica soltanto una tendenza ma non ha alcun effetto legale valido.
Abbiamo cominciato dalla fine: abbiamo costruito l‟indice e c‟è la commissione che lo
valida. Da chi è composta? Da un sindaco o un suo delegato (di solito assessore con
funzione di presidenza), un membro dell‟ispettorato del lavoro, dirigente ufficio di
statistica della camera di commercio, dai membri delle associazioni rappresentative
dei datori di lavoro (per Genova Confindustria, Confartigianato e Ascom), dagli
esponenti delle associazioni rappresentative dei lavoratori (sempre un numero di tre,
per Genova CGIL, CISL e UIL) dal responsabile dell‟ufficio statistico o dal suo
delegato e da una segreteria che ha funzioni di aiuto.
Perché ho inserito questa slide qua? Questa slide riguardava la parte legislativa e per
farvi notare che una volta non c‟erano i canali di diffusione dei dati come ora. Oggi si
fa un comunicato stampa, si mette online, si diffonde subito alle televisioni e alla
134
stampa. Una volta lo scopo essenziale di tutta questa riunione era di far conoscere
immediatamente agli esponenti più rappresentativi, alle varie categorie del mondo del
lavoro, le tendenze dei prezzi, proprio perché non c‟erano i canali di diffusione che ci
sono ora.
Adesso, questa riunione che ha un compito di validazione dell‟indice, in realtà svolge
una funzione meramente formale e burocratica di validazione. Comunque la vera
validazione dal punto di vista tecnico la da l‟Istat. Tant‟è vero che ci sono comuni che
non riescono nemmeno a costituire la commissione comunale di controllo, o che, nel
giorno di uscita dell‟indice, non raggiungono il numero legale. Gli esponenti
complessivamente sono dieci, questi due esponenti hanno tre rappresentanti, a volte la
comunale di controllo non raggiunge le sei unità per cause varie. Magari sono 4-5. In
quel caso la responsabilità di validazione dell‟indice provvisorio è assunta direttamente
dal direttore dell‟UCS e in seconda battuta dall‟Istat.
Da quando ci sono io, io sono 13 anni che lavoro in UCS e sei anni che mi occupo di
rilevazione dei prezzi, per fortuna il numero legale è stato sempre raggiunto. Anche
perché c‟è un interesse da parte di queste categorie di associazioni, non solo di avere
comunque il dato, quello lo possono vedere online dopo un quarto d‟ora che è stato
diffuso, ma soprattutto di capire come si stanno muovendo le tendenze dei prezzi, e
quindi avere un minimo di commento a quello che è successo in quel settore.
Ancora un cenno sul decreto legislativo 322 1989. Solo per dire che questa è una
legge quadro in materia di statistica. È la legge che, oltre a ribadire che la rilevazione
dei prezzi è di interesse nazionale, quindi viene promossa da questo stesso decreto
legislativo, istituisce il Sistan, il Sistema Statistico Nazionale. È l‟insieme di enti e
organismi composti dagli uffici di statistica di regioni comuni camere di commercio
USL, amministrazioni dello stato enti privati che fanno statistica a livello nazionale,
che collaborano con l‟Istat per la raccolta dei dati statistici.
Questo decreto ribadisce che l‟Istat è l‟unico soggetto a cui è demandata la
produzione degli indici dei prezzi. Infine una norma che va richiamata è il regolamento
comunitario del 1995 cui hanno fatto seguito ulteriori specificazioni, che istituisce
l‟indice armonizzato europeo dei prezzi al consumo, quello che avete già sentito
chiamare con l‟abbreviazione IPCA (Indice Prezzi Consumo Armonizzato).
Indice europeo nato dopo la costituzione dell‟Europa, dopo il trattato di Maastricht.
Questo regolamento impone all‟Europa e ai paesi membri di calcolare non solo un indice
nazionale ma anche un indice che possa essere utile per la costruzione di un indice
europeo. È un indice diverso da quello nazionale: vedremo perché non tiene conto di
tutte le rilevazioni.
La cosa importante è che è un indice confrontabile a livello di tutti gli stati membri
della comunità, perché la metodologia di costruzione è la stessa in tutta Europa. Già
da questo capiamo che in realtà ogni UCS, fa una rilevazione mirata non alla
costruzione di un solo indice, ma di più indici. Abbiamo parlato di indice nazionale (sono
due), ed indice europeo, l‟indice dei prezzi al consumo armonizzato perché è
confrontabile in tutti i paesi d‟Europa.
135
Ora vediamo come è organizzata la rilevazione dei prezzi in Italia. Questi sono gli
ultimi dati che abbiamo, 2012, i comuni capoluogo che partecipavano alla rilevazione
erano 84. Ne abbiamo perso uno rispetto al 2011. Invece di andare avanti siamo andati
indietro. Non è perso completamente, è perso per il 2012. Siena ha interrotto perché
Istat non ha ritenuto questo comune attendibile dal punto di vista di costruzione di
indice e quindi lo ha fatto uscire dalla rilevazione. Mi auguro che l‟uscita sia
provvisoria. È già successo anche con altri comuni di dimensioni più grandi di Siena.
Purtroppo sta di fatto che sia perso diciamo un comune di discrete dimensioni.
Può anche capitare che un comune salti un indice. È una cosa molto incresciosa, a
Genova non è capitato. Ma è capitato a comuni di grosse dimensioni, anche magari per
problemi non proprio dipendenti da loro. Qualche comune ha avuto dei crash
informatici e non sono riusciti ad avere la rilevazione. Altri comuni, sto parlando di
comuni capoluogo di regione, non faccio nomi, ma hanno ricevuto una ispezione Istat
perché non lo ritenevano attendibile dal punto di vista della rilevazione, qualcuno è
finito anche sulla carta stampata. Questo per ribadire l‟estrema attenzione
dell‟Istituto nazionale di Statistica.
Prendiamo questi 84 comuni che riescono a costruire un indice più che affidabile. In
questi comuni vengono interrogati, vengono comunque considerati circa 42 mila punti
vendita e ci addentriamo nella organizzazione vera e propria della rilevazioni, anche
8300 abitazioni presso le quali vengono rilevati i canoni di affitto. Parliamo di numeri
abbastanza grandi: 42 mila esercizi, negozi e quant‟altro in cui vengono rilevati i
prezzi, e 8300 abitazioni in cui vengono rilevati i canoni di affitto. Ogni mese si
rilevano quasi 600 mila quotazioni di prezzi.
Non abbiamo parlato di prezzi, ma di quotazione dei prezzi. Ogni quotazione non
rileva solamente il prezzo ma tante altre cose del prodotto, vedremo quali cose si
rilevano insieme al prezzo. Di queste 591 mila rilevazioni, la maggior parte, circa il
78% sono rilevate dai comuni, da UCS, ma ce ne è una parte importante, 22-23%,
80.000, che sono rilevate direttamente da Istat. Istat ha una duplice funzione: non
solo verifica, controllo dei dati di aggregazione dei vari indici regionali, ma anche
funzione di rilevare direttamente determinate quotazioni di prodotti. Vedremo quali
sono quelle che rileva direttamente Istat e vedremo perché vengono direttamente
rilevate da Istat e perché non le rilevano i comuni. Istat non solo controlla, ma opera
esecutivamente con la rilevazione dei prezzi.
Questa è una rappresentazione di come la rilevazione dei prezzi sia distribuita sul
territorio nazionale. Ad eccezione del Nord Est, in cui tutte le 22 province del nord
est operano e costruiscono un indice dei prezzi, ci siano nelle altre macro regioni
italiane delle carenze. Il nord ovest ha anche dei buchi, mi pare in Lombardia. Noi
siamo abbastanza virtuosi, tutte e quattro le province, sia pure con diverso titolo,
sono in grado di costruire l‟indice.
Man mano che si scende al sud, appaiono evidenti le lacune. Anche dove c‟è una piena
copertura, nella Campania, pensate che solo nel 2007 Napoli e Salerno costruivano
l‟indice. Benevento era in fase di costruzione, Caserta e Avellino non ce la facevano.
136
Poi evidentemente si sono adeguate. Questo cosa ci dice? Che il grado di copertura
territoriale, rispetto alla popolazione italiana, è di 52 milioni su 60, abbiamo un grado
di copertura dell‟86,3%, che comunque è già abbastanza un successo. La legge italiana
impone l‟ obbligatorietà degli uffici comunali di statistica solo per comuni con più di
100 mila abitanti.
Quelli si devono sicuramente adeguare. Capite bene che non sono tantissimi i comuni
che raggiungono i 100 mila abitanti. Ci sono tutta una serie di capoluoghi che non
arrivano a questo valore e che spesso non hanno degli uffici di statistica
completamente preparati per la costruzione dell‟indice. Hanno magari personale che si
occupa non esclusivamente di statistica. Magari opera su lavori di anagrafe, di
demografia, ma non fa esclusivamente statistica.
Il compito dell‟Istat è cercare di salire a questo dato, arrivare al 100% recuperando
quelle realtà, specialmente nel centro e sud Italia che non ce la fanno. A questo
proposito il fatto dell‟accorpamento di determinate province può essere utile.
accorpando alle province più piccole province più forti, magari si riesce a costruire
l‟indice in quelle zone del territorio italiano che ora non sono ancora coperte.
Andiamo a vedere i campi di osservazione degli indici. Gli indici dei prezzi al consumo
misurano anzitutto una variazione dei prezzi nel tempo. Ovviamente non di tutti i beni
e servizi, è impossibile, sarebbe inumano andare a rilevare tutto quello che si vende al
dettaglio e al consumo in ogni territorio. Misurano le variazioni di un insieme di
prodotti che costituisce il paniere, che comprende i prodotti più rappresentativi,
secondo una scelta fatta esclusivamente da Istat ma che comporta il parere di vari
uffici comunali di statistica. La cosa che si impara è che non vengono rilevati i prezzi
di tutti i prodotti, ma quelli di un paniere.
Questa slide ci dice quali sono gli indici che vengono costruiti tramite la rilevazione
dei prezzi:
- NIC, l‟indice nazionale intera collettività, è il più comunemente usato per gli
studi e le ricerche e che vedete da tutte le parti;
- FOI, Indice di prezzi al consumo per le famiglie di operai ed impiegati,
indice costruito insieme al NIC con alcune brevi differenze, è l‟indice al quale
vengono attribuiti gli effetti amministrativi più importanti. Ad esempio
l‟adeguamento dei canoni d‟affitto. Non vengono adeguati in base al NIC, ma in
base al FOI;
- PCA, indice armonizzato dei prezzi al consumo a livello europeo.
La legge in più fa anche costruire altri due indici che derivano direttamente da questi.
Da questi due indici nazionali nascono questi due indici, che noi per comodità
chiamiamo NIS e FOS. La S indica senza. Non è una simbologia ufficiale. È una
terminologia degli ucs per semplificare le cose. NIS Nazionale Intera Collettività
senza tabacchi e FOS senza tabacchi. Escludono dalla rilevazione solamente i
tabacchi. In genere, i due indici coincidono o al massimo c‟è un decimale di differenza.
137
Si calcolano solo perché lo impone la legge: non hanno più valenza amministrativa né
formale.
Il NIC è l‟indice dell‟intera collettività. Considera il paese come un‟unica grande
famiglia di consumatori.
Eravamo arrivati a descrivere il NIC. Il NIC è l‟indice più importante, considera tutta
la collettività dei consumatori, è l‟indice con maggiori possibilità analitiche di studio e
comparazione sul piano territoriale nazionale ed internazionale. È l‟indice che trovate
quasi sempre, se trovate dati diffusi sull‟indice dei prezzi, quasi sempre trovate il
NIC.
Quasi mai si parla di FOI indice dei prezzi al consumo delle famiglie di operai ed
impiegati. Si parla solo di questo indice quando ci sono degli effetti amministrativi. È
l‟indice col quale si adeguano i valori monetari di anni e periodi diversi (per esempio è
utilizzato per adeguare ai canoni di affitto gli assegni dovuti al coniuge separato).
Abbiamo come UCS molte telefonate i giorni seguenti l‟uscita dell‟indice definitivo,
quello che è a metà mese. I cittadini, quando ci sono soldi di mezzo sanno quando è
diffuso l‟indice definitivo, chiamano l‟ufficio di statistica e ci chiedono l‟indice
dell‟ultimo mese per adeguare il canone di affitto.
IPCA nasce con Maastricht elaborato dal 1997. Permette ad Eurostat di diffondere
un indice armonizzato dei paesi UE. Permette soprattutto di elaborare e diffondere
l‟indice sintetico europeo che ovviamente deriva da una elaborazione degli indici
nazionali.
Cosa hanno in comune e di differenza questi indici? Se non ci fosse la rilevazione dei
prezzi nessuno dei tre si potrebbe costruire. La metodologia di calcolo è uguale per
tutti e tre gli indici, come anche la base territoriale, si lavora in quei comuni che
riescono a costruire un indice. Lo schema di classificazione del paniere che tra un po‟
esamineremo è comune a tutti e tre gli indici. Se sono tre indici diversi è perché
qualcosa cambia da uno all‟altro.
NIC e FOI si basano sullo stesso paniere e sui consumi finali delle famiglie. Però a ogni
bene e servizio è attribuito un peso differente. Per esempio, la pasta può avere un
peso percentuale dell‟1% in NIC, nel FOI avrà un altro peso percentuale, sicuramente
un po‟ di più, comunque il FOI è riferito ad un insieme di famiglie che tiene conto solo
degli operai impiegati e non tiene conto della grande ricchezza, dei grandi patrimoni.
Il paniere è lo stesso ma il peso dei prodotti, vedremo che importanza hanno sul
paniere, sono diversi.
Differenze tra gli indici: entra in scena IPCA. Ha la stessa popolazione del NIC e FOI
ma si differenzia dagli altri perché si riferisce alla spesa monetaria per i consumi
finali sostenuta esclusivamente dalle famiglie. Vuol dire che l‟IPCA tiene in
considerazione solo le somme spese effettivamente dalle famiglie nell‟acquisto dei
prodotti. Ci sono dei prodotti, come per i medicinali, in cui la famiglia non paga il
prezzo pieno, ma il ticket, una parte dell‟effettivo prezzo del medicinale, il resto lo
paga lo stato, la pubblica amministrazione. La differenza per l‟IPCA è questo:
138
considera quanto pagato dalle famiglie. La differenza è minima, ma su alcuni prodotti,
o alcune categorie di medicinali. Per esempio sui farmaci di fascia A, i salva vita. Il
consumatore paga il ticket e la spesa sostenuta dallo stato è maggiore. Il prezzo pieno
comprende il ticket più una parte di somma che dev‟essere inglobata al ticket.
Esclude alcuni prodotti: lotterie, lotto e i concorsi pronostici. Non ci rientrano per il
semplice motivo che gli altri paesi europei abbiano un sistema di gioco simile al nostro.
Non si può fare una comparazione diretta. Lotterie, lotto, concorsi pronostici, alcune
rilevazioni sui servizi di istruzione, anche sulle assicurazioni della vita, vengono
proprio tolte dall‟IPCA, è impossibile armonizzarle a livello europeo. Sicuramente
Eurostat si darà da fare per ampliare la popolazione di riferimento.
Ancora qualche differenza. Della prima parte vi ho già detto. Questo è importante.
L‟IPCA considera le riduzioni temporanee di prezzo: promozioni, saldi e sconti. NIC e
FOI non ne tengono conto. Noi come UCS nella rilevazione siamo costretti a rilevare
anche i saldi, gli sconti e le promozioni, questo serve a calcolare l‟IPCA. Nel calcolo del
NIC e FOI il programma non tiene conto di saldi sconti e promozioni. Tenete presente
che a proposito di saldi sconti e promozioni, le istruzioni impartite da Istat sono molto
severe.
Lo sconto che si va a rilevare in un negozio, deve permanere per almeno 15 giorni nel
negozio stesso. Il rilevatore è obbligato ad accertarsi se la promozione avrà una
dorata di almeno 15 giorni, altrimenti non ne deve tenere conto. Non solo, deve essere
accessibile a tutti i consumatori. Se vado alla Coop e non sono socio Coop non ho
diritto a determinati sconti, proprio perché non sono socio, mentre chi è socio ne ha
diritto. Questa è una disomogeneità che non può essere ritenuta valida, non vale per
tutti i consumatori.
Se non tutti i consumatori hanno diritto allo sconto, esso non si calcola. Si calcola il
prezzo pieno di vendita. Questo non ha nessun effetto per il calcolo di NIC e FOI, ce
lo ha per l‟IPCA. Per gli sconti bisogna che abbiano durata di almeno 15 giorni e che
tutti ne possano usufruire, altrimenti il rilevatore non ne deve tenere conto.
Incominciamo ad addentriamoci nell‟organizzazione. Immaginiamo che da domani siete
incaricati a costruire l‟indice dei prezzi.
La prima domanda che vi dovete porre è: i prezzi che devo rilevare, di quali prodotti
sono? Chi è che definisce la struttura del paniere? Noi UCS o Istat? La struttura del
paniere, tutti i prodotti che devono essere rilevati lo definisce Istat, con dei pareri e
suggerimenti che ogni UCS è tenuto a mandare. In questo periodo si sta ridefinendo il
paniere del 2013. Non vi posso dire le novità per una questione di segretezza d‟ufficio
di cui Istat è molto geloso, però le novità che verranno introdotte nascono da
concertazione tra ogni ufficio comunale di statistica e Istat stesso. Genova fa le sue
proposte ma non vengono accettate: magari se ne accetta una dell‟anno scorso che
quest‟anno non abbiamo riproposto. Quantomeno prima o poi ne hanno tenuto in
considerazione.
139
Queste operazioni a cosa mirano? Ad aggiornare il paniere. Il paniere è in continua
evoluzione. Da anni non si rilevano le video cassette, prodotto che quasi nessuno
acquista. Ogni anno c‟è necessità di ridefinire la struttura del paniere.
Non è detto che ci siano solo prodotti nuovi nel paniere 2013. Ci saranno anche dei
prodotti che escono. Alcuni escono, non sono più acquistati in maniera significativa dai
consumatori, e ci saranno altri che cambiano descrizione. Vedremo bene cosa significa
la descrizione del prodotto: devono essere rilevati in un‟altra maniera. Per ora
accontentiamoci di dire che ogni anno viene definita la struttura paniere, lo fa l‟Istat
con la nostra collaborazione e vengono ridefiniti i pesi dei prodotti.
Se il pane pesa 1,4% rispetto al complesso dei prodotti che ci sono nel paniere, non è
detto che l‟anno dopo abbia lo stesso peso. Può essere aumentato o diminuito, a
seconda dei consumi delle famiglie.
Come si ridefiniscono i pesi del paniere? Operazione fatta da Istat. Ci sono dei dati
sui consumi delle famiglie, già in possesso da Istat, dei dati che arrivano nuovi
dall‟indagine dei consumi delle famiglie di cui forse avrete sentito parlare, che
permettono a Istat stesso di capire quali sono i consumi che stanno aumentando o
diminuendo di importanza.
Sulla base di questi dati, con calcoli matematici molto complessi che si fanno a livello
centrale, viene poi ridefinita la struttura del paniere Istat. È una struttura molto
complessa quella dei pesi: i prodotti inseriti nel paniere complessivamente per un
milione. I singoli prodotti pesano per una parte di questo milione. Se il pane avesse
peso dell‟1,4% peserebbe 14.000 in realtà pesa 13900 e passa. La definizione del peso
del paniere è molto articolata, si arriva ad un dettaglio molto articolato, a livello di
milionesimo di peso.
Scelta e descrizione dei prodotti. La scelta definitiva di quali prodotti inserire o
togliere o la descrizione di alcuni prodotti dentro il paniere la fa l‟Istat. La
descrizione dei prodotti è fondamentale. Dobbiamo dire ai rilevatori, o meglio lo deve
dire l‟Istat, esattamente cosa devi rilevare. Non puoi dire vai a rilevare il quotidiano.
Il rilevatore si sente in difficoltà: che quotidiano rilevo? Un quotidiano di diffusione
nazionale o locale? Quando lo rilevo? Tutte le domeniche, tutti i lunedì, tutti i giorni
della settimana, tutto il mese? Quando ci sono degli inserti, devo rilevare il prezzo
degli inserti o no? La descrizione del prodotto è essenziale.
A proposito del quotidiano Istat dice: bisogna rilevare il quotidiano più diffuso a livello
locale nella settimana di riferimento che va dal 9 al 15 di ogni mese compreso il prezzo
degli inserti obbligatori, non quelli facoltativi.
Ecco che con questa descrizione il rilevatore sa cosa deve fare. Sa che si deve
muovere nella seconda settimana del mese, dal 9 al 15, sa che deve rilevare il
quotidiano di maggiore diffusione locale, non tutti i quotidiani, sa che deve tenere in
considerazione il prezzo anche degli inserti obbligatori, e sa che poi deve fare una
media aritmetica dei prezzi rilevati durante quella settimana.
140
La descrizione precisa di Istat sarà: media aritmetica del quotidiano più diffuso a
livello locale nella settimana di riferimento dal 9 al 15 del mese compresi gli inserti
obbligatori. La descrizione è fondamentale.
Se dovessi rilevare il prezzo del cinema che cosa rilevo? Cinema multisala rilevo tutte
le sale o una sola? Rilevo i cinema in tre dimensioni o solo quelli normali? Devo fare la
media aritmetica se rilevo tutte le sale o no? Istat mi deve dare esattamente la
descrizione del prodotto. Le cose cominciano a farsi un minimo più complesse. Ogni
prodotto, sono quasi 1400, ha una sua determinata descrizione.
Le scelte delle città dove condurre l‟indagine è opera dell‟Istat. Abbiamo visto
secondo quali criteri l‟Istat inserisce le città nelle rilevazioni: quelle di cui si fida,
dove c‟è un ufficio di statistica idoneo alla costruzione corretta dell‟indice. L‟Istat
decide in corso d‟anno se togliere qualche città.
Scelta della vendita in cui effettuare la rilevazione. Ho il paniere con tutti i pesi
determinati da Istat. Ho la descrizione dei prodotti che devo rilevare e so che siamo
una delle città che deve condurre la rilevazione dei prezzi. Istat dice il mio compito è
finito, ti ho dato gli strumenti: adesso sei tu che devi operare secondo sue indicazioni
che poi vedremo. Noi dobbiamo cominciare a pensare dove andare a rilevare i prodotti
contenuti nel paniere, in quali punti vendita effettuare la rilevazione (compito UCS).
Analogamente dobbiamo scegliere la referenza. Non parliamo più di prodotto. Stiamo
parlando di referenza, tra poco vedremo che cosa è. Per ora diciamo che è il prodotto.
Se dobbiamo rilevare la pasta, devo rilevare la pasta in confezione di un chilogrammo e
devo andarla a rilevare in un determinato punto vendita. Il rilevatore deve scegliere
che pasta rilevare: Agnesi, Voiello, De Cecco, Barilla? Nella descrizione Istat la marca
non c‟è. È il rilevatore che deve scegliere quale, secondo lui, è il prodotto più idoneo a
rilevare, secondo delle disposizioni di cui parleremo tra poco.
Altra cosa da determinare (fatto da rilevatori insieme a UCS) è il rispetto della
periodicità della rilevazione del prodotto. Ci sono prodotti che vanno rilevati
mensilmente ed altri che vanno rilevati più di una volta al mese. Quando scegliamo la
referenza, un prodotto da rilevare, il rilevatore deve sapere quante volte andare a
rilevare il prodotto presso il punto vendita. Le cose non si stanno ancora complicando
del tutto ma dobbiamo farci una serie di domande. Non solo dobbiamo rilevare la pasta
andiamo a rilevare la pasta. Chiediamoci: ma dove, che tipo di pasta rileviamo, e quante
volte dobbiamo rilevarla?
Di queste cose vi hanno già parlato. È impossibile misurare le variazioni di prezzi di
tutti i singoli prodotti e devo quindi selezionare un campione di beni e servizi dei
quali misurare la dinamica dei prezzi. Diciamo, non tutti i beni e servizi hanno la stessa
importanza. Se noi andiamo a rilevare i prodotti alimentari, nella divisione dei prodotti
alimentari, trovo pepe e carne: hanno la stessa importanza? Decisamente no, Istat
attribuisce un peso molto diverso alla carne, al pane, pasta, rispetto a sale e pepe.
Le posizioni rappresentative (per ora assimiliamoli ai prodotti, anche se sono qualcosa
di più) sono selezionate tra le tipologie maggiormente consumate. Altro problema che
141
si deve porre il rilevatore. Le disposizioni Istat dicono si che devi rilevare la pasta, ma
devi rilevare la pasta che è maggiormente smerciata nel punto vendita.
Altro problema che si aggiunge: abbaiamo visto scegliere il punto di vendita, trovare il
prodotto, quante volte rilevare il prodotto? Una, due volte al mese, una volta all‟anno?
In che periodo rilevarlo (quotidiano dal 9 al 15 di ogni mese), ma poi soprattutto
rilevare il prodotto maggiormente consumato. Il rilevatore Non può andare al super
mercato e rilevare il prezzo di un prodotto che non compra nessuno. Non mi può
portare una marca di pasta sconosciuta, ma possibilmente (anche se viene ammessa
qualche piccola deroga), il prodotto più venduto.
È quello maggiormente rappresentativo dei consumi della popolazione. La gente
compra quello: l‟indice dei prezzi è più influenzato da quel prodotto e non da quello che
non compra nessuno. La costruzione dell‟indice è più corretta sul prodotto
maggiormente consumato. Si avvicina di più all‟intera collettività dei consumatori, i
gusti e le preferenze dell‟intera collettività dei consumatori. Le referenze, i prodotti
devono essere rilevate sul territorio. Della revisione annuale del paniere e dei sistemi
di ponderazione ne abbiamo già parlato prima.
Abbiamo già cominciato a parlare della metodologia di rilevazione. Il rilevatore sa già
che ha dei limiti a cui non può derogare, derivano dalla descrizione del prodotto, punto
di vendita, rilevare il prodotto maggiormente venduto, e lo deve rilevare in
determinati periodi e giorni del mese.
Questa è l‟attuale divisione del paniere. Non vi spaventate, è semplicemente una
divisone derivante dalla disaggregazione dei prodotti. All‟ultimo ci stanno i prodotti,
quello che il rilevatore deve rilevare. Per esempio: la pasta di semola di grano duro, il
cappuccino al bar. Al di sopra ci sono posizioni rappresentative, sono molto meno,
derivano da una aggregazione di prodotti, spesso coincidono questi due casi. La
posizione rappresentativa è nota come posizione rappresentativa semplice, coincide il
prodotto. In molti casi no.
Rifacendo l‟esempio di prima. un prodotto può essere il cappuccino al bar, il caffè al
bar, caffè decaffeinato al bar. I prodotti vengono conglobati in una posizione
rappresentativa che si chiama caffetteria al bar. Si calcola indice specifico anche per
posizione rappresentativa. Poi si sale fino ad arrivare alle fondamentali 12 divisioni di
prodotto, i grandi gruppi di prodotto: alimentari, bevande alcoliche e tabacchi,
abbigliamento e calzature, prodotti sanitari, trasporti, comunicazioni, beni per
ricreazione cultura e spettacolo, beni per la casa, prodotti relative alle spese per le
spese per la casa e così via.
Sono i grossi raggruppamenti di prodotti: per ognuno viene calcolato un indice. Posso
avere indice di Genova mese x +0,5. Magari a livello di divisione di prodotto, gli
alimentari hanno fatto segnare +0.1. trasporti hanno fatto segnare 1% prezzo
carburante è salito talmente tanto che ha trascinato al rialzo la divisione del prodotto
dei trasporti. Alimentari hanno fatto da contrappeso. Dalla media ponderata, ognuno
ha un peso, di tutte le divisioni è uscito un indice di +0,5.
142
Queste sono le dodici divisioni di prodotto. Prodotti alimentare, bevande alcoliche,
abbigliamento, spese per la casa (abitazioni acqua elettricità), servizi sanitari,
immobili e così via. Abbiamo anche parlato dei pesi.
Qui fanno 100, abbiamo semplificato in termini percentuali. In realtà è fatto a milione,
per andare nel dettaglio del peso fino all‟unità di misura. Prodotti alimentari e bevande
alcoliche pesano 15,97% sul campione, pesano parecchio, più o meno come i trasporti, e
molto più di altre importanti divisioni: spese per casa, servizi ricettivi e di
ristorazione. C‟è anche una differenza tra 2011 e 2012 e un‟altra per il 2013. Questo
deriva dal processo di rifasamento, di aggiornamento della struttura del paniere,
cambiamento per anno in anno, dei pesi di tutti i prodotti che portano a livello di
aggregazione di un cambiamento di peso nella divisione del prodotto.
Vedete come nel 2012 rispetto al 2011 si è ritenuto che alcune divisioni del prodotto
devono scendere per importanza. Particolarmente sono scese le spese per i servizi
sanitari e per la salute. Brutta considerazione: se i consumi per questo scendono in un
paese che invecchia, la gente spende di meno per la medicina, proprio perché può
avere carenze economiche per comprare gli altri prodotti. Ogni anno la ponderazione
viene rifatta.
Questo è il peso che ogni regione ha nella costruzione dell‟indice. Fatto 100 il NIC, la
vedete che la Liguria ha spesa per il 3%. Sommando Piemonte Veneto Lombardia Emilia
Romagna e Lazio, queste 5 regioni hanno come importanza quasi la metà del peso
totale sul campione. L‟indice di Genova 1,9-2%, non è poco, è molto sotto controllo,
comunque pesa del 2% su campione. Se ci sono errori su Genova del 2% di riflesso si
ripercuotono anche sull‟indice nazionale.
Questo è uno specchietto relativo non ai prodotti, ma qui siamo ancora alle sotto
classi. Siamo ad un livello di aggregazione abbastanza elevato. Sottoclassi, segmenti di
consumo, posizioni rappresentative e prodotti. A parte il codice del prodotto che non
interessa, cominciamo a scendere nel dettaglio delle singole sottoclassi e vedo per
ciascuna il peso che è assegnato. Ovviamente la somma di queste sotto classi deve
dare un milione. Andando ancora più nel dettaglio, quando dico formaggi e latticini, si
scende nel livello di dettaglio passando a segmenti di consumo, formaggi freschi e
stagionati, sino ad arrivare ai singoli prodotti. Si da un peso anche ai singoli prodotti:
al gorgonzola, piuttosto che alla ricotta, eccetera.
Questo è un altro esempio ancora più dettagliato, ma semplificato, ho tolto un po‟ di
cose lasciando le cose che a voi interessano. Alla fin fine, quando viene calcolato indice
dei prezzi, viene calcolato l‟indice per ciascuna posizione rappresentativa. Vedete che
avete un prospetto di alcuni segmenti di consumo, posizioni rappresentative che
entrano nel campione; questa è la frequenza di rilevazione. Susine B, bimensile,
rilevate due volte al mese, per la loro particolarità. Tutti i prodotti orto frutticoli,
suscettibili di variazioni di prezzi, non ci accontentiamo di rilevarli una volta al mese,
ma due volte al mese e il programma fa la media delle due rilevazione.
IS-FS in stagione o fuori stagione. Qui c‟è il peso attribuito alla singola posizione
rappresentativa, o al singolo segmento di prodotto. Vedete il dettaglio: classe frutta,
143
sotto classe, frutta fresca e refrigerata, frutta secca e congelata. Poi arance,
pesche, banane, mele eccetera. La somma dei pesi dei segmenti di consumo dà il peso
della sottoclasse. Somma sottoclassi da peso delle classi, la somma delle classi da il
peso dei gruppi, la somma dei gruppi da il peso delle divisioni. È tutta una cascata.
Questi sono prospetti che derivano dalle schermate del computer e non è che noi
sappiamo a memoria i pesi o le variazioni. A livello di classe come è cambiata la frutta?
Conta 1,26% rispetto al peso del campione (peso totale fatto a 1.000.000), 12600 su
un milione, alla fine cosa dico? La frutta rispetto al mese precedente, questa è la
variazione congiunturale o mensile, è aumentata dell‟ 1,8%. Rispetto all‟anno
precedente, variazione tendenziale, la frutta aumenta del 9,9%. Ogni mese ho valori
nuova di frutta e di tutte le suddivisioni della frutta.
Questo prospetto non riporta i prodotti. Le mele sono genericamente mele. Ma quali
mele rileviamo? Siamo ancora a livello di posizione rappresentativa composita: questa
rappresentazione porta insieme tutte le qualità di mele. Questa non è ancora la
suddivisione più disaggregata possibile. Siccome noi non possiamo diffondere indici
che siano a livello più dettagliato di posizione rappresentativa, parliamo di mele come
posizione rappresentativa.
Il codice non ve ne frega niente. Queste sono le disaggregazioni dell‟indice delle classi
sottoclassi. La divisione di prodotto sarà prodotti alimentari, poi il gruppo, mi pare che
sia alimenti, poi la classe frutta, sottoclasse segmento di consumo. La frequenza di
rilevazione, i prodotti orto frutticoli almeno due volte al mese. Stagionalità del
prodotto, peso ed indici. Gli indici servono a calcolare la variazione mensile e
tendenziale (congiunturale e rispetto allo stesso mese dell‟anno precedente). Se noi
vogliamo far uscire questo 1,8, preso il mese corrente, 107,5 sottraggo 105, 6 divido
per 105,6 e moltiplico per 100. Se voglio trovare l‟1,9 confronto questi altri due.
A livello di prezzo mela vengono pesate diversamente o sono consumate nella stessa
quantità? Non sono tutte consumate nella stessa quantità. Istat non calcola un indice
per ciascuna tipologia di mela anche se sotto sotto lo fa, altrimenti non potrebbe
calcolare l‟indice dalla posizione rappresentativa, è una media geometrica di tutte le
rappresentazioni fatte. Diciamo che poi arriva al calcolo dell‟indice della singola
posizione rappresentativa.
Se tu mi fai una domanda: richiesta di diffondere l‟indice della mela Delicius non te lo
do. Ha un peso deciso dall‟Istat, diverso dalle Renette. La metodologia va talmente in
profondità che ogni regione ha un peso diverso rispetto ad un‟altra regione. Il peso
411 delle ciliegie per la Liguria è diverso da quelle della Lombardia e da quello della
Calabria. L‟Istat pondera tutto, hanno dei modelli di calcolo molto sofisticati.
Immaginate peso diverso per ogni regione con tutti i prodotti che ci sono dentro il
paniere e per ognuno calcolare il suo indice, a livello regionale e poi nazionale. I
consumi della ciliegia in Liguria possono essere diversi da quelli della Calabria. Per
considerare questo l‟Istat ha considerato pesi diversi. Poi sono loro che mettono
insieme tutto. Hanno dei programmi di calcolo molto avanzati.
144
Questo era per dirvi che, come avete potuto capire, la metodologia è abbastanza
avanzata. Non è semplicemente misurare il prezzo del prodotto come fanno i
giornalisti. Rilevo a Milano a Genova e vedo chi è più caro. Non è che se il prosciutto è
più caro a Milano, Milano è più cara di Genova.
Questi sono prodotti rilevati da Istat. Rileva un po‟ di prodotti che hanno prezzi uguali
su tutto il territorio. Soprattutto i beni tecnologici, sono soggetti a variazioni
continue, li rilevano loro. Tutta la divisione dei prodotti delle comunicazioni è a carico
Istat. I servizi il cui godimento non è ristretto alla popolazione di un singolo comune
(esempio stabilimento balneare: ci può andare il cittadino genovese e quello di Savona)
interviene Istat e anche in servizi bancari e postali in cui la rilevazione di Istat è più
efficiente. Questo porta a far si che la rilevazione Istat pesa 22,8% con le
comunicazioni rilevate da loro. Con UCS attribuiamo alimentari e abbigliamento e
calzature. Per altri prodotti c‟è un po‟ una commistione, un po‟ loro e un po‟ noi.
Qua siamo ancora nella fase di organizzazione della rilevazione. Eravamo rimasti a
quali punti di vendita scegliere. Immaginiamo di dover organizzare la rilevazione. Un‟
altra domanda che ci dobbiamo fare? Quanto andiamo a rilevare in percentuale nei
negozi tradizionali, grandi magazzini, supermercati? Devo distribuire la rilevazione
anche in base ai consumi della popolazione nella distribuzione tradizionale e nella
distribuzione moderna. Quante mele rileviamo? Quante quotazioni effettuiamo? Come
distribuiamo la rilevazione sul territorio? Tutto il territorio comunale, trascuro la
periferia, punti rappresentativi, negozi più grandi, negozi che attirano più gente,
come ci organizziamo? Quante quotazioni facciamo misurare ai rilevatori?
Abbiamo delle linee guida. Le quotazioni previste, il minimo di quotazioni previste sono
7 per i beni alimentari e 5 per i non alimentari e servizi. Quando rilevo la mela devo
farlo per 7, anzi 14 perché la rilevazione della mela è bimensile, arriviamo ad un
minimo di 14, già Genova ne fa 30. 5 per beni non alimentari e servizi. Per tutto ciò che
non si mangia, è sufficiente numero minimo di rilevazione di 5. Istat definisce numero
di appartamenti presso il quale rilevare gli affitti: 150.
Ci fornisce le tavole sull‟andamento generale delle vendite del commercio. Dalle tavole
posso dedurre quanto incide la grande distribuzione presso super mercati, iper
mercati in termini percentuali rispetto alla distribuzione dai negozi tradizionali. Noi ci
organizziamo poi, con un minimo di oscillazione (l‟Istat lo concede), nell‟organizzare la
rilevazione dicendo quante quotazioni vado a fare nei negozi tradizionali e quante
presso super mercati, iper mercati, discount? Abbiamo tavole che ci danno un range e
noi non dobbiamo uscire da questo range.
Una volta rispettate le linee guida ci organizziamo e aggiorniamo il nostro piano della
rilevazione, spostiamo le quotazioni. Stiamo rilevando troppo presso i supermercati:
tolgo qualche quotazione da una parte e la mettiamo nella distribuzione tradizionale.
L‟UCS di Genova da linee guida. Noi siamo un grande comune, siamo un capoluogo di
regione, siamo la sesta città in Italia, non possiamo limitarci a rispettare le quotazioni
medie di Istat, facciamo molte più quotazioni. Gli alimentari, che comportano 7
145
quotazioni, d noi spesso per i prodotti alimentari se ne fanno 20, per i bimensili le 14
da noi diventano 30. Andiamo a rilevare un maggior numero di referenze.
Non è che trascuriamo le periferie, zone di montagna. Opero nelle estreme periferie.
Più difficilmente li è presente il grande negozio, che ha tanto commercio e tanta
vendita, dobbiamo esser anche li.
Scelgo i punti vendita tra quelli maggiormente frequentati e rispettiamo la
proporzione come vi ho detto di vendita nella distribuzione moderna tradizionale. Se
nella distribuzione moderna abbiamo un 40% di quote di mercato e 60% nella
tradizionale, e ho 10 quotazioni da fare, ne faremo 4 nella moderna e le altre 6 presso
la distribuzione tradizionale e rileviamo o cerchiamo di rilevare il prodotto più
venduto.
Questi sono i numeri delle nostre rilevazioni. Abbiamo 5 rilevatori che operano nelle 5
grandi zone della città: ponente levante, le due valli, la Polcevera comprende
Sampierdarena e centro.
Abbiamo 97 giri di rilevazione, un giro di rilevazione è un insieme di ditte abbastanza
vicine sul territorio raggruppate, per comodità, in maniera che il rilevatore sa che in
quella zona del territorio li ha un determinato numero di ditte ben elencate che deve
rilevare. Istat effettua i controlli proprio sui centri di rilevazione.
842 punti di vendita. Mensilmente ci rechiamo presso 842 tra negozi, professionisti.
In molti ci andiamo due volte, per le rilevazioni bimensili: frutta, ortaggi, pescherie,
benzinai (i carburanti hanno un prezzo volatile). Facciamo circa poco più di 110 mila
quotazioni annue e rileviamo 150 affitti.
Questa è la percentuale di rilevazione per grossi step nel nostro territorio. Nel
42,2% si rileva nei negozi tradizionali rispettando le linee guida che ci vengono
imposte, 39,3% supermercati, 5,8% nei mercati rionali. 12,7% è residuale. Nelle
farmacie rilevo molti prodotti, studi medici: pediatria, cardiologia, ginecologia. Unità
diverse: parrucchieri, esercizi di liberi professionisti, commercialisti, avvocati. Ed
esercizi non classificabili che sono veramente residuali, ad esempio assicurazioni.
Questa è la distribuzione della rilevazione tra grande e piccola distribuzione.
Dove operano i rilevatori? Già parlato.
Vi ho parlato di prodotti. Quando andiamo a rilevare, non rileviamo solo il prezzo del
prodotto, ma la referenza: è costituita da un insieme di cose. Oltre il prezzo, devo
rilevare la quantità del prodotto in termini di peso, altrimenti non ha senso. Pasta ma
quanto? La marca, e rileviamo la varietà, per differenziare un prodotto dall‟altro.
Esempio di elettrodomestici: lavatrice, marca, in genere si specifica il modello, ma
anche: classe energetica. Ogni referenza è estremamente differenziata l‟una
dall‟altra. Entrano in gioco nella classificazione della referenza tutti questi anche dove
si rileva, anche il negozio in cui si rileva.
Si fa presto a dire inflazione, c‟è dietro una attività molto complessa e complicata.
Ringrazio il dottor Profumo, spero che l‟intervento vi sia stato utile. è una attività
molto misconosciuta, l‟attività del comune è anche molto complessa.
146
Vi aggiornerò col materiale su aula web.
14 LEZIONE
11/12/2012
Parliamo di cotone. In fondo è una commodity che riguarda tutti noi. In quanto noi ci
vestiamo, ed indossiamo abiti in cotone: intimo, camicie, e d‟estate i vestiti, ci sono
molti impieghi per quel che concerne la materia prima.
Questa è un campione prelevato da un pezzo di cotone, è un cotone russo, coltivato
nelle ex repubbliche sovietiche. La domanda che ci poniamo è: come passare dal fiocco
al filo, dal filo al tessuto? Noi abbiamo varie categorie di fibre. Abbiamo le fibre
naturali, di origine animale, per esempio la lana. Oppure di origine vegetale, delle quali
fa parte il cotone, ma anche: lino, canapa. Fibre naturali di origine animale, vegetale.
Fibra naturale di origine vegetale, che ha fatto scandalo anni fa: l‟amianto. Sono stati
prodotti dei tessuti intrecciando fili di amianto.
Queste fibre naturali si contrappongono alle microfibre che sono artificiali, sintetiche
o miste. Tutte ottenute grazie a reazioni chimiche, oppure utilizzando in alcuni casi il
petrolio. È evidente la correlazione tra l‟andamento del costo del petrolio e i costi di
produzione di certe fibre artificiali: correlazione positiva.
Cenno storico. Cotone coltivato già in Messico nel 5800 avanti Cristo, poi Pakistan, e
l‟india ne fu il primo esportatore. In arabo cuttun. L‟origine della parola proviene
dall‟arabo.
Nel 14esimo secolo la produzione dei capi era più che altro artigianale. Il ciclo di
filatura e tessitura avevano una dimensione artigianale. I primi capi di vestiario
avevano una componente mista tra cotone e lino. Successivamente, nel 18esimo secolo,
sono apparsi i macchinari: velocizzato la produzione e aumentato le quantità
consumate.
Dire che le piante di cotone sono ibrido complesso, significa pensare ai procedimenti
statistici dove si testano varie componenti a livello di seme per ottenere un certo
risultato. I famosi piani di esperienza. Questo ibrido viene realizzato anche con analisi
di correlazione.
Il cotone è seminato e raccolto circa sei sette mesi dopo. Si coltiva tra le latitudini 45
gradi nord e 35 gradi sud. Vedete dal Kasakistan o l‟Argentina e Australia sono le zone
estreme.
Il primo riconoscimento che si fa sulla pianta del cotone è determinare la lunghezza
della fibra. La fibra può essere: corta media lunga o extra lunga. Questo grafico
esprime il ciclo tra la piantagione, la maturazione (giunge dal valore modale) e via via
fino alla raccolta.
Abbiamo due modalità di raccolta. Nel primo caso è un taglio più ergonomico, segue più
la forma del seme, la fibra sarà irregolare. Il fiocco matura intorno al seme, nell‟altro
caso saranno più omogenee.
147
Lo standard mondiale è 220 chili. I cinesi avevano balla da 80 chili, si sono dovuti
adeguare agli standard internazionali. Il cotone è una delle piante totalmente
riciclabili, con la raccolta del seme si fabbrica olio vegetale, cosmetici, pane e biscotti.
La rimanenza serve a produrre alimentazione per ovini ma, la peluria attaccata al
seme, viene usata per produrre la carta per banconote e pergamene.
Tutti noi abbiamo avuto in mano un blocco della Fabriano. Fabriano è l‟unica cartiera,
fornitrice della Zecca, che compra del cotone per mixarlo alla carta.
Chi produce le statistiche sul cotone? USDA. Questa tabella rappresenta una serie
storica: la stagione comincia il primo agosto e finisce il trentun luglio, va a cavallo
dell‟anno. Abbiamo serie storica su 4 anni più proiezione per la stagione in corso, mese
per mese. Vedete che in termini di milioni di tonnellate, abbiamo circa 25 milioni di
tonnellate nel mondo.
Da questo grafico vedete che Cina India e Stati Uniti hanno una netta predominanza.
Riguardo a queste statistiche, paese per paese, abbiamo detto che risulta evidente la
predominanza del mercato cinese. Non solo la Cina è primo produttore nel mondo, ma
anche primo importatore. Determina il prezzo del cotone determinato nel NY cotton
excange. Tutto funziona secondo un sistema di quotazione internazionale.
West Africa: Benin, Burkina, Ciad, Costa d‟avorio e successivamente Mali, Senegal,
Togo, e Zimbaue. La maggior parte del quantitativo viene trasportato via mare. Il
cotone russo, tra le ex repubbliche sovietiche Azerbagian, Kazakistan, Tagikistan,
Turkmenistan e maggior produttore Uzbekistan. Veniva portato a Riga col treno. Gli
europei andavano a Riga a vederlo. Poteva poi proseguire per camion, ferrovia.
Nel Mali, che produce (in migliaia di balle), il cotone per arrivare al porto di Cotoneau
viene fatto viaggiare col treno. Abbiamo, per quest‟anno, una previsione di 116 milioni
834 mila balle nel mondo.
Fino al 1960-70 aveva netta predominanza, col sintetico il gap si è ridotto. Paesi
produttori di lana sono l‟Uruguay. Dopo vediamo che cambia. Nel sintetico abbiamo una
serie storica divisa per regioni, per paesi, Stati Uniti, Europa dell‟Ovest, Corea
Taiwan, e il Giappone è rimasto sempre costante.
Anche l‟Italia produce. Il Gruppo Orlandi, sopra Bergamo da noi.
Brevemente, con una serie di dati, l‟equazione del trend è questa. Siccome i dati non
sono allineati, introduciamo un modello additivo. Se ho un numero abbiamo pari la
somma è zero. Se il numero è dispari ho una situazione diversa. Con i minimi quadrati
ordinari posso stimare a e b, dove a è la media delle osservazioni, e b stimato è la
somma delle osservazioni sulla sommatoria al quadrato. Servono a stimare i parametri,
se ho una serie di punti.
Stesso procedimento, consumo mondiale di fibre. Quando vedete coefficiente 486,3
per cento vuol dire che spiega i valori con 86,3%. In questa serie metto in relazione il
GDP che producono sul suolo americano, diverso dall‟indice che comporta le aziende sul
suolo e all‟estero (GNP). Il GDP è rapportato al consumo globale di fibre pro capita.
148
Abbiamo un trend di questo tipo. Guardando un altro grafico vediamo che se
rapportiamo a 1990 il GDP con il consumo di fibre, ho una distribuzione di osservazioni
di questo tipo che si potrebbe regressare con una funzione di tipo esponenziale.
Interessante è vedere nel caso lineare, se rapportiamo il GDP con i chilogrammi pro
capita di fibre consumate, ho una relazione di questo tipo. Ho la spiegazione del GDP
verso la quantità di fibre consumate nell‟ordine dell‟80,5%, buon grado di spiegazione.
Questa serie che abbiamo visto si può dividere in due serie a seconda della posizoine
geografica dei paesi. Per i paesi più freddi abbiamo più dispersione dei dati, per i paesi
più caldi abbiamo più concentrazione. Si potrebbe ipotizzare non solo il modello lineare
dei minimi quadrati ordinari ma anche altri modelli.
Un esempio dell‟uso statistico che si può fare è in ambito di qualità. Se metto in
relazione la lunghezza della fibra col numero di fibre corte ho una relazione
strettamente proporzionale.
Questo grafico illustra il prosieguo della ripartizione del mercato fra fibre sintetiche
e fibre naturali. Anche se aggiungo le altre fibre naturali c‟è una predominanza
comunque del sintetico.
Altra serie storica sulla produzione di fibre naturali paragonata alla produzione di
fibre sintetiche, vediamo la netta predominanza. Una parola sul cotone organico. Il
cotone, dal punto di vista agricolo, è grande consumatore di pesticidi. Al fine di
ottimizzare la produzione c‟è l‟uso dei pesticidi con un impatto ambientale forte.
È stato inventato un cotone più ecologico con meno utilizzo di pesticidi. C‟è comunque
una crescita, ma è limitato. Per quale ragione? Il costo. Tutto ciò comporta un costo
elevato. In questa tabella, dato 2009, se sommo cotone lana e seta, sulle fibre
naturali ho predominanza del cotone, abbiamo questa cifra: 26392. Questa cifra la
ritrovo qua quale base anno 2009 alla quale aggiungo le fibre artificiali per un totale
ed è stato calcolato un rapporto fra totale e popolazione.
Abbiamo detto: fiocco raccolto, si formano le balle. Certificato di deposito. Poi va
venduto. Viene proposto sul mercato sul mercato locale. Il coltivatore vende sul
mercato locale (dentro gli USA).
Questa foto di questa balla, è di cotone egiziano è uno dei più elevati standard di
qualità. Programma di selezione delle balle. Il filatore ha le sue esigenze. Per produrre
esige un mix di qualità, programma apposito in base ai criteri di qualità.
Parte internazionale del commercio. Ho qualche situazione simile. I caricatori vendono
direttamente ai filatori attraverso un agente di vendita in Italia, oppure ci sono
cooperative di commercianti, commercianti spot, oppure chi vende ai filatori italiani o
di altri paesi dirretamente.
Associazioni, in caso di divergenze contrattuali. Breve cenno sulle condizioni di endita.
Il cotone americano è quotato in borsa a NW sulla base di CIF nord Europa. Ci sono
anche dei porti in Italia, ma abbiamo perso molti traffici. I famosi magazzini del
cotone sono stati fiori all‟occhiello del porto, specie quando è arrivato il cotone
americano. Col peggioramento delle tariffe, aumenti su aumenti e problemi di ordine
149
organizzativo, è stato deviato sui porti del nord Europa. È più veloce, economico, per
quale ragioni? inoltrato via ferrovia.
In termini di risparmio, quando si mandava il cotone a Vicenza, interamente col camion
o intermodale (treno , scarica il termine e ultima parte va fatto col camion) risparmio
700 euro.
Indici a e b. il b è stato abbandonato, veniva usato per cotoni inferiori. Indice a usato
per molti paesi, con Cina e Brasile. Nel continente americano maggior produttore è il
Brasile.
Controllo di qualità. Deve garantire certa qualità del prodotto. Prendo buona parte del
cotone, devo pettinarla e strapparla. Da li si può misurare la lunghezza della fibra. Più
la fibra è lunga, più resiste, avremo capi di vestiario migliori.
Un po‟ di criteri tecnici. L‟intervallo ideale è tra il 7 e il 4,2 pollici. Il colore ha una
importanza perché se il cotone è già nastro è stato raccolto ma immaturo. Abbiamo
guardato questo piccolo campione di cotone, in realtà devo considerare due luci, con
taratura eccetera.
Nelle varie categorie di colorazione ho: se è grigio non si può filare, va buttato via.
Resistenza della fibra. Per fare una fibra resistente, bisogna comunque fare un test.
Oggi lo fanno le macchine, una volta a mano. Più la fibra è resistente più soddisfa
tutto il criterio industriale di produzione.
Descrizione tecnica: passaggi per determinare l‟indice di resistenza, ha a che fare con
la statistica. Se ho un risultato di 8, per una fibra si spezzerebbe da sola di 86400
libbre. Altra componente è il glucosio.
Risultati. Se il risultato di questo test da un colore rosso si può utilizzare al massimo
il 5% di quel lotto rappresentato da quella serie di campioni. Arancio va mixato. Il blu
è lavorabile direttamente. L‟umidità è una componente importante. Qui avete il
procedimento tecnico. Se il cotone è troppo umido non si attorciglia uniformemente.
Se è troppo secco non diventa uguale nella sua lunghezza.
Classifiche di cotone. Alcune secondo gli standard americani. Ci sono degli standard di
classifica egiziani. Cotone turco. Buona parte del cotone viene raccolto a mano. In
america è tutto a macchina, in Africa tutto a mano, è un grosso generatore di impiego.
Cotone russo, cotone sudan, cotone Israele. Israele coltiva cotone ma può venderlo nei
paesi arabi. Arrivava a trieste con avvolgimenti a livello di balla, venivano cambiati i di
documenti.
Ciclo di filatura. Abbiamo una breve descrizione: battuto, pettinato, stirato. Eventuali
lavorazioni successive, filato gasasto, trattato con la soda. I filati si classificano
secondo questi criteri.
Alla fine del filo non è strettamente attorcigliato ma rimane aperto. In America,
Messico, Italia, Cina, e soprattutto il Bangladesh. La tessitura avviene attraverso i
telai, è un intreccio. I tessuti possono essere classificati in questo modo:
abbigliamento, arredamento, vari tipi di tessuto. Poi abbiamo un breve cenno sui
tessuti non tessuti. Non vanno nel ciclo di tessitura classico: tovaglie, strofinacci,
presine.
150
Alcuni tessuti subiscono procedimento di fissaggio. Abbiamo percorso pressoché
tutto.
Abbiamo ragionato in termini di mondo del cotone: contestualizzare un mondo molto
specifico, molto particolare. Il problema che c‟è in questi corsi universitari, stiamo
cercando di portare persone che lavorano nel mondo reale, si fa presto a dire
inflazione, produzione del cotone nel mondo. Dietro ci sono tante cose che non si
vedono. Quello che vorrei vi rimanesse è che tutta la produzione, i dati che vedete,
non sono numeri teorici hanno dietro il mondo, la misurazione, la statistica.
La statistica ha dietro il mondo, serve per misurare le grandezze del mondo. Il mondo
del cotone utilizza la statistica. Controllo della qualità, quanto è buono il cotone.
Soprattutto importante la parte delle statistiche ufficiali e andamento storico sul
cotone.
Sulla serie storica del cotone si è visto che c‟è stato un calo del prezzo. Negli anni
2004-5 c‟è stato un calo drastico. Molti commercianti sono falliti. Avevano comprato il
cotone a caro prezzo e rivenderlo a basso prezzo, funziona come il sistema delle
futures. Molti commercianti sono falliti, perché non si riesce a competere. Ci i
concentra più su dei prodotti a maggior valore aggiunto.
Tenete conto che un jeans venduto a carissimo prezzo in alta moda in Germania, costa
produrlo alle Mauricius 16 euro. Aggiungeteci 1-2 euro di trasporto. Il resto costi di
pubblicità e soprattutto margini.
151
Scarica

Statistica Economica – Appunti