Fonti di dati - 1 • Come abbiamo già visto in precedenza, spesso non è possibile rilevare direttamente le informazioni. In questi casi, quindi, è necessario rivolgersi ad istituzioni, pubbliche e private, che raccolgono e mettono a disposizione le informazioni (es. ISTAT, Commissione Europea, Banca d’Italia, Censis, ecc…). • I dati disponibili, poi, non sono sempre nel formato utile per procedere con le analisi, ossia inseriti all’interno di una matrice dei dati. Spesso, infatti, è possibile consultare solo le rappresentazioni tabulari di distribuzioni di frequenza, limitando necessariamente le possibilità di analisi. Dati individuali L’unità di analisi è il singolo individuo o gruppo di individui (famiglia) Dati aggregati L’unità di analisi è un aggregato di dati rilevati a livello territoriale (es. n. matrimoni nel Comune X). Fonti di dati - 2 Tra le fonti di dati, un grossa “fetta” è occupata dalle statistiche ufficiali, ossia da dati prodotti dall’amministrazione pubblica. Si deve ricordare che la produzione di statistiche da parte della cosa pubblica ha origini antichissime (ad es. nell’antica civiltà dei Sumeri), tanto che il termine statistica, coniato nel 1500, stava ad indicare la disciplina che permetteva la descrizione quantitativa delle caratteristiche più importanti di una nazione (Corbetta, 1999). Per comprendere correttamente cosa produce l’amministrazione pubblica è necessario considerare i seguenti aspetti: la produzione dei dati l’unità di analisi il contenuto delle rilevazioni l’ampiezza della rilevazione Fonti di dati: la produzione - 1 Il primo aspetto da prendere in considerazione è sicuramente quello del perché e del come questi dati sono prodotti. Il perché i dati sono raccolti può essere suddiviso in due tipi: 1. I dati sono il frutto del normale lavoro delle amministrazioni pubbliche (process-produced data). Gli atti amministrativi, se opportunamente raccolti ed organizzati, producono dati statistici. Molti dati provengono da atti amministrativi: le statistiche demografiche, quelle sui reati, sul commercio, quelle sanitarie, ecc… E’ ovviamente necessario che in tutto il territorio nazionale la rilevazione delle informazioni sia omogenea: si è cercato di raggiungere questo scopo con l’istituzione nel 1989 del SISTAN. RILEVAZIONE INDIRETTA Fonti di dati: la produzione - 2 2. I dati possono essere raccolti anche per esplicita volontà dell’amministrazione, al fine di approfondire la conoscenza verso alcune tematiche ritenute rilevanti. In Italia questo tipo di raccolta, a livello pubblico, è portata avanti principalmente dall’ISTAT (ad es. le indagini di vittimizzazione, per tenere conto dei reati non denunciati, o l’indagine sulle famiglie, per conteggiare il numero di nuove forme di struttura familiare). Spesso queste indagini sono campionarie, ossia rilevano le informazioni solo su parte dell’intera popolazione. Fa eccezione il censimento, indagine volontaria a rilevazione totale. RILEVAZIONE DIRETTA Fonti di dati: le unità di analisi - 1 L’unità di analisi che generalmente viene proposta nelle statistiche ufficiali coincide, tradizionalmente, con l’unità amministrativa, ossia Comune, Provincia o Regione. L’unità di analisi, quindi, non è costituita dall’individuo (come nel caso delle indagini campionarie), ma dal territorio. Ciò non significa che i dati non siano stati raccolti individualmente. Come già accennato in precedenza, bisogna distinguere tra l’unità di rilevazione (i singoli individui) e l’unità di analisi (il territorio comunale, provinciale o regionale) in cui i dati sono rappresentati DATI AGGREGATI ID Comune Sesso Età 1 Milano M 22 Comune Maschi 20-24 25-29 2 Milano M 24 Milano 586.128 59.066 93.173 3 Desio F 25 Desio 17.117 2.008 2.639 4 Lodi M 34 Lodi 19.218 2.004 2.849 5 Pavia F 40 Pavia 33.188 3.510 5.137 … … … … … … … … Fonti di dati: le unità di analisi - 2 Per quale motivo i dati delle statistiche ufficiali sono distribuiti a livello aggregato (territoriale)? I motivi possono essere diversi: 1. Riservatezza: il dato potrebbe essere rilevato a livello individuale ma viene registrato solo a livello aggregato (es. elezioni politiche – voto segreto) 2. Limitatezza: l’informazione è raccolta a livello individuale per fini amministrativi, ma riguarda solo il fenomeno in sé, senza alcuna specificazione sull’individuo stesso (es. matrimoni e in genere tutte le statistiche demografiche) 3. Complessità: l’informazione è raccolta a livello individuale, ma per esigenze organizzative viene presentato aggregato (es. censimento) 4. Già aggregato in origine: l’informazione raccolta si riferisce già ad unità di analisi aggregata (es. n. di biglietti venduti nelle sale cinematografiche di un Comune) Fonti di dati: le unità di analisi - 3 Se i dati pubblicati dalle statistiche ufficiali sono principalmente dati aggregati, che tipo di variabili andranno a creare? L’operazione di aggregazione non è altro che un’operazione di conteggio (quanti maschi ci sono nel Comune, quanti individui con età compresa fra i 20 e i 24 anni, ecc…) VARIABILI CARDINALI Queste variabili sono dette anche variabili aggregate, ossia variabili che derivano da operazioni di aggregazione condotte su variabili individuali. Esse si distinguono dalle variabili globali, ossia variabili che non derivano da rilevazioni condotte su individui: ad es., possiamo misurare la distanza di un comune dal proprio capoluogo di regione e rilevare così la variabile globale “marginalità-centralità territoriale”. Fonti di dati: le unità di analisi - 4 Che tipo di elaborazioni è possibile effettuare con i dati aggregati? Fondamentalmente si possono ricondurre a due tipi: 1. L’analisi diacronica, ossia l’analisi delle serie temporali di un gruppo di variabili rilevate in un ambito territoriale definito. E’ l’analisi tipica offerta dalle fonte statistiche ufficiali, anche perché queste rilevano i dati spesso periodicamente e con continuità (es. censimento) 2. L’analisi sincronica, ossia l’analisi delle variazioni territoriali: si analizza uno stesso fenomeno in diverse unità territoriali, nello stesso periodo temporale. Fonti di dati: Il contenuto - 1 Il contenuto delle rilevazioni riflette, ovviamente, il contesto di produzione. Trattandosi principalmente di atti amministrativi l’informazione ricavata non è frutto dell’osservazione, ma è semplicemente la registrazione di uno stato di fatto (una nascita, un matrimonio, un reato, sono semplicemente registrati e conteggiati). DATI FATTUALI Ciò sta a significare che i dati raccolti nelle statistiche ufficiali non permetteranno di conoscere le opinioni, gli atteggiamenti e le motivazioni che spingono gli individui a compiere una determinata scelta. Anche nel caso di rilevazioni dirette (non derivanti da atti amministrativi – ISTAT) difficilmente ci si preoccupa di rilevare questo genere di informazioni, pare (Corbetta, 1999) perché le istituzioni pubbliche preferiscono non invadere la sfera privata dei propri cittadini. Fonti di dati: ampiezza della rilevazione - 1 L’ultimo punto riguarda l’ampiezza della rilevazione. Come già detto nelle prime lezioni, le indagini si possono classificare in due tipi: 1. Rilevazione esaustiva: registrazione delle informazioni su tutta la popolazione. I dati amministrativi in maggioranza appartengono a questa classe. 2. Rilevazione campionaria: registrazione compiuta solo su parte della popolazione. Solitamente il campione è costruito affinché rappresenti la distribuzione di alcune proprietà (ad es. sesso, titolo di studio e zona di residenza) nell’intera popolazione. Anzi, spesso le indagini ISTAT sono condotte su campioni di ampie dimensioni, affinché possano garantire un alto livello di rappresentatività (a volte anche a livello provinciale), una delle funzioni peculiari delle statistiche ufficiali. Fonti di dati: I limiti dell’analisi - 1 L’uso delle statistiche ufficiali ha alcuni limiti, in parte già sottolineati, ma che indichiamo sistematicamente qui: 1. I dati sono registrati dalle amministrazioni pubbliche con finalità diverse rispetto a quelle del ricercatore: per questo motivo si deve accettare il sistema di rilevazione dei dati (e quindi le definizioni operative degli enti produttori di dati), senza poter modificare alcunché. 2. Poiché sono dati aggregati, è possibile che siano disponibili solo alcune tabulazioni incrociate, limitando di fatto l’analisi. 3. Spesso è difficile mettere insieme dati provenienti da diverse fonti, poiché adottano sistemi di rilevazioni differenti. È necessario, quindi, essere accorti nel confrontare dati da fonti diverse. 4. Spesso le unità di analisi sono diverse: solitamente coincidono con le unità amministrative, ma possono essere anche di altro genere: le diocesi, le ASL, le circoscrizioni elettorali, ecc… Fonti di dati: I limiti dell’analisi - 2 5. I dati registrati dalle statistiche ufficiali sono definiti dati fattuali: è quindi impossibile conoscere le opinioni, atteggiamenti e motivazioni che spingono gli individui a compiere una determinata scelta. 6. I dati aggregati non sono adatti per l’analisi dei comportamenti individuali. Ad es., se in uno stesso ambito territoriale si rileva un alto numero di voti per i partiti di sinistra e un alto numero di operai, non posso sostenere che gli operai votano a sinistra (non so effettivamente quanti degli operai hanno effettivamente votato a sinistra) FALLACIA ECOLOGICA Fonti di dati: dati aggregati - 1 Si presenteranno ora alcune delle fonti ufficiali dalle quali è possibile raccogliere alcune informazioni rilevanti. Per i dati aggregati, la maggior parte dei dati è raccolta dall’Istituto Nazionale di Statistica (ISTAT) e questi sono pubblicati in siti “paralleli” rispetto a quello ufficiale dell’Istituto. Nelle slides successive si riporteranno solo alcune delle banche dati dell’ISTAT. Per l’elenco completo consultare la pagina: http://www.istat.it/dati/db_siti/ http://www.istat.it/dati/dataset/ Fonti di dati: dati aggregati - 2 Censimento generale della popolazione e delle abitazioni http://dawinci.istat.it/MD/ Contenuto: caratteristiche socio-demografiche, lavorative e abitative della popolazione residente UA: nazione, ripartizione geografica, regione, provincia, comune (solo per alcune proprietà) Censimento generale dell’industria e dei servizi http://dwcis.istat.it/cis/index.htm Contenuto: n. di imprese di tipo, n. di unità locali, n. di addetti, ecc… UA: nazione, regione, provincia, comune Fonti di dati: dati aggregati - 3 Censimento dell’agricoltura http://censagr.istat.it/ Contenuto: n. di aziende agricole, tipo di struttura, tipo di coltivazioni/allevamenti, caratteristiche socio-demografiche degli operatori UA: nazione, ripartizione geografica, regione, provincia, comune Statistiche demografiche: Demografia in cifre http://demo.istat.it/ Contenuto: popolazione residente italiana e straniera per età, sesso e stato civile; bilancio demografico per sesso e cittadinanza UA: nazione, ripartizione geografica, regione, provincia, comune Fonti di dati: dati aggregati - 4 Sistema di Indicatori territoriali http://sitis.istat.it/sitis/html/index.htm Contenuto: sistema di indicatori diviso in 15 aree – tra le quali prezzi, Ambiente, Imprese, Abitazioni, Trasporti e turismo, Famiglie ed aspetti sociali, Giustizia UA: nazione, ripartizione geografica, regione, provincia, capoluogo Sistema informativo territoriale sulla Giustizia http://giustiziaincifre.istat.it/ Contenuto: giustizia civile, giustizia amministrativa, attività notarile, giustizia penale, materia penitenziaria UA: nazione, ripartizione geografica, regione, provincia, distretto di Corte di Appello Fonti di dati: dati aggregati - 5 Sistema informativo territoriale su sanità e salute http://www.istat.it/sanita/Health/ Contenuto: sistema di 4.000 indicatori su diverse aree tematiche – tra cui fecondità, interruzioni volontarie della gravidanza, aborti spontanei, malattie infettive, speranza di vita, attività ospedaliera in generale, risorse finanziarie, umane e tecniche. UA: regione, provincia Banca dati di indicatori congiunturali http://con.istat.it/amerigo/ Contenuto: prezzi, occupazione, forze di lavoro e conti economici nazionali trimestrali. UA: prevalentemente nazionale Fonti di dati: dati aggregati - 6 Ministero della Salute http://www.ministerosalute.it/resources/static/servizi.jsp Contenuto: i numeri del sistema sanitario nazionale (n. servizi offerti, n. medici, ecc…); ricoveri ospedalieri. UA: ASL Ministero della giustizia http://www.giustizia.it/statistiche/statistiche-indice.htm Contenuto: statistiche sull’amministrazione penitenziaria, sull’organizzazione giudiziaria, sulla giustizia minorile. UA: nazione, regione Annuario statistico Regionale della Lombardia http://www.ring.lombardia.it/ Contenuto: generico, con focus su dati relativi a tutti i comuni della Lombardia UA: regione, comune Fonti di dati: dati individuali - 1 Presenteremo ora alcune indagini campionarie, commissionate dall’ISTAT o da altre istituzioni pubbliche, nazionali ed internazionali Indagini Multiscopo ISTAT http://www.istat.it/dati/catalogo/20060615_00/ Obiettivo: esplorare alcuni aspetti della società italiana difficilmente conoscibili con le informazioni raccolte dalla normale attività amministrativa Temi: 1. 2. 3. Aspetti della vita quotidiana (annuale): famiglia, abitazione e zona in cui si vive; condizione di salute e stili di vita; cultura e tempo libero; soddisfazione servizi di pubblica utilità. Cittadini e tempo libero (quinquennale): uso del tempo libero, in particolare sport, consumi culturali, hobby, relazioni sociali. Famiglia e soggetti sociali (quinquennale): struttura familiare e caratteristiche sociali della famiglia italiana; relazioni sociali e amicali; vita di coppia e cura dei figli. Fonti di dati: dati individuali - 2 Indagini Multiscopo ISTAT Temi: 4. 5. 6. Condizioni di salute e ricorso ai servizi sanitari (quinquennale): percezione soggettiva del proprio stato di salute; stili di vita rilevanti per il benessere psico-fisico. Viaggi e vacanze (trimestrale): stima dei flussi turistici e caratteristiche; caratteristiche socio-demografiche dei turisti; motivo della vacanza e spesa sostenuta. Sicurezza dei cittadini (quinquennale): indagine di vittimizzazione (stima del numero di reati non denunciati alle Forze dell’Ordine); percezione della sicurezza nella zona in cui si vive; giudizio sulle Forze dell’Ordine. UA: individui, famiglie Rappresentatività: nazione, ripartizione territoriale, regione, tipologia comunale (area metropolitana, classi di ampiezza popolazione) Fonti di dati: dati individuali - 3 Altri dati individuali: Indagine sui bilanci delle famiglie italiane – Banca d’Italia: • • • http://www.bancaditalia.it/statistiche/indcamp/bilfait Obiettivi: conoscere i redditi e le proprietà delle famiglie italiane. UA: individui, famiglie European Social Survey: • • • http://www.europeansocialsurvey.org/ Obiettivi: conoscere gli atteggiamenti e i valori degli europei verso alcuni aspetti della propria vita. UA: individui Eurobarometer: • • • http://ec.europa.eu/public_opinion/index_en.htm Obiettivi: conoscere gli atteggiamenti e i valori degli europei verso le istituzioni europee; spesso vengono eseguite indagini su temi di rilevanza internazionale (immigrazione, salute, alimentazione, ecc…). UA: individui Fonti di dati: approfondimenti Fonti statistiche ufficiali: AA.VV., Le Ricerche di Petronilla. Una guida alle fonti statistiche per l’analisi secondaria nelle scienze sociali, Università degli Studi di Trento http://www4.soc.unitn.it:8080/dsrs/content/e242/e245/e2392/quad38.pdf Rapporti statistici - 1 • Spesso le variabili cardinali a disposizione non derivano né da una misurazione né da conteggio, bensì derivano da trasformazioni di altre variabili cardinali • Questo tipo di variabile, non rilevata direttamente, viene detta variabile derivata, appunto perché essa deriva da una trasformazione di una o più variabili già presenti. • Sono variabili derivate, ad esempio, quelle costruite attraverso operazioni di ricodifica, normalizzazione e standardizzazione. • E’ possibile costruire variabili derivate anche unendo le informazioni contenute in due variabili distinte, ad esempio costruendo un rapporto tra le due variabili. Ciò può essere utile se vogliamo normalizzare l’andamento di un fenomeno (ad esempio il numero di disoccupati) con la numerosità della popolazione di riferimento o l’ampiezza del territorio in cui il fenomeno è rilevato (sempre nel nostro esempio, normalizzare il numero di disoccupati per la numerosità della popolazione attiva). RAPPORTO STATISTICO Rapporti statistici - 2 • Esistono diversi tipi di rapporti statistici. Ne esamineremo quattro: •Rapporto di composizione: relazione tra una delle possibili manifestazioni del fenomeno con il fenomeno nella sua interezza. Es. Proporzione di maschi: numero di maschi sul totale di maschi e femmine Proporzione di spesa per affitto: spesa per l’affitto sul totale delle spese familiari Indice di possesso del diploma di scuola media superiore – 19 anni in su: rapporto tra la popolazione di 19 anni in su con diploma di scuola media superiore sul totale della popolazione di 19 anni in su (x 100) Indice di non conseguimento della scuola dell’obbligo: popolazione con età tra i 15 e i 52 anni che non ha il diploma di scuola media inferiore sul totale della popolazione della stessa classe di età (x 100) Tasso di disoccupazione [giovanile]: popolazione [di età compresa tra i 15 e i 24 anni] in cerca di lavoro su forza lavoro [della stessa classe di età] ( (x 100) Rapporti statistici - 3 2. Rapporto di coesistenza: relazione tra due delle possibili manifestazioni del fenomeno. Es. Indice di mascolinità: numero di maschi sul numero di femmine (x 100) Rapporto di matrimoniabilità: numero di coniugati su numero di non coniugati (celibi, nubili, vedovi e divorziati) (x 100) Indice di dipendenza: numero di individui con età da 0-14 anni e con età superiore ai 65 anni e oltre diviso il numero di individui con età tra i 15 e i 64 anni (x 100) Indice di vecchiaia: numero di individui con età superiore ai 65 anni sul numero di individui con età inferiore ai 15 anni (x 100) Indice di ricambio della popolazione: popolazione con età tra 0 e 14 anni su popolazione con età superiore ai 65 anni (x 100) Indice di ricambio della popolazione attiva: popolazione tra 60 e i 64 anni su popolazione tra i 15 e i 19 anni (x 100) Rapporti statistici - 4 2. Rapporto di derivazione: rapporto fra la misura di un fenomeno e quella di un altro fenomeno considerato un suo presupposto necessario. È da considerarsi una forma di normalizzazione. Es. Tasso di natalità (mortalità): numero di nascite (morti) sul totale della popolazione (x 1.000) Quoziente di immigrazione: numero di immigrati sul totale della popolazione (x 1.000) Quoziente di criminalità: numero di reati sul totale della popolazione (x 100.000) Tasso di incidentalità: numero di incidenti stradali sul totale della popolazione (x 100.000) Rapporti statistici - 5 2. Rapporto medio: rapporto fra due grandezze che riguardano due fenomeni diversi (categoria residuale). Es. Densità della popolazione: numero di abitanti su superficie del territorio Indice di affollamento: numero di componenti della famiglia su numero di stanze dell’abitazione Indice di vivacità sociale: numero di luoghi di interazione sociale (attività commerciali, associazioni, servizi socio-culturali, sportivi e ricreativi) sul totale della popolazione residente Contatti Domingo Scisci Università di Milano-Bicocca Via Bicocca degli Arcimboldi 8 20126 Milano Edificio U7/II Piano Stanza 207 Telefono: 02 64487513 Mail: [email protected] Quest'opera è stata rilasciata sotto la licenza Creative Commons Attribuzione-Non commerciale-Condividi allo stesso modo 2.5 Italia. Per leggere una copia della licenza visita il sito web http://creativecommons.org/licenses/by-nc-sa/2.5/it/ o spedisci una lettera a Creative Commons, 171 Second Street, Suite 300, San Francisco, California, 94105, USA.