Corso di POPOLAZIONE TERRITORIO E SOCIETA’ 1 AA 2013-2014 LEZIONE 0 INFORMAZIONI GENERALI SUL CORSO • http://www.statistica.unimib.it/utenti/rimoldi/ • Esame frequentanti: - frequenza al corso - svolgimento esercitazioni 5/6 - discussione orale delle esercitazioni • Esame non frequentanti: esame orale • Materiale preparazione esame: dispense fornite e slides delle lezioni • SEMINARI: 12 dicembre Tineke Fokkema (NIDI) Loneliness among older adults: Theory and empirical evidence 18 (o 19) dicembre Petros Pétsimeris (Univ. Paris 1-Pantheon Sorbonne) Social segregation in London 7 (o 8) gennaio Camille Schmoll (Univ. Paris 4 Diderot) Women migrants in Italy OBIETTIVO DEL CORSO: integrare la conoscenza delle tecniche di analisi della popolazione con strumenti specifici per l’analisi territoriale Popolazione Parte 1 Strumenti per l’analisi territoriale Territorio Parte 2 Alcune tematiche importanti in Italia Introduzione autocorrelazione spaziale Uso GIS Popolazione Territorio Definizione di popolazione: “Insieme di individui, stabilmente costituito, legato da vincoli di riproduzione e identificato da caratteristiche territoriali, politiche, giuridiche, etniche o religiose” (Livi Bacci 1990). L’attributo più frequente Il TEMPO è la dimensione fondamentale dei processi demografici (Santini 1992) Ma è sul TERRITORIO che essi concretamente si osservano e si misurano. OSSERVAZIONE DISPONIBILITA’ DEI DATI Per tutte le discipline (statistiche) applicate, come la demografia, la statistica economica o la statistica sociale, la disponibilità delle informazioni di base si pone come precondizione indispensabile per la ricerca. La disponibilità delle informazioni varia al variare della scala territoriale e dipende : a) dal livello di rilevazione delle informazioni b) dal dettaglio di diffusione delle informazioni (segreto statistico) Un ulteriore vincolo riguarda il tipo di misura del fenomeno su cui si indaga, misure assolute o indicatori: nel secondo caso sussistono vincoli di significato e consistenza (es. l’abortività viene misurata attraverso I tassi, per aggregati territoriali piccoli I valori possono non essere abbastanza consistenti) . Infine, è necessario considerare l’obiettivo delle analisi: pur essendo rilevata individualmente un’informazione può non avere alcuna utilità se non è opportunamente misurata: la fecondità, ad esempio, viene rilevata per ogni singola donna ma è su un insieme di donne che il fenomeno ha interesse demografico. CLASSIFICAZIONE DEL TERRITORIO A livello globale: http://unstats.un.org/unsd/methods/m49/m49.htm (UNITED NATIONS Standard Country or Area Codes for Statistical Use) - MACRO GEOGRAPHICAL REGIONS (Continenti, es. 002 Africa) -REGIONS (es. 014 Eastern Africa, 017 Middle Africa, 015 Northern Africa, 018 Southern Africa, 011 Western Africa) - COUNTRIES (es. 710 South Africa) CLASSIFICAZIONE DEL TERRITORIO A livello europeo: http://epp.eurostat.ec.europa.eu/portal/page/portal/nuts_nomenclature /introduction (EUROSTAT Nomenclature of territorial units for statistics - NUTS) NUTS 3: small regions for specific diagnoses (1294) Es, Le Province italiane, i Dipartimenti francesi, le province spagnole, NUTS 2: basic regions for the application of regional policies (270) Es, Le Regioni italiane, le Regioni francesi,, le comunità autonome in spagna NUTS 1: major socio-economic regions (97) Es, Le Macro-aree italiane, le Zone d'études et d'aménagement du territoire francesi, gli Stati federati tedeschi. Le Regioni in Belgio ecc. Principio 1 - dimensione LEVEL NUTS 1 NUTS 2 NUTS 3 MINIMUM 3 million 800 000 150 000 MAXIMUM 7 million 3 million 800 000 Principio 2 – criterio normativo La definizione NUTS si basa sulle classificazioni amministrative degli Stati Principio 3 – criterio geografico generale Le unità geografiche generali sono preferibili rispetto a quelle specifiche per particolari obiettivi Scopi della classificazione EUROSTAT 1) Raccolta e armonizzazione statistiche 2) Analisi socio-economiche: - NUTS1 principali aree socio-economiche - NUTS2 aree base per l’applicazione di politiche regionali (ES- FONDI STRUTTURALI) - NUTS3 piccole aree per specifiche analisi CLASSIFICAZIONE DEL TERRITORIO A livello nazionale: http://sistat.istat.it/sistat/ ISTAT Classificazione istituzionale MACRO AREE: Nord-Ovest, Nord-Est, Centro, Sud, Isole (5) REGIONI: Piemonte, Valle d’Aosta..ecc. (20) PROVINCE: Alessandria, Torino…ecc. (110) COMUNI: (8091 al 30.06.12) di cui 10 città metropolitane dal 1.1.2014 Città N. metropolitana 1 Roma 2 Milano 3 Napoli 4 Torino 5 Bari 6 Bologna 7 Firenze 8 Genova 9 Venezia 10 Reggio Calabria Popolazione Superficie Densità abitativa Delimitazione amministrativa 31.05.13 (km2) (km2) Provincia di Roma 4,056,731 5,352 757 Provincia di Milano 3,119,756 1,575 1,977 Provincia di Napoli 3,053,539 1,171 2,607 Provincia di Torino (ridim) 2,280,383 6,829 330 Provincia di Bari 1,245,653 3,821 325 Provincia di Bologna 994,436 3,702 264 Provincia di Firenze 990,208 3,514 278 Provincia di Genova 848,852 1,839 463 Provincia di Venezia 848,352 2,462 343 Provincia di Reggio Calabria 55,001 3,183 172 E, nelle regioni a Statuto Speciale, Delimitazione amministrativa 11 Cagliari 12 Catania 13 Messina 14 Palermo Provvedimento Non delimitata Individua un'area di cui fanno parte 27 comuni Individua un'area di cui fanno parte 51 comuni Individua un'area di cui fanno parte 27 comuni Classificazione funzionale Sistemi Locali del Lavoro Distretti Industriali Distretti socio-sanitari Ecc. Il problema della DIMENSIONE di un aggregato può considerarsi da 2 punti di vista: DIMENSIONE DEMOGRAFICA: consistenza niumerica dell’aggregato di individui DIMENSIONE GEOGRAFICA: ampiezza del territorio su cui viene rilevato un certo fenomeno demografico http://www.worldatlas.com/aatlas/populations/ctyareal.htm Ulteriore elemento di disturbo: ARBITRARIETA’ delle suddivisioni Amministrative Statistiche Funzionali Quale scegliere? si intersecano e sovrappongono Dipende! Unica regola: più si aggrega, più si media, più si va nel dettaglio territoriale più si coglie la differenza Concetti fondamentali nelle analisi geospaziali LUOGO (posto) Porzione di spazio di varia misura e forma. I luoghi possono sovrapporsi (un lago che attraversa due comuni) o essere l’uno incluso nell’altro (l’Italia dentro l’Europa) I luoghi cambiano e si trasformano continuamente: perché le persone si muovono, per I cambiamento climatici, per tutti I processi fisici e sociali che trasformano l’ambiente I cambiamenti dovuti a cause naturali hanno solitamente tempi lunghi (eccetto le catastrofi come I terremoti, le inondazioni ecc.); sono ininfluenti sul ciclo di vita dell’individuo. Ai luoghi sono associate molte informazioni, in genere legate al ruolo che I luoghi svolgono. L’informazione di base per definire un luogo è un sistema di coordinate geografiche. L’attuale WGS (World Geodetic System-1984) fornisce un’accurata stima delle coordinate per ciascun luogo della terra. L’altitudine costituisce ancora elemento un problematico nella misura, essendo riferita al livello del mare che, a sua volta, è variabile Accanto alle tre dimensionoi geografiche si associa normalmente il TEMPO. OGGETTO GEOGRAFICO Varia nella misura e nella forma: punti (es. stazioni di rilevamento dell’inquinamento atmosferico), linee (es. reti stradali, fiumi), poligoni (es. comuni, regioni, Stati) APPROCCIO SPAZIALE ai fenomeni E’ possibile sintetizzare il punto di vista spaziale in 3 aspetti: - Orientamento / Direzione - Distanza - Contiguità Esempio: Un gruppo di turisti con guida in un luogo di interesse (es. Museo). La guida si ferma davanti alle opere di maggiore interesse: I turisti si disporranno davanti alla guida in modo da massimizzare vista e udito, possibilmente a semicerchio partendo dal centro e raggiungendo l’estremità finché non diventa talmente periferica da rendere più conveniente una posizione più centrale anche se più lontana. Si noti che ogni turista occupa uno spazio. Lo spazio tenderà ad essere più piccolo tanto più si è vicini alla guida. ORIENTAMENTO/DIREZIONE • Vi è una qualità direzionale nella voce della guida: ci sarà un fronte e un retro. • L’orientamento è dunque definito da 2 punti e da una freccia che li congiunge. DISTANZA • L’efficacia della guida diminuisce all’aumentare della distanza; questa è una proprietà che caratterizza molti fenomeni. I tempi di trasporto, ad esempio, aumentano con la distanza. • Altri fenomeni sono invarianti: ad esempio la giurisdizione di una autorità su di un’area è la stessa sia alla periferia che al centro dell’area. • La distanza fra due punti è generalmente definita come il cammino più breve, qualunque sia l’unità di misura. • Vi sono molte misure possibili: NON ce n’è una giusta per tutti I problemi.Ogni problema va attentamente valutato; la distanza fra le unità può essere il semplice ordinamento oppure può essere asimmetrica. • In uno spazio metrico la proncipale proprietà della distanza è che, dati a, b, c tre punti, d(a,b) £ d(a,c) + d(c,b) CONTIGUITA’/CONNESSIONE • Si parla di connessione, contiguità, adiacenza o semplicemente posizione relativa come proprietà topologica dfello spazio. • La contiguità può rimanere invariante anche se cambiano la direzione e la distanza. Problematiche dei tre elementi o Quando una (o più) delle tre dimensioni vengono ignorate emergono alcune criticità: ad es. Negli studi urbani, l’analisi centro-periferia non è sufficiente. o Negli studi di rete generalmente vengono ignorate sia la distanza che la direzione: le comunicazioni non hanno bisogno di link fisici, possono essere definite come associazioni (interazioni) funzionali che si manifestano attraverso SCAMBI. o Gli scambi si riferiescono a flussi di persone, beni o comunicazioni o Es. Nel caso dei turisti, la loro distribuzione spaziale dipende unicamente dalla loro relazione funzionale (sono tutti li per ascoltare la guida): in questo caso lo scambio riguarda “le parole” o Se si prende il gruppo di turisti e lo si sposta fuori dal museo, le caratteristiche del nuovo luogo modificheranno la disposizione dei turisti attorno alla guida (ostacoli fisici diversi, ecc.) ALCUNI PROBLEMI GEOGRAFICI DI BASE 1. TENSIONE STORICA Supponiamo di portare il gruppo di turisti fuori dal museo. Se trovassero delle panchine disposte abbastanza convenientemente le utilizzerebbero così come sono o con pochi spostamenti. La disposizione originaria delle panchine rappresenta il “beneficio” e il “legame” con il passato. In generale, l’insieme delle infrastrutture esistenti rapresentano un vincolo oltre che un’opportunità per le società. 2. TENSIONE DIMENSIONALE E’ la tensione che si crea tra punti e aree: la relazione che lega I punti dentro le aree (qual’è l’allocazione ottimale?) 3. TENSIONE SPAZIO-TEMPORALE (when time is short, space is conserved) Ad esempio problema che si crea nel traffico nelle ore di punta o nelle sanatorie a tempo. 4. SCALA DI OSSERVAZIONE Deve dipendere dall’oggetto di studio La variabilità dell’informazione al variare dell’area su cui è rilevata richiama il PROBLEMA DELL’UNITA’ AREALE MODIFICABILE MAUP (Modifiable Areal Unit Problem) Il MAUP è la potenziale fonte di errore che si commette nelle analisi spaziali che utilizzano dati aggregati (Unwin 1996) Per comprendere il MAUP dobbiamo partire dall’analisi dello spazio. Lo spazio è continuo, ma la nostra rappresentazione dello spazio non può che essere discreta, A PUNTI A POLIGONI IRREGOLARI A LINEE A POLIGONI REGOLARI L’UTILIZZO DI UNITA’ AREALI DISCRETE E’ NECESSARIO OGNI VOLTA CHE VOGLIAMO MISURARE UN FENOMENO IN UN’AREA: AD ES: Il livello della disoccupazione in Lombardia è aumentato; e nelle province?” L’UTILIZZO DELLE UNITA’ AREALI E’ INDISPENSABILE OGNI VOLTA CHE VOGLIAMO MISURARE UN FENOMENO CHE NON PUO’ ESSERE MISURATO IN UN SINGOLO PUNTO AD ES: Tasso di natalità, % di fumatori, tasso di deforestamento L’UTILIZZO DELLE UNITA’ AREALI E’ UTILE QUANDO VOGLIAMO PROTEGGERE LA PRIVACY AD ES: I dati del Censimento della popolazione che sono raccolti a livello individuale ma diffusi in modo aggregato L’UTILIZZO DELLE UNITA’ AREALI E’ UTILE QUANDO LE UNITA’ INDIVIDUALI SONO NUMEROSE AD ES: I dati sui consumi delle famiglie E’ quindi necessario attribuire CONFINI allo spazio Linee costiere, fiumi Confini amministrativi, comuni, sezioni di censimento Quando disegniamo confini arbitrari, la dimensione e la forma dell’area diventano elementi ARBITRARI, pertanto “soggettivi e discutibili” che hanno conseguenze sui risultati dell’analisi Esempio: LA DEFINIZIONE DEI COLLEGI ELETTORALI Nella costruzione dei collegi, ottenuti per aggregazione di comuni, si possono configurare due situazioni: la concentrazione dei voti di un partito in POCHI collegi, in modo da riservare TUTTI I RESTANTI collegi all’elettorato dell’altro partito [PACKING] la dispersione dei voti di un partito sul maggior numero possibile di collegi in modo tale che in nessuno di essi ottenga la maggioranza [DILUTION] Es. Elezioni Politiche 2001: Il Centro–Destra vince nella maggioranza dei collegi elettorali e quindi ottiene il maggior numero dei parlamentari eletti nei collegi uninominali, anche se il numero complessivo di voti conquistati nella quota proporzionale dalle liste collegate al Centro-Sinistra è maggiore del numero di voti del Centro-Destra Il MAUP si compone di 2 effetti EFFETTO SCALA Problema statistico EFFETTO AGGREGAZIONE Problema geografico EFFETTO SCALA: variabilità dei risultati al variare del numero di aree, sulla stessa porzione di territorio n = 16 n=4 n=2 entro le aree Varianza fra le aree Dimensione delle aree (Weins, 1989) Esempio: Sia V una variabile osservata sulle 16 unità in cui è divisa l’area A Media = 3,75 Varianza = 2,60 Media = 3,75 Varianza = 0,50 Media = 3,75 Varianza = 0,0 Esempio: L’area A è formata da 4 zone; si rileva l’età del capofamiglia delle famiglie Num. Fam. Età Zona 1° Zona 2°: 1 = C+1°; 2 = 2°N+2°S x = 43, 08 s = 15, 6 2°N C 1° 2°S 1 2 3 4 5 6 7 8 9 10 11 12 Media di Età Etichette di riga C 1° 2°N 2°S Totale dev st. 22 24 26 28 31 40 48 54 58 62 62 62 Totale 60,67 50,00 24,67 37,00 43,08 13,53 2°N 2°N 2°S 2°N 2°S 1° 1° 2°S C C C 1° 2 2 2 2 2 1 1 2 1 1 1 1 Media di Età Etichette di riga Totale 1 2 Importo totale dev. St. 55,33 30,83 43,08 12,25 ESEMPIO: Si considerino ora 2 variabili: X variabile indipendente e 87 40 41 14 49 55 95 55 30 56 44 25 72 55 26 37 51 33 37 38 35 34 67 32 44 88 38 8 17 59 Y variabile dipendente 72 50 21 19 38 58 24 34 24 18 37 54 75 60 46 36 47 40 100 R² = 0.6902 90 80 70 60 Y 50 40 30 20 10 0 0 10 20 30 40 50 X 60 70 80 90 100 85 49 22 48 52 46 29 46 42 23 52 38 58 84 45 8 22 35 30 23 14 29 48 55 (87+95)/2= 54,5 91 47,5 46,5 34 61 35,5 30,5 31 35 35,5 13 46,5 59 27 40 32,5 56,5 73,5 57 44 55 47,5 53,5 33,5 32 29,5 27,5 35,5 18,5 42,5 52 35 49 42 45 100 90 R² = 0.8151 AUMENTA! 80 70 60 Y 50 40 30 20 10 0 0 10 20 30 40 50 X 60 70 80 90 100 EFFETTO AGGREGAZIONE: variabilità dei risultati al variare della forma delle aree di aggregazione N=3 N=3 N=3 L’effetto aggregazione ha a che fare con la maggiore o minore omogeneità dei valori all’interno delle aree aggregate ESEMPIO 4 11 6 8 12 4 6 2 4 N=9 Media = 6,33 s = 3,2 … per l’effetto scala 7 8 4 N=3 N=2 Media = 6,33 s = 1,7 Media = 6,33 s = 1,5 7,8 4,9 Per l’effetto aggregazione… 6 8,3 4,7 Media = (6+8,3+4,7)/3 = 6,33 s = 1,5 7,7 7,3 4 Media = (7,7+7,3+4)/3 = 6,33 s = 1,7 ESEMPIO: Si considerino ora le 2 variabili: X variabile indipendente e Y variabile dipendente 87 40 41 14 49 55 95 55 30 56 44 25 72 55 26 37 51 33 37 38 35 34 67 32 44 88 38 8 17 59 72 50 21 19 38 58 24 34 24 18 37 54 75 60 46 36 47 40 85 49 22 48 52 46 29 46 42 23 52 38 58 84 45 8 22 35 30 23 14 29 48 55 100 R² = 0.6902 Originalmente R2=0,69 90 80 70 60 Y 50 40 30 20 10 0 0 10 20 30 40 50 X 60 70 80 90 100 SCHEMA DI RAGGRUPPAMENTO 1 91 54,5 34 73,5 57 44 47,5 46,5 61 55 47,5 53,5 35,5 30,5 31 33,5 32 29,5 35 35,5 13 27,5 35,5 18,5 46,5 59 27 42,5 52 35 40 32,5 56,5 49 42 45 100 Originalmente R2=0,69 90 R² = 0.8151 80 70 raggruppando per colonna R2 = 0,82 60 Y 50 40 30 20 10 0 0 10 20 30 40 50 X 60 70 80 90 100 SCHEMA DI RAGGRUPPAMENTO 2 63,5 75,0 63,5 37,5 66,0 29,0 61,0 67,5 67,0 37,5 71,0 26,5 27,5 43,0 31,5 34,5 23,0 21,0 20,0 41,0 35,0 32,5 26,5 21,5 52,0 34,5 42,0 49,5 38,0 45,5 48,0 43,5 49,0 45,0 28,5 51,5 100 Originalmente R2=0,69 90 R² = 0.8899 80 70 raggruppando per colonna R2 = 0,82 60 Y 50 40 raggruppando per riga R2 = 0,90 30 20 10 0 0 10 20 30 40 X 50 60 70 80 MAUP Le relazioni statistiche tra i caratteri cambiano al cambiare della scala e/o del raggruppamento Esempio: FALLACIA ECOLOGICA La relazione statistica che si osserva al livello aggregato può non essere vera a livello individuale Grande variabilità nel Td, Analoga variabilità nella % Ispanici Gli individui di origine ispanica hanno una più elevata probabilità di essere disoccupati Città (Pop. > 100.000) A B C D E F G H I J K L M N Tasso di disoccupazione % % Ispanici Tasso disoc. Ispanici Tasso disoc. Non Ispanici Regione 9.3 8.5 7.2 7.2 6.8 6.4 6.2 6.0 5.7 5.3 5.1 5.0 4.6 4.6 19.2 17.6 14.5 16.1 14.2 14.5 14.4 12.1 10.4 9.2 6.3 7.5 5.2 4.8 17.2 8.3 6.0 6.8 6.0 6.4 5.8 5.8 6.0 5.4 4.7 4.7 3.5 3.5 9.6 8.5 7.3 7.4 6.9 6.4 6.3 6.1 5.7 5.3 5.1 5.0 4.7 4.7 SW SW W SW NE SW W MW NE W MW NE W MW Esempio 2: comportamenti riproduttivi Sia s una generica area; Y un comportamento; X vettore delle variabili esplicative Quando non si dispone dei dati individuali si utilizzano spregiudicatamente i dati aggregati Ys = f ( Xs ) ® Y = f ( X ) Ma facendo ciò ipotizziamo che: E (Y ) = f ( E ( X )) In generale, però, la relazione osservabile a livello individuale si nota anche a livello aggregato se, nel tempo, le variabili X e Y variano in modo simile in tutte le aree oggetto di studio (CASO DI NORMALITA’ ECOLOGICA). ESEMPIO 3: livello di religiosità e comportamento riproduttivo Livello individuale Cittadinanza 1 2 3 4 5 6 Liv. religiosità 2 3 Francia Francia Francia Italia Italia Italia 6 N. figli 2 5 Citt. Francia Italia Italia Francia y = 1,5455x - 0,3636 R2 = 0,7506 Francia + Italia 5 4 6 6 5 5 4 4 3 2 3 2 1 1 3 0 0 0 2 1 2 3 4 5 0 6 1 2 Correlazione lineare fra le medie 1 6 0 y = 3x - 4 R2 = 1 5 0 1 2 3 4 Livello di religiosità 5 6 4 3 2 1 0 0 3 4 Livello di religiosità Livello di religiosità Numero di figli Numero di figli NORMALITA’ ECOLOGICA Numero di figli N. figli Numero di figli Livello di religiosità 1 2 3 2 3 4 Livello ecologico (media) 1 2 3 4 Livello di religiosità 5 6 5 6 Francia 8 Italia 8 7 7 Francia + Italia 4 3 7 2 6 1 y = 0,3636x + 3,0909 R2 = 0,0182 5 5 4 3 2 1 0 0 1 2 3 4 5 6 7 0 8 0 1 Livello di religiosità 4 2 3 Correlazione lineare fra le medie 2 8 1 7 6 0 0 1 2 3 4 5 Livello di religiosità 6 7 8 5 4 3 y = -4x + 14 R2 = 1 2 1 0 0 1 4 5 Livello di religiosità 3 Numero di figli Numero di figli 8 6 5 Numero di figli Numero di figli 6 2 3 4 5 Livello di religiosità 6 7 8 6 7 8 EFFETTI STRUTTURALI (Emile Durkheim 1858-1917) Comportamenti e caratteristiche proprie degli aggregati di popolazione, indipendenti dai comportamenti e dalle caratteristiche degli individui ma in grado di influenzarli Studio dei suicidi derivati da anomia (mancanza di una direzione morale): - Essere protestanti - Non essere sposati Comunità TASSI DI SUICIDIO Maggioranza protestante Protestanti Individui Cattolici Maggioranza cattolica ESEMPIO: tasso di natalità e % afro-americani Campione di 12 stati, elencati in ordine decrescente per proporzione di afro-americani sul complesso della popolazione (primi 6; ultimi 6) I tassi di natalità sono più elevati dove è più alta la proporzione di afro-americani Tasso di natalità In media, i tassi di natalità degli afro-americani sono più elevati ESISTE L’EFFETTO STRUTTURALE? Ci si può chiedere se una minore presenza di afro-americani influisce sulla loro fecondità riducendola Comunità TASSI DI NATALITA’ Afro-americani Individui Euro americani Forte presenza afro- Scarsa presenza afroamericani americani Massachusset, Missouri (tasso nat. Louisiana, Illinois, Afro-am. Sopra la New Jersey media) Georgia, Illinois, New Missouri, Kentucky, Colorado Jersey, Maryland NON SI PUO’ DIRE!... QUADRO CONFUSO Togliamo Illinois, New jersey, Missouri e Kentucky • I tassi afro-am. Sono più alti degli euro-am. sia negli stati a forte presenza afro-am che in quelli a bassa presenza • I tassi di natalità degli afro-am. Sono più elevati della media negli stati a forte presenza afro-am. ECCETTO COLORADO • I tassi di natalità degli euro-am. Sono più bassi negli stati con bassa presenza Afro-am. ECCETTO MASSACHUSSET • L’effetto strutturale è molto modesto, tenuto conto che le differenze tra i tassi complessivi del 1° e del 2° gruppo sono modeste