POPOLAZIONE, TERRITORIO E SOCIETA’ I Stefania Rimoldi http://www.statistica.unimib.it/utenti/rimoldi/ Modalita’ esame frequentanti: DISCUSSIONE ORALE delle ESERCITAZIONI SVOLTE (le esercitazioni possono essere svolte tutte o in parte; le eventuali esercitazioni mancanti potranno essere compensate da domande orali) non frequentanti: ORALE http://www.statistica.unimib.it/utenti/rimoldi/ OBIETTIVO DEL CORSO Esaminare le relazioni tra la popolazione e il territorio in cui vive, in particolare come la variabile territorio (spazio) interagisce con la popolazione che lo abita ARGOMENTI DEL CORSO PARTE PRIMA: strumenti e metodi per l’analisi territoriale PARTE SECONDA: rassegna studi sul territorio italiano http://www.statistica.unimib.it/utenti/rimoldi/ INTRODUZIONE Definizione di POPOLAZIONE (Livi Bacci, 1990) Insieme di individui, stabilmente costituito, legato da vincoli di riproduzione e identificato da caratteristiche territoriali, politiche, giuridiche, etniche o religiose http://www.statistica.unimib.it/utenti/rimoldi/ CLASSIFICAZIONE DEL TERRITORIO A livello globale: http://unstats.un.org/unsd/methods/m49/m49.htm (UNITED NATIONS Standard Country or Area Codes for Statistical Use) - MACRO GEOGRAPHICAL REGIONS (Continenti, es. 002 Africa) -REGIONS (es. 014 Eastern Africa, 017 Middle Africa, 015 Northern Africa, 018 Southern Africa, 011 Western Africa) - COUNTRIES (es. 710 South Africa) http://www.statistica.unimib.it/utenti/rimoldi/ CLASSIFICAZIONE DEL TERRITORIO A livello europeo: http://epp.eurostat.ec.europa.eu/portal/page/portal/nuts_nomenclature /introduction (EUROSTAT Nomenclature of territorial units for statistics - NUTS) NUTS 3: small regions for specific diagnoses (1294) Es, Le Province italiane, i Dipartimenti francesi, le province spagnole, NUTS 2: basic regions for the application of regional policies (270) Es, Le Regioni italiane, le Regioni francesi,, le comunità autonome in spagna NUTS 1: major socio-economic regions (97) Es, Le Macro-aree italiane, le Zone d'études et d'aménagement du territoire francesi, gli Stati federati tedeschi. Le Regioni in Belgio ecc. http://www.statistica.unimib.it/utenti/rimoldi/ Principio 1 - dimensione LEVEL NUTS 1 NUTS 2 NUTS 3 MINIMUM 3 million 800 000 150 000 MAXIMUM 7 million 3 million 800 000 Principio 2 – criterio normativo La definizione NUTS si basa sulle classificazioni amministrative degli Stati Principio 3 – criterio geografico generale Le unità geografiche generali sono preferibili rispetto a quelle specifiche per particolari obiettivi http://www.statistica.unimib.it/utenti/rimoldi/ Scopi della classificazione EUROSTAT 1) Raccolta e armonizzazione statistiche 2) Analisi socio-economiche: - NUTS1 principali aree socio-ec. - NUTS2 aree base per l’applicazione di politiche regionali (ES- FONDI STRUTTURALI) - NUTS3 piccole aree per specifiche analisi http://www.statistica.unimib.it/utenti/rimoldi/ CLASSIFICAZIONE DEL TERRITORIO A livello nazionale: http://sistat.istat.it/sistat/ ISTAT Classificazione istituzionale MACRO AREE: Nord-Ovest, Nord-Est, Centro, Sud, Isole (5) REGIONI: Piemonte, Valle d’Aosta..ecc. (20) PROVINCE: Alessandria, Torino…ecc. (da 110 al 30.06.12 a 51 dal 1.01.13) COMUNI: (8091 al 30.06.12) di cui 10 città metropolitane http://www.statistica.unimib.it/utenti/rimoldi/ Classificazione funzionale Sistemi Locali del Lavoro Distretti Industriali Distretti socio-sanitari Ecc. http://www.statistica.unimib.it/utenti/rimoldi/ Considerazioni • La classificazione istituzionale e la classificazione funzionale si sovrappongono e si intersecano • Elemento di arbitrarietà nella scelta del livello di analisi • La variabilità dei fenomeni dipende dal livello di disaggregazione dei dati: piccole dimensioni fanno risaltare la variabilità mentre grandi dimensioni “mediano” le diversità MAUP http://www.statistica.unimib.it/utenti/rimoldi/ MAUP Modifiable Areal Unit Problem DEFINIZIONE: Il problema dell’unità areale modificabile è una potenziale fonte di errore nelle analisi spaziali che utilizzano fonti di dati aggregati (Unwin, 1996). Per comprendere il MAUP dobbiamo partire dall’analisi dello spazio. Lo spazio è continuo, ma la nostra rappresentazione dello spazio non può che essere discreta, http://www.statistica.unimib.it/utenti/rimoldi/ A PUNTI A POLIGONI IRREGOLARI A LINEE A POLIGONI REGOLARI http://www.statistica.unimib.it/utenti/rimoldi/ L’UTILIZZO DI UNITA’ AREALI DISCRETE E’ NECESSARIO OGNI VOLTA CHE VOGLIAMO MISURARE UN FENOMENO IN UN’AREA: AD ES: Il livello della disoccupazione in Lombardia è aumentato; e nelle province?” L’UTILIZZO DELLE UNITA’ AREALI E’ INDISPENSABILE OGNI VOLTA CHE VOGLIAMO MISURARE UN FENOMENO CHE NON PUO’ ESSERE MISURATO IN UN SINGOLO PUNTO AD ES: Tasso di natalità, % di fumatori, tasso di deforestamento L’UTILIZZO DELLE UNITA’ AREALI E’ UTILE QUANDO VOGLIAMO PROTEGGERE LA PRIVACY AD ES: I dati del Censimento della popolazione che sono raccolti a livello individuale ma diffusi in modo aggregato L’UTILIZZO DELLE UNITA’ AREALI E’ UTILE QUANDO LE UNITA’ INDIVIDUALI SONO NUMEROSE AD ES: I dati sui consumi delle famiglie E’ quindi necessario attribuire CONFINI allo spazio Linee costiere, fiumi Confini amministrativi, comuni, sezioni di censimento Quando disegniamo confini arbitrari, la dimensione e la forma dell’area diventano elementi ARBITRARI, pertanto “soggettivi e discutibili” che hanno conseguenze sui risultati dell’analisi Esempio: LA DEFINIZIONE DEI COLLEGI ELETTORALI Nella costruzione dei collegi, ottenuti per aggregazione di comuni, si possono configurare due situazioni: la concentrazione dei voti di un partito in POCHI collegi, in modo da riservare TUTTI I RESTANTI collegi all’elettorato dell’altro partito [PACKING] la dispersione dei voti di un partito sul maggior numero possibile di collegi in modo tale che in nessuno di essi ottenga la maggioranza [DILUTION] Es. Elezioni Politiche 2001: Il Centro–Destra vince nella maggioranza dei collegi elettorali e quindi ottiene il maggior numero dei parlamentari eletti nei collegi uninominali, anche se il numero complessivo di voti conquistati nella quota proporzionale dalle liste collegate al Centro-Sinistra è maggiore del numero di voti del Centro-Destra Il MAUP si compone di 2 effetti EFFETTO SCALA Problema statistico EFFETTO AGGREGAZIONE Problema geografico EFFETTO SCALA: variabilità dei risultati al variare del numero di aree, sulla stessa porzione di territorio n = 16 n=4 n=2 entro le aree Varianza fra le aree Dimensione delle aree (Weins, 1989) Esempio: Sia V una variabile osservata sulle 16 unità in cui è divisa l’area A Media = 3,75 Varianza = 2,60 Media = 3,75 Varianza = 0,50 Media = 3,75 Varianza = 0,0 Esempio: L’area A è formata da 4 zone; si rileva l’età del capofamiglia delle famiglie x = 43, 08 s = 15, 6 2°CN C 1°C 2°CS Num. Fam. 1 2 3 4 5 6 7 8 9 10 11 12 Media di Età Etichette di riga C 1° 2°N 2°S Totale dev st. Età 22 24 26 28 31 40 48 54 58 62 62 62 Totale 60,67 50,00 24,67 37,00 43,08 13,53 Zona 1° 2°N 2°N 2°S 2°N 2°S 1° 1° 2°S C C C 1° Zona 2°: 1 = C+!°; 2 = 2°N+2°S 2 2 2 2 2 1 1 2 1 1 1 1 Media di Età Etichette di riga Totale 1 2 Importo totale dev. St. 55,33 30,83 43,08 12,25 ESEMPIO: Si considerino ora 2 variabili: X variabile indipendente e 87 40 41 14 49 55 95 55 30 56 44 25 72 55 26 37 51 33 37 38 35 34 67 32 44 88 38 8 17 59 Y variabile dipendente 72 50 21 19 38 58 24 34 24 18 37 54 75 60 46 36 47 40 100 R² = 0.6902 90 80 70 60 Y 50 40 30 20 10 0 0 10 20 30 40 50 X 60 70 80 90 100 85 49 22 48 52 46 29 46 42 23 52 38 58 84 45 8 22 35 30 23 14 29 48 55 91 54,5 34 73,5 57 44 47,5 46,5 61 55 47,5 53,5 35,5 30,5 31 33,5 32 29,5 35 35,5 13 27,5 35,5 18,5 46,5 59 27 42,5 52 35 40 32,5 56,5 49 42 45 100 90 R² = 0.8151 AUMENTA! 80 70 60 Y 50 40 30 20 10 0 0 10 20 30 40 50 X 60 70 80 90 100 EFFETTO AGGREGAZIONE: variabilità dei risultati al variare della forma delle aree di aggregazione N=3 N=3 N=3 ESEMPIO 10 15 5 5 10 15 5 10 5 … per l’effetto scala 10 N=4 N=2 8 Media = 9 Media = 9,17 6,67 12,5 7,5 10 Per l’effetto aggregazione… 10 6,7 12,5 Media = 9,17 7,5 10 5 10 10 Media = 8,75 ESEMPIO: Si considerino ora le 2 variabili: X variabile indipendente e 87 40 41 14 49 55 95 55 30 56 44 25 72 55 26 37 51 33 37 38 35 34 67 32 44 88 38 8 17 59 Y variabile dipendente 72 50 21 19 38 58 24 34 24 18 37 54 75 60 46 36 47 40 100 R² = 0.6902 90 80 70 60 Y 50 40 30 20 10 0 0 10 20 30 40 50 X 60 70 80 90 100 85 49 22 48 52 46 29 46 42 23 52 38 58 84 45 8 22 35 30 23 14 29 48 55 SCHEMA DI RAGGRUPPAMENTO 1 91 54,5 34 73,5 57 44 47,5 46,5 61 55 47,5 53,5 35,5 30,5 31 33,5 32 29,5 35 35,5 13 27,5 35,5 18,5 46,5 59 27 42,5 52 35 40 32,5 56,5 49 42 45 100 90 Originalmente R2=0,69 R² = 0.8151 80 70 60 Y 50 40 30 20 10 0 0 10 20 30 40 50 X 60 70 80 90 100 SCHEMA DI RAGGRUPPAMENTO 2 63,5 75,0 63,5 37,5 66,0 29,0 61,0 67,5 67,0 37,5 71,0 26,5 27,5 43,0 31,5 34,5 23,0 21,0 20,0 41,0 35,0 32,5 26,5 21,5 52,0 34,5 42,0 49,5 38,0 45,5 48,0 43,5 49,0 45,0 28,5 51,5 100 Originalmente R2=0,69 90 R² = 0.8899 80 70 raggruppando per colonna R2 = 0,82 60 Y 50 40 30 20 10 0 0 10 20 30 40 X 50 60 70 80 MAUP Le relazioni statistiche tra i caratteri cambiano al cambiare della scala e/o del raggruppamento Esempio: FALLACIA ECOLOGICA La relazione statistica che si osserva al livello aggregato può non essere vera al livello individuale Grande variabilità nel Td, Analoga variabilità nella % Ispanici Gli individui di origine ispanica hanno una più elevata probabilità di essere disoccupati Città (Pop. > 100.000) A B C D E F G H I J K L M N Tasso di disoccupazione % % Ispanici Tasso disoc. Ispanici Tasso disoc. Non Ispanici Regione 9.3 8.5 7.2 7.2 6.8 6.4 6.2 6.0 5.7 5.3 5.1 5.0 4.6 4.6 19.2 17.6 14.5 16.1 14.2 14.5 14.4 12.1 10.4 9.2 6.3 7.5 5.2 4.8 17.2 8.3 6.0 6.8 6.0 6.4 5.8 5.8 6.0 5.4 4.7 4.7 3.5 3.5 9.6 8.5 7.3 7.4 6.9 6.4 6.3 6.1 5.7 5.3 5.1 5.0 4.7 4.7 SW SW W SW NE SW W MW NE W MW NE W MW Esempio 2: comportamenti riproduttivi Sia s una generica area; Y un comportamento; X vettore delle variabili esplicative Quando non si dispone dei dati individuali si utilizzano spregiudicatamente i dati aggregati Ys = f ( Xs ) ® Y = f ( X ) Ma facendo ciò ipotizziamo che: E (Y ) = f ( E ( X )) In generale, però, la relazione osservabile a livello individuale si nota anche a livello aggregato se, nel tempo, le variabili X e Y variano in modo simile in tutte le aree oggetto di studio (CASO DI NORMALITA’ ECOLOGICA). ESEMPIO 3: livello di religiosità e comportamento riproduttivo NORMALITA’ ECOLOGICA Italia 6 4 5 5 4 4 3 2 3 2 1 1 3 0 0 0 2 1 2 3 4 5 0 6 1 2 Correlazione lineare fra le medie 1 6 0 y = 3x - 4 R2 = 1 5 0 1 2 3 4 Livello di religiosità 5 6 4 3 2 1 0 0 3 4 Livello di religiosità Livello di religiosità Numero di figli Numero di figli 5 6 Numero di figli y = 1,5455x - 0,3636 R2 = 0,7506 Francia + Italia Numero di figli Francia 6 1 2 3 4 Livello di religiosità 5 6 5 6 Francia 8 Italia 8 7 7 Francia + Italia 4 3 7 2 6 1 y = 0,3636x + 3,0909 R2 = 0,0182 5 5 4 3 2 1 0 0 1 2 3 4 5 6 7 0 8 0 1 Livello di religiosità 4 2 3 Correlazione lineare fra le medie 2 8 1 7 6 0 0 1 2 3 4 5 Livello di religiosità 6 7 8 5 4 3 y = -4x + 14 R2 = 1 2 1 0 0 1 4 5 Livello di religiosità 3 Numero di figli Numero di figli 8 6 5 Numero di figli Numero di figli 6 2 3 4 5 Livello di religiosità 6 7 8 6 7 8 EFFETTI STRUTTURALI (Emile Durkheim 1858-1917 Comportamenti e caratteristiche proprie degli aggregati di popolazione, indipendenti dai comportamenti e dalle caratteristiche degli individui ma in grado di influenzarli Studio dei suicidi derivati da anomia (mancanza di una direzione morale): - Essere protestanti - Non essere sposati Comunità TASSI DI SUICIDIO Maggioranza protestante Protestanti Individui Cattolici Maggioranza cattolica ESEMPIO: tasso di natalità e % afro-americani Campione di 12 stati, elencati in ordine decrescente per proporzione di afroamericani sul complesso della popolazione (primi 6; ultimi 6) I tassi di natalità sono più elevati dove è più alta la proporzione di afro-americani Tasso di natalità In media, i tassi di nataità degli afro-americani sono più elevati ESISTE L’EFFETTO STRUTTURALE? Comunità Afro-americani Individui Euro americani Forte presenza afro- Scarsa presenza afroamericani americani Massachusset, Missouri (tasso nat. Louisiana, Illinois, Afro-am. Sopra la New Jersey media) Georgia, Illinois, New Missouri, Kentucky, Colorado Jersey, Maryland NON SI PUO’ DIRE!... QUADRO CONFUSO Togliamo Illinois, New jersey, Missouri e Kentucky • I tassi afro-am. Sono più alti degli euro-am. sia negli stati a forte presenza afro-am che in quelli a bassa presenza • I tassi di natalità degli afro-am. Sono più alti negli stati a forte presenza afro-am. ECCETTO COLORADO • I tassi di natalità degli euro-am. Sono più bassi negli stati con bassa presenza Afro-am. ECCETTO MASSACHUSSET • L’effetto strutturale è molto modesto, tenuto conto che le differenze tra i tassi complessivi del 1° e del 2° gruppo sono modeste