Introduction to spatial data analysis and spatial econometrics 2 Scuola di Dottorato in Economia, La Sapienza, 2014/2015 Instructors: Filippo Celata, Hubert Jayet, Federico Martellozzo e Luca Salvati http://www.memotef.uniroma1.it/node/6524 Associazione di dati tabellari (Table join) 2 Aggiungi all’area di lavoro: -lezgis15/basemap/zoneurbanistiche.shp -lezgis15/tablejoin/rm_immig.shp -lezgis15/tablejoin/rm_immig_dt.dbf Individua il field di raccordo Selezioni e queries - Selezioni manuali Sulla tabella Sulla carta Esegui il join di .dbf a .shp: -tasto destro sullo shapefile / Join and relates/Join/Join attributes from a table - Specifica il field per il join nello shapefile e nella tabella -Esegui il join / Verifica Esporta per consolidare: tasto destro SUL LAYER / data / export data Selezioni multiple: sulla tabella tieni premuto CTRL / sulla carta tieni premuto MAIUSCOLO - Selection queries: Select by attributes (=, <, >…) Select by location Select by location: Intersect Are within a distance of Are within Are completely within Contain Completely contain Have their centroid in Share a line segment with Touch the boundary of Are identical to Are crossed by the outline of -Per creare un layer o uno shapefile contenente solo gli elementi selezionati 1. Create new layer from selected features: tasto destro sul layer che contiene la selezione / selection / create layer from selected features 2. Crea uno shapefile con gli elementi selezionati tramite: tasto destro sul layer creato al punto 1. / data / export data (come shapefile) 3. Per esportare come layer autonomo: tasto destro / save as layer file Selezioni -Join spaziale: associa alla tabella del layer i valori della tabella di un altro layer sulla base di una relazione spaziale - Crea layer contenente solo la zona urbanistica “centro storico” = seleziona su carta o su tabella / tasto destro sul layer / Selection / Create layer from selected feature (modifica il nome del layer) - Seleziona tutti le imprese condotte da immigrati con forma giuridica diversa da “impresa individuale” (tipo = “individ”) = Selection / Select by attributes / + inverti la selezione = tasto destro sul layer / Selection / Switch selection (e crea layer contenente i soli elementi selezionati) - Seleziona tutte le imprese condotte da originari del Bangladesh - Seleziona le imprese localizzate nella zona urbanistica (e “source layer”) “centro storico” = Selection / Select by location / “Target layers features are completely within the source layer” + switch selection e crea nuovo layer - Seleziona tutte le imprese con più di 5 addetti (Select by attributes – “add08” > 5) -Seleziona tutte le imprese localizzate entro i 2 km dall’impresa più grande = crea layer impresa più grande / Select by location (“are within a distance”) Analisi di prossimità: = interazione, attrazione, influenza, contagio, interdipendenza, somiglianza, clustering, autocorrelazione spaziale, concentrazione, squilibrio, segregazione, ecc... -Es. Buffering -Associa al layer puntuale delle imprese il nome della zona urbanistica nella quale sono localizzate Il toolbox Analisi di ‘prossimità’: strumenti di calcolo della distanza = measure, near (tutti al più vicino), point distance (tutti a tutti), standard distance (misura di compattezza), buffering, (spatial join..) Buffering Tipi di distanza: - euclidea / manhattan - distanza su un network - cost-weighted: utilizzando un raster di “costo” (es. land use, slope) Esegui un buffer di 500 mt da rm_immig.shp 1) Arctoolbox / Analysis / Proximity / Buffer / input feature: rm_immig.shp, linear unit: 500 mt, dissolve: none 2) Crea uno shapefile dall’output del buffer (Tasto destro sul buffer / Data / Export data) Distanza (geografica, funzionale, economica..) Euclidea vs. Manhattan vs. Network based Distanza tra poligoni: centroid-to-centroid (poligoni regolari e simili), border-to-border (poligoni irregolari) Distanza e interazione spaziale: al crescere della distanza le opportunità di incontro e di scambio diminuiscono drasticamente (‘tirannia della distanza’, ..e globalizzazione) ‘Distance decay function’: le opportunità di interazione diminuiscono in misura più che proporzionale all’aumentare della distanza. Inverse distance decay: Exponential distance decay: b > 1 = per es. 2 (le opportunità di interazione sono inversamente proporzionali al quadrato della distanza) Prossimità, interazione e gravitazione Distanza + opportunità di interazione (distance decay) + ‘massa’: l’interazione tra due luoghi è funzione della ‘massa’ di opportunità di interazione di ciascuno di essi Massa = P (popolazione, oppure servizi, risorse, attività, ecc.) Gravitazione = opportunità di interazione = forza di attrazione (es. pendolarismo) = flussi di visitatori/clienti = scambi commerciali (l’interscambio si riduce dello 0,5‐0,9% se la distanza aumenta dell’1%) = diffusione di innovazioni = probabilità di contagio = ecc. + complementarità (l’offerta nella località X deve essere diversa dall’offerta di Y) e ‘intervening opportunity’ (assenza offerte alternative) Modelli di gravitazione di interazione spaziale (semplici) Pi e Pj : Importanza o peso delle località di origine e destinazione dij : distanza tra le località k : costante pari alla probabilità dell’evento/movimento β (beta) : parametro non lineare di frizione della distanza, e.g. qualità trasporti λ (lambda) : potenzialità di generare movimenti (emissività). Per es. reddito α (alpha) : potenziale di attrattività. Per es. specializzazione commerciale Prossimità, gravitazione, accessibilità (potenziale) = 1/distanza tra elementi geografici (impedence function) * "massa" di opportunità di interazione (popolazione, reddito, activity function) α > 1 per l’esistenza di effetti di agglomerazione (le località più grandi pesano proporz. di più Prossimità, interazione e auto‐correlazione spaziale Prossimità, interazione e (spatial) clustering Prima legge della geografia (Tobler) = tutto è correlato con tutto, ma le cose vicine sono più correlate delle cose lontane Il metodo di identificazione dell’Atlas of Economic Clusters in London (GaWC): “A clustered firm is defined as one whose average distance to its 10 nearest neighbours (in its sector) is less than 100 metres” SPATIAL AUTO‐CORRELATION: grado di similitudine tra i caratteri di un elemento geografico e i caratteri degli elementi a lui più vicini, rispetto ad ipotesi di distribuzione perfettamente casuale (CSR) Le “ethnic enclaves” e la concentrazione spaziale (clustering) delle imprese condotte da immigrati Esercizio: individua le aree con almeno 10 imprese condotte da immigrati in un raggio di 500 mt: Inputs: -> Shape puntuale delle imprese condotte da immigrati -> Shape poligoniale dei buffer Quanti punti sono compresi in ogni poligono? -> Attribuire ad ogni poligono il numero di punti in esso compreso / Associare alla tabella del buffer una colonna contenente la somma dei punti in esso compresi = Spatial join / “Each polygon will be given a summary of the numeric attributes” del layer puntuale (colonna: “Count”) Quali punti soddisfano la condizione richiesta? -> Selezionare i punti localizzati in poligoni nei quali sono compresi almeno 10 punti Quanti sono, dove sono, cosa includono, perché.. Esercizio: individua le aree con almeno 10 imprese condotte da immigrati in un raggio di 500 mt: 1) Esegui un Join spaziale per attribuire al buffer il numero di punti localizzati all’interno: Tasto destro sul buffer / Join and relates / Join / Join data from another layer base on spatial location / “Each polygon will be given a summary…” 2) Nello shapefile di output: seleziona i poligoni con “Count” > 10 e crea layer con i poligoni selezionati 3) Seleziona i punti compresi nei poligoni di output del punto 2: Selection / Select by location / Target layer: rm_immig.shp / Source layer: poligoni di output del punto 2 / Spatial selection method: “Target layer features are within the source layer” / Esegui 4) Crea layer con punti selezionati (tasto destro su layer / create layer from selected features) -> Crea shapefile da selezione (Export data) Attrazione (o contagio) “apparente”: concentrazione dovuta a cause esterne o casuali vs. Attrazione (o contagio) “reale”: concentrazione dovuta ad attrazione. Sistemi di coordinate e proiezioni Come riportare una superficie (quasi) sferica su una superficie a 2D con il minimo di distorsione? Il problema dei sistemi di coordinate Proiezioni isogoniche -Projected coordinate systems vs. geographic coordinate systems Mantengono inalterati gli angoli del reticolo carografico -Sistemi di coordinate equidistanti / equivalenti / isogonici (/conformi) -Il sistema di coordinate del dataframe vs. il sistema di coordinate dei singoli layer La regola “aurea”: sistema di coordinate del dataframe = sistema di coordinate dei singoli shapefile = sistema di coordinate della carta di output - Proiezione di Mercatore: Proiezione cilindrica e conforme: rappresenta gli angoli e le forme in maniera corretta. La distanza varia con la latitudine. Al diminuire della scala (grandi aree) i rapporti tra i valori di superficie sono molto distorti (Googlemap). Adatta per la navigazione (bussola): linee rette sulla carta rappresentano la rotta effettiva da seguire (non la più corta…) Proiezionie equivalenti Mantengono inalterato il rapporto tra le aree Proiezione di Lambert o (migliore) proiezioni Albers equalarea conic con due paralleli standard. Quasi conforme. Proiezioni cylindrical equal-area rappresentano correttamente le aree, ma distorcono gli angoli e conseguentemente (su grandi aree) anche la forma. Buone per carte continentali (es. Europa), carte tematiche e per analisi che implicano il calcolo di aree. Proiezioni equidistanti Mantengono inalterato il rapporto tra le distanze (Polar azimuthal equal-area projection): mantiene inalterati i rapporti tra le aree. Le direzioni sono corrette solo a partire dal centro. Il pattern di distorsione è radiale. Le distanze diminuiscono allontanandosi dal centro. Adatta per carte di continenti o regioni che hanno forma rotonda (Asia, oceano pacifico). Proiezione Universal Transverse Mercator (UTM) 60 fusi (nord e sud) Proiezione Plate Carrée: proiezione equidistant cylindrical. Sia la forma che le aree sono abbastanza ben rappresentate (tranne che ai poli). E’ equidistante solo lungo i meridiani, nord-sud (o alternativamente sui paralleli). Buona per carte tematiche e per analisi che implicano il calcolo di distanze. Proiezioni cilindrica conforme e equidistante: per carte topografiche e a grande scala (piccole aree): United Nations Cartography Committee, 1952. Settare il sistemi di coordinate - Per impostare il sistema di coordinate del dataframe: layers / properties / coordinate system - Per cambiare il sistema di coordinate dello shapefile: data / export data / same coordinate system as the data frame Editing: per modificare la geometria dei geodati -tasto destro sul layer che si vuole editare / start editing -Crea nuovi punti nel layer rm_immig.shp: seleziona il template nella finestra a destra / clicca sulla carta per creare nuovi punti / verifica e popola tabella attributi Editing / es. reshape existing feature Aggiungere campi (colonne) alle tabelle Formati delle colonne: String (testo) Integer (es. 3) Double (3,21) Ecc. Field calculator Calculate geometry Area Perimeter Centroid Lenght Ecc. - Calcola l’area delle zone urbanistiche in Km2: add field (name: “areaKM”; type: double; precision: 12, scale: 2) / tasto destro sul field / calculate geometry (area in sq km) - Calcola densità della popolazione straniera per zona urbanistica: 1) associa a zoneurbanistiche.shp gli attributi della tabella lezgis15/tablejoin/ZUR_dt.dbf; 2) aggiungi colonna: add field (name “dens_str”; type: double, precis.: 12, scale: 2); 3) calcola indicatore: tasto destro sul nuovo field / field calculator: “stranieri/areaKM”) Geprocessing Merge Dissolve Fai: utilizzando il layer delle zone urbanistiche, si crei uno shapefile dei Municipi di Roma, tramite dissolve field: “Municipi” Altri… Split Modificare la tipologia dei geodati (punti <-> poligoni <-> linee) 2) Per passare da punti a poligoni: creare POLIGONI DI THIESSEN (triangulated irregular network (TIN) that meets the Delaunay criterion) 1) Per passare da poligoni a punti (pesati/marcati): CENTROIDE DEI POLIGONI (problemi nel caso di aree fortemente irregolari). - Sul layer poligoniale (zoneurbanistiche), nella tabella degli attributi: Table properties/Add field (colonna “X”, colonna “Y”; formato numerico: “double”, precision: 12 / scale: 4). -Arctoolbox/Analysis/Proximity/Create Thiessen Polygons - Nelle colonne X, Y: tasto destro sull’intestazione / “calculate geometry” per stimare i valori di latitudine e longitudine dei centroidi dei poligoni / esporta la tabella in formato .dbf (*) - Crea un layer puntuale importando la tabella con il Tool Add x,y Data. - Esporta il layer puntuale per creare lo shapefile definitivo - Negli “environments”: setta il “processing extent” FISHNET: crea un poligoniale regolare rettangolare FISHNET (2) Specifico ampiezza (in map units) / numero di righe/colonne = 0 (o viceversa) Creare layer lineare da punti di origine e destinazione (pointto-point network) -Points to Line (1 to 1) - (Spider) (1 to All) All to All: EC calculate (and draw) / ET Geo Wizard / etc.