Corso di POPOLAZIONE TERRITORIO E SOCIETA’ 1 AA 2013-2014 LEZIONE 5 Misure di diversità e segregazione Date: P: P1 + P2+ P3 +…+Pn R: Misure della diversità 1) Entropia 2) Interazione Misure della segregazione Misure di diversità (indici aspaziali) BASSO ALTO PREDOMINANZA EQUILIBRIO 1. ENTROPIA P: P1 + P2+ P3 +…+Pn P P H k ln k P k 1 P n ln n 0 Pk 0 k 1,..., n 1 P Pk 1 k n P Pk P n Pk 1 P n k 1,..., n n Pk 1 Pk 1 H ln ln P n k 1 P k 1 n 1 1 n ln (ln 1 ln n) ln n n n n P P P P H k ln k 0 n ln n 0 1 0 0 P P P k 1 P n H* H ln n 0 H * 1 Indice normalizzato ESEMPIO Gruppo 1 Gruppo 2 Gruppo 3 Sezione 1 60% 30% 10% Sezione 2 65% 20% 15% Domanda: quale delle due sezioni ha un maggior grado di diversità rispetto alla composizione della popolazione in gruppi? H*1= [(-0,6ln0,6)+(-0,3ln0,3)+(-0,1ln0,1)]/ln3 = 0,817 H*2= [(-0,65ln0,65)+(-0,2ln0,2)+(-0,15ln0,15)]/ln3 = 0,887 Si può notare come l’indice di Entropia esalti la composizione più equilibrata rispetto ai due gruppi di minoranza (30-10=20 per la sez 1 mentre 20-15=5 nella sez.2), mettendo in secondo piano il relativo maggiore disequilibrio tra le minoranze e la maggioranza. Complessivamente dunque, per l’Entropia la sezione 2 è più equilibrata della 1. 2. INTERAZIONE Simpson P P k k k 1 P ; ' k k P PP 1 2 dove Pk/P è la proporzione di popolazione appartenente al k-esimo sottogruppo. e ’ , rispettivamente, per popolazioni finite e infinite (per P e Pk molto grandi i due indici convergono). P S 1 k k 1 P n 2 0 Pk 0 k 1,..., n 1 P Pk 1 k n P n 1 n Pk 1 P n Pk P n S max 1 n 1 1 1 n 1 n n n 2 S min 1 n 1 0 12 1 1 0 S* S S max n S n 1 k 1,..., n ESEMPIO Sezione 1 60% 30% 10% Gruppo 1 Gruppo 2 Gruppo 3 Sezione 2 65% 20% 15% Domanda: quale delle due sezioni ha un maggior grado di diversità rispetto alla composizione della popolazione in gruppi? 32 0,81 3 0,15 0,77 2 S1* 1 0,6 0,3 0,1 2 2 2 S 2* 1 0,65 0,2 2 2 2 In questo caso l’indice enfatizza il maggiore equilibrio tra il gruppo di maggioranza e le minoranze (60-30=30; 60-10=50 per la sez 1 mentre (65-20=45 e 65-15=50 per la sez. 2). Pertanto, l’Indice di interazione è maggiore per la sezione 1. In conclusione, i risultati dei due indici non sono in contraddizione; esprimono cose diverse ESEMPIO Gruppo A B C D Gruppo A B C D Comunità X Pk P ln 2000 8000 4000 8000 22000 Comunità Y Pk P 0,09 0,36 0,18 0,36 Pk P 0,32 0,23 0,18 0,27 Pk P Pk P -1,139 -1,470 -1,715 -1,309 1,262 X 0,9103 Pk H Pk 1 , 3863 * H ; H ln ln n P Y 1,364 0,9839 k 1 P 1,3863 0,700 X 0,9333 n Pk 0,750 * S S; S 1 0,740 n 1 k 1 P Y 0,9747 0,750 2 Pk P ln k P P 0,008 0,130 0,032 0,130 0,300 n n 2 -2,408 -1,022 -1,715 -1,022 ln 7000 5000 4000 6000 22000 Pk P 2 -0,217 -0,368 -0,309 -0,368 -1,262 Pk P ln k P P 0,102 0,053 0,032 0,073 0,260 -0,364 -0,338 -0,309 -0,353 -1,364 APPLICAZIONE INDICI DI DIVERSITA’ AL BUSINESS Gli indici di diversità vengono impiegati per valutare il grado di omogeneità nella composizione delle aree su cui vengono impostate campagne promozionali. Il marketing individua il sottogruppo di popolazione più interessato all’acquisto di un certo prodotto (utilizzo di un certo servizio). Le campagne promozionali sono tanto più efficaci quanto più sono svolte in aree in cui il sottogruppo di riferimento è dominante. ESEMPIO Promozione di prodotti finanziari per famiglie di livello medio alto: due quartieri A e B classificate come “PELLICCE E SUV =famiglie medio-alto livello” nelle categorie di marketing. A sez. 1021 Popol. 2000 sez. 1022 sez. 1023 sez. 1024 8000 4000 8000 22000 B sez. 1382 sez. 1383 Popol. 7000 5000 sez. 1384 sez. 1385 4000 6000 22000 Classificazione di Marketing Blue Chip Blues Città e camici Pellicce e SUV Pellicce e SUV Classificazione di Marketing Blue Chip Blues Pellicce e SUV Città e camici Pellicce e SUV Descrizione Imprenditori, classe medio alta, famiglie con figli Quadri intermedi, famiglie giovani, vivono in aree extraurbane Dirigenti e liberi professionisti, quartieri alti Dirigenti e liberi professionisti, quartieri alti Descrizione Imprenditori, classe medio alta, famiglie con figli Dirigenti e liberi professionisti, quartieri alti Quadri intermedi, famiglie giovani, vivono in aree extraurbane Dirigenti e liberi professionisti, quartieri alti Analizza la composizione Calcolo di H A Blue Chip Blues Città e camici Pellicce e SUV Pk/P 0,091 0,364 0,545 ln(Pk/P) -2,398 -1,012 -0,606 H Normalizzato: H/ln n -0,218 -0,368 -0,331 0,916 0,834 B Blue Chip Blues Città e camici Pellicce e SUV Pk/P 0,318 0,182 0,500 ln(Pk/P) -1,145 -1,705 -0,693 H Normalizzato: H/ln n -0,364 -0,310 -0,347 1,021 0,929 La località B è più omogenea, quindi sarebbe la meno idonea; inoltre la categoria “Pellicce e SUV”, che è la categoria target, è più concentrata in A che in B. Tuttavia, anche la categoria “Blue Chip Blues” è un potenziale cliente e nella località A, invece, è quasi assente. Pertanto, in questo caso, benché con un maggior grado di diversità, la località preferenziale dove impostare la campagna promozionale è la B. Misure di diversità e segregazione Date: P: P1 + P2+ P3 +…+Pn R: Misure della diversità Misure della segregazione 1) Disparità 2) Esposizione 3) Cocentrazione 4) Centralizzazione 5) Raggruppamento MISURARE LA SEGREGAZIONE Gli indici di segregazione esprimono la misura della dispersione di sottogruppi di una popolazione in un insieme di sub-aree di una regione P: P1 + P2+ P3 +…+Pn R: Cosa deve avere un indice di segregazione... •non deve essere distorto dalla dimensione relativa del gruppo di minoranza nel complesso della popolazione; •non deve dipendere dalla dimensione complessiva della popolazione e dell’area; •non deve dipendere dal numero di sub-aree in cui è divisa l’area complessiva; •deve essere standardizzabile, in modo da variare tra 0 e 1, dove 0 indica la situazione in cui in ciascuna sub-area il rapporto tra i gruppi è lo stesso che si osserva per il complesso della regione R e 1 corrisponde alla situazione in cui i sottogruppi risultano nettamente separati nelle sub-aree di R; •l’indice deve risentire dello spostamento di una o più unità da un’area all’altra; •l’indice deve essere invariante alle trasformazioni di scala nella composizione: o un aumento nel livello assoluto di un particolare gruppo in tutte le sub-aree o un aumento del livello assoluto di tutti i gruppi in una particolare sub-area. DIMENSIONI DEGLI INDICI DI SEGREGAZIONE DISPARITA’ Spiegano la distribuzione differenziale della popolazione nelle sub-aree ESPOSIZIONE Misurano il potenziale contatto tra membri del medesimo gruppo o di gruppi diversi CONCENTRAZIONE Misurano l’ammontare relativo di spazio fisico occupato CENTRALIZZAZIONE Misurano il gado in cui un gruppo è collocato vicino al centro di un’area urbana RAGGRUPPAMENTO Misurano il grado in cui i membri del gruppo di minoranza vivono in aree contigue INDICI DI DISPARITA’ Forniscono una misura del grado di distribuzione spaziale dei sottogruppi della popolazione, verso la concentrazione o la dispersione 1) INDICE DI DISSIMILARITA’ Applicabile a 2 sottogruppi Dati P = Ph + Pg R = A1 + A2 +...+ Ar 1 r Pig Pih D= å 2 i=1 Pg Ph sottogruppi della popolazione sub-aree g h Totale 1 P1 2 P2 .. i Pig Pih Pi … R Pg Ph P 0 Segregazione minima Pig Pg Pig P = Þ = ih Pih Ph Pg Ph 1 r Pig Pih D= å =0 2 i=1 Pg Ph D 1 Segregazione massima ìP ï ig = 0 1 £ a £ r ï Pg í ï Pih ï P =0 r-a î h Tutta la pop. appartiene a h Tutta la pop. appartiene a g 1 r Pig Pih D = ×å = 2 i=1 Pg Ph é Pig P 1 ê = × å - 0 + å 0 - ih 2 êëiÎRg Pg Ph iÎRh 1 æç Pg Ph ö÷ = ×ç + ÷ =1 2 è Pg Ph ø ù ú= úû ESEMPIO In quale delle due aree metropolitane c’è più segregazione? DR = 0,4 = 0,2 2 DP = Indica la proporzione di popolazione che dovrebbe 0,5 = 0,25 riallocarsi per ottenere un’equa distribuzione dei 2 sottogruppi della popolazione nei quartieri Limiti dell’indice di dissimilarità: un’applicazione alla pianificazione dei bacini scolastici DA = (1/2)(|0,375-0,250| + |0,375-0,250| + |0,125-0,250| + |0,125-0,250|) = 0,25 DB = (1/2)(|0,500-0,250| + |0,250-0,250| + |0,250-0,250| + |0,000-0,250|) = 0,25 I risultati dell’indice dicono che I due piani sono equivalenti quanto a segreazione prodotta ma EVIDENTEMENTE Il piano B è più segregato in quanto nel bacino 4 non ci sono studenti ispanici Inoltre, Secondo le indicazioni dell’indice per entrambi I piani ¼ della popolazione dovrebbe spostarsi per ottenere equaripartizione dei sottogruppi ma l’indice non fornisce alcuna indicazione su COME operare questo spostamento ad es: Bacini scolastici 1 2 3 4 Totale Piano A Ispanici 750 750 250 250 2000 Anglo 2000 2000 2000 2000 8000 Entrambe le ipotesi rispondono alle richieste dell’indice ma I risultati non sono ugualmente auspicabili (nell’ipotesi 2 I bacini 1 e 2 risulterebbero sovraffollati) INOLTRE: Il valore dell’indice dipende dal numero di sub-aree in cui è suddivisa l’area e dalla loro conformazione Non consente il confronto fra un numero di sottogruppi maggiore di 2 Non gode della proprietà di invarianza alle trasformazioni di scala (secondo questa proprietà l’indice non dovrebbe risentire di un aumento nel livello assoluto di un particolare gruppo nelle sub-aree o di un aumento del livello assoluto di tutti i gruppi in una sub-area) ESEMPIO: si vuole misurare il livello di segregazione delle famiglie povere in quattro scuole di una città Indicatore di povertà = numero studenti aventi diritto al pasto gratuito 1 r Pig Pih D= å = 0,267 2 i=1 Pg Ph Supponiamo che il numero di studenti poveri raddoppi in tutte le scuole (operiamo cioè una trasformazione di scala) 1 r Pig Pih D= å = 0,267 2 i=1 Pg Ph Correttamente, il risultato di D non cambia! Si noti che la proporzione di studenti poveri, però, è cambiata! Se invece si volesse raddoppiare la proporzione (e non il numero assoluto) di studenti poveri nelle scuole, lasciando invariato il totale di studenti 1 r Pig Pih D= å = 0,4 L’indice risulta aumentato!!! 2 i=1 Pg Ph La proporzione di studenti poveri nelle scuole è sempre uguale Ma il livello di segregazione intercettato dall’indice è aumentato!!! L’indice di Dissimilarità gode della proprietà DEBOLE di invarianza alle trasformazioni di scala in quanto intercetta un aumento della segregazione quando aumenta il livello generale della povertà attraverso l’aumento della proporzione di un sottogruppo. Alternativa Pig Pi× 1 S= å 2 i Pg P P D=S× Ph Indice di segregazione: gode della propretà di invarianza FORTE Infatti: Pig Pi× P 1 Pig Pig + Pih P P 1 S× = å - × = å × = Ph 2 i Pg P Ph 2 i Pg P Ph ( ) ( ) Pig P - Pg × Pig + Pih P 1 Pig P - Pg - Pg Pih P 1 = å × = å × = 2 i Pg P Ph 2 i Pg P Ph Pig Ph - Pg Pih P 1 Pig Ph P Pg Pih P 1 = å × = å × × = 2 i Pg P Ph 2 i Pg P Ph Pg P Ph Pig Pih 1 = å =D 2 i Pg Ph 2) INDICE DI GINI Applicabile a 2 sottogruppi Dati P = Ph + Pg R = A1 + A2 +...+ Ar sottogruppi della popolazione sub-aree g h 1 … Pig Pih i … Pjg Pjh j … Pg Ph R r r Pih Pjh 1 G Pi Pj P P Pi Pj 2 P 2 h 1 h i 1 j 1 P P Totale Pi Pj P É calcolato in corrispondenza di uno dei 2 sottogruppi permette di superare il limite riscontrato per l’indice di Dissimilarità circa l’incapacità di fornire indicazioni sulla direzione degli interventi ESEMPIO Piano A Bacini scolastici Ispanici 750 750 250 250 2000 1 2 3 4 Totale Piano B Anglo 2000 2000 2000 2000 8000 Ispanici 1000 500 500 0 2000 Anglo 2000 2000 2000 2000 8000 r r Pih Pjh 1 G= P P åå i j P - P æ ö æ ö P P i j 2P 2 ç h ÷ × ç1- h ÷ i=1 j=1 èPø è Pø 1 2 3 4 PIANO A I (h) A (g) 750 2000 750 2000 250 2000 250 2000 2000 8000 Pi 2750 2750 2250 2250 Pih/pi Pjh/pj 0,2727 0,2727 0,2727 0,2727 0,1111 0,1111 0,1111 0,1111 0,2 0,2 Pj 2750 Pi 2750 2750 2250 2250 Pih/Pi 0,2727 0,2727 0,1111 0,1111 0,2727 0 0 999900 999900 2750 2250 2250 Pjh/Pj 0,2727 0,1111 0,1111 Totali 0 999900 999900 1999800 0 999900 999900 1999800 999900 0 0 1999800 999900 0 0 1999800 Denominatore G 7999200 32000000 0,249975 Piano A Bacini scolastici Ispanici 750 750 250 250 2000 1 2 3 4 Totale Piano B Anglo 2000 2000 2000 2000 8000 Ispanici 1000 500 500 0 2000 Anglo 2000 2000 2000 2000 8000 r r Pih Pjh 1 G= P P åå i j P - P æ ö æ ö P P i j 2P 2 ç h ÷ × ç1- h ÷ i=1 j=1 èPø è Pø PIANO B I (h) A (g) Pi PiI/pi Pjh/pj 1 1000 2000 3000 0,3333 0,3333 2 500 2000 2500 0,2000 0,2000 3 500 2000 2500 0,2000 0,2000 4 0 2000 2000 0,0000 0,0000 2000 8000 0,2 0,2 Pj 3000 2500 2500 2000 Pjh/Pj Pi Pih/Pi 0,3333 3000 0,3333 2500 0,2 0,2 0 0 999750 999750 1999800 3999300 0,2 999750 0 0 1000000 1999750 2500 0,2 999750 0 0 1000000 1999750 2000 0 1999800 1000000 1000000 0 3999800 11998600 A differenza dell’indice di dissimilarità, l’indice di Gini mostra chiaramente che il piano B conduce ad una maggiore segregazione 32000000 0,3749563 Interpretazione: nel piano B il 37% della popolazione del gruppo h dovrebbe spostarsi per ottenere equadistribuzione 0 G 1 Segregazione massima Segregazione minima Pih Pjh Ph costante Pi Pj P i sottogruppi sono “isolati” nelle diverse sub-aree: alcune contengono solo soggetti di h altre solo soggetti di g r r Pih Pjh 1 G P P i j Ph Pi Pj 2 Ph i 1 j 1 2 P 1 P P Pih Pjh 0, i, j G 0 Pi Pj Coppie i,j di sub-aree di soli individui h: Pih Pjh Ph Componente pari a 0 Pi Pj P Coppie i,j di sub-aree di soli individui g: Pih Pjh 0 Componente pari a 0 Pi Pj Coppie i,j in cui la i-esima è di h e la j-esima è di g (quindi qui h=0): P P i i j j P ih 0 Ph Pg Pi Coppie i,j in cui la i-esima è di g (quindih=0) e la j-esima è di h: P P 0 i i j j G 00 P ih Ph Pg Pi Ph Pg P Pg 2P 2 h P P Pg Ph P Pg 2P 2 h P P 2 Ph Pg P Pg 2P 2 h P P 1 ESEMPIO (massima segregazione) 5 solo G 1 solo G 1 2 3 4 5 PiH/Pi 0 1 0 1 0 4 solo H 3 solo G 2 solo H PiG/Pi 1 0 1 0 1 r r Pih Pjh 1 G P P i j Ph Pi Pj 2 Ph i 1 j 1 2 P 1 P P Le possibili coppie 1 2 3 4 5 1 0 HG GG HG GG HH = GG = 0 1 2 3 4 5 G 00 1 1 0 1 0 2 1 1 0 1 Ph Pg 2P 2 Ph Pg P P 3 0 1 1 0 Pg Ph 2P 2 Ph Pg P P 4 1 0 1 1 HG = GH = 1 5 0 1 0 1 - 2 Ph Pg 2P 2 Ph Pg P P 2 23 2 23 2 GH 0 GH HH GH 3 GG HG 0 HG GG 4 GH HH GH 0 GH 5 GG HG GG HG 0 ESEMPIO (massima segregazione) A:Ph=1 B:Ph=3 C:Pg=2 D:Pg=2 h 1 3 0 0 A B C D g 0 0 2 2 |Pih/Pi - Pjh/Pj| A B C D Pj A 0 1 1 1 B 0 1 1 3 C 1 1 0 2 D 1 1 0 2 Pi 1 3 2 2 PiPj|Pih/Pi - Pjh/Pj| A B C D A 0 2 2 B 0 6 6 C 2 6 0 D 2 6 0 - SOMMA 4 12 8 8 32 r r Pih Pjh 1 G P P i j Ph Pi Pj 2 Ph i 1 j 1 2 P 1 P P 1 4 4 2 8 8 8 2 32 1 Pi=Pj 1 3 2 2 Pih/Pi 1 1 0 0 3) ENTROPIA DELLA SEGREGAZIONE (INDICE DI THEIL) Applicabile a un numero superiore a 2 sottogruppi sub-aree 1 2 … i … R 1° sottogruppi di popolazione 2° … k° H* … Totale Pik Pi Pk P (H H ' ) H P P H k ln k P k 1 P n Pi n Pik P H ' ln ik Pi i 1 P k 1 Pi r Pi n Pik P H ' ln ik Pi i 1 P k 1 Pi P P H k ln k P k 1 P n 0 Segregazione minima Pik Pk Pi P H* 1 Segregazione massima Pik 0 oppure 1 Pi i Pi n Pk P H ' ln k P i 1 P k 1 P r r P H ' i i 1 P Al variare del k-esimo gruppo n 0 ln 0 ..... 1 ln 1 0 k 1 =0 P P P k ln k i H P i 1 P k 1 P n H* r H H' 0 H r H* H 0 1 H =0 ESEMPIO Piano A Bacini scolastici 1 2 3 4 Totale Ispanici 750 750 250 250 2000 Piano B Anglo 2000 2000 2000 2000 8000 Ispanici 1000 500 500 0 2000 Anglo 2000 2000 2000 2000 8000 2000 8000 8000 2000 H ln ln 0,5004 10000 10000 10000 10000 2750 750 750 2000 2000 2750 750 750 2000 2000 H ' ( A) ln ln ln ln 2750 2750 2750 10000 2750 2750 2750 2750 10000 2750 2250 250 250 2000 2000 2250 250 250 2000 2000 ln ln ln ln 0,4792 10000 2250 2250 2250 2250 10000 2250 2250 2250 2250 3000 1000 1000 2000 2000 2500 500 500 2000 2000 H ' ( B) ln ln ln ln 3000 3000 3000 10000 2500 2500 2500 2500 10000 3000 H * A 0,5004 0,4792 0,0423 0,5004 2500 500 500 2000 2000 2000 2000 2000 ln ln ln 0,44114 10000 2500 2500 2500 2500 10000 2000 2000 H * B 0,5004 0,44114 0,118 0,5004 ESEMPIO Stato del Rhode Island: numero di famiglie (con capofamiglia 15-64 anni) per tipologia – Dati per le 5 contee - Anno 2000 Quale contea ha il massimo livello di segregazione rispetto alle famiglie? Famiglie Coppie coniugate Rhode Island 158.933 Bristol Kent Newport Providence Washington 8.628 28.914 14.275 85.605 21.511 Altri nuclei 58.382 1.958 7.866 3.870 39.586 5.102 Senza nuclei 94.889 3.432 14.382 9.023 57.685 10.367 312.204 14.018 51.162 27.168 182.876 36.980 Totale Fonte: US Census Bureau, 2001 P P H k ln k P k 1 P n P n P P H ' i ik ln ik Pi i 1 P k 1 Pi r H* Famiglie Rhode Island Coppie coniugate Altri nuclei Senza nuclei Totale Famiglie Coppie coniugate Altri nuclei Senza nuclei Somma Pi/P H’=1,012=-somma 158.933 58.382 94.889 312.204 Bristol -0,299 -0,275 -0,344 -0,918 0,045 -0,041 Kent -0,323 -0,288 -0,357 -0,968 0,164 -0,159 Pk/P (1) 0,509 0,187 0,304 Ln(Pk/P) (2) -0,675 -1,677 -1,191 Newport Providence -0,338 -0,355 -0,277 -0,331 -0,366 -0,364 -0,981 -1,050 0,087 0,586 -0,085 -0,615 (1)*(2) -0,344 -0,314 -0,362 H=1,020 Washington -0,315 -0,273 -0,356 -0,944 0,118 -0,112 H H ' 1,020 1,012 0,0078 NON C’E’ SEGREGAZIONE PER LE FAMIGLIE DEL RHODE ISLAND H 1,020