“Teoria e metodi della ricerca sociale e organizzativa” Corso di Laurea in Scienze dell’Organizzazione Facoltà di Sociologia Università Milano-Bicocca 2009 Simone Sarti 1 LA FALLACIA ECOLOGICA Non è corretto mettere in relazione variabili misurate ad un diverso grado di aggregazione, o meglio è scorretto inferire da una relazione tra dati aggregati correlazioni a livello individuale. Tasso std mortalità M ITALIA 126.94 2003 <= 150 <= 140 <= 130 <= 120 Vedendo questo grafico e sapendo che le regioni del nord hanno un maggiore benessere socio-economico (correlato ad un’istruzione media più alta) possiamo ipotizzare che gli anni di scolarità siano associati ad una salute peggiore ? <= 110 No dati Min = 100 3 ASCOLI_m X SALUTE_M Y Campania 8.7 4.32 Puglia 8.4 4.29 Sicilia 8.2 4.22 Trentino 8.7 4.21 Calabria 8.3 4.17 Basilicata 8.3 4.16 Molise 8.1 4.16 Abruzzo 8.7 4.15 Lazio 9.1 4.14 Toscana 8.7 4.14 Marche 8.6 4.12 Sardegna 8.3 4.11 Umbria 9.0 4.11 Veneto 8.7 4.11 Liguria 9.1 4.08 Lombardia 8.9 4.08 Piemonte 8.6 4.08 Friuli Venezia Giulia 8.9 4.04 Emilia Romagna 8.8 4.03 Correlazione fra anni di scolarità (0-21) e salute* (1-5) con dati aggregati r = - 0,41 byx = -0,1 Affidandoci ai soli dati aggregati affermeremmo che la relazione tra salute e scolarità è negativa. Cioè all’aumentare dell’istruzione la salute diminuisce. In media per ogni anno di istruzione in più la salute diminuisce di 0,1 punti. * 1=salute cattiva; 5=salute buona TUTTAVIA, potendo disporre di dati individuali, possiamo controllare che la “vera” relazione a livello individuale delle due variabili è diversa. In media ad ogni anno di scolarità in più la salute aumenta di 0,05 punti. Correlazione fra anni di scolarità e salute con dati individuali r = + 0,22 byx = + 0,05 5 Il livello di aggregazione interviene sulla relazione tra variabili a livello individuale esercitando un effetto spurio. Se usiamo dati ecologici il livello di aggregazione può divenire la “reale causa” dell’effetto inferito a livello individuale. Nell’esempio, le regioni del nord, hanno salute peggiore e più alta istruzione (in media), ma il dato aggregato inganna, poiché a livello individuale l’istruzione è invece correlata con una salute migliore. Il dato aggregato non discerne tra coloro, all’interno della stessa regione, che hanno istruzione bassa e salute bassa, e istruzione alta e salute alta. Considerandoli tutti insieme, nella media regionale, perde di vista la relazione. Relazioni a livello ecologico, non adatte all’inferenza 190 NO R= 0.67 170 PIL eq. 2006 (media 100) 150 CH NL IE SE 130 DE UK BE ES 110 DK FR IT GR 90 PT 70 50 18 19 20 21 22 23 24 25 26 27 Percentuali di giovani 2005 7 28 Relazioni a livello ecologico, non adatte all’inferenza 300 DE R = 0.83 250 n. Brevetti 2003-2005 SE NL 200 DK 150 FR BE 100 NO IT 50 ES UK IE GR PT 0 0.0 0.5 1.0 1.5 2.0 2.5 % PIL in ricerca e sviluppo 2000-2002 8