“Teoria e metodi della ricerca sociale e organizzativa”
Corso di Laurea in Scienze dell’Organizzazione
Facoltà di Sociologia
Università Milano-Bicocca
2009
Simone Sarti
1
LA FALLACIA ECOLOGICA
Non è corretto mettere in relazione
variabili misurate ad un diverso grado
di aggregazione, o meglio è scorretto
inferire da una relazione tra dati
aggregati correlazioni a livello
individuale.
Tasso std mortalità M
ITALIA
126.94
2003
<= 150
<= 140
<= 130
<= 120
Vedendo questo grafico
e sapendo che le regioni
del nord hanno un
maggiore benessere
socio-economico
(correlato ad
un’istruzione media più
alta) possiamo ipotizzare
che gli anni di scolarità
siano associati ad una
salute peggiore
?
<= 110
No dati
Min = 100
3
ASCOLI_m
X
SALUTE_M
Y
Campania
8.7
4.32
Puglia
8.4
4.29
Sicilia
8.2
4.22
Trentino
8.7
4.21
Calabria
8.3
4.17
Basilicata
8.3
4.16
Molise
8.1
4.16
Abruzzo
8.7
4.15
Lazio
9.1
4.14
Toscana
8.7
4.14
Marche
8.6
4.12
Sardegna
8.3
4.11
Umbria
9.0
4.11
Veneto
8.7
4.11
Liguria
9.1
4.08
Lombardia
8.9
4.08
Piemonte
8.6
4.08
Friuli Venezia Giulia
8.9
4.04
Emilia Romagna
8.8
4.03
Correlazione fra anni di
scolarità (0-21) e salute*
(1-5) con dati aggregati
r = - 0,41
byx = -0,1
Affidandoci ai soli dati
aggregati affermeremmo
che la relazione tra salute e
scolarità è negativa.
Cioè all’aumentare
dell’istruzione la salute
diminuisce.
In media per ogni anno di
istruzione in più la salute
diminuisce di 0,1 punti.
* 1=salute cattiva; 5=salute buona
TUTTAVIA, potendo
disporre di dati individuali,
possiamo controllare che la
“vera” relazione a livello
individuale delle due
variabili è diversa.
In media ad ogni anno di
scolarità in più la salute
aumenta di 0,05 punti.
Correlazione fra anni
di scolarità e salute
con dati individuali
r = + 0,22
byx = + 0,05
5
Il livello di aggregazione interviene sulla relazione
tra variabili a livello individuale esercitando un
effetto spurio.
Se usiamo dati ecologici il livello di aggregazione
può divenire la “reale causa” dell’effetto inferito a
livello individuale.
Nell’esempio, le regioni del nord, hanno salute peggiore e
più alta istruzione (in media), ma il dato aggregato
inganna, poiché a livello individuale l’istruzione è invece
correlata con una salute migliore.
Il dato aggregato non discerne tra coloro, all’interno della
stessa regione, che hanno istruzione bassa e salute bassa,
e istruzione alta e salute alta.
Considerandoli tutti insieme, nella media regionale, perde
di vista la relazione.
Relazioni a livello ecologico, non adatte all’inferenza
190
NO
R= 0.67
170
PIL eq. 2006
(media 100)
150
CH
NL
IE
SE
130
DE
UK
BE
ES
110
DK
FR
IT
GR
90
PT
70
50
18
19
20
21
22
23
24
25
26
27
Percentuali di giovani 2005
7
28
Relazioni a livello ecologico, non adatte all’inferenza
300
DE
R = 0.83
250
n. Brevetti
2003-2005
SE
NL
200
DK
150
FR
BE
100
NO
IT
50
ES
UK
IE
GR PT
0
0.0
0.5
1.0
1.5
2.0
2.5
% PIL in ricerca e sviluppo
2000-2002
8
Scarica

MZ2009_7.3_BIVARIATA - Dipartimento di Sociologia