La costruzione di indicatori soggettivi
mediante indici di dissomiglianza:
un’applicazione all’indagine sugli aspetti
della vita quotidiana
Sara Casacci e Adriano Pareto
Istituto Nazionale di Statistica
Sommario
1. Introduzione
2. I metodi classici
3. Il metodo basato sull’indice di dissomiglianza
4. Un’applicazione ai dati di soddisfazione per la vita
5. Conclusioni
La costruzione di indicatori soggettivi mediante indici di dissomiglianza – Sara Casacci e Adriano Pareto
Qualità della vita in Italia: vent’anni di studi attraverso l’indagine Multiscopo dell’Istat – Roma, 27-28 gennaio 2015
Introduzione
La costruzione di indicatori soggettivi riguardanti:
- giudizi;
- percezioni;
- atteggiamenti;
- ecc.
nei confronti di un fenomeno, secondo le modalità di una variabile
qualitativa ordinale, è una questione di particolare interesse in statistica.
Si pensi, in particolare, all’analisi dei dati riguardanti le opinioni dei
cittadini, rilevate attraverso le indagini Multiscopo sulle famiglie condotte
dall’Istat.
In tal caso, il problema è duplice e riguarda due aspetti:
- la quantificazione;
- la sintesi.
1
La costruzione di indicatori soggettivi mediante indici di dissomiglianza – Sara Casacci e Adriano Pareto
Qualità della vita in Italia: vent’anni di studi attraverso l’indagine Multiscopo dell’Istat – Roma, 27-28 gennaio 2015
Introduzione
La quantificazione
Come passare da una misura su scala ordinale (per esempio, molto,
abbastanza, poco, per niente) a una misura su scala di intervallo.
2
La costruzione di indicatori soggettivi mediante indici di dissomiglianza – Sara Casacci e Adriano Pareto
Qualità della vita in Italia: vent’anni di studi attraverso l’indagine Multiscopo dell’Istat – Roma, 27-28 gennaio 2015
Introduzione
Perché quantificare?
Fase descrittiva
Fase investigativa
Esempio
Moda e mediana delle due
distribuzioni sono uguali.
Per
evidenziare
lo
‘spostamento’ verso le
modalità più basse, è
necessario quantificare.
Ai fini della descrizione, la quantificazione è
inutile e può essere fuorviante.
Per lo studio delle relazioni e i confronti, la
quantificazione consente di superare i limiti
degli strumenti per scale ordinali.
Livello di
soddisfazione
Molto
Abbastanza
Poco
Per niente
Frequenza (%)
t0
t1
25
20
50
5
5
10
45
40
3
La costruzione di indicatori soggettivi mediante indici di dissomiglianza – Sara Casacci e Adriano Pareto
Qualità della vita in Italia: vent’anni di studi attraverso l’indagine Multiscopo dell’Istat – Roma, 27-28 gennaio 2015
Introduzione
La sintesi
Come passare da una misura su singoli individui (per esempio, l’insieme
dei maschi) a una misura complessiva.
4
La costruzione di indicatori soggettivi mediante indici di dissomiglianza – Sara Casacci e Adriano Pareto
Qualità della vita in Italia: vent’anni di studi attraverso l’indagine Multiscopo dell’Istat – Roma, 27-28 gennaio 2015
Introduzione
In questo lavoro, si propone un metodo per la costruzione di un indicatore
soggettivo per gruppi di individui (per esempio, per regione).
Persone di 14 anni e oltre per livello di soddisfazione rispetto alla situazione
economica per regione - Anno 2013 (valori percentuali)
REGIONE
Piemonte
Valle d'Aosta
Liguria
Lombardia
Bolzano/Bozen
Trento
Veneto
Friuli-Venezia Giulia
Emilia-Romagna
Toscana
Umbria
Marche
Lazio
Abruzzo
Molise
Campania
Puglia
Basilicata
Calabria
Sicilia
Sardegna
Italia
Molto
Abbastanza
Poco
Per niente
1,9
4,6
1,0
2,3
8,2
2,6
2,0
2,6
3,0
2,4
2,8
1,4
1,7
2,2
1,0
0,8
1,6
1,4
1,2
1,2
1,2
1,9
40,1
53,9
45,1
47,1
63,3
61,0
42,5
48,1
43,5
41,7
42,1
41,3
38,0
39,9
39,8
31,5
30,8
41,0
26,7
24,9
29,9
38,9
39,2
29,7
38,6
35,5
22,0
25,7
35,9
33,7
38,8
39,7
37,1
40,4
40,8
39,7
38,4
45,8
45,9
39,5
48,3
46,3
40,6
40,1
18,8
11,8
15,4
15,1
6,6
10,7
19,6
15,5
14,8
16,2
17,9
16,9
19,5
18,2
20,8
21,9
21,7
18,2
23,8
27,5
28,2
19,1
Indicatore di
soddisfazione
5
La costruzione di indicatori soggettivi mediante indici di dissomiglianza – Sara Casacci e Adriano Pareto
Qualità della vita in Italia: vent’anni di studi attraverso l’indagine Multiscopo dell’Istat – Roma, 27-28 gennaio 2015
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
?
I metodi classici
Metodo della percentuale (PERC): Si calcola la proporzione di tutti gli
individui ‘soddisfatti’, a prescindere dal livello di soddisfazione.
Gruppo
A
B
C
D
E
F
G
H
Molto
Abbastanza
100
50
0
25
5
0
0
0
0
50
100
20
10
0
0
0
Poco Per niente
0
0
0
50
45
100
50
0
0
0
0
5
40
0
50
100
Totale
PERC
100
100
100
100
100
100
100
100
1,00
1,00
1,00
0,45
0,15
0,00
0,00
0,00
6
La costruzione di indicatori soggettivi mediante indici di dissomiglianza – Sara Casacci e Adriano Pareto
Qualità della vita in Italia: vent’anni di studi attraverso l’indagine Multiscopo dell’Istat – Roma, 27-28 gennaio 2015
I metodi classici
Quantificazione diretta (EQUI): Si assegnano dei valori ordinati ed
equidistanti ai livelli di soddisfazione e si calcola la media ponderata.
Gruppo
A
B
C
D
E
F
G
H
Quantif.
Molto
Abbastanza
100
50
0
25
5
0
0
0
0
50
100
20
10
0
0
0
0
0
0
50
45
100
50
0
0
0
0
5
40
0
50
100
1,00
0,67
0,33
0,00
Poco Per niente
Totale
EQUI
100
100
100
100
100
100
100
100
1,00
0,83
0,67
0,55
0,27
0,33
0,17
0,00
7
La costruzione di indicatori soggettivi mediante indici di dissomiglianza – Sara Casacci e Adriano Pareto
Qualità della vita in Italia: vent’anni di studi attraverso l’indagine Multiscopo dell’Istat – Roma, 27-28 gennaio 2015
Il metodo basato sull’indice di dissomiglianza (DISS)
Si calcola l’indice quadratico relativo di dissomiglianza della distribuzione
di ciascun gruppo dalla distribuzione di massima insoddisfazione.
Gruppo
A
B
C
D
E
F
G
H
Rif.
Molto
Abbastanza
100
50
0
25
5
0
0
0
0
50
100
20
10
0
0
0
0
0
0
50
45
100
50
0
0
0
0
Poco Per niente
Totale
DISS
0
0
0
5
40
0
50
100
100
100
100
100
100
100
100
100
1,00
0,87
0,82
0,62
0,36
0,58
0,29
0,00
100
100
8
La costruzione di indicatori soggettivi mediante indici di dissomiglianza – Sara Casacci e Adriano Pareto
Qualità della vita in Italia: vent’anni di studi attraverso l’indagine Multiscopo dell’Istat – Roma, 27-28 gennaio 2015
Il metodo basato sull’indice di dissomiglianza (DISS)
In formule, si ha:
m -1
DISS  z2 
 (FkG  FkR )2
k 1
m 1
dove:
FkG = freq. cumulata della modalità k nella distribuzione del gruppo G;
FkR = freq. cumulata della modalità k nella distribuzione di riferimento R;
m = numero di modalità.
Poiché:
FkR = 0 (k=1, …, m-1) e FkR = 1 (k=m)
si ottiene:
m -1
DISS 
 (FkG )2
k 1
m 1
9
La costruzione di indicatori soggettivi mediante indici di dissomiglianza – Sara Casacci e Adriano Pareto
Qualità della vita in Italia: vent’anni di studi attraverso l’indagine Multiscopo dell’Istat – Roma, 27-28 gennaio 2015
Un’applicazione ai dati di soddisfazione per la vita
I dati utilizzati sono tratti dall’Indagine sugli Aspetti della vita quotidiana.
10
Un’applicazione ai dati di soddisfazione per la vita
Le variabili analizzate riguardano la soddisfazione per l’anno trascorso
rispetto ad alcuni aspetti della vita quotidiana:
Per queste informazioni sono disponibili le serie storiche dal 1993 a oggi.
11
Un’applicazione ai dati di soddisfazione per la vita
2014
2010
2012
2006
2008
2004
2002
1998
2000
2014
2012
2010
0,4
2008
0,4
2006
0,4
2004
0,5
2002
0,5
2000
0,5
1998
0,6
1996
0,6
1994
0,6
1992
0,7
2014
0,7
2010
2012
0,7
2006
2008
0,8
2004
0,8
2002
0,8
1998
2000
0,9
1994
1996
0,9
Risultati coerenti: tutti i
metodi ricostruiscono gli
stessi
andamenti nel tempo
0,9
1994
1996
PERC
1,0
1992
Indice di soddisfazione
Le scale
sono uguali,
ma i valori
non sono
direttamente
confrontabili:
PERC è una
frequenza;
EQUI è una
media;
DISS è una
distanza
EQUI
1,0
1992
DISS
1,0
Anno
12
DISS è una via di mezzo e
riesce a cogliere le differenze
tra ‘molto’ e ‘abbastanza’,
senza quantificare
esplicitamente
Situazione_economica
Salute
Relazioni_f amiliari
Relazioni_con_amici
Tempo_libero
EQUI tende a
‘equidistanziare’ le
‘serie’, a causa
della quantificazione diretta
PERC tende a
separare i
‘soddisfatti’ dagli
‘insoddisfatti’,
perché aggrega
Un’applicazione ai dati di soddisfazione per la vita
Indice di soddisfazione sulla situazione economica per metodo di quantificazione - Anno 2013
Per la
situazione
economica,
non ci sono
differenze
rilevanti tra i
metodi
Valore
Differenza di rango
Regione
Piemonte
Valle d'Aosta
Liguria
Lombardia
Bolzano/Bozen
Trento
Veneto
Friuli-Venezia Giulia
Emilia-Romagna
Toscana
Umbria
Marche
Lazio
Abruzzo
Molise
Campania
Puglia
Basilicata
Calabria
Sicilia
Sardegna
Italia
Diff. media assoluta
Rho di Spearman
13
Rango
DISS
EQUI
PERC
DISS
EQUI
PERC
DISSEQUI
DISSPERC
EQUIPERC
0,528
0,612
0,556
0,567
0,680
0,633
0,531
0,569
0,561
0,547
0,540
0,539
0,519
0,531
0,514
0,488
0,490
0,532
0,469
0,445
0,452
0,524
0,417
0,504
0,439
0,455
0,577
0,518
0,423
0,460
0,449
0,435
0,433
0,424
0,407
0,420
0,403
0,371
0,375
0,419
0,351
0,333
0,347
0,413
0,420
0,585
0,461
0,494
0,714
0,636
0,445
0,508
0,464
0,441
0,450
0,427
0,398
0,421
0,408
0,323
0,325
0,424
0,279
0,262
0,311
0,409
14
3
7
5
1
2
13
4
6
8
9
10
15
12
16
18
17
11
19
21
20
14
3
7
5
1
2
11
4
6
8
9
10
15
12
16
18
17
13
19
21
20
14
3
7
5
1
2
9
4
6
10
8
11
16
13
15
18
17
12
20
21
19
0
0
0
0
0
0
2
0
0
0
0
0
0
0
0
0
0
-2
0
0
0
0
0
0
0
0
0
4
0
0
-2
1
-1
-1
-1
1
0
0
-1
-1
0
1
0
0
0
0
0
0
2
0
0
-2
1
-1
-1
-1
1
0
0
1
-1
0
1
Le distribuzioni regionali sono concentrate, per
circa l’80%, su ‘abbastanza’ e ‘poco’
(‘molto’ soddisfatti = 2%)
0,2
0,995
0,7
0,982
0,6
0,990
L’effetto
‘aggregazione’
di PERC è
trascurabile
Un’applicazione ai dati di soddisfazione per la vita
Indice di soddisfazione sulla salute per metodo di quantificazione - Anno 2013
Le
distribuzioni
regionali sono
concentrate,
per oltre il
60%, su
‘abbastanza’
(‘per niente’
soddisfatti =
5%)
Valore
Differenza di rango
Regione
Piemonte
Valle d'Aosta
Liguria
Lombardia
Bolzano/Bozen
Trento
Veneto
Friuli-Venezia Giulia
Emilia-Romagna
Toscana
Umbria
Marche
Lazio
Abruzzo
Molise
Campania
Puglia
Basilicata
Calabria
Sicilia
Sardegna
Italia
Diff. media assoluta
Rho di Spearman
14
Rango
DISS
EQUI
PERC
DISS
EQUI
PERC
DISSEQUI
DISSPERC
EQUIPERC
0,730
0,755
0,738
0,748
0,801
0,773
0,739
0,745
0,739
0,736
0,735
0,733
0,728
0,732
0,729
0,730
0,711
0,721
0,701
0,721
0,692
0,732
0,643
0,670
0,654
0,666
0,749
0,699
0,657
0,666
0,658
0,652
0,655
0,645
0,635
0,648
0,637
0,636
0,626
0,627
0,610
0,637
0,602
0,646
0,816
0,853
0,830
0,847
0,918
0,882
0,828
0,841
0,825
0,823
0,821
0,819
0,812
0,815
0,809
0,815
0,778
0,799
0,758
0,803
0,745
0,817
13
3
8
4
1
2
6
5
7
9
10
11
16
12
15
14
19
17
20
18
21
13
3
9
4
1
2
7
5
6
10
8
12
17
11
14
16
19
18
20
15
21
12
3
6
4
1
2
7
5
8
9
10
11
15
14
16
13
19
18
20
17
21
0
0
-1
0
0
0
-1
0
1
-1
2
-1
-1
1
1
-2
0
-1
0
3
0
1
0
2
0
0
0
-1
0
-1
0
0
0
1
-2
-1
1
0
-1
0
1
0
1
0
3
0
0
0
0
0
-2
1
-2
1
2
-3
-2
3
0
0
0
-2
0
0,8
0,983
0,6
0,990
1,0
0,968
Lievi
differenze tra
i metodi
Al
max.
3
ranghi
di diff.
Un’applicazione ai dati di soddisfazione per la vita
Indice di soddisfazione sulle relazioni familiari per metodo di quantificazione - Anno 2013
Valore
Rango
Differenza di rango
Regione
Piemonte
Valle d'Aosta
Liguria
Lombardia
Bolzano/Bozen
Trento
Veneto
Friuli-Venezia Giulia
Emilia-Romagna
Toscana
Umbria
Marche
Lazio
Abruzzo
Molise
Campania
Puglia
Basilicata
Calabria
Sicilia
Sardegna
Italia
Diff. media assoluta
Rho di Spearman
15
DISS
EQUI
PERC
DISS
EQUI
PERC
DISSEQUI
DISSPERC
EQUIPERC
0,808
0,803
0,809
0,812
0,843
0,830
0,812
0,810
0,807
0,811
0,824
0,808
0,793
0,807
0,803
0,785
0,782
0,791
0,798
0,801
0,805
0,803
0,757
0,745
0,757
0,769
0,815
0,796
0,769
0,768
0,760
0,767
0,780
0,751
0,730
0,757
0,743
0,708
0,713
0,722
0,729
0,737
0,745
0,749
0,928
0,923
0,931
0,923
0,948
0,942
0,921
0,918
0,914
0,922
0,942
0,934
0,914
0,923
0,929
0,909
0,891
0,916
0,929
0,927
0,932
0,920
10
14
8
5
1
2
4
7
12
6
3
9
18
11
15
20
21
19
17
16
13
11
14
9
5
1
2
4
6
8
7
3
12
17
10
15
21
20
19
18
16
13
9
11
6
13
1
2
15
16
19
14
3
4
18
12
7
20
21
17
8
10
5
-1
0
-1
0
0
0
0
1
4
-1
0
-3
1
1
0
-1
1
0
-1
0
0
1
3
2
-8
0
0
-11
-9
-7
-8
0
5
0
-1
8
0
0
2
9
6
8
2
3
3
-8
0
0
-11
-10
-11
-7
0
8
-1
-2
8
1
-1
2
10
6
8
0,8
0,978
4,2
0,566
4,9
0,470
Per le relazioni
familiari, si registrano
sensibili differenze
Le
distribuzioni
sono
concentrate,
per il 90%,
su ‘molto’ e
‘abbastanza’
PERC
porta a
risultati
molto
diversi
dagli altri
metodi
Un’applicazione ai dati di soddisfazione per la vita
Indice di soddisfazione sulle relazioni con amici per metodo di quantificazione - Anno 2013
Valore
Rango
Differenza di rango
Regione
Piemonte
Valle d'Aosta
Liguria
Lombardia
Bolzano/Bozen
Trento
Veneto
Friuli-Venezia Giulia
Emilia-Romagna
Toscana
Umbria
Marche
Lazio
Abruzzo
Molise
Campania
Puglia
Basilicata
Calabria
Sicilia
Sardegna
Italia
Diff. media assoluta
Rho di Spearman
16
DISS
EQUI
PERC
DISS
EQUI
PERC
DISSEQUI
DISSPERC
EQUIPERC
0,762
0,775
0,769
0,755
0,802
0,768
0,756
0,759
0,752
0,756
0,762
0,752
0,746
0,770
0,743
0,725
0,732
0,755
0,755
0,737
0,755
0,749
0,693
0,703
0,704
0,697
0,756
0,710
0,695
0,702
0,687
0,689
0,699
0,680
0,671
0,699
0,672
0,638
0,654
0,673
0,671
0,663
0,683
0,680
0,858
0,885
0,862
0,838
0,911
0,871
0,838
0,838
0,834
0,845
0,859
0,840
0,837
0,868
0,826
0,791
0,805
0,855
0,850
0,817
0,858
0,835
7
2
4
12
1
5
10
8
15
9
6
16
17
3
18
21
20
13
14
19
11
10
4
3
8
1
2
9
5
12
11
7
14
18
6
16
21
20
15
17
19
13
7
2
5
15
1
3
14
13
17
11
6
12
16
4
18
21
20
9
10
19
8
-3
-2
1
4
0
3
1
3
3
-2
-1
2
-1
-3
2
0
0
-2
-3
0
-2
0
0
-1
-3
0
2
-4
-5
-2
-2
0
4
1
-1
0
0
0
4
4
0
3
3
2
-2
-7
0
-1
-5
-8
-5
0
1
2
2
2
-2
0
0
6
7
0
5
Anche per le relazioni con
gli amici, i risultati
differiscono sensibilmente
1,8
0,936
1,7
0,921
2,9
0,800
Le
distribuzioni
sono simili a
quelle delle
relazioni
familiari,
concentrate,
per l'80%, su
'molto' e
'abbastanza'
Un’applicazione ai dati di soddisfazione per la vita
Indice di soddisfazione sul tempo libero per metodo di quantificazione - Anno 2013
Le
distribuzioni
sono
concentrate,
per circa
l’80%, su
‘abbastanza’
e ‘poco’
(‘per niente’
soddisfatti =
8%)
Valore
Differenza di rango
Regione
Piemonte
Valle d'Aosta
Liguria
Lombardia
Bolzano/Bozen
Trento
Veneto
Friuli-Venezia Giulia
Emilia-Romagna
Toscana
Umbria
Marche
Lazio
Abruzzo
Molise
Campania
Puglia
Basilicata
Calabria
Sicilia
Sardegna
Italia
Diff. media assoluta
Rho di Spearman
17
Rango
DISS
EQUI
PERC
DISS
EQUI
PERC
DISSEQUI
DISSPERC
EQUIPERC
0,661
0,684
0,690
0,678
0,750
0,693
0,663
0,667
0,668
0,662
0,687
0,676
0,647
0,664
0,663
0,620
0,616
0,651
0,649
0,620
0,647
0,654
0,573
0,598
0,605
0,597
0,686
0,618
0,581
0,584
0,589
0,581
0,605
0,590
0,552
0,570
0,572
0,521
0,529
0,556
0,551
0,529
0,557
0,567
0,659
0,686
0,715
0,686
0,831
0,712
0,661
0,653
0,670
0,669
0,700
0,678
0,623
0,658
0,674
0,573
0,600
0,652
0,625
0,568
0,617
0,644
14
5
3
6
1
2
12
9
8
13
4
7
18
10
11
19
21
15
16
20
17
12
5
3
6
1
2
11
9
8
10
4
7
17
14
13
21
19
16
18
20
15
12
6
2
5
1
3
11
14
9
10
4
7
17
13
8
20
19
15
16
21
18
2
0
0
0
0
0
1
0
0
3
0
0
1
-4
-2
-2
2
-1
-2
0
2
2
-1
1
1
0
-1
1
-5
-1
3
0
0
1
-3
3
-1
2
0
0
-1
-1
0
-1
1
1
0
-1
0
-5
-1
0
0
0
0
1
5
1
0
1
2
-1
-3
1,0
0,966
1,3
0,955
1,1
0,953
Risultati simili a
quelli per la
salute
Conclusioni
I risultati forniti dai diversi metodi sono concordanti nel tempo ed
evidenziano un ‘crollo’ della soddisfazione per la situazione economica
personale a partire dall’anno 2001.
Dal punto di vista territoriale, invece, le maggiori differenze riguardano il
livello di soddisfazione per le relazioni familiari e amicali, a causa
dell’effetto ‘aggregazione’ del metodo PERC.
Nel complesso, il metodo basato sull’indice di dissomiglianza sembra
collocarsi a metà strada tra i due metodi classici, senza averne gli
inconvenienti.
Il metodo DISS, infatti, non comporta perdita di informazione (come
avviene in PERC) e non richiede una quantificazione arbitraria ‘esplicita’
(come avviene in EQUI).
Inoltre, l’uso di un indicatore soggettivo di soddisfazione consente di
superare i limiti di indici di posizione, come la moda e la mediana.
18
La costruzione di indicatori soggettivi mediante indici di dissomiglianza – Sara Casacci e Adriano Pareto
Qualità della vita in Italia: vent’anni di studi attraverso l’indagine Multiscopo dell’Istat – Roma, 27-28 gennaio 2015
Bibliografia
Casacci C., Pareto A. (2014). Methods for Quantifying Ordinal Variables:
A Comparative Study. Quality & Quantity, doi: 10.1007/s11135-0140063-2
Hensler C., Stipak B. (1979). Estimating Interval Scale Values for Survey
Item Response Categories. Am. J. Polit. Sci., 23, pp. 627-648
Herzel A. (1974). Un criterio di quantificazione. Aspetti statistici. Metron,
32, pp. 3-54
Istat (2006). Il sistema di indagini sociali multiscopo. Contenuti e
metodologia delle indagini. Metodi e norme, n. 31
Istat (2013). La soddisfazione dei cittadini per le condizioni di vita.
Statistiche report, 20 novembre 2013
Jamieson S. (2004). Likert scales: how to (ab)use them. Med. Educ., 38,
pp. 1212-1218
Leti G. (1983). Statistica descrittiva. Il Mulino, Bologna
La costruzione di indicatori soggettivi mediante indici di dissomiglianza – Sara Casacci e Adriano Pareto
Qualità della vita in Italia: vent’anni di studi attraverso l’indagine Multiscopo dell’Istat – Roma, 27-28 gennaio 2015
Scarica

Presentazione di PowerPoint