La costruzione di indicatori soggettivi mediante indici di dissomiglianza: un’applicazione all’indagine sugli aspetti della vita quotidiana Sara Casacci e Adriano Pareto Istituto Nazionale di Statistica Sommario 1. Introduzione 2. I metodi classici 3. Il metodo basato sull’indice di dissomiglianza 4. Un’applicazione ai dati di soddisfazione per la vita 5. Conclusioni La costruzione di indicatori soggettivi mediante indici di dissomiglianza – Sara Casacci e Adriano Pareto Qualità della vita in Italia: vent’anni di studi attraverso l’indagine Multiscopo dell’Istat – Roma, 27-28 gennaio 2015 Introduzione La costruzione di indicatori soggettivi riguardanti: - giudizi; - percezioni; - atteggiamenti; - ecc. nei confronti di un fenomeno, secondo le modalità di una variabile qualitativa ordinale, è una questione di particolare interesse in statistica. Si pensi, in particolare, all’analisi dei dati riguardanti le opinioni dei cittadini, rilevate attraverso le indagini Multiscopo sulle famiglie condotte dall’Istat. In tal caso, il problema è duplice e riguarda due aspetti: - la quantificazione; - la sintesi. 1 La costruzione di indicatori soggettivi mediante indici di dissomiglianza – Sara Casacci e Adriano Pareto Qualità della vita in Italia: vent’anni di studi attraverso l’indagine Multiscopo dell’Istat – Roma, 27-28 gennaio 2015 Introduzione La quantificazione Come passare da una misura su scala ordinale (per esempio, molto, abbastanza, poco, per niente) a una misura su scala di intervallo. 2 La costruzione di indicatori soggettivi mediante indici di dissomiglianza – Sara Casacci e Adriano Pareto Qualità della vita in Italia: vent’anni di studi attraverso l’indagine Multiscopo dell’Istat – Roma, 27-28 gennaio 2015 Introduzione Perché quantificare? Fase descrittiva Fase investigativa Esempio Moda e mediana delle due distribuzioni sono uguali. Per evidenziare lo ‘spostamento’ verso le modalità più basse, è necessario quantificare. Ai fini della descrizione, la quantificazione è inutile e può essere fuorviante. Per lo studio delle relazioni e i confronti, la quantificazione consente di superare i limiti degli strumenti per scale ordinali. Livello di soddisfazione Molto Abbastanza Poco Per niente Frequenza (%) t0 t1 25 20 50 5 5 10 45 40 3 La costruzione di indicatori soggettivi mediante indici di dissomiglianza – Sara Casacci e Adriano Pareto Qualità della vita in Italia: vent’anni di studi attraverso l’indagine Multiscopo dell’Istat – Roma, 27-28 gennaio 2015 Introduzione La sintesi Come passare da una misura su singoli individui (per esempio, l’insieme dei maschi) a una misura complessiva. 4 La costruzione di indicatori soggettivi mediante indici di dissomiglianza – Sara Casacci e Adriano Pareto Qualità della vita in Italia: vent’anni di studi attraverso l’indagine Multiscopo dell’Istat – Roma, 27-28 gennaio 2015 Introduzione In questo lavoro, si propone un metodo per la costruzione di un indicatore soggettivo per gruppi di individui (per esempio, per regione). Persone di 14 anni e oltre per livello di soddisfazione rispetto alla situazione economica per regione - Anno 2013 (valori percentuali) REGIONE Piemonte Valle d'Aosta Liguria Lombardia Bolzano/Bozen Trento Veneto Friuli-Venezia Giulia Emilia-Romagna Toscana Umbria Marche Lazio Abruzzo Molise Campania Puglia Basilicata Calabria Sicilia Sardegna Italia Molto Abbastanza Poco Per niente 1,9 4,6 1,0 2,3 8,2 2,6 2,0 2,6 3,0 2,4 2,8 1,4 1,7 2,2 1,0 0,8 1,6 1,4 1,2 1,2 1,2 1,9 40,1 53,9 45,1 47,1 63,3 61,0 42,5 48,1 43,5 41,7 42,1 41,3 38,0 39,9 39,8 31,5 30,8 41,0 26,7 24,9 29,9 38,9 39,2 29,7 38,6 35,5 22,0 25,7 35,9 33,7 38,8 39,7 37,1 40,4 40,8 39,7 38,4 45,8 45,9 39,5 48,3 46,3 40,6 40,1 18,8 11,8 15,4 15,1 6,6 10,7 19,6 15,5 14,8 16,2 17,9 16,9 19,5 18,2 20,8 21,9 21,7 18,2 23,8 27,5 28,2 19,1 Indicatore di soddisfazione 5 La costruzione di indicatori soggettivi mediante indici di dissomiglianza – Sara Casacci e Adriano Pareto Qualità della vita in Italia: vent’anni di studi attraverso l’indagine Multiscopo dell’Istat – Roma, 27-28 gennaio 2015 ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? I metodi classici Metodo della percentuale (PERC): Si calcola la proporzione di tutti gli individui ‘soddisfatti’, a prescindere dal livello di soddisfazione. Gruppo A B C D E F G H Molto Abbastanza 100 50 0 25 5 0 0 0 0 50 100 20 10 0 0 0 Poco Per niente 0 0 0 50 45 100 50 0 0 0 0 5 40 0 50 100 Totale PERC 100 100 100 100 100 100 100 100 1,00 1,00 1,00 0,45 0,15 0,00 0,00 0,00 6 La costruzione di indicatori soggettivi mediante indici di dissomiglianza – Sara Casacci e Adriano Pareto Qualità della vita in Italia: vent’anni di studi attraverso l’indagine Multiscopo dell’Istat – Roma, 27-28 gennaio 2015 I metodi classici Quantificazione diretta (EQUI): Si assegnano dei valori ordinati ed equidistanti ai livelli di soddisfazione e si calcola la media ponderata. Gruppo A B C D E F G H Quantif. Molto Abbastanza 100 50 0 25 5 0 0 0 0 50 100 20 10 0 0 0 0 0 0 50 45 100 50 0 0 0 0 5 40 0 50 100 1,00 0,67 0,33 0,00 Poco Per niente Totale EQUI 100 100 100 100 100 100 100 100 1,00 0,83 0,67 0,55 0,27 0,33 0,17 0,00 7 La costruzione di indicatori soggettivi mediante indici di dissomiglianza – Sara Casacci e Adriano Pareto Qualità della vita in Italia: vent’anni di studi attraverso l’indagine Multiscopo dell’Istat – Roma, 27-28 gennaio 2015 Il metodo basato sull’indice di dissomiglianza (DISS) Si calcola l’indice quadratico relativo di dissomiglianza della distribuzione di ciascun gruppo dalla distribuzione di massima insoddisfazione. Gruppo A B C D E F G H Rif. Molto Abbastanza 100 50 0 25 5 0 0 0 0 50 100 20 10 0 0 0 0 0 0 50 45 100 50 0 0 0 0 Poco Per niente Totale DISS 0 0 0 5 40 0 50 100 100 100 100 100 100 100 100 100 1,00 0,87 0,82 0,62 0,36 0,58 0,29 0,00 100 100 8 La costruzione di indicatori soggettivi mediante indici di dissomiglianza – Sara Casacci e Adriano Pareto Qualità della vita in Italia: vent’anni di studi attraverso l’indagine Multiscopo dell’Istat – Roma, 27-28 gennaio 2015 Il metodo basato sull’indice di dissomiglianza (DISS) In formule, si ha: m -1 DISS z2 (FkG FkR )2 k 1 m 1 dove: FkG = freq. cumulata della modalità k nella distribuzione del gruppo G; FkR = freq. cumulata della modalità k nella distribuzione di riferimento R; m = numero di modalità. Poiché: FkR = 0 (k=1, …, m-1) e FkR = 1 (k=m) si ottiene: m -1 DISS (FkG )2 k 1 m 1 9 La costruzione di indicatori soggettivi mediante indici di dissomiglianza – Sara Casacci e Adriano Pareto Qualità della vita in Italia: vent’anni di studi attraverso l’indagine Multiscopo dell’Istat – Roma, 27-28 gennaio 2015 Un’applicazione ai dati di soddisfazione per la vita I dati utilizzati sono tratti dall’Indagine sugli Aspetti della vita quotidiana. 10 Un’applicazione ai dati di soddisfazione per la vita Le variabili analizzate riguardano la soddisfazione per l’anno trascorso rispetto ad alcuni aspetti della vita quotidiana: Per queste informazioni sono disponibili le serie storiche dal 1993 a oggi. 11 Un’applicazione ai dati di soddisfazione per la vita 2014 2010 2012 2006 2008 2004 2002 1998 2000 2014 2012 2010 0,4 2008 0,4 2006 0,4 2004 0,5 2002 0,5 2000 0,5 1998 0,6 1996 0,6 1994 0,6 1992 0,7 2014 0,7 2010 2012 0,7 2006 2008 0,8 2004 0,8 2002 0,8 1998 2000 0,9 1994 1996 0,9 Risultati coerenti: tutti i metodi ricostruiscono gli stessi andamenti nel tempo 0,9 1994 1996 PERC 1,0 1992 Indice di soddisfazione Le scale sono uguali, ma i valori non sono direttamente confrontabili: PERC è una frequenza; EQUI è una media; DISS è una distanza EQUI 1,0 1992 DISS 1,0 Anno 12 DISS è una via di mezzo e riesce a cogliere le differenze tra ‘molto’ e ‘abbastanza’, senza quantificare esplicitamente Situazione_economica Salute Relazioni_f amiliari Relazioni_con_amici Tempo_libero EQUI tende a ‘equidistanziare’ le ‘serie’, a causa della quantificazione diretta PERC tende a separare i ‘soddisfatti’ dagli ‘insoddisfatti’, perché aggrega Un’applicazione ai dati di soddisfazione per la vita Indice di soddisfazione sulla situazione economica per metodo di quantificazione - Anno 2013 Per la situazione economica, non ci sono differenze rilevanti tra i metodi Valore Differenza di rango Regione Piemonte Valle d'Aosta Liguria Lombardia Bolzano/Bozen Trento Veneto Friuli-Venezia Giulia Emilia-Romagna Toscana Umbria Marche Lazio Abruzzo Molise Campania Puglia Basilicata Calabria Sicilia Sardegna Italia Diff. media assoluta Rho di Spearman 13 Rango DISS EQUI PERC DISS EQUI PERC DISSEQUI DISSPERC EQUIPERC 0,528 0,612 0,556 0,567 0,680 0,633 0,531 0,569 0,561 0,547 0,540 0,539 0,519 0,531 0,514 0,488 0,490 0,532 0,469 0,445 0,452 0,524 0,417 0,504 0,439 0,455 0,577 0,518 0,423 0,460 0,449 0,435 0,433 0,424 0,407 0,420 0,403 0,371 0,375 0,419 0,351 0,333 0,347 0,413 0,420 0,585 0,461 0,494 0,714 0,636 0,445 0,508 0,464 0,441 0,450 0,427 0,398 0,421 0,408 0,323 0,325 0,424 0,279 0,262 0,311 0,409 14 3 7 5 1 2 13 4 6 8 9 10 15 12 16 18 17 11 19 21 20 14 3 7 5 1 2 11 4 6 8 9 10 15 12 16 18 17 13 19 21 20 14 3 7 5 1 2 9 4 6 10 8 11 16 13 15 18 17 12 20 21 19 0 0 0 0 0 0 2 0 0 0 0 0 0 0 0 0 0 -2 0 0 0 0 0 0 0 0 0 4 0 0 -2 1 -1 -1 -1 1 0 0 -1 -1 0 1 0 0 0 0 0 0 2 0 0 -2 1 -1 -1 -1 1 0 0 1 -1 0 1 Le distribuzioni regionali sono concentrate, per circa l’80%, su ‘abbastanza’ e ‘poco’ (‘molto’ soddisfatti = 2%) 0,2 0,995 0,7 0,982 0,6 0,990 L’effetto ‘aggregazione’ di PERC è trascurabile Un’applicazione ai dati di soddisfazione per la vita Indice di soddisfazione sulla salute per metodo di quantificazione - Anno 2013 Le distribuzioni regionali sono concentrate, per oltre il 60%, su ‘abbastanza’ (‘per niente’ soddisfatti = 5%) Valore Differenza di rango Regione Piemonte Valle d'Aosta Liguria Lombardia Bolzano/Bozen Trento Veneto Friuli-Venezia Giulia Emilia-Romagna Toscana Umbria Marche Lazio Abruzzo Molise Campania Puglia Basilicata Calabria Sicilia Sardegna Italia Diff. media assoluta Rho di Spearman 14 Rango DISS EQUI PERC DISS EQUI PERC DISSEQUI DISSPERC EQUIPERC 0,730 0,755 0,738 0,748 0,801 0,773 0,739 0,745 0,739 0,736 0,735 0,733 0,728 0,732 0,729 0,730 0,711 0,721 0,701 0,721 0,692 0,732 0,643 0,670 0,654 0,666 0,749 0,699 0,657 0,666 0,658 0,652 0,655 0,645 0,635 0,648 0,637 0,636 0,626 0,627 0,610 0,637 0,602 0,646 0,816 0,853 0,830 0,847 0,918 0,882 0,828 0,841 0,825 0,823 0,821 0,819 0,812 0,815 0,809 0,815 0,778 0,799 0,758 0,803 0,745 0,817 13 3 8 4 1 2 6 5 7 9 10 11 16 12 15 14 19 17 20 18 21 13 3 9 4 1 2 7 5 6 10 8 12 17 11 14 16 19 18 20 15 21 12 3 6 4 1 2 7 5 8 9 10 11 15 14 16 13 19 18 20 17 21 0 0 -1 0 0 0 -1 0 1 -1 2 -1 -1 1 1 -2 0 -1 0 3 0 1 0 2 0 0 0 -1 0 -1 0 0 0 1 -2 -1 1 0 -1 0 1 0 1 0 3 0 0 0 0 0 -2 1 -2 1 2 -3 -2 3 0 0 0 -2 0 0,8 0,983 0,6 0,990 1,0 0,968 Lievi differenze tra i metodi Al max. 3 ranghi di diff. Un’applicazione ai dati di soddisfazione per la vita Indice di soddisfazione sulle relazioni familiari per metodo di quantificazione - Anno 2013 Valore Rango Differenza di rango Regione Piemonte Valle d'Aosta Liguria Lombardia Bolzano/Bozen Trento Veneto Friuli-Venezia Giulia Emilia-Romagna Toscana Umbria Marche Lazio Abruzzo Molise Campania Puglia Basilicata Calabria Sicilia Sardegna Italia Diff. media assoluta Rho di Spearman 15 DISS EQUI PERC DISS EQUI PERC DISSEQUI DISSPERC EQUIPERC 0,808 0,803 0,809 0,812 0,843 0,830 0,812 0,810 0,807 0,811 0,824 0,808 0,793 0,807 0,803 0,785 0,782 0,791 0,798 0,801 0,805 0,803 0,757 0,745 0,757 0,769 0,815 0,796 0,769 0,768 0,760 0,767 0,780 0,751 0,730 0,757 0,743 0,708 0,713 0,722 0,729 0,737 0,745 0,749 0,928 0,923 0,931 0,923 0,948 0,942 0,921 0,918 0,914 0,922 0,942 0,934 0,914 0,923 0,929 0,909 0,891 0,916 0,929 0,927 0,932 0,920 10 14 8 5 1 2 4 7 12 6 3 9 18 11 15 20 21 19 17 16 13 11 14 9 5 1 2 4 6 8 7 3 12 17 10 15 21 20 19 18 16 13 9 11 6 13 1 2 15 16 19 14 3 4 18 12 7 20 21 17 8 10 5 -1 0 -1 0 0 0 0 1 4 -1 0 -3 1 1 0 -1 1 0 -1 0 0 1 3 2 -8 0 0 -11 -9 -7 -8 0 5 0 -1 8 0 0 2 9 6 8 2 3 3 -8 0 0 -11 -10 -11 -7 0 8 -1 -2 8 1 -1 2 10 6 8 0,8 0,978 4,2 0,566 4,9 0,470 Per le relazioni familiari, si registrano sensibili differenze Le distribuzioni sono concentrate, per il 90%, su ‘molto’ e ‘abbastanza’ PERC porta a risultati molto diversi dagli altri metodi Un’applicazione ai dati di soddisfazione per la vita Indice di soddisfazione sulle relazioni con amici per metodo di quantificazione - Anno 2013 Valore Rango Differenza di rango Regione Piemonte Valle d'Aosta Liguria Lombardia Bolzano/Bozen Trento Veneto Friuli-Venezia Giulia Emilia-Romagna Toscana Umbria Marche Lazio Abruzzo Molise Campania Puglia Basilicata Calabria Sicilia Sardegna Italia Diff. media assoluta Rho di Spearman 16 DISS EQUI PERC DISS EQUI PERC DISSEQUI DISSPERC EQUIPERC 0,762 0,775 0,769 0,755 0,802 0,768 0,756 0,759 0,752 0,756 0,762 0,752 0,746 0,770 0,743 0,725 0,732 0,755 0,755 0,737 0,755 0,749 0,693 0,703 0,704 0,697 0,756 0,710 0,695 0,702 0,687 0,689 0,699 0,680 0,671 0,699 0,672 0,638 0,654 0,673 0,671 0,663 0,683 0,680 0,858 0,885 0,862 0,838 0,911 0,871 0,838 0,838 0,834 0,845 0,859 0,840 0,837 0,868 0,826 0,791 0,805 0,855 0,850 0,817 0,858 0,835 7 2 4 12 1 5 10 8 15 9 6 16 17 3 18 21 20 13 14 19 11 10 4 3 8 1 2 9 5 12 11 7 14 18 6 16 21 20 15 17 19 13 7 2 5 15 1 3 14 13 17 11 6 12 16 4 18 21 20 9 10 19 8 -3 -2 1 4 0 3 1 3 3 -2 -1 2 -1 -3 2 0 0 -2 -3 0 -2 0 0 -1 -3 0 2 -4 -5 -2 -2 0 4 1 -1 0 0 0 4 4 0 3 3 2 -2 -7 0 -1 -5 -8 -5 0 1 2 2 2 -2 0 0 6 7 0 5 Anche per le relazioni con gli amici, i risultati differiscono sensibilmente 1,8 0,936 1,7 0,921 2,9 0,800 Le distribuzioni sono simili a quelle delle relazioni familiari, concentrate, per l'80%, su 'molto' e 'abbastanza' Un’applicazione ai dati di soddisfazione per la vita Indice di soddisfazione sul tempo libero per metodo di quantificazione - Anno 2013 Le distribuzioni sono concentrate, per circa l’80%, su ‘abbastanza’ e ‘poco’ (‘per niente’ soddisfatti = 8%) Valore Differenza di rango Regione Piemonte Valle d'Aosta Liguria Lombardia Bolzano/Bozen Trento Veneto Friuli-Venezia Giulia Emilia-Romagna Toscana Umbria Marche Lazio Abruzzo Molise Campania Puglia Basilicata Calabria Sicilia Sardegna Italia Diff. media assoluta Rho di Spearman 17 Rango DISS EQUI PERC DISS EQUI PERC DISSEQUI DISSPERC EQUIPERC 0,661 0,684 0,690 0,678 0,750 0,693 0,663 0,667 0,668 0,662 0,687 0,676 0,647 0,664 0,663 0,620 0,616 0,651 0,649 0,620 0,647 0,654 0,573 0,598 0,605 0,597 0,686 0,618 0,581 0,584 0,589 0,581 0,605 0,590 0,552 0,570 0,572 0,521 0,529 0,556 0,551 0,529 0,557 0,567 0,659 0,686 0,715 0,686 0,831 0,712 0,661 0,653 0,670 0,669 0,700 0,678 0,623 0,658 0,674 0,573 0,600 0,652 0,625 0,568 0,617 0,644 14 5 3 6 1 2 12 9 8 13 4 7 18 10 11 19 21 15 16 20 17 12 5 3 6 1 2 11 9 8 10 4 7 17 14 13 21 19 16 18 20 15 12 6 2 5 1 3 11 14 9 10 4 7 17 13 8 20 19 15 16 21 18 2 0 0 0 0 0 1 0 0 3 0 0 1 -4 -2 -2 2 -1 -2 0 2 2 -1 1 1 0 -1 1 -5 -1 3 0 0 1 -3 3 -1 2 0 0 -1 -1 0 -1 1 1 0 -1 0 -5 -1 0 0 0 0 1 5 1 0 1 2 -1 -3 1,0 0,966 1,3 0,955 1,1 0,953 Risultati simili a quelli per la salute Conclusioni I risultati forniti dai diversi metodi sono concordanti nel tempo ed evidenziano un ‘crollo’ della soddisfazione per la situazione economica personale a partire dall’anno 2001. Dal punto di vista territoriale, invece, le maggiori differenze riguardano il livello di soddisfazione per le relazioni familiari e amicali, a causa dell’effetto ‘aggregazione’ del metodo PERC. Nel complesso, il metodo basato sull’indice di dissomiglianza sembra collocarsi a metà strada tra i due metodi classici, senza averne gli inconvenienti. Il metodo DISS, infatti, non comporta perdita di informazione (come avviene in PERC) e non richiede una quantificazione arbitraria ‘esplicita’ (come avviene in EQUI). Inoltre, l’uso di un indicatore soggettivo di soddisfazione consente di superare i limiti di indici di posizione, come la moda e la mediana. 18 La costruzione di indicatori soggettivi mediante indici di dissomiglianza – Sara Casacci e Adriano Pareto Qualità della vita in Italia: vent’anni di studi attraverso l’indagine Multiscopo dell’Istat – Roma, 27-28 gennaio 2015 Bibliografia Casacci C., Pareto A. (2014). Methods for Quantifying Ordinal Variables: A Comparative Study. Quality & Quantity, doi: 10.1007/s11135-0140063-2 Hensler C., Stipak B. (1979). Estimating Interval Scale Values for Survey Item Response Categories. Am. J. Polit. Sci., 23, pp. 627-648 Herzel A. (1974). Un criterio di quantificazione. Aspetti statistici. Metron, 32, pp. 3-54 Istat (2006). Il sistema di indagini sociali multiscopo. Contenuti e metodologia delle indagini. Metodi e norme, n. 31 Istat (2013). La soddisfazione dei cittadini per le condizioni di vita. Statistiche report, 20 novembre 2013 Jamieson S. (2004). Likert scales: how to (ab)use them. Med. Educ., 38, pp. 1212-1218 Leti G. (1983). Statistica descrittiva. Il Mulino, Bologna La costruzione di indicatori soggettivi mediante indici di dissomiglianza – Sara Casacci e Adriano Pareto Qualità della vita in Italia: vent’anni di studi attraverso l’indagine Multiscopo dell’Istat – Roma, 27-28 gennaio 2015