VOICES from the Blogs We look into the data, not at the data Napolitano? Istituzionale come Einaudi Analisi testuale dei messaggi di fine anno dal 1949 al 2014 Milano, 14 Gennaio 2015 Voices from the Blogs S.r.l. Sede Legale: Via Edmondo De Amicis 49, 20123 Milano Numero 1999899 del R.E.A. P.IVA: 08046080969 C.F.: 08046080969 Url: www.voicesfromtheblogs.com Email: [email protected] Twitter: @blogsvoices DATI Periodo considerato: 1949-2014 Fonte: messaggi di fine anno dei 10 Presidenti della Repubblica Italiana in carica tra il 1948 ed il 2015 disponibili su Quirinale.it Numero di testi: 66 Numero di parole analizzate: 108.000 Metodologia: Wordfish – algoritmo automatizzato di analisi testuale quantitativa Tabella: Dettaglio sui dati analizzati Presidente Numero di testi Numero di parole 6 7 2 7 7 7 7 7 7 9 1176 5404 1747 8201 7167 14527 13950 23960 11936 19796 Einaudi Gronchi Segni Saragat Leone Pertini Cossiga Scalfaro Ciampi Napolitano DETTAGLI SULLA METODOLOGIA Per esaminare i messaggi di fine anno è stato utilizzato Wordfish, un programma automatizzato di analisi quantitativa del testo, che si serve del software statistico R per analizzare il contenuto dei documenti testuali sottoposti all’analisi, determinando la posizione politica di ciascun documento su una dimensione latente (Slapin e Proksch 2008; Proksch e Slapin 2009).Questa posizione è stimata attraverso un algoritmo che, per ciascuna parola contenuta in un testo, confronta le frequenze riscontrate con quelle attese. Più precisamente, Wordfish analizza i documenti estraendo due parametri; il primo (ψ) misura la frequenza con cui una parola compare nei diversi testi, il secondo (β) misura la posizione politica di una parola. Più estremo è il valore di β maggiore è la capacità di quella parole di discriminare tra documenti che stanno su un estremo o sull’estremo opposto della dimensione latente. Parole che compaiono nei testi con una elevata frequenza avranno un minor potere discriminante (e quindi un minor valore di β), e viceversa. Analizzando, per ogni parola, questi due parametri, Wordfish è in grado di cogliere il contenuto dei testi sottoposti all’analisi, e fornisce stime delle posizioni, allineando i documenti su Voices from the Blogs S.r.l. Sede Legale: Via Edmondo De Amicis 49, 20123 Milano Numero 1999899 del R.E.A. P.IVA: 08046080969 C.F.: 08046080969 -2- Url: www.voicesfromtheblogs.com Email: [email protected] Twitter: @blogsvoices un’unica dimensione latente, estratta in base a questi. Il significato della dimensione latente non è predefinito va interpretato ex-post e dipende anche dal contenuto dei testi sottoposti all’analisi (ad esempio, quando vengono analizzati programmi elettorali di diversi partiti Wordfish allineerà i partiti lungo la scala sinistra-destra). Nel caso dei messaggi di fine anno, la dimensione latente sembra separare da un lato presidenti che utilizzano linguaggio e contenuti più formali ed istituzionali rispetto a presidenti più “pop” che si appellano in modo più diretto ai cittadini. Va ricordato che le stime delle posizioni effettuate da Wordfish sono affidabili quando comparate con altri metodi di analisi del testo; i risultati sono inoltre robusti rispetto alla selezione dei testi inclusi nell’analisi e alle principali assunzioni del programma (quali ad esempio l’idea che le parole nel testo seguano una distribuzione di Poisson). Wordfish inoltre permette di produrre stime longitudinali confrontando l’evoluzione delle posizioni di un attore politico nel corso del tempo (come nel caso dei messaggi di fine anno, in cui documenti di uno stesso Presidente sono trattati come indipendenti l’uno dall’altro quando inclusi nell’analisi). Infine, Wordfish è in grado di analizzare tutte le parole contenute in un testo misurando, per ciascuna di esse, la capacità discriminante e la sua posizione lungo la dimensione latente. Tali caratteristiche si adattano perfettamente al tipo di analisi qui effettuata. RIFERIMENTI BIBLIOGRAFICI Proksch, S. O. e J. B. Slapin (2009a), WORDFISH: Scaling Software for Estimating Political Positions from Texts, Version 1.3 (22 January 2009), http://www.wordfish.org. Slapin, J. B. e S. O. Proksch (2008), A Scaling Model for Estimating Time-Series Party Positions from Texts, in “American Journal of Political Science”, 52, 3, pp. 705-722. CONTATTI Luigi Curini, Prof., PhD CEO VOICES Email: [email protected] Cell: +39 366 1652058 Stefano Maria Iacus, Prof. PhD Vice President VOICES Email: [email protected] Cell: +39 366 1652064 Voices from the Blogs S.r.l. Sede Legale: Via Edmondo De Amicis 49, 20123 Milano Numero 1999899 del R.E.A. P.IVA: 08046080969 C.F.: 08046080969 -3- Andrea Ceron, PhD Senior Officer VOICES Email: [email protected] Cell: +39 366 1652061 Url: www.voicesfromtheblogs.com Email: [email protected] Twitter: @blogsvoices