VOICES from the Blogs
We look into the data, not at the data
Napolitano? Istituzionale come Einaudi
Analisi testuale dei messaggi di fine anno
dal 1949 al 2014
Milano, 14 Gennaio 2015
Voices from the Blogs S.r.l.
Sede Legale: Via Edmondo De Amicis 49, 20123 Milano
Numero 1999899 del R.E.A.
P.IVA: 08046080969 C.F.: 08046080969
Url: www.voicesfromtheblogs.com
Email: [email protected]
Twitter: @blogsvoices
DATI
Periodo considerato: 1949-2014
Fonte: messaggi di fine anno dei 10 Presidenti della Repubblica Italiana in carica tra il 1948 ed il 2015
disponibili su Quirinale.it
Numero di testi: 66
Numero di parole analizzate: 108.000
Metodologia: Wordfish – algoritmo automatizzato di analisi testuale quantitativa
Tabella: Dettaglio sui dati analizzati
Presidente
Numero di testi
Numero di parole
6
7
2
7
7
7
7
7
7
9
1176
5404
1747
8201
7167
14527
13950
23960
11936
19796
Einaudi
Gronchi
Segni
Saragat
Leone
Pertini
Cossiga
Scalfaro
Ciampi
Napolitano
DETTAGLI SULLA METODOLOGIA
Per esaminare i messaggi di fine anno è stato utilizzato Wordfish, un programma automatizzato di analisi
quantitativa del testo, che si serve del software statistico R per analizzare il contenuto dei documenti
testuali sottoposti all’analisi, determinando la posizione politica di ciascun documento su una dimensione
latente (Slapin e Proksch 2008; Proksch e Slapin 2009).Questa posizione è stimata attraverso un
algoritmo che, per ciascuna parola contenuta in un testo, confronta le frequenze riscontrate con quelle
attese. Più precisamente, Wordfish analizza i documenti estraendo due parametri; il primo (ψ) misura la
frequenza con cui una parola compare nei diversi testi, il secondo (β) misura la posizione politica di una
parola. Più estremo è il valore di β maggiore è la capacità di quella parole di discriminare tra documenti
che stanno su un estremo o sull’estremo opposto della dimensione latente. Parole che compaiono nei testi
con una elevata frequenza avranno un minor potere discriminante (e quindi un minor valore di β), e
viceversa. Analizzando, per ogni parola, questi due parametri, Wordfish è in grado di cogliere il
contenuto dei testi sottoposti all’analisi, e fornisce stime delle posizioni, allineando i documenti su
Voices from the Blogs S.r.l.
Sede Legale: Via Edmondo De Amicis 49, 20123 Milano
Numero 1999899 del R.E.A.
P.IVA: 08046080969 C.F.: 08046080969
-2-
Url: www.voicesfromtheblogs.com
Email: [email protected]
Twitter: @blogsvoices
un’unica dimensione latente, estratta in base a questi. Il significato della dimensione latente non è
predefinito va interpretato ex-post e dipende anche dal contenuto dei testi sottoposti all’analisi (ad
esempio, quando vengono analizzati programmi elettorali di diversi partiti Wordfish allineerà i partiti
lungo la scala sinistra-destra). Nel caso dei messaggi di fine anno, la dimensione latente sembra separare
da un lato presidenti che utilizzano linguaggio e contenuti più formali ed istituzionali rispetto a presidenti
più “pop” che si appellano in modo più diretto ai cittadini.
Va ricordato che le stime delle posizioni effettuate da Wordfish sono affidabili quando comparate con
altri metodi di analisi del testo; i risultati sono inoltre robusti rispetto alla selezione dei testi inclusi
nell’analisi e alle principali assunzioni del programma (quali ad esempio l’idea che le parole nel testo
seguano una distribuzione di Poisson). Wordfish inoltre permette di produrre stime longitudinali
confrontando l’evoluzione delle posizioni di un attore politico nel corso del tempo (come nel caso dei
messaggi di fine anno, in cui documenti di uno stesso Presidente sono trattati come indipendenti l’uno
dall’altro quando inclusi nell’analisi). Infine, Wordfish è in grado di analizzare tutte le parole contenute in
un testo misurando, per ciascuna di esse, la capacità discriminante e la sua posizione lungo la dimensione
latente. Tali caratteristiche si adattano perfettamente al tipo di analisi qui effettuata.
RIFERIMENTI BIBLIOGRAFICI
Proksch, S. O. e J. B. Slapin (2009a), WORDFISH: Scaling Software for Estimating Political Positions
from Texts, Version 1.3 (22 January 2009), http://www.wordfish.org.
Slapin, J. B. e S. O. Proksch (2008), A Scaling Model for Estimating Time-Series Party Positions from
Texts, in “American Journal of Political Science”, 52, 3, pp. 705-722.
CONTATTI
Luigi Curini, Prof., PhD
CEO VOICES
Email: [email protected]
Cell: +39 366 1652058
Stefano Maria Iacus, Prof. PhD
Vice President VOICES
Email: [email protected]
Cell: +39 366 1652064
Voices from the Blogs S.r.l.
Sede Legale: Via Edmondo De Amicis 49, 20123 Milano
Numero 1999899 del R.E.A.
P.IVA: 08046080969 C.F.: 08046080969
-3-
Andrea Ceron, PhD
Senior Officer VOICES
Email: [email protected]
Cell: +39 366 1652061
Url: www.voicesfromtheblogs.com
Email: [email protected]
Twitter: @blogsvoices
Scarica

qui - VOICES from the Blogs