http://richard.cyganiak.de/2007/10/lod/
Open Data – Data Journalism
Trasparenza e informazione al servizio delle
società nell’era digitale
Cenni storici da un passato molto prossimo (1/2)
Il D.J. eredita la parte
migliore del
tradizionale
giornalismo
d’inchiesta: i fatti
Dalla crisi del
giornalismo molti
giornalismi possibili
La differenza è nelle
dimensioni. Differenze
di scala estreme =
differenze di genere
I CABLI DI WIKILEAKS
LE FOTO DEI CITIZEN
JOURNALIST
PLICO/
WATERGATE
Open Data – Data Journalism di Andrea Fama
2
Cenni storici da un passato molto prossimo (2/2)
IL RUOLO DEL D.J.
PER IL LETTORE
“Certezza” del dato = bussola
PER IL GIORNALISTA
Distinguere i fatti dalle opinioni
senza equilibrismi da “un colpo al
cerchio e uno alla botte”
DATI
Open Data – Data Journalism di Andrea Fama
3
Le possibilità tecniche
Digitalizzazione dei
fatti del mondo
=
Enorme mole di
materiale da ricercare,
processare e
pubblicare
Le redazioni sono dotate delle professionalità necessarie?
“Una nuova razza
a metà strada tra i tecnici e i giornalisti”
(Irfan Essa)
Open Data – Data Journalism di Andrea Fama
4
Le ragioni giornalistiche
RACCONTARE STORIE ALTRIMENTI NON RACCONTABILI
INCHIESTE
TRASPARENZA
Deep Web
Data Mining
Big Data
Semantic Web/Data
“Il D.J. incarna l’espressione più avanzata del
principio di libertà e accesso all’informazione”.
(Simon Roger – ex Data Blog editor,The Guardian)
SERVIZIO AL
CITTADINO
Open Parlamento/Voi siete qui
Crime mapping (il Giro della Nera)
RU486
Open Data – Data Journalism di Andrea Fama
5
La spinta civica
TRASPARENZA
PARTECIPAZIONE
CONSAPEVOLEZZA
SPINTA CIVICA
ALLA CONOSCENZA
I poteri forti lasciano che il vero messaggio passi sopra la testa del cittadino,
mentre la realtà sfila sotto al suo naso. Ma oggi è sempre più difficile rivolgersi ad
uditori accondiscendenti che assumono l’informazione come un farmaco sotto
prescrizione, eccitante o sedativo a seconda della sintomatologia.
Open Data – Data Journalism di Andrea Fama
6
Applicazioni del Data Journalism
Portata del D.J. e vastità di applicazioni.
La tecnologia lo rende enorme, potenzialmente infinito.
GEOGRAFIA
Ambiente
Urbanistica
Turismo
TRASPORTI
Traffico
Viabilità
Qualità della vita
Open Data – Data Journalism di Andrea Fama
SICUREZZA
Crime mapping
Disposizione forze dell’ordine
Servizi di quartiere
7
La cassetta degli attrezzi del Data Journalist (1/2)
GIORNALISMO
GRAFICA
Il D.J. non è un media a se,
bensì una sovrapposizione
di competenze appartenenti a
diversi campi
STATISTICA
INFORMATICA
MATEMATICA
Open Data – Data Journalism di Andrea Fama
8
I dati che abbiamo sono attendibili?
Se uno scienziato dei dati produce i risultati sbagliati, accorgersene
potrebbe non essere una cosa banale.
 la semplice trasparenza non porta al cambiamento (vedi evidenze cambiamenti
climatici e politiche ambientali)
 non ci piacciono i numeri fornitici? basta etichettarli come corrotti
 se l’infografica è il nuovo discorso elettorale, mettere in dubbio i dati ne è la naturale
confutazione.
 la trasparenza dei dati è una corsa alle armi
 nel mondo della divulgazione, alterare i dati è come alterare i bilanci
 quanti degli attuali scienziati dei dati diventeranno i periti contabili di domani,
impegnati in una guerra alla frode e all’ignoranza? Alistair Croll
Open Data – Data Journalism di Andrea Fama
9
La cassetta degli attrezzi del Data Journalist
IMPORTARE
Scraperwiki, Yahoo! Pipes, OutWit Hub, Google
Spreadsheets.
VISUALIZZARE
ManyEyes, Tableau Public.
CREARE MAPPE
OpenHeatMap
Public Data Explorer, ecc.
CONDIVIDERE
Google Fusion
Open Data – Data Journalism di Andrea Fama
10
La cassetta degli attrezzi del Data Journalist
FOCUS: Le 10 regole di Troy Thibodeaux (1/3)
1. I FOGLI DI CALCOLO (SPREADSHEET)
 Importare su un foglio elettronico (es. Excell) i dati grezzi in formato universale - senza
formattazione, come un insieme di valori separati da virgole
 Applicare filtri, formule e funzioni (if..then; vertical look-up, ecc.)
 Scrivere le proprie formule (esprimere le proprie idee tramite codici).
2. SQL (Interrogazione di DB)
 Il foglio di calcolo ha dei limiti
 Per sondare il Big Data: SQL (Structured Query Language);
PostgreSQL
ACCESS;
SQLite;
MySQL;
 SQL: permette di gestire insiemi e sottoinsiemi di dati correlati
3. PULIRE I DATI
 Google Refine e Data Wrangler: come i fogli di calcolo, ma studiati per nomi standardizzati (Andrea
Marco Fama, Fama Andrea Marco, Andrea M. Fama, ecc.)
 Google Refine Expression Language: come sopra, ma per insiemi di dati e codici più sfofisticati
 CSVKIT: studiato dai giornalisti, converte il proprio lavoro in un formato comune
Open Data – Data Journalism di Andrea Fama
11
La cassetta degli attrezzi del Data Journalist
FOCUS: Le 10 regole di Troy Thibodeaux (2/3)
4. VISUALIZZAZIONE
 Non è una decorazione, ma una funzione essenziale per comprendere meglio i dati e individuare
tendenze altrimenti invisibili
 Google Fusion Tables e Tableau Public: semplici ed efficaci
 R: per gli esperti, è un pacchetto di statistica open source che combina analisi e visualizzazione
attraverso un linguaggio di programmazione sofisticato
5. SOFTWARE PER LA MAPPATURA
 Data mapping: corrispondenza/match tra fonte ed obiettivo (due DB con gli stessi dati ma sotto
nomi differenti)
 Strumenti: Google Fusion, Tableau Public , Qgis , Arcview
 Postgis e Spatiallite (specifici per dati di natura geografica)
6. LINGUAGGI DI PROGRAMMAZIONE
 Il governo non rilascia i dati che stanno dietro un sito web? Basta scavare per averli (Data Mining /
Screen-scraper)
 Non si hanno i dati nel formato corretto utilizzando gli strumenti a disposizione? Basta costruirne
uno proprio
 I linguaggi di programmazione più comuni tra i giornalisti: Python, Ruby, Perl o Php
Open Data – Data Journalism di Andrea Fama
12
La cassetta degli attrezzi del Data Journalist
FOCUS: Le 10 regole di Troy Thibodeaux (3/3)
7. WEB FRAMEWORK
 Cos’è un web framework? Una struttura di supporto su cui organizzare e progettare un software.
 A cosa serve? Ad evitare la riscrittura di un codice già steso in precedenza per compiti simili
 Strumenti: django per python; rails per ruby; symfony per il php; catalyst per perl.
8. EDITOR
 Strumenti: Textmateer Mac ; Notepad++ (Gratuito); Vim e Emacs (Open Source)
9. CONTROLLO E REVISIONE
 Salvare i backup
 Estrarre elementi da versioni temporanee di file
 Condividere il lavoro
 Strumenti: github; git o subversion
10. ANALISI DEI DOCS
 Document cloud: ricerca , estrazione e condivisione (molto usato dai giornalisti)
 Altri strumenti: Jigsaw; Python’s Natural Language Tool Kit e Standford Corenlp.
Open Data – Data Journalism di Andrea Fama
13
Scarica

Open data – Data Journalism – Digit2013 di Andrea Fama