Il libro elettronico e l’editoria
digitale umanistica
© Fabio Ciotti – CRILet, Università di Roma “La Sapienza”
I temi dell’editoria digitale
umanistica
Il problema della rappresentazione digitale
del testo



codifica
linguaggi di mark-up
XML
Il problema della disseminazione del
documento digitale:


biblioteche digitali
e-book
La codifica del testo
La codifica del testo è la
rappresentazione del testo su supporto
digitale in un formato “leggibile” da un
elaboratore
Tale rappresentazione


si basa su un determinato linguaggio
informatico, detto linguaggio di codifica
implica una definizione del concetto di
testo
Cosa è un testo?
Un testo è un oggetto complesso
caratterizzato da molteplici livelli strutturali









Livello del documento materiale (libro, manoscritto,
etc.)
Livello linguistico superficiale (sequenza di caratteri
in una notazione alfabetica)
Livello della struttura editoriale, articolata in base al
genere
Livello linguistico profondo (struttura sintattica e
morfologica)
Livello della struttura metrica (per i testi in versi)
Livello della struttura retorica
Livello della struttura tematica
Livello della struttura narrativa
…
Cosa è un testo?
Ognuno di questi “livelli” è oggetto di una o più



discipline
teorie
pratiche di elaborazione (edizione, stampa, analisi,
commento …)
Ciascuna di esse adotta uno o più linguaggi
teorici e codici descrittivi per rappresentare e
analizzare le strutture testuali rilevanti
La codifica come linguaggio teorico
Normalmente i linguaggi teorici e i codici
descrittivi delle scienze del testo sono
linguaggi non formali basati sul
linguaggio naturale o su sistemi di
presentazione analogica
Esempi:



critica letteraria
stampa tipografica
ecdotica
La codifica come linguaggio teorico
Possiamo considerare il linguaggio di codifica
come un linguaggio teorico/rappresentazionale
di natura formale e digitale
La sua utilizzazione implica



la selezione e classificazione degli elementi
rilevanti del testo per ciascun livello strutturale
l’individuazione delle relazioni tra tali elementi
la costruzione di uno schema di codifica
Lo schema di codifica
Uno schema di codifica associa


un insieme di caratteristiche o elementi
costituenti del testo a un insieme di simboli
del linguaggio
le relazioni strutturali tra gli elementi
testuali alle relazioni sintattiche tra i
simboli del linguaggio
Lo schema di codifica
Uno schema di codifica è caratterizzato
dai seguenti aspetti:




un insieme di caratteristiche o elementi
testuali
un insieme di simboli o identificatori
una grammatica che governa l’uso degli
identificatori
una funzione di correlazione tra
identificatori sintattici ed elementi
Il modello del testo
Un testo codificato in base a un
determinato schema di codifica è un
modello formale del testo
Testo
Frontespizio
Schema di codifica
Intro ?
Corpo
Titolo
Para +
Char
Titolo
Char
Testo
Capitoli
Appendice
Indice
Glossario ?
Para +
Lista +
Citazione +
Char
Modello formale del testo
Problemi teorici della codifica
Problemi semiotici


Passaggio da linguaggi non formali a
linguaggi formali
Passaggio da rappresentazioni
analogiche a rappresentazioni digitali
Problemi teorici della codifica
Problemi epistemologici


Il processo di codifica è …
… interpretativo o descrittivo?
Per Sperberg-McQueen

“la codifica riflette una teoria del testo”
Problemi teorici della codifica
Problemi ontologici




Il testo è…
… un ente realmente “così e così” (realismo)
… un ente costruito dal linguaggio
(costruttivismo)
… un ente reale che possiamo descrivere/su
cui possiamo teorizzare solo mediante un
linguaggio (realismo interno)
I linguaggi di codifica
Un linguaggio di codifica del testo è un
formalismo o linguaggio informatico
mediante il quale è possibile
rappresentare un documento testuale
su supporto digitale in modo che sia
trattabile dall’elaboratore in quanto
testo
Un linguaggio di codifica testuale
permette di creare dati di tipo testuale
La codifica dei caratteri
I formalismi più elementari per la codifica
informatica dell’informazione testuale sono i
sistemi di codifica dei caratteri
In generale, ogni documento elettronico è
costituito da un flusso (o stringa) di caratteri
Il carattere dunque è l’unità atomica per la
rappresentazione l’organizzazione ed il controllo
di dati testuali sull’elaboratore
La codifica dei caratteri
Come qualsiasi altro tipo di dati, anche i
caratteri vengono rappresentati all’interno
di un elaboratore mediante una codifica
numerica binaria
A
B
C
I coded character set
Per codificare i caratteri si stabilisce
una associazione biunivoca tra:


gli elementi di una collezione ordinata di
caratteri (character repertoir)
un insieme (code set) di codici numerici
(code point)
l’insieme risultante viene denominato
tecnicamente coded character set
I principali Coded Character
ASCII / ISO 646 IRV / US ASCII
ISO 8859 (il più utilizzato è ISO 8859-1 o
ISO Latin 1)
ISO/IEC 10646-2:2001: Universal
Character Set - Unicode 3.2
(http://www.unicode.org)
I linguaggi di codifica
La codifica dei caratteri non esaurisce i
problemi di rappresentazione delle
caratteristiche di un testo
Un testo è un oggetto complesso
caratterizzato da molteplici livelli
strutturali che non si limitano alla
sequenza di simboli del sistema di
scrittura (simboli alfabetici, numerici,
ortografici, diacritici)
I linguaggi di mark-up
Si parla propriamente di linguaggio di
codifica testuale solo in riferimento ai
linguaggi che consentono la
rappresentazione o il controllo di uno o più
livelli strutturali di un documento testuale
Tali linguaggi vengono correntemente
denominati mark-up language
I linguaggi di mark-up
Un linguaggio di mark-up è composto da:



un insieme di istruzioni detti tag o mark-up
che rappresentano o determinano le
caratteristiche del documento testuale
una grammatica che regola l’uso del mark-up
un semantica che definisce il dominio di
applicazione e la funzione del mark-up
I linguaggi di mark-up
Il mark-up viene inserito direttamente
all’interno del testo cui viene applicato
Ogni istruzione è a sua volta costituita da
una sequenza di caratteri, preceduta da
caratteri speciali che la delimitano e
permettono all’elaboratore di distinguere il
testo dal mark-up
Tipologia dei linguaggi di mark-up
Tradizionalmente i linguaggi di mark-up
sono stati divisi in due gruppi tipologici in
relazione a considerazioni semantiche e
funzionali
linguaggi procedurali o specifici
linguaggi descrittivi, o generici, o analitici
I linguaggi procedurali
Nei linguaggi procedurali il mark-up
specifica quali operazioni un dato
programma deve compiere su un
documento elettronico per ottenere una
determinata presentazione


la semantica è un processo computazionale
di trattamento del testo, una procedura
informatica
le caratteristiche specificate sono strutture di
formattazione, di resa grafica
Un esempio: Latex
\documentclass{article}
\begin{document}
\usepackage{xtheorem}
\section{First Section}
\DeclareInstance{theoremstyle}{example}{std}
{
pre-skip = 1cm,
post-skip = 1cm,
body-style = \ttfamily,
head-style = \sffamily,
post-head-action = \newline,
}
\begin{Def}
\emph{My package} is the \textsf{xtheorem}
package.
\end{Def}
\begin{Thm}
My package works as advertised.
\end{Thm}
\begin{Cor}[Achim]
It can be used.
\end{Cor}
\begin{Rem}
This is good.
\end{Rem}
\newtheorem{plain}{Thm}{Theorem}[section]
\newtheorem{plain}{Prop}[Thm]{Proposition}
\newtheorem{plain}{Lem}[Thm]{Lemma}
\newtheorem{plain}{Cor}[Thm]{Corollary}
\newtheorem{definition}{Def}[Thm]{Definition}
\newtheorem*{remark}{Rem}{Remark}
\newtheorem*{example}{Exam}{Example}
\section{Second Section}
I linguaggi dichiarativi
Nei linguaggi descrittivi il mark-up descrive
la struttura di un documento testuale
identificandone i componenti


la semantica predica l’appartenenza di una
porzione di testo a una determinata classe di
elementi testuali
le caratteristiche codificate sono strutture o
componenti astratti o logici
I linguaggi dichiarativi
In particolare ci si riferisce alla struttura
editoriale, costituita da componenti
(content object) organizzati in modo
gerarchico (OHCO)





Frontespizio,introduzione, corpo …
Capitoli, sottocapitoli, atti, scene, canti …
Titoli, epigrafi, abstract …
Paragrafi, versi, battute, entrate di
dizionario…
Enfasi, citazioni …
Il rapporto tra presentazione e
struttura editoriale astratta
Titolo
1. La codifica dei testi
Paragrafo
La codifica dei testi è la
rappresentazione di un
testo su un supporto
informatico mediante un
linguaggio formale.
Termine
straniero
Per effettuare tale codifica
vengono utilizzati dei
markup language.
Enfasi
Grassetto
centrato, etc
Spazio
orizzontale
Spazio
verticale
italico
Tipologia dei linguaggi di mark-up
La classificazione tradizionale dei
linguaggi di mark-up è stata di recente
sottoposta a diverse analisi critiche:



Allen Renear (modo
imperativo/indicativo/performativo dominio
logico/presentazionale)
Wendell Piez (validazione stretta/lasca e
prospettiva prolettica/metalettica)
Mavis Courname … e Fabio Ciotti
(semantica dichiarativa/procedurale dominio
astratto/presentazionale)
Requisiti dei linguaggi di mark-up
Oltre alla tipologia semantica vanno
considerati altri requisiti per caratterizzare
un linguaggio di mark-up
Tali requisiti sono importanti elementi di
valutazione per verificare se e in che
misura un linguaggio di mark-up soddisfa
le complesse esigenze della elaborazione
e trasmissione digitale di dati in ambito
scientifico
Requisiti dei linguaggi di mark-up
Tali requisiti possono essere suddivisi in
tre aree:

potenza espressiva

portabilità e riusabilità

standardizzazione e apertura
Potenza espressiva
La potenza espressiva di un linguaggio di
mark-up riguarda:




la capacità di modellizzare il maggior numero di
tipologie e generi testuali
la capacità di rappresentare adeguatamente il
maggior numero di livelli strutturali e di
caratteristiche di un documento tstuale
la capacità di esprimere tali caratteristiche
secondo diverse prospettive metodologiche
la capacità di associare metadati descrittivi e
gestionali ai documenti digitali
Portabilità e riusabilità
Un documento è un dispositivo comunicativo,
che valore in quanto può essere fruito dal
maggior numero di individui, senza limitazioni
di spazio e di tempo


Un documento digitale dovrebbe essere accessibile
su ogni piattaforma e dispositivo informatico
(portabilità)
Un documento digitale dovrebbe essere accessibile
anche a distanza di tempo dalla sua creazione
(riusabilità)
Portabilità e riusabilità
indipendenza dall’hardware,

ovvero da una particolare architettura (processore), da un
particolare supporto (disco magnetico, disco ottico, etc.), o
da un particolare dispositivo o sistema di output (video,
stampa)
indipendenza dal software

ovvero da singoli sistemi operativi e software deputati alla
creazione, analisi, elaborazione e visualizzazione di testi
elettronici
indipendenza logica e funzionale dai processi e dai
contesti applicativi

ovvero da un particolare processo di elaborazione, quale
ad esempio la produzione di versioni a stampa di un
documento, o l’analisi grammaticale di un corpus
linguistico, etc.
Apertura e standardizzazione
Un linguaggio di codifica (come ogni
altra tecnologia) dovrebbe essere
adottato universalmente dalla comunità
di utenti interessata al suo utilizzo esso
deve essere uno standard
Un linguaggio di codifica (come ogni
altra tecnologia) dovrebbe essere aperto
e di pubblico dominio
XML
XML - Extensible Markup Language:



è un linguaggio che consente la rappresentazione
di documenti e dati strutturati su supporto digitale
è uno dei più potenti e versatili sistemi per la
creazione, archiviazione, preservazione e
disseminazione di documenti digitali…
… ma la sua sintassi rigorosa e al contempo
flessibile ne rende possibile l’applicazione anche
nella rappresentazione di dati strutturati, fornendo
una soluzione alternativa ai tradizionali sistemi
DBMS relazionali
XML: le origini
XML è stato sviluppato dal World Wide Web
Consortium (http://www.w3.org)
Le specifiche sono state rilasciate come W3C
Recommendation nel 1998 e aggiornate nel 2000
XML deriva da SGML, un linguaggio di mark-up
dichiarativo sviluppato dalla International
Standardization Organization (ISO), e pubblicato
ufficialmente nel 1986 con la sigla ISO 8879
XML nasce come un sottoinsieme semplificato di
SGML orientato alla utilizzazione su World Wide
Web…
… ma ha assunto ormai un ruolo autonomo e una
diffusione ben maggiore del suo progenitore
XML: caratteristiche
XML è un metalinguaggio, che permette
di definire sintatticamente linguaggi di
mark-up
Un linguaggio XML permette di
esplicitare la (le) struttura(e) di un
documento in modo formale mediante
marcatori (mark-up) che vanno inclusi
all’interno del testo (character data)
XML: caratteristiche
XML adotta un formato di file di tipo
testuale: sia il mark-up sia il testo sono
stringhe di caratteri
XML si basa sul sistema di codifica dei
caratteri ISO 10646/UNICODE
Un documento XML è “leggibile” da un
utente umano senza la mediazione di
software specifico
XML: caratteristiche
XML è indipendente dal tipo di piattaforma
hardware e software su cui viene utilizzato
XML permette la rappresentazione di qualsiasi
tipo di documento (e di struttura testuale)
indipendentemente dalle finalità applicative
XML è indipendente dai dispositivi di
archiviazione e visualizzazione
un documento XML può essere archiviato su
qualsiasi tipo di supporto digitale (attuale e…
futuro!)
un documento XML può essere visualizzato su
qualsiasi dispositivo di output
XML: caratteristiche
On-line
WWW
File
XML
<Title> Titolo </title>
<p>Paragarafo ..
Carta
CD-ROM
<p>Paragrafo
DBMS NATIVI O RELAZIONALI
DOCUMENT MANAGEMENT SYSTEMS
XML: caratteristiche
XML può essere usato per la
rappresentazione di dati strutturati
(archivi, tabelle, matrici) in alternativa ai
formati di database tradizionali
XML può essere usato come formato di
scambio dati in applicazioni middleware
XML: caratteristiche
XML è uno standard di pubblico dominio
ogni software “conforme XML” è in grado di
gestire dati in formato XML
sono disponibili numerose applicazioni e
librerie open source per la manipolazione di
dati in formato XML basate su diversi
linguaggi di programmazione (Java, C,
Python, Perl…)
una applicazione in grado di elaborare dati in
formato XML viene definita elaboratore XML
XML: principi fondamentali
XML adotta un paradigma di codifica
dichiarativo e descrittivo
XML è un metalinguaggio
XML descrive un documento come una
struttura ad albero
XML introduce il concetto di “tipo di
documento” e di “sintassi del documento”
Il concetto di metalinguaggio
XML è un metalinguaggio




XML definisce un insieme regole
(meta)sintattiche, attraverso le quali è descrivere
formalmente un linguaggio di markup, detto
“applicazione XML”
ogni applicazione XML eredita un insieme di
caratteristiche sintattiche comuni
ogni applicazione XML a sua volta definisce una
sintassi formale particolare
ogni applicazione XML è dotata di una semantica
specificata in modo non formale
Il concetto di tipo di documento
La definizione di una applicazione XML
si basa su un determinato tipo di
documento
Un tipo di documento descrive le
caratteristiche di una classe di
documenti strutturalmente omogenei
Il tipo di documento è il fondamento della
sintassi e della semantica di una
applicazione XML
Il concetto di tipo di documento
Un tipo di documento descrive la struttura
della classe di documenti cui si riferisce
come un albero ordinato di componenti
testuali o elementi
Un tipo di documento è caratterizzato da



un insieme di elementi strutturali
le relazioni di dipendenza tra gli elementi
le relazioni di ricorrenza degli elementi
La struttura gerarchica ordinata
testo
corpo
?
?
frontespizio
introduzione
?
+
appendice
capitolo
+
titolo
titolo
autore
PCDATA
+
?
paragrafo
titolo
*
enfasi
+
titolo
paragrafo
paragrafo
*
citazione PCDATA
enfasi
+
citazione
Il concetto di tipo di documento
La struttura ad albero del tipo di documento
determina la sintassi del linguaggio di mark-up
XML
La sintassi di un tipo di documento deve essere
espressa implicitamente (mediante il mark-up) in
ogni documento XML
La definizione formale della sintassi di un tipo di
documento XML può essere espressa
esplicitamente in una Document Type Definition
(DTD) o un XML Schema
Strutture XML: gli elementi
I componenti strutturali di un documento
sono denominati elementi (element)
Ogni nodo dell’albero del tipo di
documento è un (tipo di) elemento
Ogni (tipo di) elemento è dotato di un
nome (detto identificatore generico) che lo
identifica
Strutture XML: gli attributi
A ogni elemento possono essere associati
uno o più attributi (attribute) che ne
specificano ulteriori caratteristiche o
proprietà non strutturali. Ad esempio:





il tipo rispetto a una data tassonomia
la lingua del suo contenuto testuale
un identificatore univoco
un numero di ordine
etc.
XML: documenti ben formati e
validi
Ogni documento XML deve essere ben
formato
Un documento è ben formato


se la sua struttura è implicita nel markup
e se rispetta i vincoli di buona formazione
indicati nelle specifiche
Un documento XML ben formato non
richiede la presenza di una DTD
XML: documenti ben formati e
validi
Un documento XML può essere valido
Un documento è valido se


si riferisce a una DTD esplicita mediante una
Doctype declaration
ne soddisfa i vincoli sintattici (nome, sequenza
occorrenze ed attributi degli elementi)
Il controllo di validità viene effettuato da un
apposito programma detto parser
La parte del documento XML all’interno del
nodo radice viene definita document instance
Come si crea un documento
XML
Un documento XML contiene il mark-up che
rappresenta linearmente la struttura
gerarchica degli elementi, i loro eventuali
attributi, e i caratteri del testo
L’inserimento di mark-up e caratteri deve
rispettare i vincoli di buona formazione
indicati nelle specifiche XML
Un documento valido deve rispettare anche i
vincoli sintattici definiti nella DTD
La forma di un documento XML
Ogni documento XML inizia con un
prologo che contiene:



una XML declaration
eventualmente una Doctype declaration (la
dichiarazione della DTD a cui il documento si
riferisce)
eventualmente una serie di processing
instruction
La forma di un documento XML
Nel documento ogni elemento non vuoto
(contenente cioè altri elementi o caratteri)
deve essere marcato da un tag iniziale e
da un tag finale
Ogni tag è costituito da caratteri
delimitatori e dal nome dell'elemento
La forma di un documento XML
<text>
<div1>
<p>Subito, con le prime parole che le rivolse, volle
avvisarla che non intendeva compromettersi in una
relazione troppo seria…</p>
<p>La sua famiglia? Una sola sorella non
ingombrante né fisicamente né moralmente, piccola
e pallida, di qualche anno più giovane di lui…</p>
…
</div1>
</text>
La forma di un documento XML
La relazione lineare tra i tag rappresenta
la relazione gerarchica tra gli elementi
Per ogni elemento, se il suo tag iniziale è
nel contenuto di un elemento P allora il
suo tag finale deve essere nel contenuto
del medesimo elemento P
Detto altrimenti le coppie di tag devono
annidarsi correttamene e mai sovrapporsi
La forma di un documento XML
SBAGLIATO!!!
<p>Subito, con le prime parole che le rivolse,
volle avvisarla che non intendeva
compromettersi in <emph>una relazione troppo
seria… </p>
<p>La sua famiglia?</emph>Una sola sorella
non ingombrante né fisicamente né
moralmente, piccola e pallida, di qualche anno
più giovane di lui… </p>
La forma di un documento XML
CORRETTO!!!
<p>Subito, con le prime parole che le rivolse,
volle avvisarla che non intendeva
compromettersi in <emph>una relazione
troppo seria… </emph> </p>
<p><emph>La sua famiglia?</emph> Una
sola sorella non ingombrante né fisicamente
né moralmente, piccola e pallida, di qualche
anno più giovane di lui… </p>
Applicazioni XML rilevanti
DocBook : DTD per la creazione di
manualistica tecnica curata dal consorzio
OASIS
XHTML 1.0: DTD per la creazione di documenti
Web realizzato dal W3 Consortium
Text Encoding Initiative: DTD per la creazione
di testi su supporto digitale in ambito
umanistico sviluppata dal TEI consortium
Encoded Archival Description: DTD per la
descrizione di materiali archivistici realizzato
dalla Library of Congress
Standard correlati a XML
XML adotta due linguaggi appositamente
sviluppati per la specificazione di strutture
ipertestuali complesse:


XML Linking Specification (XLink) specifica come
costruire elementi e attributi di collegamento
XML Extended Pointer Specification (XPointer)
specifica i sistemi di indirizzamento delle
destinazioni di un link
Standard correlati a XML
La presentazione di un documento XML viene
controllata da uno o più fogli di stile
I linguaggi di stile utilizzabili con XML sono

Extensible Stylesheet Language (XSL)
XPath: selezione e individuazione di nodi
XSLT: trasformazione tra alberi
XSL-FO: formattazione di pagina

Cascading Style Sheet (CSS)
La disseminazione del documento
digitale
Disseminazione on-line

biblioteche digitali
Disseminazione off-line


E-book
supporti digitali ottici
Il concetto di biblioteca digitale
Definiamo biblioteca digitale un sistema
informativo accessibile on-line
caratterizzato da



una collezione di documenti digitali, dotata
di un’organizzazione interna di natura
semantica
un apparato di metadati descrittivi e
gestionali
un insieme di servizi funzionali
Il concetto di biblioteca digitale
Organizzazione intradocumentale

I documenti sono oggetti complessi dotati di una
struttura interna che gioca un ruolo
fondamentale ai fini del reperimento e della
fruizione dell’informazione che veicolano
Organizzazione interdocumentale

Il contenuto informativo di una biblioteca si
distingue da un generico insieme di documenti in
quanto dotato di un’organizzazione complessiva
dovuta ad un agente intenzionale distinto dai
creatori dei singoli documenti in essa contenuti
I servizi della biblioteca digitale
La nozione di servizio di biblioteca
digitale si riferisce:


ai processi ed ai sistemi necessari alla
costituzione e alla gestione della biblioteca
digitale
alle risorse tecnologiche necessarie ad
implementare una biblioteca digitale
I servizi della biblioteca digitale
Servizi di archiviazione e preservazione
dei documenti
Servizi di gestione dei metadati
Servizi di ricerca dei documenti
Servizi di disseminazione dei documenti
Servizi di ricerca avanzati intra e
interdocumetali
Il sistema di gestione dei
metadati
Con il termine metadati si indica
l'insieme di dati e informazioni che
descrivono una risorsa o un documento
digitale
Il sistema di gestione dei
metadati
Metadati descrittivi


Descrizione del documento elettronico
attraverso le sue determinazioni
bibliografiche
Indicazione della fonte del testo per i
documenti elettronici che sono prodotti
mediante digitalizzazione di materiale
preesistente
Il sistema di gestione dei
metadati
Metadati amministrativi



Documentazione degli aspetti tecnici relativi
ai formati di digitalizzazione
Documentazione delle metodologie e dei
linguaggi adottati nella codifica del
documento
Documentazione delle procedure e delle
tecnologie adottate nella digitalizzazione e
nella preservazione del documento digitale
I servizi di disseminazione
I servizi di disseminazione dei
documenti costituiscono nel loro
complesso l’interfaccia utente del
sistema biblioteca digitale
Possiamo distinguere tre modalità
con cui un utente può accedere ai
documenti archiviati in una biblioteca
digitale
I servizi di disseminazione
Distribuzione remota di file
contenenti documenti digitali in vari
formati per la consultazione off-line

mediante tecnologie di trasferimento
file (con protocollo FTP o HTTP),
eventualmente con la mediazione di
pagine Web che fungono da indice
attivo e da guida all’accesso per gli
utenti
I servizi di disseminazione
Consultazione on-line di documenti in
ambiente Web


i documenti vengono inviati in formato HTML
all’user agent dell’utente, ma alla fonte
possono essere archiviati in vari formati;
in questo caso la versione HTML viene
generata dinamicamente dal lato server
prima di essere inviata mediante protocollo
HTTP
Servizi di ricerca avanzati
Ricerca avanzata intra e
interdocumentale basata su sistemi
di information retrieval

l'utente non solo è in grado di leggere il
testo e di fare ricerche per termini, ma
dispone di un vero e proprio ambiente
di lavoro virtuale, con strumenti di
ricerca contestuale
XML e biblioteche digitali
XML rappresenta una soluzione ottimale
per la creazione di servizi di biblioteca
digitale

Per la digitalizzazione di documenti

Per la gestione dei metadati

Per la creazione di servizi avanzati di accesso
E-book: il futuro del libro?
I supporti digitali, almeno
per ora, non hanno
rappresentato una vera e
propria alternativa al libro
cartaceo
L’attività della lettura, in
gran parte delle sue forme
e manifestazioni, è rimasta
legata al rapporto con il
tradizionale libro cartaceo
I limiti della lettura elettronica
Dal punto di vista tecnico i dispostivi
informatici presentano evidenti limiti di
ergonomia e versatilità


la risoluzione e la qualità grafica
dell’immagine digitale sono di gran lunga
inferiori a quella della stampa
la lettura prolungata su schermo (soprattutto
sugli schermi a tubo catodico) induce fastidi
e disagi alla vista
I limiti della lettura elettronica


I dispositivi hardware sono scarsamente o per
nulla portabili, e comunque necessitano di
accedere a fonti di energia
La presenza di molteplici tecnologie hardware
e software per la codifica, archiviazione e
fruizione dei contenuti digitali costringe gli
utenti a servirsi di numerosi strumenti diversi,
ognuno con una sua particolare interfaccia
I limiti della lettura elettronica

Ma non meno rilevanti sono stati gli ostacoli
culturali
La diffusa e consolidata familiarità con il libro a
stampa
Il ruolo fondamentale nella società occidentale
della parola scritta nella trasmissione culturale e
nel processo formativo delle nuove generazioni
Il vero e proprio rapporto affettivo che si instaura
tra un lettore e i suoi libri
La predominante diffidenza o indifferenza di
molta parte del mondo umanistico verso i
dispositivi informatici, e la conseguente scarsa
alfabetizzazione informatica che ne è derivata
E-book: il futuro del libro?
Le tecnologia degli e-book nasce proprio
per mettere in discussione la centralità del
libro cartaceo come supporto della lettura
Gli E-book
In generale con il
termine e-book (libro
elettronico) si intende
un’opera letteraria
monografica pubblicata
in forma digitale e
consultabile mediante
appositi dispositivi
informatici
Gli E-book
Il termine e-book viene comunemente impiegato
per indicare sia una pubblicazione su supporto
digitale sia gli strumenti con cui vi si accede
Per evitare questa ambivalenza useremo
l’espressione dispositivo di lettura per indicare
gli strumenti hardware e software che
consentono a un utente di avere accesso a
un’opera letteraria in formato elettronico
Le tecnologie e-book
Lo sviluppo di standard per la creazione
distribuzione e fruizione dei documenti digitali
La comparsa dei primi dispositivi software e
hardware per la lettura di e-book
Il perfezionamento delle tecnologie di
visualizzazione su schermo dei caratteri
Lo sviluppo di tecnologie per la protezione del
copyright sui contenuti digitali (Digital Right
Managment, in sigla DRM)
I formati per i libri elettronici
Open eBook Publication Structure
Specification
Adobe Portable Document Format
Formati proprietari: TK3, Palm Doc…
Open eBook Format
Sviluppato dal consorzio indipendente Open
eBook Forum (www.oeb.com)
Formato standard di pubblico dominio
È un mark-up language basato su




XML
HTML
CSS
Dublin Core (metadati)
I dispositivi di lettura
I dispositivi di lettura per gli e-book possono
essere divisi in due gruppi
Lettori software

Applicazioni specializzate per piattaforme PC e
palmari
Lettori hardware dedicati


Apparecchi
progettati
esclusivamente
o
principalmente per la visualizzazione di libri elettronici
In linea generale si presentano come dei computer
palmari, privi di tastiera e dotati di schermi LCD ad
alta risoluzione, e cercano di riprodurre le
caratteristiche ergonomiche dei libri tradizionali
I dispositivi di lettura software
Microsoft Reader



Versione per palmari
Pocket PC e per
piattaforma Pc
Windows
Usa una versione
compilata di OEB
Implementa tecnologie
di protezione dei diritti
I dispositivi di lettura software
Adobe Ebook Reader



Basato su PDF
Versione per
piattaforme PC
Windows Mac
Implementa tecnologie
di protezione dei diritti
I lettori hardware
I lettori Gemstar

GEB 1150
Dimensioni di un libro
tascabile
Peso 700 grammi
Schermo touch screen
320 per 480 B/N
8 Mb RAM
Batteria 20 ore circa
Il futuro: e-ink ed e-paper
Se confrontiamo i dispositivi di lettura ebook attualmente disponibili con i libri
cartacei, il loro livello di usabilità e
portabilità resta ancora insoddisfacente
Per non parlare delle abitudini percettive
e motorie che ci legano a quella pila di
fogli di carta rilegati, e del fascino che
essa esercita verso un vero lettore
Il futuro: e-ink ed e-paper
Numerosi ricercatori sono coinvolti da
diversi anni nello sviluppo di nuovi
supporti dalle caratteristiche veramente
rivoluzionarie
Si tratta delle delle tecnologie
denominate


e-paper (carta elettronica) sviluppata dalla
Xerox
e-ink (inchiostro elettronico) sviluppata
presso lo MIT
Il futuro: e-ink ed e-paper
L’idea di questi progetti è la creazione di un
supporto di visualizzazione

Flessibile

Sottile

Leggero


Dalle proprietà tattili di un normale foglio di
carta…
… ma in grado di svolgere tutte le funzioni di
output visivo attualmente effettuate dagli
schermi a tubo catodico o a cristalli liquidi
Il futuro degli e-book
Le condizioni culturali e tecnologiche perché gli
e-book si possano affermare come strumenti di
diffusione della conoscenza presso vaste fasce
di utenza si sono verificate quasi tutte
Paradossalmente i ritardi culturali più evidenti si
scontano sul versante della produzione e
distribuzione dei contenuti digitali
Il futuro degli e-book
La diffusione degli e-book non determinerà
automaticamente la fine della funzione del
libro cartaceo nel nostro sistema culturale
e formativo
Ma è ormai chiaro che tale funzione non
sarà più esclusiva, e che accanto al libro
cartaceo nei prossimi anni prenderanno
posto molti altri strumenti
Il futuro degli e-book
Queste considerazioni ci permettono anche di
rispondere ai timori sul destino della cultura
che ha caratterizzato la nostra civiltà e che
sembra destinata a essere travolta dal golem
elettronico
Secondo questi timori la “scomparsa” del libro
cartaceo porterà con sé la crisi dei valori e dei
contenuti culturali a esso associati: il pensiero
analitico, la priorità del linguaggio verbale,
l’attenzione alla qualità espressiva delle
parole, l’identità individuale profonda, la
letteratura…
Il futuro degli e-book
Al contrario i nuovi media digitali offrono
l’opportunità di sviluppare e sperimentare
nuovi modelli e nuovi contenuti culturali
che si affiancheranno a quello testuale ma
non lo sostituiranno
Scarica

presentazione PowerPoint