Milano, 23 Luglio 2004
“Il potere del web sta nella sua universalità. Un aspetto essenziale è
che tutti possano accedervi a prescindere dalle disabilità”
Tim Berners-Lee
Applicazione di tecniche e strumenti di
comunicazione multimodale e di valutazione
della leggibilità e complessità di contenuti web
Tesi di Laurea di Davide Ceriani
Indice di presentazione
Introduzione al tema Accessibilità
Il progetto navigAbile
Project Management di navigAbile
Il Dizionario di navigAbile
Un sistema di analisi di leggibilità
e comprensibilità di un testo
Conclusioni e Future Works
Accessibilità e usabilità
Usabilità. Un sito usabile soddisfa i bisogni informativi
dell’utente in modo efficace ed efficiente, fornendogli
facilità di accesso e navigabilità
Accessibilità. Un sito accessibile è un ambiente
multimediale in cui il contenuto informativo, le
procedure di navigazione e i servizi disponibili siano
pienamente fruibili da qualsiasi tipo di utente
indipendentemente:
dalle sue capacità, dalla sua abilità
dalla configurazione hardware e software disponibile
Il rapporto tra queste due caratteristiche in un sito web
è di fondamentale importanza per la sua corretta
fruizione
Accessibilità
Progettare pagine web accessibili significa:
garantire a tutti gli utenti della rete la fruibilità delle
informazioni e dei servizi disponibili
porre l’utente e le sue esigenze al centro
dell’attenzione
Benefici non solo per i disabili, ma per chiunque utilizzi il
web per lavoro o per reperire informazioni
Fondamentale per l’accessibilità è la separazione della
forma dal contenuto: il significato di un documento deve
essere
salvato
separatamente
da
come
deve
apparireCSS
Un sito accessibile dovrebbe sfruttare i cosiddetti
equivalenti multimodali
Normativa
A livello internazionale, l’ente più rappresentativo
preposto alla definizione delle linee guida per il tema
dell’accessibilità dei documenti web è il WAI (Web
Accessibility Initiative) proposto dal W3C
Ottenere una certificazione riconosciuta spesso non basta:
con i validatori si può verificare solamente un
sottoinsieme dei requisiti di accessibilità (accessibilità
sostanziale e non formale)
Legge Stanca (Gennaio 2004): lo scopo della legge è quello
di abbattere le "barriere virtuali" che limitano l’accesso dei
disabili alla Società della Informazione
Limiti della normativa: carenza di norme per la tutela dei
disabili cognitivi
Perchè un sito accessibile
Valore etico e sociale del progetto
Possibilità di raggiungere un bacino di
utenza più vasto e di conseguenza la
possibilità di aumentare la propria quota di
mercato
L’attenzione
alla
tematica
sociale
dell’accessibilità può costituire un vantaggio
competitivo in termini di immagine
Il disaccoppiamento contenuti-presentazione
può aprire la strada alla portabilità del sito
(su browser speciali per disabili, WAP,
UMTS, PocketPC, Digitale Terrestre…)
La CAA
La Comunicazione Aumentativa Alternativa è un insieme
di metodi, strategie e ausili di comunicazione che servono
per potenziare le capacità del soggetto di comunicare
Quando una persona non può accedere ai normali mezzi
espressivi (parola - scrittura), può ricorrere ad un codice
alternativo per rendere trasmissibile il proprio pensiero
I sistemi iconici, in sostituzione del sistema alfabetico,
strutturalmente molto più complesso, per la loro facilità di
comprensione del significato rappresentato, costituiscono
una notevole facilitazione nell’ambito della CAA
Esempi di linguaggi iconici: PCS, Bliss, PICSYM
Il progetto navigAbile
in partnership con:
LA VISION
I disabili in Italia sono circa 3 milioni.
Moltissimi di loro sono giovani e
potenziali utenti di internet ma esclusi
dal web. La vision del progetto
navigAbile è quella di contribuire a
realizzare un web diverso:
Un web che possa essere uno
strumento di formazione e di
crescita per tutti, e in particolare
per i disabili in età evolutiva
Un web a cui la persona disabile
possa accedere in modo semplice
e intuitivo
Un web che si adatti al
linguaggio e alle esigenze di
accessibilità
/
navigabilità
dell’utente e non viceversa
LA MISSION
Progettare, sviluppare e
validare scientificamente
un’architettura abilitante
per
migliorare
l’accessibilità
del
web
prioritariamente ai disabili
in
età
evolutiva,
permettendo
loro,
attraverso
l’utilizzo
e
l’esplorazione della Rete,
di recuperare, valorizzare
e potenziare le diverse
abilità possedute.
Focus del progetto
Focus del progetto navigAbile
Servizio
Caratteristiche di
accessibilità
sito/portale: sono le
“rampe di accesso
elettroniche” per il web
Formazione e
“cultura
web”
Servizio
Servizio
Servizi futuri
Strumenti personali ausili e
strumentazione HW e
SW (e.g. tastiere e
mouse speciali)
Oggi vi è una “cultura web” diffusa (soprattutto tra i giovani anche
disabili) e gli ausili hanno raggiunto una ragionevole maturità.
Sono invece bloccanti le barriere che riguardano il cuore del
“sistema web”, ossia le caratteristiche di accessibilità di siti e
portali. Da lì bisogna partire per creare un web più accessibile
I servizi di navigAbile
Servizio
Servizio
Servizio
Servizio
I Requisiti dell’Evoluzione navigAbile
Servizi di
Registrazione e
Profilazione
Il servizio di registrazione e profilazione deve
permettere di raccogliere anche informazioni rispetto
alle esigenze di accessibilità dell’utente
Servizi di
Personalizzazione e
Navigazione:
I contenuti devono essere presentati nel modo più
adatto all’utente fornendo on-line, dove possibile, il
supporto necessario per la navigazione e la fruizione
degli stessi da parte di tutti
Servizi di Gestione
dei Contenuti:
I servizi redazionali devono mettere in condizione i
“redattori” di fornire contenuti altamente accessibili e
disponibili in versioni alternative
Risultati del progetto
Servizi architetturali: navigAbile è innanzitutto un’architettura
orientata ai servizi (SOA). Servizi di base:
Semplificazione struttura e contenuti: esistono 3 livelli di
semplificazione dei contenuti: Basic, Easy, Standard
Dizionario multimodale
Tabella di comunicazione
Sito dedicato di navigAbile (www.navigabile.it): è nato per tre
esigenze diverse:
Sottoporre a test i servizi architetturali, realizzando un primo
esempio di applicazione che li mostrasse in azione
Applicare i servizi navigAbile a un contesto semplice ma
realistico di un sito di informazione
Mettere a disposizione agli utenti coinvolti nella sperimentazione
alcuni servizi web accessibili, quali la bacheca o le news
L’architettura
Obiettivi
dell’architettura SOA:
Non
ghettizzazione
Servizi
condivisibili
Non invasività
Semplicità d’uso
Profilazione
e
personalizzazione
Flessibilità
Project Management
Si possono individuare tre componenti
fondamentali che hanno caratterizzato il
project management di navigAbile:
Interdisciplinarietà:
competenze
distribuite tra diversi attori
Specificità del testing: valutazione
dell’esperienza della coppia utente-tutor
Validazione scientifica sulla base dei
risultati del testing
Planning secondo la logica del “think big,
start small, scale fast”
Il dizionario di navigAbile
FORMA_FLESSA: la tabella che
contiene tutte le forme flesse dei lemmi
della lingua italiana. Ad esempio per il
lemma “andare” sono presenti le
forme flesse: “vado”, “vai”, etc. Per
ogni forma flessa è presente una tag
grammaticale che permette di ottenere
la forma flessa a partire dal lemma
origine
LEMMA: contiene tutti i lemmi della
lingua italiana. I lemmi uguali hanno
lo stesso attributo “LINK_LEMMA”
che viene usato per la relazione con la
tabella “FORMA_FLESSA”. L’attributo
“VDB_INFO” codifica l’appartenenza
o meno al Vocabolario di Base di De
Mauro
LEMMA
PK
ID
FK2
FK1
LEMMA_ORIGINE
LINK_LEMMA
CD_CATEGORIA_GRAMMATICALE
CD_FORMA
VDB_INFO
ID_CATEGORIA
ID_CATEGORIA_PADRE
URL_PCS
URL_BLISS
URL_PICSYM
URL_IMMAGINE_GENERICA
URL_ANIMAZIONE
URL_SUONO_PREREG
PCS_VISIBLE
FORMA_FLESSA
PK,FK1
ID
FK1
VOCABOLO
CD_TAG_GRAMMATICALE
LINK_LEMMA
DESCRIZIONI
PK
ID
LEMMA
SILLABAZIONE
ETIMOLOGIA
CATEGORIA GRAMMATICALE
ID1
ID2
DESCRIZIONE
SINONIMI
PK
ID
ID_LEMMA
SINONIMO
ID_GRUPPO
Scenari di utilizzo del dizionario
Navigazione visuale del dizionario:
Per categorie
Per ordine alfabetico
Supporto al calcolo degli indici di comprensibilità e
leggibilità di un testo
Visualizzazione dei dettagli di una voce del
dizionario (con tabella DESCRIZIONI)
Contiene le informazioni per l’analisi sintattica. Ogni
lemma ha nei suoi attributi delle informazioni che
specificano la sua categoria grammaticale.
Servizio di suggerimento dei sinonimi (thesaurus)
più comprensibili (con tabella SINONIMI)
Leggibilità e comprensibilità
Entrambe intuitivamente sono legate alla facilità con cui
si riesce a catturare l’informazione presente in un testo
Leggibilità
Visiva
Linguistica
La leggibilità linguistica di un testo dipende dal modo
in cui sono strutturate le sue frasi: periodi brevi che
contengono parole brevi sono più leggibili di frasi
lunghe, così come frasi lineari sono più leggibili di frasi
involute, ricche di incisi e subordinate
La comprensibilità di un testo dipende dalle parole che
contiene, ma anche dalla condivisione di un universo
culturale: gli specialisti di un settore specifico si
comprendono perché condividono un contesto comune
Analisi della comprensibilità:
il Vocabolario di Base di De Mauro
Il Vocabolario di Base della lingua italiana (VdB)
di Tullio De Mauro, pubblicato nel 1997, è un
elenco dei lemmi più comuni, elaborato
prevalentemente secondo criteri statistici
I lemmi del VdB sono classificati in tre livelli:
Vocabolario fondamentale: circa 2000 lemmi: sono i
più frequenti in assoluto della nostra lingua
Vocabolario di alto uso: i successivi 2.750 lemmi
dell'insieme preso dal LIF (Lessico di frequenza della
lingua italiana contemporanea)
Vocabolario di alta disponibilità: 2.350 lemmi
determinati in vario modo, soprattutto con dizionari
dell'italiano comune
L’indicatore di comprensibilità
di navigAbile
I COMP 
  N f    Nu    N d
N
100
Nf: numero lemmi del VdB fondamentale
Nu: numero lemmi del VdB ad alto uso
Nd: numero lemmi del VdB ad alta disponibilità
N: numero totale di lemmi
=1, =0.75, =0.5
L’indicatore di comprensibilità si basa sulla su
statistiche di appartenenza delle varie parole del
testo ai vari livelli del Vocabolario di Base di Tullio
De Mauro e fornisce un’indicazione quantitativa
sulla comprensibilità delle parole del testo, sulla base
delle scelte lessicali dell’autore.
Analisi di leggibilità: Gulpease
Un indice di leggibilità è una formula matematica che,
attraverso un calcolo statistico, è in grado di predire la
reale difficoltà di un testo in base a una scala predefinita
di valori, dipendente dal grado di istruzione del lettore
La formula per il calcolo dell’Indice Gulpease è stata
determinata verificando con una serie di test la reale
comprensibilità di un corpus di testi
I limiti di questo indicatore stanno nella sua parzialità:
non tiene conto infatti della struttura sintattica della frase,
che è un elemento fondamentale che determina la
complessità della frase
NL
NF
I G  89  10 
 300 
NP
NP
NL: numero di lettere
NP: numero di parole
NF: numero di frasi
Un nuova metodologia per la valutazione della
leggibilità con strumenti di analisi sintattica
Parser chunk-IT: è uno shallow parser  Robustezza
Esistono 10 tipi di chunk per l’italiano:
Chunk nominale: “la mia casa”
Chunk preposizionale: “di mio figlio”
Chunk verbale “rimangono”
Altri tipi: aggettivo, avverbio, gerundio, infinito, participio,
predicato, subordinato
Esempio di frase divisa in chunk:
“A Milano, una speciale squadra ripulirà la città dai graffiti.”
“A Milano”P_C “una speciale squadra”N_C “ripulirà”FV_C
città”N_C “dai graffiti”P_C
Possibili impieghi del parser:
Calcolo leggibilità
Disambiguazione lemmi
Keyword extraction
Analisi delle concordanze
“la
L’indicatore di leggibilità proposto
La metodologia introdotta per la valutazione della leggibilità
mira ad arricchire il contenuto informativo dell’indice di
Gulpease, attraverso l’impiego di informazioni derivanti
dall’analisi sintattica
Introduzione di un nuovo indicatore ottenuto come media
(eventualmente pesata) di una serie di features:
Numero medio di parole per frase
Numero medio di lettere per frase
Numero medio di chunk per frase
Distribuzione delle tipologie di chunk
I LEGG  a  I G  b  I C  c  I T
I pesi sono stati ricavati con criteri statistici sulla base di un
corpus di testi semplificati, validati da un team di linguisti
IC 
100
 NC 

 1
 NF

Peso del chunk di tipo i-esimo
T
IT  k 
w  N
i 1
i
i
NC
Numero medio di chunk per frase
Numero di chunk del tipo i-esimo
Lo schema del sistema di analisi
L’insieme di questi due indicatori consente di avere una comparazione
quantitativa tra diversi testi e quindi in particolare, nell’ambito del progetto
navigAbile, permette di valutare l’efficacia del processo di semplificazione a vari
livelli (Normal, Easy, Basic) del testo di una stessa notizia
Conclusioni sull’accessibilità
Riassumendo possiamo individuare due strategie
principali per affrontare il problema dell’accessibilità
dei portali web:
Impiego di versioni parallele
Design for All: prevede l’impiego di una sola
versione che deve tener conto dei bisogni e delle
esigenze di tutti gli utenti a cui è rivolto il portale
navigAbile propone una soluzione che unisce i pregi
dei due approcci, attraverso la profilazione e
personalizzazione, che permettono una presentazione
dei contenuti che si adatta alle abilità e alle esigenze
dell’utente
Con la condivisione dei servizi si ha una riduzione dei
costi legati all’accessibilità dei portali che utilizzano i
servizi di navigabile
Conclusioni sull’analizzatore di
comprensibilità e leggibilità
Nuovo metodo di valutazione di leggibilità e comprensibilità
Valutazione comprensibilità: basata sulla su statistiche di
appartenenza delle varie parole del testo ai vari livelli del VdB
Valutazione leggibilità: l’indicatore proposto mira ad arricchire
il contenuto informativo dell’indice di Gulpease, attraverso
l’impiego di informazioni derivanti dall’analisi sintattica,
ottenute attraverso uno shallow parser
Analisi dei 2 indici
Comparazione quantitativa che permette di valutare l’efficacia
del processo di semplificazione a vari livelli (Normal, Easy,
Basic) del testo di una stessa notizia.
Notevole valore aggiunto per navigAbile, che ha come obiettivo
primario il raggiungimento della massima fruibilità
dell’informazione da parte di tutte le tipologie di utenti
Future works
Ipotesi di attribuzione dei pesi per il calcolo
dell’indice di leggibilità complessivo, e relativa
validazione, eventualmente effettuata con diverse
categorie di utenti
Ipotesi alternativa di attribuzione dei pesi
dell’indicatore di leggibilità, basata sulle probabilità
condizionate di concatenamento di chunk consecutivi
Componente architetturale per l’estrazione delle
keywords
Sfruttamento del parser per l’analisi delle
concordanze
Componenti architetturali per la gestione del Bliss
Word Predictor da integrare nel compositore frasi
Scarica

navigAbile, diapositive di presentazione