Milano, 23 Luglio 2004 “Il potere del web sta nella sua universalità. Un aspetto essenziale è che tutti possano accedervi a prescindere dalle disabilità” Tim Berners-Lee Applicazione di tecniche e strumenti di comunicazione multimodale e di valutazione della leggibilità e complessità di contenuti web Tesi di Laurea di Davide Ceriani Indice di presentazione Introduzione al tema Accessibilità Il progetto navigAbile Project Management di navigAbile Il Dizionario di navigAbile Un sistema di analisi di leggibilità e comprensibilità di un testo Conclusioni e Future Works Accessibilità e usabilità Usabilità. Un sito usabile soddisfa i bisogni informativi dell’utente in modo efficace ed efficiente, fornendogli facilità di accesso e navigabilità Accessibilità. Un sito accessibile è un ambiente multimediale in cui il contenuto informativo, le procedure di navigazione e i servizi disponibili siano pienamente fruibili da qualsiasi tipo di utente indipendentemente: dalle sue capacità, dalla sua abilità dalla configurazione hardware e software disponibile Il rapporto tra queste due caratteristiche in un sito web è di fondamentale importanza per la sua corretta fruizione Accessibilità Progettare pagine web accessibili significa: garantire a tutti gli utenti della rete la fruibilità delle informazioni e dei servizi disponibili porre l’utente e le sue esigenze al centro dell’attenzione Benefici non solo per i disabili, ma per chiunque utilizzi il web per lavoro o per reperire informazioni Fondamentale per l’accessibilità è la separazione della forma dal contenuto: il significato di un documento deve essere salvato separatamente da come deve apparireCSS Un sito accessibile dovrebbe sfruttare i cosiddetti equivalenti multimodali Normativa A livello internazionale, l’ente più rappresentativo preposto alla definizione delle linee guida per il tema dell’accessibilità dei documenti web è il WAI (Web Accessibility Initiative) proposto dal W3C Ottenere una certificazione riconosciuta spesso non basta: con i validatori si può verificare solamente un sottoinsieme dei requisiti di accessibilità (accessibilità sostanziale e non formale) Legge Stanca (Gennaio 2004): lo scopo della legge è quello di abbattere le "barriere virtuali" che limitano l’accesso dei disabili alla Società della Informazione Limiti della normativa: carenza di norme per la tutela dei disabili cognitivi Perchè un sito accessibile Valore etico e sociale del progetto Possibilità di raggiungere un bacino di utenza più vasto e di conseguenza la possibilità di aumentare la propria quota di mercato L’attenzione alla tematica sociale dell’accessibilità può costituire un vantaggio competitivo in termini di immagine Il disaccoppiamento contenuti-presentazione può aprire la strada alla portabilità del sito (su browser speciali per disabili, WAP, UMTS, PocketPC, Digitale Terrestre…) La CAA La Comunicazione Aumentativa Alternativa è un insieme di metodi, strategie e ausili di comunicazione che servono per potenziare le capacità del soggetto di comunicare Quando una persona non può accedere ai normali mezzi espressivi (parola - scrittura), può ricorrere ad un codice alternativo per rendere trasmissibile il proprio pensiero I sistemi iconici, in sostituzione del sistema alfabetico, strutturalmente molto più complesso, per la loro facilità di comprensione del significato rappresentato, costituiscono una notevole facilitazione nell’ambito della CAA Esempi di linguaggi iconici: PCS, Bliss, PICSYM Il progetto navigAbile in partnership con: LA VISION I disabili in Italia sono circa 3 milioni. Moltissimi di loro sono giovani e potenziali utenti di internet ma esclusi dal web. La vision del progetto navigAbile è quella di contribuire a realizzare un web diverso: Un web che possa essere uno strumento di formazione e di crescita per tutti, e in particolare per i disabili in età evolutiva Un web a cui la persona disabile possa accedere in modo semplice e intuitivo Un web che si adatti al linguaggio e alle esigenze di accessibilità / navigabilità dell’utente e non viceversa LA MISSION Progettare, sviluppare e validare scientificamente un’architettura abilitante per migliorare l’accessibilità del web prioritariamente ai disabili in età evolutiva, permettendo loro, attraverso l’utilizzo e l’esplorazione della Rete, di recuperare, valorizzare e potenziare le diverse abilità possedute. Focus del progetto Focus del progetto navigAbile Servizio Caratteristiche di accessibilità sito/portale: sono le “rampe di accesso elettroniche” per il web Formazione e “cultura web” Servizio Servizio Servizi futuri Strumenti personali ausili e strumentazione HW e SW (e.g. tastiere e mouse speciali) Oggi vi è una “cultura web” diffusa (soprattutto tra i giovani anche disabili) e gli ausili hanno raggiunto una ragionevole maturità. Sono invece bloccanti le barriere che riguardano il cuore del “sistema web”, ossia le caratteristiche di accessibilità di siti e portali. Da lì bisogna partire per creare un web più accessibile I servizi di navigAbile Servizio Servizio Servizio Servizio I Requisiti dell’Evoluzione navigAbile Servizi di Registrazione e Profilazione Il servizio di registrazione e profilazione deve permettere di raccogliere anche informazioni rispetto alle esigenze di accessibilità dell’utente Servizi di Personalizzazione e Navigazione: I contenuti devono essere presentati nel modo più adatto all’utente fornendo on-line, dove possibile, il supporto necessario per la navigazione e la fruizione degli stessi da parte di tutti Servizi di Gestione dei Contenuti: I servizi redazionali devono mettere in condizione i “redattori” di fornire contenuti altamente accessibili e disponibili in versioni alternative Risultati del progetto Servizi architetturali: navigAbile è innanzitutto un’architettura orientata ai servizi (SOA). Servizi di base: Semplificazione struttura e contenuti: esistono 3 livelli di semplificazione dei contenuti: Basic, Easy, Standard Dizionario multimodale Tabella di comunicazione Sito dedicato di navigAbile (www.navigabile.it): è nato per tre esigenze diverse: Sottoporre a test i servizi architetturali, realizzando un primo esempio di applicazione che li mostrasse in azione Applicare i servizi navigAbile a un contesto semplice ma realistico di un sito di informazione Mettere a disposizione agli utenti coinvolti nella sperimentazione alcuni servizi web accessibili, quali la bacheca o le news L’architettura Obiettivi dell’architettura SOA: Non ghettizzazione Servizi condivisibili Non invasività Semplicità d’uso Profilazione e personalizzazione Flessibilità Project Management Si possono individuare tre componenti fondamentali che hanno caratterizzato il project management di navigAbile: Interdisciplinarietà: competenze distribuite tra diversi attori Specificità del testing: valutazione dell’esperienza della coppia utente-tutor Validazione scientifica sulla base dei risultati del testing Planning secondo la logica del “think big, start small, scale fast” Il dizionario di navigAbile FORMA_FLESSA: la tabella che contiene tutte le forme flesse dei lemmi della lingua italiana. Ad esempio per il lemma “andare” sono presenti le forme flesse: “vado”, “vai”, etc. Per ogni forma flessa è presente una tag grammaticale che permette di ottenere la forma flessa a partire dal lemma origine LEMMA: contiene tutti i lemmi della lingua italiana. I lemmi uguali hanno lo stesso attributo “LINK_LEMMA” che viene usato per la relazione con la tabella “FORMA_FLESSA”. L’attributo “VDB_INFO” codifica l’appartenenza o meno al Vocabolario di Base di De Mauro LEMMA PK ID FK2 FK1 LEMMA_ORIGINE LINK_LEMMA CD_CATEGORIA_GRAMMATICALE CD_FORMA VDB_INFO ID_CATEGORIA ID_CATEGORIA_PADRE URL_PCS URL_BLISS URL_PICSYM URL_IMMAGINE_GENERICA URL_ANIMAZIONE URL_SUONO_PREREG PCS_VISIBLE FORMA_FLESSA PK,FK1 ID FK1 VOCABOLO CD_TAG_GRAMMATICALE LINK_LEMMA DESCRIZIONI PK ID LEMMA SILLABAZIONE ETIMOLOGIA CATEGORIA GRAMMATICALE ID1 ID2 DESCRIZIONE SINONIMI PK ID ID_LEMMA SINONIMO ID_GRUPPO Scenari di utilizzo del dizionario Navigazione visuale del dizionario: Per categorie Per ordine alfabetico Supporto al calcolo degli indici di comprensibilità e leggibilità di un testo Visualizzazione dei dettagli di una voce del dizionario (con tabella DESCRIZIONI) Contiene le informazioni per l’analisi sintattica. Ogni lemma ha nei suoi attributi delle informazioni che specificano la sua categoria grammaticale. Servizio di suggerimento dei sinonimi (thesaurus) più comprensibili (con tabella SINONIMI) Leggibilità e comprensibilità Entrambe intuitivamente sono legate alla facilità con cui si riesce a catturare l’informazione presente in un testo Leggibilità Visiva Linguistica La leggibilità linguistica di un testo dipende dal modo in cui sono strutturate le sue frasi: periodi brevi che contengono parole brevi sono più leggibili di frasi lunghe, così come frasi lineari sono più leggibili di frasi involute, ricche di incisi e subordinate La comprensibilità di un testo dipende dalle parole che contiene, ma anche dalla condivisione di un universo culturale: gli specialisti di un settore specifico si comprendono perché condividono un contesto comune Analisi della comprensibilità: il Vocabolario di Base di De Mauro Il Vocabolario di Base della lingua italiana (VdB) di Tullio De Mauro, pubblicato nel 1997, è un elenco dei lemmi più comuni, elaborato prevalentemente secondo criteri statistici I lemmi del VdB sono classificati in tre livelli: Vocabolario fondamentale: circa 2000 lemmi: sono i più frequenti in assoluto della nostra lingua Vocabolario di alto uso: i successivi 2.750 lemmi dell'insieme preso dal LIF (Lessico di frequenza della lingua italiana contemporanea) Vocabolario di alta disponibilità: 2.350 lemmi determinati in vario modo, soprattutto con dizionari dell'italiano comune L’indicatore di comprensibilità di navigAbile I COMP N f Nu N d N 100 Nf: numero lemmi del VdB fondamentale Nu: numero lemmi del VdB ad alto uso Nd: numero lemmi del VdB ad alta disponibilità N: numero totale di lemmi =1, =0.75, =0.5 L’indicatore di comprensibilità si basa sulla su statistiche di appartenenza delle varie parole del testo ai vari livelli del Vocabolario di Base di Tullio De Mauro e fornisce un’indicazione quantitativa sulla comprensibilità delle parole del testo, sulla base delle scelte lessicali dell’autore. Analisi di leggibilità: Gulpease Un indice di leggibilità è una formula matematica che, attraverso un calcolo statistico, è in grado di predire la reale difficoltà di un testo in base a una scala predefinita di valori, dipendente dal grado di istruzione del lettore La formula per il calcolo dell’Indice Gulpease è stata determinata verificando con una serie di test la reale comprensibilità di un corpus di testi I limiti di questo indicatore stanno nella sua parzialità: non tiene conto infatti della struttura sintattica della frase, che è un elemento fondamentale che determina la complessità della frase NL NF I G 89 10 300 NP NP NL: numero di lettere NP: numero di parole NF: numero di frasi Un nuova metodologia per la valutazione della leggibilità con strumenti di analisi sintattica Parser chunk-IT: è uno shallow parser Robustezza Esistono 10 tipi di chunk per l’italiano: Chunk nominale: “la mia casa” Chunk preposizionale: “di mio figlio” Chunk verbale “rimangono” Altri tipi: aggettivo, avverbio, gerundio, infinito, participio, predicato, subordinato Esempio di frase divisa in chunk: “A Milano, una speciale squadra ripulirà la città dai graffiti.” “A Milano”P_C “una speciale squadra”N_C “ripulirà”FV_C città”N_C “dai graffiti”P_C Possibili impieghi del parser: Calcolo leggibilità Disambiguazione lemmi Keyword extraction Analisi delle concordanze “la L’indicatore di leggibilità proposto La metodologia introdotta per la valutazione della leggibilità mira ad arricchire il contenuto informativo dell’indice di Gulpease, attraverso l’impiego di informazioni derivanti dall’analisi sintattica Introduzione di un nuovo indicatore ottenuto come media (eventualmente pesata) di una serie di features: Numero medio di parole per frase Numero medio di lettere per frase Numero medio di chunk per frase Distribuzione delle tipologie di chunk I LEGG a I G b I C c I T I pesi sono stati ricavati con criteri statistici sulla base di un corpus di testi semplificati, validati da un team di linguisti IC 100 NC 1 NF Peso del chunk di tipo i-esimo T IT k w N i 1 i i NC Numero medio di chunk per frase Numero di chunk del tipo i-esimo Lo schema del sistema di analisi L’insieme di questi due indicatori consente di avere una comparazione quantitativa tra diversi testi e quindi in particolare, nell’ambito del progetto navigAbile, permette di valutare l’efficacia del processo di semplificazione a vari livelli (Normal, Easy, Basic) del testo di una stessa notizia Conclusioni sull’accessibilità Riassumendo possiamo individuare due strategie principali per affrontare il problema dell’accessibilità dei portali web: Impiego di versioni parallele Design for All: prevede l’impiego di una sola versione che deve tener conto dei bisogni e delle esigenze di tutti gli utenti a cui è rivolto il portale navigAbile propone una soluzione che unisce i pregi dei due approcci, attraverso la profilazione e personalizzazione, che permettono una presentazione dei contenuti che si adatta alle abilità e alle esigenze dell’utente Con la condivisione dei servizi si ha una riduzione dei costi legati all’accessibilità dei portali che utilizzano i servizi di navigabile Conclusioni sull’analizzatore di comprensibilità e leggibilità Nuovo metodo di valutazione di leggibilità e comprensibilità Valutazione comprensibilità: basata sulla su statistiche di appartenenza delle varie parole del testo ai vari livelli del VdB Valutazione leggibilità: l’indicatore proposto mira ad arricchire il contenuto informativo dell’indice di Gulpease, attraverso l’impiego di informazioni derivanti dall’analisi sintattica, ottenute attraverso uno shallow parser Analisi dei 2 indici Comparazione quantitativa che permette di valutare l’efficacia del processo di semplificazione a vari livelli (Normal, Easy, Basic) del testo di una stessa notizia. Notevole valore aggiunto per navigAbile, che ha come obiettivo primario il raggiungimento della massima fruibilità dell’informazione da parte di tutte le tipologie di utenti Future works Ipotesi di attribuzione dei pesi per il calcolo dell’indice di leggibilità complessivo, e relativa validazione, eventualmente effettuata con diverse categorie di utenti Ipotesi alternativa di attribuzione dei pesi dell’indicatore di leggibilità, basata sulle probabilità condizionate di concatenamento di chunk consecutivi Componente architetturale per l’estrazione delle keywords Sfruttamento del parser per l’analisi delle concordanze Componenti architetturali per la gestione del Bliss Word Predictor da integrare nel compositore frasi