Corso di User Experience A.A.2010-‐2011 RELAZIONE FINALE: Studio sull’interazione tra bellezza, bontà e usabilità di prodotti interattivi Autori: Battistutta Paola, Franjul Sandi Data: 08/03/2011 INTRODUZIONE Questo studio si basa sull’esperimento svolto da Marc Hassenzahl, uno psicologo con un interesse applicato alla ricerca dell’interazione uomo-‐macchina. Il titolo di tale studio è “Interazione tra bellezza, bontà, usabilità nei prodotti interattivi”, pubblicato nel 2004. Lo scopo di questo studio, è quello di confrontare i risultati ottenuti da Hassenzahl con quelli ottenuti al termine di questo esperimento. In questo esperimento, viene usato il Modello di Hassenzahl (2003), per quanto concerne la relazione tra utente e prodotto, per definire i concetti chiave e viene usato come base per predire le relazioni tra essi. Tale modello assume che gli utenti si costruiscono degli attributi del prodotto combinando le funzionalità dello stesso (ad es. presentazione, contenuto, funzionalità, interazione) a causa di aspettative personali o a degli standard prefissati. Inoltre, il modello assume che due gruppi distinti di attributi chiamati attributi pragmatici ed edonici , possono descrivere il carattere di un prodotto. Gli attributi pragmatici sono connessi ai bisogni dell’utente per raggiungere obiettivi comportamentali. Gli attributi edonici sono invece legati al sé dell’utente e si dividono in due categorie principali: stimolazione (stimolo, novità, bisogno di crescita personale in termini di conoscenze e capacità) e identificazione (bisogno di esprimere se stessi mediante il prodotto, identificazione con prodotto). Un prodotto può venire percepito come pragmatico perché fornisce metodi efficaci ed efficienti per raggiungere obiettivi comportamentali. Un prodotto può venire percepito come edonico perché fornisce stimolazione o identificazione comunicando importanti valori personali. 2 STUDIO Studi precedenti a questo si sono dimostrati discordanti su alcuni punti riguardanti la bellezza, bontà ed usabilità di un prodotto. Per esempio, Tractinsky (2000), dagli studi svolti ha concluso che effettivamente, l' esperienza di usabilità non ha né un effetto sulla percezione di usabilità, né sui giudizi di bellezza. Hassenzahl (2002), invece, ha riscontrato una forte correlazione tra le valutazioni post uso delle qualità pragmatiche e del piacere (attrazione), se l' interazione precedente era goal-‐ directed. A differenza della debole correlazione tra attributi pragmatici e picere riscontrati in interazioni con il solo fine di divertirsi (have fun) con un prodotto. In altri studi è stato ipotizzato che la bellezza potrebbe modificare la sua natura da 'appearance-‐based' a 'experience-‐based' e che le qualità pragmatiche potrebbero avere un ruolo importante anche nel determinate la bellezza. In caso contrario, la bellezza rimane un costrutto in gran parte legato alle qualità edoniche e non a quelle pragmatiche. Ne consegue che la bontà dovrebbe essere influenzata delle esperienze e di conseguenza dovrebbe mostrare una stretta relazione con gli attributi pragmatici. In generale, le valutazioni delle qualità pragmatiche dovrebbero essere maggiormente influenzate dall' esperienza d' uso che dalla valutazione della qualità edonica. Inoltre, siccome ci si aspetta che la qualità pragmetica sia 'experience-‐ based', la correlazione tra pre e post valutazione delle qualità pragmatiche dovrebbe essere bassa, o almeno inferiore rispetto alla correlazione tra attributi edonici di identificazione e stimolazione. Lo studio si occuperà di verificare sia le ipotesi e le affermazioni accennate precedentemente che quelle emerse dai risultati incrociati con quelli dello studio di Hassenzahl sul quale il presente si basa fedelmente. 3 METODO 1. Partecipanti: Dieci individui (7 uomini, 3 donne) hanno partecipato allo studio. L’età media era di 23 anni (minimo 20, massimo 29). I partecipanti erano tutti studenti di diverse facoltà appartenenti all’Università degli Studi di Udine. Tutti i partecipanti avevano usato in passato (alcuni solo in parte) il software testato. Nessuno ha ricevuto ricompense per la propria partecipazione allo studio. 2. Variabili e Misurazioni: Questo studio ha come oggetto principale il software di un lettore MP3 (Winamp v5.6, www.winamp.com) al quale vengono applicate diverse “skin”. Una “skin” è un file grafico usato per cambiare l’apparenza dell’interfaccia di un’applicazione. Le “skin” di Winamp variano nello stile di presentazione e nel modo in cui viene usata l’interfaccia (ad es. differenze nel layout, leggibilità, posizione dei controlli), mentre le funzionalità rimangono le stesse. Per questo studio sono state scelte quattro “skin” scaricate dal sito ufficiale di Winamp; due delle quali etichettate come belle e due brutte. Questa scelta è stata fatta ordinando le “skin” del sito secondo “i più votati”; sono state prese le due “skin” con punteggio associato più alto valutato dagli utenti del sito e le due con punteggio più basso. In Figura 1 è rappresentato il sito ufficiale di Winamp, mentre in Figura 2 le quattro “skin” scelte per l’esperimento. Figura 1 : Sito web ufficiale di Winamp 4 Skin 1 – Toyota (brutta) Skin 2 -‐ MMD3 (bella) Skin 3 – MATRIX (brutta) Skin 4 – DRONE (bella) Figura 2 : Le quattro skin del lettore MP3 Agli utenti è stato chiesto di lavorare su due piccoli scenari. In seguito è stato presentato loro il questionario AttracDiff2, per valutare le qualità pragmatiche (PQ), edoniche-‐stimolazione (HQS) e edoniche-‐identificazione (HQI), la bellezza e la bontà. Il questionario consisteva in una lista di 23 coppie di aggettivi opposti, da valutare con una scala di 7 punti. In Figura 3 è illustrato il questionario presentato agli utenti. 5 Figura 3 : Questionario AttracDiff2 presentato agli utenti 6 Allo scopo di migliorare la presentazione del questionario e lo svolgimento dei due scenari è stata fatta una prova con un utente. Questo test ha fatto emergere problemi con il secondo scenario, in quanto l’interfaccia presentava di default una finestra aperta con la playlist ed il compito per l’utente diventava troppo banale. Infatti, bastava cliccare sul pulsante “Aggiungi playlist” per caricare la lista di canzoni. Si è deciso di eliminare questa finestra, lasciando all’utente il compito di trovarla e visualizzarla. Lo sforzo mentale è stato calcolato con il questionario SMEQ subito dopo la terminazione di ogni scenario. Lo SMEQ è un questionario che serve per calcolare lo sforzo mentale soggettivo, attraverso una scala di valutazione singola con punteggio da 0 a 150. Alla scala sono state associate diverse etichette per facilitare la valutazione agli utenti (ad esempio, “abbastanza difficile da fare”, “molto difficile da fare”, ecc.) . Alla fine è stato calcolato lo sforzo mentale totale (SMEtot) sommando entrambi i valori SMEQ per ogni utente. I questionari AttracDiff2 e SMEQ sono stati presentati agli utenti sottoforma elettronica in un comune browser web (Google Chrome). In Figura 4 è raffigurato il questionario SMEQ presentato agli utenti. Figura 4 : Questionario SMEQ presentato agli utenti 7 3. Procedura : L’esperimento è stato fatto su un portatile, ed è durato in media 40 minuti per ogni partecipante. Ad ogni utente singolarmente, sono state presentate inizialmente le 4 “skin” (Figura 2), in ordine casuale. In seguito, è stato chiesto loro di valutare ognuna di esse con l’aiuto di un questionario AttracDiff2 (valutazione pre uso; Figura 3). Dopo aver valutato tutte le skin, agli utenti è stato chiesto di usarle in due scenari. Nel primo scenario, mentre la musica suonava, iniziava a suonare un cellulare, e l’utente aveva il compito di abbassare il volume per rispondere alla chiamata. Nel secondo scenario, i partecipanti avevano il compito di caricare una playlist preparata precedentemente e far suonare determinate canzoni. Dopo il completamento di ogni scenario è stato assegnato agli utenti il questionario SMEQ (Figura 4) da compilare per valutare lo sforzo mentale impiegato per svolgerlo. Successivamente allo SMEQ , ai partecipanti sono stati presentati i risultati della loro valutazione pre uso, chiedendo loro di modificarli in base all’esperienza avuta usando le skin. 8 RISULTATI I risultati di questo studio portano a classificare le 4 skin nel modo seguente: la più bella è stata la skin MMD3, seguita da Drone, Matrix ed infine Toyota; come rappresentato in Figura 5. 1. MMD3 : 3. MATRIX : 2. DRONE : 4. TOYOTA : Figura 5: Classifica delle skin secondo la valutazione degli utenti in base alla bellezza Il livello di bellezza non è stato significativamente influenzato dalle esperienze derivate dall' effettivo utilizzo, mentre quello di bontà è cambiato anche se di poco. La skin con punteggi HQI più alti è stata MMD3 sia pre che post uso, mentre i punteggi HQS sono stati simili per Drone e MMD3. Infine, i punteggi PQ pre uso più alti sono stati quelli di Drone e MMD3, quelli post uso però sono stati più alti per Drone. A differenza dello studio di Hassenzahl, il presente studio ha dimostrato che in alcuni casi l' influenza dell' esperienza di utilizzo è stata notevole. Come si può vedere nei grafici, alcune medie variano anche di 2 unità da pre a post uso. In media, le skin belle sono state ancora percepite come migliori soprattutto nel fornire identificazione (HQI), seguita dalla stimolazione (HQS). Come nello studio di Hassenzahl è stata evidenziata una stretta relazione dei punteggi di HQI e della bellezza. Inoltre, questa relazione non è cambiata significativamente da pre a post uso. I punteggi di HQS invece non risultano correlare 9 significativamente con i punteggi di bellezza o bontà. Per quanto riguarda PQ, si nota una similitudine tra i punteggi e la valutazione di bontà delle singole skin. Dallo studio di Hassenzahl sono risultate differenze interessanti tra le valutazioni di bellezza e bontà post uso. In questo studio non è stato così, infatti le differenze tra bellezza e bontà sono state minime, in media inferiori all' unità. Anche la differenza tra valutazioni di bellezza e bontà pre-‐post uso sono state significative nello studio di Hassenzahl. In questo studio non ci sono state diffierenze significative, i punteggi di bellezza sono rimasti quasi invariati mentre quelli di bontà sono cambiati solo leggermente. Come nello studio di Hassenzahl, i punteggi di PQ post uso sono stati molto differenti rispetto a quelli pre uso. Ciò indica che i partecipanti hanno cambiato la loro valutazione a causa dell' esperienza vissuta. In sintesi, le qualità pragmetiche e la bontà sono state influenzate di più dall' utilizzo del prodotto rispetto alle qualità edoniche e la bellezza. In seguito, nelle Figure 6, 7, 8, 9 vengono presentati i risultati pre e post uso in base ai valori medi calcolati per ogni skin: Figura 6 : Valori medi di valutazione della skin MMD3 10 Figura 7 : Valori medi di valutazione della skin DRONE Figura 8 : Valori medi di valutazione della skin MATRIX 11 Figura 9 : Valori medi di valutazione della skin TOYOTA La correlazione dello sforzo mentale (SMEtot, Figura 11) e dei punteggi di PQ é stata sostanziale è negativa, mentre la correlazione dello sforzo mentale e HQI o HQS non è stata significativa. Anche le valutazioni di bellezza e bontà delle singole skin correlano negativamente con lo sforzo mentale indicato dagli utenti. Figura 10: Valori medi dello sforzo mentale per ogni skin (divisi per scenario) 12 Figura 11: Valori medi dello sforzo mentale per ogni skin (SMEtot) 13 CONCLUSIONE Le due skin che sono state votate come più belle nel sito www.winamp.com sono state giudicate ancora una volta come le più belle. Come previsto, anche la percezione di bontà è stata alta per le due skin più belle. Analizzando i risultati si nota che la percezione degli attributi varia notevolmente da skin a skin, mentre in alcuni casi anche i voti dati alla stessa skin da utenti diversi sono stati molto diversi. Dalla media dei risultati risulta che le skin più belle sono state quelle con i voti di HQI più alti. Possiamo dire che gli attributi HQI sono strettamente legati alla bellezza del prodotto. Non si può sostenete altrettanto per gli attributi HQS che variano troppo rispetto alle valutazioni di bellezza e bontà. Per quanto riguarda gli attributi PQ, dai risultati si nota che essi hanno influenzato notevolmente le valutazioni di bontà. La percezione di tali attributi è stata molto diversa tra pre e post uso ed a ciò è seguito pure un cambiamento nella valutazione della bontà del prodotto dopo l’utilizzo. Perciò si può dire che gli attributi pragmatici sono strettamente legati alla bontà del prodotto. Gli attributi pragmatici così come la bontà sono stati colpiti maggiormente dall' esperienza, cioè da problemi di usabilità, mentre gli attributi edonici e la bellezza sono rimasti più stabili nel tempo. Lo sforzo mentale provato dai partecipanti è legato alle valutazioni post uso di PQ; infatti, i valori più alti si riferiscono a skin con punteggi PQ molto bassi e viceversa. Possiamo dire che lo sforzo mentale dipende dalla bontà(post uso) del prodotto, al contrario la bellezza è legata agli attributi edonici e quindi non è in stretta relazione con lo sforzo mentale. In questo studio, a differenza dello studio condotto da Hassenzahl, le skin non sono state scelte dai partecipanti perciò non abbiamo a disposizione tutta la quantità di dati della prima parte dell’esperimento. Ciò ha reso impossibile svolgere tutte le analisi che sono state svolte da Hassenzahl, ma i risultati ottenuti sono lo stesso soddisfacenti e significativi. I risultati ottenuti in questo studio rispecchiano in gran parte quelli ottenuti da Hassenzahl nel suo studio. Come descritto nei risultati ci sono alcuni elementi che non combaciano alla perfezione ma si può dire che i punti più importanti dello studio di Hassenzahl sono stati dimostrati anche da questo studio. Le differenze riscontrate possono essere dovute a differenze nello svolgimento dell' esperimento in quanto non tutti i dettagli nell’articolo sono descritti nei minimi particolari. Daltronde anche Hassenzahl nel suo articolo dice che i sui risultati non sono uguali a quelli di Tractinsky (2000) che aveva concluso che non ci sono effetti significativi dell'esperienza d'uso sui punteggi di bellezza ed usabilità, mentre noi abbiamo visto che queste differenze sono ben marcate (per la bontà, usabilità). Hassenzahl indica come possibili cause di queste differenze il diverso trattamento dei partecipanti e la diversa monipolazione delle variabili dell' esperimento. 14 Esistono centinaia o migliaia di definizioni e frasi fatte sulla bellezza, ma la bellezza non può dipendere da una sola di queste perché la bellezza è soggettiva, dipende dalla cultura, dal credo, dall' età, dal sesso e molto altro ancora. Questo studio ha cercato di definire alcuni costrutti che siano d'aiuto nel valutare la bellezza e la bontà di un prodotto. 15