Emozioni suscitate da pagine web

Le dimensioni fondamentali relative alle emozioni secondarie suscitate da pagine web: riassunto della tesi di Lisa Pedrazzi (scritto da Lisa nel gennaio 2007).

Indice sinottico

  1. Introduzione
  2. Metodologia
  3. Analisi dei dati
  4. Limiti del lavoro

Introduzione

Perché studiare le emozioni?

In base alle nostre esperienze quotidiane, tutti sappiamo che ogni prodotto (sia un oggetto fisico che un oggetto intangibile come può essere, ad esempio, un software), può evocare responsi emotivi molto forti che poi possono andare a influenzare positivamente o meno la scelta di acquisto di tale prodotto, il suo utilizzo attuale e futuro e il numero di errori che una persona compie nell'utilizzarlo.
Nel caso di un sito Internet si andrà in particolar modo a influire su:

  • la percezione della semplicità d'uso del sito (che a sua volta incrementerà le prestazioni di utilizzo);
  • la credibilità del sito e quindi sul senso di fiducia e di sicurezza dell'utente;
  • la possibile fidelizzazione dell'utente.

Naturalmente queste caratteristiche vengono influenzate positivamente solo se il sito internet dispone dei contenuti attesi dall'utente per assolvere allo scopo che si era prefisso, e questi risultano disposti in una struttura di facile comprensione per i destinatari, nonché accessibili tramite strumenti di supporto (menù per la navigazione, mappe, motori di ricerca...) di semplice utilizzo, ovvero se il sito è usabile.

Sollecitando in maniera opportuna le emozioni elicitate da un certo prodotto, è quindi possibile indurre precisi comportamenti negli utenti che utilizzano questo prodotto. Per poter godere appieno però di questi possibili benefici, è necessario prima approfondire quali emozioni posso venire evocate nell'utilizzo di un prodotto specifico, quali sono gli elementi che le sollecitano e come questi fattori interagiscano fra di loro. Ed è proprio questo il movente alla base dell'esperimento condotto che stiamo andando ad analizzare.

Le aree di interesse: Emotional Design e Kansei Engineering

Nonostante i primi studi scientifici sulle emozioni risalgano all'inizio del secolo scorso, fino a pochi decenni fa, all'interno del campo di studi dell'interazione uomo-macchina l'enfasi è sempre stata posta in maggior misura sull'efficienza e sulla facilità d'uso di un sistema e quindi sulle prestazioni del sistema e dell'utente. Solo recentemente, all'interno delle comunità che si occupano di usabilità e di design, si è acceso l'interesse per le relazioni che legano l'uso di un generico prodotto software alle emozioni che insorgono o all'estetica percepita durante il suo utilizzo. Si è quindi sviluppata una nuova area che si occupa del cosiddetto Emotional Design il cui scopo è l'utilizzo di informazioni relative ai sentimenti e alle emozioni evocati da certi tipi di prodotti, o sul come sia possibile evocare queste sensazioni, e inserirle all'interno della progettazione di un prodotto in modo che quest'ultimo risponda meglio ai fabbisogni o ai desideri di un potenziale cliente.
Alcuni decenni prima della nascita di quest'area di interesse, in Oriente si è sviluppata una metodologia specifica per il trattamento delle emozioni all'interno proprio delle fasi di progettazione di un qualsiasi prodotto: il Kansei Engineering. La sua particolarità sta nel fatto che, a differenza di altre tecniche di produzione, essa cerca di tradurre sentimenti ed emozioni all'interno delle caratteristiche degli oggetti cercando in particolar modo di misurare i sentimenti evocati e proponendosi di mostrarne le relazioni con determinate caratteristiche del prodotto, in modo che questo prodotto possa poi venir disegnato per evocare precisi sentimenti e sensazioni.

Partendo dagli studi esistenti in queste due aree (Emotional Design e Kansei Engineering) si sono individuati numerosi studi empirici che sottolineano l'importanza delle emozioni o dell'estetica nell'utilizzo di un prodotto e le relazioni che queste hanno con l'utente (ad esempio Desmet, Overbeeke e Tax,Schutte, Norman), ma solo pochi di questi (Kim, Lee e Choi,Lavie e Tractinsky, Van der Heijden) hanno approfondito la problematica inserendola specificatamente all'interno di un contesto quale Internet.
Tra questi, è risultato particolarmente interessante lo studio di alcuni ricercatori coreani (Kim, Lee e Choi) che si sono interessati proprio allo studio delle emozioni suscitate dalla visione di una determinata pagina al fine di identificare da quali fattori di disegno queste emozioni vengano influenzate e in che misura. Per giungere a questo risultato i coreani hanno sviluppato tre studi successivi i cui scopi sono:

  1. identificare un numero ridotto di dimensioni emozionali descrittive di tutta la gamma di emozioni che delle persone possono provare osservando una pagina web;
  2. identificare i fattori chiave di progettazione che i designer professionisti utilizzano frequentemente nelle loro pagine per cercare di evocare una determinata sensazione;
  3. identificare le correlazioni fra i due precedenti aspetti, quantificando la misura in cui una caratteristica influisce sulla relativa emozione.

Il progetto realizzato si propone come primo passo per la creazione di questa metodologia di supporto ai progettisti di pagine web, concentrandosi sul primo dei tre studi citati precedentemente seppur adattandolo al contesto italiano e seguendo una metodologia leggermente diversa da quella proposta, adattandosi al tipologia del Kansei Engineering.

Abbiamo deciso di riproporre lo studio coreano piuttosto che lavorare sui risultati prodotti, in modo da ovviare ad una serie di limiti che ci si è trovati ad affrontare.
Innanzitutto, l'utilizzo dei risultati prodotti dallo studio coreano porta a notevoli problemi:

  • lessicali: lo studio è stato tradotto in inglese dal coreano e spesso le parole utilizzate non hanno una adeguata contropartita in italiano;
  • culturali: non è detto che, nel cambiamento di cultura da orientale a occidentale, la relazione fra caratteristiche dell'oggetto ed emozioni elicitate rimanga la medesima, potrebbe addirittura non esistere o potrebbero essercene di nuove.

In secondo luogo, si vuole utilizzare una metodologia precisa, il Kansei Engineering, che è già stata utilizzata nella pratica con ottimi risultati, in modo da esser discretamente sicuri di aver utilizzato un procedimento valido per condurre l'esperimento.

Metodologia

Come già detto, per condurre l'esperimento, si è deciso di seguire una metodologia esistente, detta Kansei Engineering.

La scelta del dominio

Il primo passo all'interno della creazione di un KES consiste nel determinare l'area di interesse del prodotto, la sua tipologia e quindi le sue caratteristiche, i clienti a cui si rivolge, la parte di mercato in cui verrà inserito. In questo caso, non volendo realizzare un prodotto specifico, possiamo identificare nel dominio l'intero Internet, nel prodotto delle generiche pagine web destinate ad un pubblico italiano, nei clienti gli utenti italiani a cui il sito si rivolge.

Definizione dello spazio semantico

Il passo successivo è costituito dalla cosiddetta definizione dello spazio semantico il cui scopo è identificare tutta una serie di parole (i Kansei) che serviranno a descrivere una determinata gamma di sensazioni o emozioni che un utente prova quando entra a contatto con il prodotto sviluppato. Il risultato di questa fase, dunque, coincide esattamente con lo scopo della tesi: individuare un certo numero di dimensioni emozionali descrittive di tutte le sensazioni generiche che un utente può provare durante l'utilizzo di un qualsiasi sito Internet.
L'obbiettivo è stato raggiunto tramite due sottofasi, tipiche del Kansei Engineering:

  • la raccolta di parole descrittive dei Kansei, ovvero di un insieme di parole generiche che siano adatte a descrivere emozioni inerenti al dominio;
  • l'identificazione della struttura del Kansei, ovvero la riduzione delle parole identificate precedentemente in categorie, allo scopo di trovare quelle che descrivono maggiormente il dominio.

La raccolta delle parole

Il primo passo all'interno della definizione dello spazio semantico si propone di raccogliere quanti più termini possibili relativi alle pagine web, utilizzando diverse fonti, fino a quando non si sia riusciti a inserire nessun termine nuovo. A questo livello non si deve scartare nessun termine, anche qualora si fosse notato essere troppo generici, tecnici, colloquiali o altro. Il motivo è semplice: da queste parole, in diversi casi, potevano esserne individuate alternative (spesso sinonimi o contrari, ma anche termini slegati indotti da una qualche associazione di idee) in grado di descrivere efficacemente il dominio.

I primi termini inseriti sono stati raccolti dalla letteratura: si sono presi i termini descrittivi delle tredici dimensioni emozionali ottenute come risultato del primo dei tre studi coreani e, in aggiunta, termini da ogni studio dell'area studiata che abbia utilizzato questionari con differenziale semantico o identificato categorie, come ad esempio gli studi sulle dimensioni emozionali e sull'estetica, o analizzato l'introduzione delle emozioni nei prodotti.
Altri termini sono stati aggiunti grazie alla collaborazione di una ventina di persone (studenti e web designer più o meno professionisti) a cui, una volta selezionate alcune pagine web esistenti, è stato chiesto di aggiungere alla lista precedentemente ottenuta termini significativi per la descrizione delle pagine. Le pagine sono state scelte per qualche loro caratteristica particolare presentata (ad esempio pagine particolarmente colorate, curate, minimaliste, ...). Per ognuno dei vocaboli così individuati, si è fatto uso di dizionari (di italiano e dei sinonimi e contrari) per includere termini multipli per le stesse caratteristiche o sensazioni individuate, in modo da essere sicuri di non escludere alcuna sfumatura delle emozioni che possono presentarsi.
Procedendo in questo modo si sono individuati 329 aggettivi.

La struttura dei Kansei

Una volta ottenuta la lista di parole generiche descrittive del dominio occorre ricondurle ad un numero ridotto di categorie che presentino aspetti comuni. Per raggiungere questo risultato si è deciso di combinare entrambe le tecniche manuali e statistiche tipiche del Kansei Engineering allo scopo di ridurne progressivamente il numero in modo che gli utenti finali disponessero di una selezione limitata di aggettivi, in modo da non rendere gravosa la compilazione di un questionario comprensivo di tutti gli aggettivi.
La strategia adottata si compone di tre passi successivi:

  • riduzione manuale dei vocaboli, in base a regole lessicali predefinite
  • test del campione risultante di aggettivi su un numero ridotto di utenti e analisi dei risultati, con lo scopo di ridurre gli aggettivi in base a precise regole fornite in modo da ottenere aggettivi adatti a descrivere efficacemente le pagine web;
  • test degli aggettivi della lista ottenuta dalla fase precedente su un numero ridotto di utenti per verificare i risultati ottenuti nel test precedente e per verificare se le pagine selezionate erano adatte a sollecitare tutta la serie di sensazioni proposte dai diversi termini;

Una volta ottenuta una struttura ridotta, per individuare le categorie emozionali esistenti, si è effettuato un test basato sulla lista definitiva di termini utilizzando un ampio numero utenti e si sono esaminati i dati tramite l'analisi statistica.

Riduzione manuale dei vocaboli

La lista iniziale è stata riadattata secondo le seguenti regole:

  • vocaboli legati solamente agli stimoli sensoriali o cognitivi (es. "febbrile" , "umiliante") devono essere eliminati;
  • vocaboli contenenti negazioni (ad esempio "non ordinato") sono stati sostituiti con il termine privato della negazione, qualora non fosse presente;
  • vocaboli contenenti semplici osservazioni relative all'aspetto della pagina (ad esempio "troppi link") o gergo tecnico (ad esempio "layout liquido") sono stati eliminati.

Nei casi di dubbio nell'applicazione di una delle regole precedentemente elencate, si è preferito lasciare inalterata la lista piuttosto che modificarla perdendo un possibile aggettivo descrittivo del dominio allo scopo di fornire un risultato il più possibile affidabile e completo.

Test della lista ridotta di aggettivi

Una volta ottenuta una lista ridotta a 302 aggettivi, è stato chiesto ad una decina di utenti di modificarla tenendo conto delle seguenti regole:

  • eliminare i termini con un significato troppo generico o troppo particolare eventualmente sostituendoli con altri termini più adatti (ad esempio da "imperscrutabile" si passa a "misterioso");
  • eliminare i termini con un significato troppo colloquiale eventualmente suggerendo un termine comune - presente o meno nella lista - che svolga la funzione di sostituto (ad esempio da "spaziale" si passa a "accattivante");
  • aggregare termini con un significato molto simile in italiano ("fosco", "cupo");
  • aggregare aggettivi che indicano un eccesso ("ultramoderno" è stato sostituito da "moderno");
  • eliminare sempre e comunque gli aggettivi che si ritengono descrittivi di oggetti o di persone, piuttosto che di un sito internet (ad esempio "riflessivo");
  • non fare riferimento ai contenuti di una pagina internet, ma all'aspetto estetico-grafico.

L'analisi dei risultati prodotti è stata fatta manualmente incrociando le diverse risposte date dai dieci utenti: qualora vi fosse un accordo fra la metà o più degli utenti sull'eliminazione dell'aggettivo, o sulla sua sostituzione con un altro termine, si procedeva alla modifica della lista. Il risultato è stata la riduzione della lista a 164.

Test pilota della lista definitiva degli aggettivi

Prima di procedere alla raccolta dei dati vera e propria è stato necessario selezionare un insieme ristretto di pagine che presentassero caratteristiche particolari (ad esempio colori accesi, impaginazioni particolari,...) e verificare che queste pagine sollecitassero tutta la possibile gamma di emozioni descritte dalle diverse parole. Per lo svolgimento di questo test sono stati reclutati dieci studenti a cui sono stati affidati i ventitre layout selezionati dal sito di CSSZenGarden sottoforma di immagini stampate. Il loro compito era quello di, data lista individuata precedentemente, segnare per ciascuna parola quando essa superava, in una scala da uno a cinque, il valore due relativamente ad un'immagine, ma segnalando quale.
L'analisi manuale dei dati ottenuta incrociando i diversi risultati prodotti mostra che i dati sono abbastanza uniformi da poter concludere che due delle ventitre pagine mostrate producevano emozioni che venivano sollecitate in maniera evidente anche da altre pagine, e che pertanto erano superflue. Riguardo agli aggettivi, si è notato che della lista fornita, quattro termini sono stati utilizzati solamente da due dei dieci utenti, al contrario dei sinonimi corrispondenti che hanno avuto un più ampio utilizzo. Anche questi quattro termini sono stati eliminati, riducendo a 160 la lista degli aggettivi risultanti.

Il test effettivo

Una volta ottenuta la lista definitiva di aggettivi da utilizzare e selezionate le pagine da visualizzare, si è potuto procedere con la preparazione e l'esecuzione del test vero e proprio sulla lista di 160 aggettivi allo scopo di ottenere i dati necessari per effettuare l'analisi dei cluster e la suddivisione in dimensioni emozionali.
Per rendere più agevole la raccolta dei dati, si è costruita un'applicazione LAMP che fornisce le seguenti funzionalità:

  • registrazione dell'utente e sua identificazione;
  • selezione casuale di un numero ridotto di immagini da valutare;
  • visualizzazione dell'immagine del sito da valutare e del relativo questionario associato;
  • memorizzazione dei risultati dei test, parziali o completi che siano.

I vantaggi di avere un sistema software a propria disposizione, oltre alla semplificazione della gestione dei dati, sono numerosi. In primo luogo, rendendola accessibile via internet, è possibile generalizzare la tipologia degli utenti, senza ridurre l'esperimento all'ambito universitario, evitando quindi di ottenere dei risultati validi solo per una determinata classe di possibili utenti. In secondo luogo, è possibile per l'utente interrompere il test quando vuole, per poi riprenderlo successivamente senza perdere i risultati svolti.
Allo scopo di descrivere sia il funzionamento del sistema, sia la realizzazione del questionario, vediamo nel dettaglio i singoli passi che un utente qualsiasi ha dovuto compiere per partecipare all'esperimento.
Prima di poter accedere alla sezione di test vero e proprio era necessario registrarsi nel sistema, inserendo la propria e-mail, una password, la propria età e il sesso. Al momento della registrazione, inoltre, l'applicazione assegnava all'utente cinque immagini casuali fra le ventuno disponibili (riduzione effettuata per non rendere il compito troppo gravoso: ogni utente ha dovuto rispondere a 160 domande per 5 questionari, ovvero dare 800 risposte! ).
L'utente poteva scegliere di accedere ad uno qualsiasi dei suoi test cliccando sul thumbnail che lo rappresentava: il sistema gli proponeva l'immagine da valutare prescelta per un tempo limitato (circa dieci secondi) sostituendola poi con il questionario da completare e recuperando eventuali risposte fornite.
Il questionario era composto dai 160 aggettivi individuati nelle fasi precedenti, polarizzati all'interno di una scala di Likert a 5 punti e visualizzati in maniera casuale ad ogni accesso al test per evitare che solamente le prime risposte venissero valutate in maniera accurata. L'utente ha dovuto scegliere, per ogni vocabolo, quanto esso si adattasse all'immagine vista: 1 significa che l'aggettivo non aveva nulla a che vedere con quella pagina, 5, al contrario, che descriveva efficacemente le prime impressioni ricevute dall'immagine. In ogni momento era possibile rivedere l'immagine da valutare per qualche secondo, e, naturalmente, salvare le risposte date e uscire, per poi riprendere il test in un momento successivo.
Un problema risultante dalla riduzione del campione è stato quello dell'assegnazione delle pagine: per rendere i risultati nel modo più casuale possibile si è pensato di introdurre una funzione che assegni le pagine in modo random, invece di attribuirle manualmente influenzando in qualche modo i dati raccolti.
La casualità introdotta invece sugli aggettivi è legata alla grande quantità di risposte che l'utente doveva fornire per ogni questionario. Per evitare che un soggetto riflettesse molto sulle prime domande e poi procedesse più istintivamente sulle rimanenti, l'ordine degli aggettivi viene sempre variato casualmente, assicurando che il disturbo sui dati sia minimale.
Si noti che una delle richieste fatte agli utenti era quella di rispondere secondo la loro prima impressione, senza soffermarsi a valutare il contenuto o la pagina nel dettaglio. Sempre per evitare un'analisi scrupolosa della pagina, questa viene visualizzata solamente per dieci secondi all'utente, un tempo ritenuto ragionevole per osservarla senza analizzarla nel dettaglio, anche tenendo conto degli esiti degli esperimenti di Tractinsky che asseriva che per sollecitare una sensazione basta una frazione di secondo. In ogni caso, qualora l'utente si fosse distratto, o dopo un certo periodo di tempo si fosse dimenticato l'immagine, il sistema offriva anche la possibilità di rivederla.
I rispondenti che hanno portato a termine tutti i test a loro assegnati sono stati in totale 70 (25 donne e 45 uomini, di cui 11 aventi un età superiore ai 35 anni), tutti di nazionalità italiana.

Analisi dei dati

I dati raccolti durante l'esperimento sono stati inseriti in una matrice tridimensionale con le seguenti dimensioni: 160(aggettivi) x 21(n.test) x 70(n.utenti) che individuano un numero naturale, il voto, compreso nell'intervallo [1,5]. Questa matrice è stata analizzata utilizzando l'analisi dei cluster, in modo da poter identificare all'interno della lista degli aggettivi iniziali, quali sono gli aggettivi utilizzati in maniera similare dagli utenti.

In particolare, si sono utilizzati diversi tipi di algoritmi di clustering, sia di partizionamento sia gerarchici, osservando i risultati non solo in base all'indice di qualità proposto per ciascuno di essi, ma confrontandoli fra loro in base ad un indice comune: lo spessore medio della silhouette prodotta da un partizionamento.
Per ogni elemento i della matrice contenente i dati, infatti, possiamo calcolare la media delle dissimilarità di i da tutti gli altri oggetti del cluster:

Figura 1: formula che esprime la media della dissimilarita' di i da tutti gli altri oggetti dal cluster cui appartiene

dove A è il cluster di appartenenza di i.
Considerando ora tutti i cluster C diversi da A si può calcolare come

Figura 2: formula che esprime la media della dissimilarita' di i da tutti gli altri oggetti del cluster C, dove C viene rappresentato da tutti i cluster diversi da A

ovvero la media delle dissimilarità di i da tutti gli altri oggetti del cluster C.
Una volta calcolate tutte le d(i,C), si prenda il più piccolo valore rappresentato da

Figura 3: formula che calcola il piu' piccolo elemento dell'insieme calcolato al passo precedente

Il cluster B che si ottiene da questo minimo, che è dato da d(i,B) = b(i), viene detto neighbor dell'oggetto i ed è il secondo miglior cluster in cui si può ritrovare i. Il valore della silhouette s(i) per l'oggetto i, viene definito come

Figura 4: formula che calcola il valore della silhouette s(i) sull'oggetto i


Questo valore, che risulta sempre compreso fra -1 e 1, è interpretabile come segue:

valore della silhouetteclassificazione
s(i) prossimo a 1l'oggetto risulta ben classificato in A
s(i) prossimo a 0l'oggetto giace fra i due cluster A e B
s(i) prossimo a -1l'oggetto risulta meglio classificato in B rispetto ad A

L'indice di qualità del metodo di clustering viene dato dalla media totale di tutti gli spessori delle silhouette, ovvero la media di tutti gli s(i) su tutti gli oggetti i considerati. In particolare si noti che questo metodo si può applicare anche agli algoritmi di tipo gerarchico, qualora si decida il numero di gruppi da ottenere come output (ovvero qualora si decida l'altezza a cui tagliare il dendrogramma che questi algoritmi producono)
Tutti gli algoritmi sono stati eseguiti su due tipi di dati: un dataset formato dai dati originali provenienti direttamente dai risultati dei questionari e quindi compresi in un intervallo pari a [1,5], il secondo invece è costituito da un dataset con dati riscalati, in cui l'intervallo non era più la scala originaria, ma un intervallo fra [-2,2]. Questo per analizzare se l'analisi producesse risultati sensibilmente diversi a seconda della scala utilizzata, cosa che non si è verificata: i dati ottenuti erano i medesimi, qualsiasi metrica o metodo venisse utilizzato.

Di tutti gli algoritmi considerati i migliori in base all'indice considerato sono stati due: l'algoritmo di partizionamento PAM e quello agglomerativo AGNES. I risultati ottenuti sono visibili nella tabella sottostante e nel relativo grafico.

Numero clusterAGNESPAM
100,190,21
110,200,19
120,200,17
130,210,19
140,210,19
150,200,18
160,200,18
170,200,17
180,190,17
190,200,16

Figura 5: grafico prodotto dal confronto degli indici risultati dall'esecuzione dei due algoritmi

Come si può vedere, il valore massimo compare, identico per due algoritmi diversi: si ottiene da AGNES con metodo ward con 13 o 14 cluster, e da PAM con 10 cluster. Entrambi gli algoritmi utilizzano la metrica coseno.
Come scegliere quale partizionamento considerare? Innanzitutto bisogna analizzare i grafici prodotti dalle silhouette di entrambi gli algoritmi, in modo da poter fare un maggior numero di considerazioni.

Figura 6: grafici prodotti dalle silhouette di pam e agnes

Dalla figura si può notare come, nonostante il valore medio delle silhouette sia lo stesso, la struttura sia sostanzialmente diversa. In particolare, osservando il profilo di entrambi i grafici, possiamo osservare che AGNES tende ad assumere valori di silhouette più elevati rispetto a PAM, ma che, allo stesso tempo, segnala più cluster come mal classificati rispetto a PAM: AGNES considera come mal classificati 12 elementi, PAM 10. Inoltre, l'indice considerato per ogni elemento mal classificato, in PAM è generalmente più vicino allo zero rispetto ai cluster classificati erroneamente secondo AGNES.
Per non limitarci alle sole deduzioni statistiche, si è guardato anche al risultato della clusterizzazione: la divisione prodotta in entrambi i casi è sicuramente logica e soddisfacente sul piano linguistico e in aggiunta, una volta confrontati, i due algoritmi non presentano forti differenze, se si eccettuano i cluster che essi stessi hanno considerato come erronei, e alcuni gruppi che PAM, avendo un numero minore di cluster da produrre, ha raggruppato rispetto ad AGNES. Queste considerazioni, che si limitano a confrontare l'algoritmo PAM con solo uno dei due possibili casi in cui si ottiene l'indice più elevato per AGNES (14 cluster), sono essenzialmente ripetibili anche per l'altro caso (in cui si considerano 13 cluster).
Quale struttura scegliere fra le tre prodotte? Non volendo effettuare alcuna congettura a priori sul numero dei cluster, l'unico altro metodo per effettuare una scelta appare essere la frequenza degli errori di classificazione. Visto che la silhouette prodotta da AGNES nel caso di 13 o 14 gruppi produce più errori e presenta indici negativi più lontani dallo zero, abbiamo scelto l'algoritmo PAM che appare più "stabile". Un'altra possibile scelta poteva essere considerare le diverse sfumature introdotte nella divisione in più cluster, rispetto a quella con dieci.

ClusterAggettivi
Cluster 1rasserenante, sereno, distensivo, accogliente, rilassante, delizioso, amabile, grazioso, adorabile, gradevole, piacevole, riposante, tenero, invitante, familiare, allettante, emozionante, attraente, coinvolgente, accattivante, seducente, commovente, promettente, romantico
Cluster 2ricercato, studiato, sofisticato, raffinato, accurato, curato, professionale, signorile, elegante, chic, elaborato, particolareggiato, coerente
Cluster 3allegro, spiritoso, vivace, scherzoso, divertente, brioso, frizzante, umoristico, buffo, effervescente, colorato, sgargiante, solare, infantile, informale, entusiasmante, energico, luminoso, caloroso
Cluster 4alternativo, rivoluzionario, futuristico, insolito,avanguardista, inconsueto, avveniristico, innovativo, astratto, pungente, singolare, provocante, eccentrico, originale, ipnotico, provocatorio,vigoroso, creativo, ingegnoso, curioso, sfarzoso, vistoso, moderno, bizzarro,eccitante, avvincente, appariscente, fantasioso,enigmatico, artistico
Cluster 5piatto, spento, arido, monotono, inespressivo, noioso, scialbo, misero, smorto, povero, spoglio, disadorno, scarno, indefinito, insignificante, ordinario, modesto, distaccato, vago, freddo, incompleto, comune, ripetitivo
Cluster 6pesante, pomposo, soffocante, kitsch, asfissiante, pacchiano, opprimente, caotico
Cluster 7lugubre, tetro, sinistro, cupo, oscuro, funereo, pauroso, minaccioso, inquietante, severo, misterioso, austero,triste, deprimente, malinconico
Cluster 8semplice, essenziale, conciso, minimalista, schematico, sobrio, pulito, formale, sdolcinato
Cluster 9raffazzonato, grossolano, improvvisato, trascurato, grezzo, disordinato, rozzo, ridicolo, confusionale, scadente
Cluster 10disgustoso, ripugnante, repellente, volgare, nauseante, sgradevole, squallido, violento

La scelta dei rappresentanti

L'ultimo passo da affrontare è scegliere dei rappresentati per ogni categoria individuata. La scelta più semplice ricade sul medoide di ciascun cluster ovvero sull'elemento che minimizza la distanza rispetto a tutti gli altri elementi appartenenti a quel cluster e che quindi si suppone essere quello che coglie meglio le diverse sfumature di tutti i vocaboli presenti in un cluster.
La scelta non è casuale: come spiegato precedentemente, PAM produce i diversi cluster calcolando proprio i medoidi, che quindi risultano la scelta più facile (perché calcolati direttamente dall'algoritmo), oltre che la più affidabile, dato che il funzionamento si basa proprio sul loro calcolo. I risultati prodotti sono visibili nella tabella sottostante.

Dimensione emozionaleRappresentanteTermini
DE 1gradevolepiacevole, sereno
DE 2accuratostudiato, coerente
DE 3allegrocolorato, luminoso
DE 4singolarecreativo, insolito
DE 5poveroindefinito, freddo
DE 6pesantesoffocante, kitsch
DE 7lugubremalinconico, triste
DE 8pulitosemplice, essenziale
DE 9raffazzonato confusionale, disordinato
DE 10disgustososgradevole, squallido

Il "secondo" metodo di partizionamento possibile

Come abbiamo visto, la scelta di quale struttura scegliere basandosi solo sugli indici della silhouette è piuttosto soggettiva. Piuttosto che confrontare i dati prodotti da ciascun termine, si poteva considerare il numero dei cluster oppure il comportamento dei diversi algoritmi rispetto a tutti i cluster prodotti con la metrica coseno (e quindi la media di tutte le silhouette ottenute sui diversi numeri di cluster per PAM e per AGNES - figura 5.8). In entrambi i casi la struttura che si sarebbe andati a considerare sarebbe stata quella di AGNES.

Cluster Aggettivi
Cluster 1accattivante, allettante, attraente, avvincente, coinvolgente, eccitante, emozionante, energico, entusiasmante, invitante, promettente, seducente, vigoroso
Cluster 2accogliente, amabile, caloroso delizioso, distensivo, familiare, gradevole, grazioso, luminoso, piacevole, rasserenante, rilassante, riposante, sereno, solare, tenero, adorabile
Cluster 3accurato, chic, coerente, elegante, particolareggiato, raffinato, ricercato, signorile, sofisticato, elaborato, professionale, curato, studiato
Cluster 4allegro, brioso, buffo, colorato, divertente, effervescente, frizzante, informale, scherzoso, sgargiante, spiritoso, umoristico, vivace
Cluster 5alternativo, appariscente, artistico, astratto, avvenieristico, bizzarro, creativo, curioso, avanguardista, eccentrico, fantastioso, futuristico, inconsueto, ingegnoso, innovatico, insolito, moderno, originale, singolare, vistoso
Cluster 6arido, comune, disadorno, distaccato, formale, freddo, indefinitom, iespressivo, insignificante, misero, modesto,monotono, noioso, ordinato, piatto, povero, ripetitivo, scialbo, smorto, spento, spoglio, vago
Cluster 7asfissiante, disgustoso, nauseante, opprimente, pesante, repellente, ripugnante, scadente, sgradevole,soffocante, squallido, volgare, violento
Cluster 8austero, cupo, deprimente, enigmatico, funereo, inquietante, lugubre, malinconico, minaccioso, misterioso, oscuro, pauroso, severo, sinistro, tetro, triste
Cluster 9 caotico, confusionale, disordinato, infantile,ridicolo, kitsch pacchiano
Cluster 10commovente, romantico, sdolcinato
Cluster 11conciso, essenziale, minimalista, pulito, schematico, semplice, sobro, succinto
Cluster 12grezzo, grossolano, improvvisato, incompleto, raffazzonato, trascurato, rozzo
Cluster 13pomposo, sfarzoso
Cluster 14provocatorio, rivoluzionario, ipnotico, provocante, pungente

Limiti del lavoro

I principali limiti che si ritiene possano in qualche modo aver influenzato l'esito di questo progetto riguardano in particola modo due delle basi su cui si è svolto l'esperimento: la scelta delle pagine e gli utenti utilizzati.

Per quanto riguarda la scelta delle pagine, si è cercato di controllare il possibile distrbo introdotto tramite i test condotti prima dell'acquisizione dei dati vera e propria, badando al fatto che le pagine selezionate coprissero tutti gli aggettivi proposti e fossero ridondanti (ovvero il termine colorato poteva venir utilizzato, secondo gli utenti delle fasi di prova, per piu' di una pagina).

Per quanto riguarda gli utenti, si è rilevato che, anche avendo reso disponibile il test su Internet, la maggior parte degli utenti rientrava in una fascia compresa fra i 18 e i 35 anni, fascia che non può essere considerata identificativa di tutta la popolazione italiana.

Note sugli algoritmi di clustering
Algoritmi di partizionamento

Gli algoritmi di partizionamento, dato un intero k fornito in input, sono in grado di trovare un partizionamento dei dati forniti in k cluster che ottimizzi il criterio di partizionamento scelto.
L'indice di qualità per questo tipo di algoritmi è dato dallo spessore medio della silhouette.

Algoritmi gerarchici

Gli algoritmi gerarchici costruiscono una struttura ordinata all'interno dei dati forniti, rappresentabile tramite un albero detto dendrogramma le cui foglie sono i cluster ottenuti. Si parla di algoritmi:

  • agglomerativi se procedono unendo ogni elemento singolo con quello considerato più simile fino ad arrivare ad un unico cluster contenente tutti i dati;
  • divisivi, se procedono inversamente, partendo dall'insieme completo dei dati che viene diviso in base alla dissimilarità fra soggetti.

Ognuno di questi due metodi ha il suo specifico indice di qualità per controllare la bontà dei risultati ottenuti. In ogni caso, una volta che si è deciso quanti gruppi ottenere, è possibile utilizzare su entrambe le tipologie di algoritmo lo stesso indice usato per gli algoritmi di partizionamento, lo spessore medio della silhouette, che viene quindi scelto come metodo di confronto fra i diversi algoritmi ottenuti.

Bibliografia essenziale

P.M.A. Desmet, C.J. Overbeeke, and S.J.E.T. Tax.
Designing products with added emotional value: development and application of an approach for research through design.
The Design Journal, 4(1):32-47, 2001.

J. Kim, J. Lee, and D. Choi.
Designing emotional evocative hompages: an empirical study of the quantitative relations between design factors and emotional dimensions.
International Journal of Human Computer Studies, 59(6):899-940, 2003.

T. Lavie and N. Tractinsky.
Assessing dimension of perceived visual aesthetics of web sites.
International Journal of Human Computer Studies, 60:269-298, 2003.

D.A. Norman.
Why We Love (Or Hate) Everyday Things.
Basic Books, 2004.

P.J. Rousseuw.
Silhouettes: a graphical aid to the interpretation and validation of cluster analysis.
Journal of Computional and Applied Mathematics, 20:53-65, 1987.

S. Schutte.
Designing Feelings into Products - Integrating Kansei Engineering Methodology in Product Development.
Linkoping Studies in Science and Technology, 2002.

H. van der Heijden.
Factors influencing the usage of websites: the case of a generic portal in the netherlands.
Information and Management, 40:541-549, 2001.

Commenti

Invia nuovo commento

Il contenuto di questo campo è privato e non verrà mostrato pubblicamente.