Com dissenyar interfícies d’usuari de veu

Cada cop hi ha més dispositius controlats per veu, com Apple HomePod, Google Home i Amazon Echo. Això és degut a que les interfícies de veu milloren l’experiència dels usuaris, de fet, comScore (una empresa de recerca en màrqueting) creu que la veu executarà el 50% de totes les cerques cap al 2020.

Les cinc companyies tecnològiques més grans, Microsoft, Google, Amazon, Apple i Facebook, han desenvolupat (o actualment es desenvolupen) assistents d’AI habilitats per veu.

Tant si es tracta de VUI (Interfícies d’Usuari de Veu) per a aplicacions web o altaveus casolans intel·ligents, les interaccions de veu són cada cop més freqüents en la tecnologia actual, sobretot perquè molta gent experimenta fatiga a estar moltes hores davant d’una pantalla.

Per tant, vegem com dissenyar les interfícies d’usuari de veu i quines comandes de veu d’anatomia haurien de tenir.

Com dissenyar interfícies de veu

Si llegeixes ressenyes en línia dels altaveus casolans, notaràs que algunes persones formen un vincle estret amb el seu altaveu d’una manera que s’assembla més a una mascota que a un producte.

Certament no podeu satisfer totes les expectatives del client amb programes que encara estan en ple procés de desenvolupament, però podeu seguir algunes pautes com a punt de partida.

Proporciona als usuaris informació sobre què poden fer

Una interfície gràfica d’usuari mostra als usuaris tot el que poden fer. Una interfície de veu no té cap manera de mostrar a l’usuari quines opcions són possibles i els nous usuaris basen les seves expectatives en la seva experiència amb converses humanes.

Per tant, poden començar demanant alguna cosa que no tingui sentit per al sistema o que no sigui possible. La solució per això és oferir opcions d’interacció d’usuaris.

Per exemple, la interfície de veu pot dir alguna cosa com "puc ajudar-vos a comprar" o "Puc donar-vos informació sobre productes".

En qualsevol cas, als usuaris també se'ls ha de proporcionar una sortida fàcil d'una funció, inclosa la "sortida" com una de les seves opcions.

Entregueu respostes amb informació completa

A les interfícies gràfiques, els usuaris poden veure en quina secció es troben, mentre que a les interfícies d’usuari de veu, els usuaris han de saber quina funcionalitat utilitzen.

Els usuaris es poden confondre ràpidament sobre on es troben a la conversa o poden activar la funcionalitat per error, per tant, sense més orientació que l'auditori, necessiten més detalls.

La interfície ha de respondre a una pregunta sobre un producte amb una frase sencera com ara "El cotxe de la marca X i el model X té un preu de 20.000 dòlars i té una garantia de 2 anys".

Això permet als usuaris conèixer quina és la funcionalitat que utilitzen i de què parla.

Feu servir tants exemples com pugueu

Quan la gent parla, sovint no expressen les seves intencions plenes, moltes vegades perquè utilitzen argot, magdalenes, escurçar paraules, etc.

Entre els humans ens entenem, però les interfícies de veu necessiten que l’home s’expressi correctament per entendre les seves intencions.

A més, com més informació sobre les seves intencions inclogui un usuari en una frase, millor.

Un usuari pot preguntar-me: "Doneu-me informació sobre els cotxes disponibles, el preu del model X si us plau" i obtenir la informació que vol immediatament, en lloc de dir primer: "Vull informació sobre els cotxes disponibles" i, a continuació, demanar el model. .

És possible que els usuaris no s’adonin d’aquesta manera d’operar, per la qual cosa heu d’utilitzar el màxim d’exemples d’interaccions possibles.

Limiteu la quantitat d’opcions

Quan els usuaris naveguen per contingut o llistes visuals, poden tornar a la informació que van passar per alt o oblidar.

No és el cas del contingut verbal. Amb contingut verbal, les frases han de ser breus.

Es recomana utilitzar més de tres opcions diferents per a una interacció.

Informeu a l'usuari que esteu escoltant

Utilitzeu alguna forma de retroalimentació senzilla perquè l'usuari sàpiga que el sistema està escoltant.

Haureu d’utilitzar informació visual perquè els usuaris sàpiguen que la interfície d’usuari de veu està escoltant, l’usuari pot veure immediatament que s’està gravant el que està dient (similar a quan parlem amb altres persones i per comunicació no verbal es pot veure que escolta. ).

Anatomia dels comandaments de la veu

Abans que es pugui crear un flux de diàleg, els dissenyadors primer han d’entendre l’anatomia d’un comandament de veu. L’ordre de veu d’un usuari consta de tres factors clau: intenció, declaració i espai. Analitzem la següent sol·licitud: "Reproduireu música relaxant per dormir".

Intenció

La intenció representa l’objectiu més ampli de l’ordre de veu d’un usuari. A la sol·licitud d’exemple, la intenció és clara, l’usuari vol escoltar música.

Declaració

Com l'usuari formula l'ordre, és a dir, la instrucció. En l’exemple que s’utilitza sabem que l’usuari vol reproduir música relaxant gràcies a la paraula "play", però no és l’única manera de dir-ho. L'usuari també pot dir "vull escoltar música".

Els dissenyadors de conversa han de tenir en compte totes les variacions de l’expressió.

Context

De vegades, una intenció sola no és suficient i es requereix més informació de l’usuari per complir la sol·licitud.

Això s’anomena "context" i aquests, com en les interfícies visuals, poden ser opcionals o necessitar per completar una sol·licitud.

En aquest cas, la paraula "relaxant" podria utilitzar el context "reproduir música" per saber que sol·liciteu tocar música relaxant.

Per dissenyar excel·lents interfícies d’usuari de veu, heu de trobar una manera elegant de proporcionar als usuaris informació rellevant sense atabalar-los.

La interacció amb els usuaris de veu pot suposar més reptes en alguns aspectes que no pas en un sistema visual, però, sens dubte és un mode d'interacció que s'utilitzarà cada cop més.