Jak zaprojektować głosowe interfejsy użytkownika

Istnieje coraz więcej urządzeń sterowanych głosem, takich jak Apple HomePod, Google Home i Amazon Echo. Wynika to z faktu, że interfejsy głosowe poprawiają komfort użytkowania, w rzeczywistości comScore (firma zajmująca się badaniami marketingowymi) uważa, że głos wykona 50% wszystkich wyszukiwań do 2020 roku.

Pięć największych firm technologicznych, Microsoft, Google, Amazon, Apple i Facebook, opracowało (lub obecnie opracowuje) asystentów AI z obsługą głosu.

Niezależnie od tego, czy mówimy o VUI (Voice User Interfaces) dla aplikacji internetowych, czy inteligentnych głośników domowych, interakcje głosowe są coraz bardziej powszechne w dzisiejszej technologii, zwłaszcza, że wiele osób odczuwa zmęczenie przebywaniem przez wiele godzin przed ekranem.

Zobaczmy więc, jak zaprojektować głosowe interfejsy użytkownika i jakie polecenia głosowe powinny mieć anatomię.

Jak zaprojektować interfejsy głosowe

Jeśli czytasz recenzje online głośników domowych, zauważysz, że niektóre osoby łączą się ze swoim głośnikiem w sposób, który bardziej przypomina zwierzę domowe niż produkt.

Z pewnością nie możesz spełnić wszystkich oczekiwań klientów dzięki programom, które wciąż są w toku, ale możesz zacząć od kilku wskazówek.

Przekaż użytkownikom informacje o tym, co mogą zrobić

Graficzny interfejs użytkownika pokazuje użytkownikom wszystko, co mogą zrobić. Interfejs głosowy nie ma możliwości pokazania użytkownikowi możliwych opcji, a nowi użytkownicy opierają swoje oczekiwania na doświadczeniach z rozmowami z ludźmi.

Dlatego mogą zacząć od pytania o coś, co nie ma sensu dla systemu lub jest niemożliwe. Rozwiązaniem tego jest zaoferowanie opcji interakcji użytkownika.

Na przykład interfejs głosowy może powiedzieć „Mogę pomóc w zakupie" lub „Mogę przekazać informacje o produktach".

W każdym razie użytkownikom należy również zapewnić łatwe wyjście z funkcji, w tym opcję „exit" jako jedną z ich opcji.

Dostarcz odpowiedzi z pełnymi informacjami

W interfejsach graficznych użytkownicy mogą zobaczyć, w której sekcji są, natomiast w interfejsach głosowych użytkownicy muszą wiedzieć, z jakich funkcji korzystają.

Użytkownicy mogą szybko zdezorientować się, gdzie są w rozmowie, lub mogą przez pomyłkę aktywować funkcje, dlatego bez dodatkowych wskazówek niż słuchowe potrzebują więcej szczegółów.

Interfejs musi odpowiadać na pytanie o produkt z całym zwrotem, np. „Samochód marki X i modelu X kosztuje 20 000 USD i jest objęty gwarancją przez 2 lata".

Dzięki temu użytkownicy mogą wiedzieć, z jakiej funkcji korzystają i o czym mówi głośnik.

Użyj jak największej liczby przykładów

Kiedy ludzie mówią, często nie wyrażają pełnych intencji, wiele razy, ponieważ używają slangu, babeczek, skracają słowa itp.

Wśród ludzi rozumiemy się nawzajem, ale interfejsy głosowe potrzebują, aby człowiek poprawnie wyraził siebie, aby zrozumieć swoje intencje.

Ponadto, im więcej informacji o ich intencjach zawiera użytkownik w zdaniu, tym lepiej.

Użytkownik może zapytać: „Podaj mi informacje o dostępnych samochodach, proszę o cenę modelu X" i natychmiast uzyskaj potrzebne informacje, zamiast najpierw powiedzieć: „Chcę uzyskać informacje o dostępnych samochodach", a następnie zapytać o model .

Użytkownicy mogą nie zdawać sobie sprawy z tego sposobu działania, dlatego należy użyć możliwie największej liczby przykładów interakcji.

Ogranicz liczbę opcji

Gdy użytkownicy przeglądają treści wizualne lub listy, mogą powrócić do informacji, które przeoczyli lub zapomnieli.

Tak nie jest w przypadku treści słownych. W przypadku treści słownych zdania powinny być krótkie.

Zalecane jest użycie więcej niż trzech różnych opcji interakcji.

Poinformuj użytkownika, że słuchasz

Użyj jakiejś formy prostej informacji zwrotnej, aby użytkownik wiedział, że system nasłuchuje.

Powinieneś użyć pewnych informacji wizualnych, aby użytkownicy wiedzieli, że głosowy interfejs użytkownika nasłuchuje, użytkownik może natychmiast zobaczyć, że to, co mówi, jest nagrywane (podobnie jak w przypadku rozmowy z innymi ludźmi i przez komunikację niewerbalną można zobaczyć, że słuchają ).

Anatomia poleceń głosowych

Zanim powstanie ciąg dialogu, projektanci muszą najpierw zrozumieć anatomię polecenia głosowego. Polecenie głosowe użytkownika składa się z trzech kluczowych czynników: intencji, deklaracji i przestrzeni. Przeanalizujmy następujące żądanie: „Odtwarzaj relaksującą muzykę do snu".

Zamiar

Intencja reprezentuje szerszy cel polecenia głosowego użytkownika. W przykładowym żądaniu zamiar jest jasny, użytkownik chce słuchać muzyki.

Komunikat

Jak użytkownik formułuje polecenie, czyli instrukcję. W użytym przykładzie wiemy, że użytkownik chce odtwarzać relaksującą muzykę dzięki słowu „grać", ale nie jest to jedyny sposób, aby to powiedzieć. Użytkownik może również powiedzieć „Chcę słuchać muzyki".

Projektanci konwersacji muszą wziąć pod uwagę wszystkie odmiany wyrażenia.

Kontekst

Czasami sama intencja nie wystarcza i do spełnienia żądania wymagana jest większa liczba informacji o użytkowniku.

Nazywa się to „kontekstem", a one, podobnie jak w interfejsach wizualnych, mogą być opcjonalne lub wymagane do ukończenia aplikacji.

W tym przypadku słowo „relaksujący" może użyć kontekstu „odtwarzać muzykę", aby wiedzieć, że chcesz odtwarzać muzykę relaksacyjną.

Aby zaprojektować doskonałe interfejsy głosowe, musisz znaleźć elegancki sposób dostarczania użytkownikom odpowiednich informacji bez ich przytłaczania.

Interakcja użytkownika głosu może w niektórych aspektach stanowić więcej wyzwań niż system wizualny, jednak nie ma wątpliwości, że jest to sposób interakcji, który będzie coraz częściej wykorzystywany.

Chcesz wiedzieć więcej?

Zdobądź więcej informacji