음성 사용자 인터페이스를 디자인하는 방법

Apple HomePod, Google Home 및 Amazon Echo와 같은 점점 더 많은 음성 제어 장치가 있습니다. comScore (마케팅 리서치 회사)는 음성 인터페이스가 사용자 경험을 향상시키기 때문에 2020 년까지 음성이 모든 검색의 50 %를 실행한다고 믿습니다.

Microsoft, Google, Amazon, Apple 및 Facebook의 5 대 기술 회사는 음성 지원 AI 도우미를 개발했거나 현재 개발 중입니다.

웹 애플리케이션이나 스마트 홈 스피커를위한 VUI (Voice User Interfaces)에 대해 이야기하든, 오늘날 많은 사람들이 화면 앞에서 많은 시간을 보내면서 피곤함을 느끼기 때문에 오늘날의 기술에서는 음성 상호 작용이 점점 일반화되고 있습니다.

음성 사용자 인터페이스를 디자인하는 방법과 해부학 음성 명령에 어떤 기능이 필요한지 살펴 보겠습니다.

음성 인터페이스를 디자인하는 방법

가정용 스피커에 대한 온라인 리뷰를 읽으면 일부 사람들은 제품보다 애완 동물처럼 보이는 방식으로 스피커와 밀접한 관계를 형성한다는 것을 알 수 있습니다.

아직 진행중인 프로그램으로 모든 고객의 기대를 충족시킬 수는 없지만 시작점으로 몇 가지 지침을 따를 수 있습니다.

수행 할 수있는 작업에 대한 정보를 사용자에게 제공

그래픽 사용자 인터페이스는 사용자가 할 수있는 모든 것을 보여줍니다. 음성 인터페이스는 가능한 옵션을 사용자에게 보여줄 방법이 없으며, 새로운 사용자는 인간 대화 경험에 대한 기대치를 바탕으로합니다.

따라서 시스템에 의미가 없거나 불가능한 것을 요구하여 시작할 수 있습니다. 이에 대한 해결책은 사용자 상호 작용 옵션을 제공하는 것입니다.

예를 들어, 음성 인터페이스는 "구매할 수 있습니다"또는 "제품에 대한 정보를 줄 수 있습니다"와 같은 문구를 말할 수 있습니다.

어쨌든 사용자는 옵션 중 하나로 '종료'를 포함하여 기능에서 쉽게 벗어날 수있는 방법을 제공해야합니다.

완전한 정보로 답변 제공

그래픽 인터페이스에서 사용자는 자신이 어느 섹션에 있는지 확인할 수 있지만 음성 사용자 인터페이스에서는 사용중인 기능을 알아야합니다.

사용자는 대화중인 위치를 신속하게 혼동하거나 실수로 기능을 활성화 할 수 있으므로 청각보다 더 많은 안내없이 세부 정보가 필요합니다.

인터페이스는 "브랜드 X 및 모델 X의 자동차 가격은 $ 20,000이며 2 년 동안 보장됩니다"와 같은 문구 전체가 포함 된 제품에 대한 질문에 답변해야합니다.

이를 통해 사용자는 사용중인 기능 및 발표자가 말하는 내용을 알 수 있습니다.

가능한 많은 예를 사용하십시오

사람들이 말할 때, 그들은 종종 속어, 머핀, 짧은 단어 등을 사용하기 때문에 온전한 의도를 표현하지 않습니다.

인간 사이에서 우리는 서로를 이해하지만, 음성 인터페이스는 인간이 자신의 의도를 이해하기 위해 자신을 올바르게 표현해야합니다.

또한 의도에 대한 정보가 많을수록 한 문장의 사용자가 더 많을수록 좋습니다.

사용자는 "사용 가능한 자동차에 대한 정보를 제공하고 X 모델의 가격을 알려주십시오."라고 묻고 먼저 "사용 가능한 자동차에 대한 정보를 원합니다"라고 말하지 않고 즉시 원하는 정보를 얻을 수 있습니다. .

사용자는 이러한 작동 방식을 인식하지 못할 수 있으므로 가능한 많은 상호 작용 예제를 사용해야합니다.

옵션의 양을 제한

사용자가 시각적 컨텐츠 또는 목록을 찾아 보면 간과하거나 잊어 버린 정보로 돌아갈 수 있습니다.

그것은 구두 콘텐츠의 경우에는 해당되지 않습니다. 구두 내용으로 문장을 짧게 유지해야합니다.

상호 작용에는 세 가지 이상의 옵션을 사용하는 것이 좋습니다.

사용자에게 듣고 있다고 알리십시오.

시스템이 듣고 있다는 것을 사용자가 알 수 있도록 간단한 형태의 간단한 피드백을 사용하십시오.

음성 사용자 인터페이스가 듣고 있음을 사용자가 알 수 있도록 시각적 정보를 사용해야합니다. 사용자는 자신이 말하는 내용이 녹음되고 있음을 즉시 확인할 수 있습니다 (다른 사람과 대화 할 때와 비슷하고 비언어적 의사 소통을 통해 듣고있는 것을 볼 수 있음) ).

음성 명령 분석

대화의 흐름을 만들기 전에 디자이너는 먼저 음성 명령의 구조를 이해해야합니다. 사용자의 음성 명령은 의도, 선언 및 공간의 세 가지 주요 요소로 구성됩니다. 다음과 같은 요청을 분석해 봅시다.

의향

의도는 사용자의 음성 명령의 광범위한 목표를 나타냅니다. 요청 예에서, 의도는 분명하고, 사용자는 음악을 듣고 싶어한다.

성명서

사용자가 명령, 즉 명령문을 공식화하는 방법 사용 된 예에서 사용자는 "재생"이라는 단어 덕분에 편안한 음악을 재생하려고하지만 이것이 유일한 방법은 아닙니다. 사용자는 "음악을 듣고 싶습니다"라고 말할 수도 있습니다.

대화 디자이너는 표현의 모든 변형을 고려해야합니다.

문맥

때로는 의도만으로는 충분하지 않으며 요청을 이행하기 위해 더 많은 사용자 정보가 필요합니다.

이를 "컨텍스트"라고하며 시각적 인터페이스에서와 같이 선택 사항이거나 응용 프로그램을 완료하는 데 필요할 수 있습니다.

이 경우 "휴식"이라는 단어는 "음악 재생"이라는 컨텍스트를 사용하여 편안한 음악 재생을 요청하고 있음을 알 수 있습니다.

뛰어난 음성 사용자 인터페이스를 디자인하려면 사용자에게 압도하지 않고 관련 정보를 제공 할 수있는 우아한 방법을 찾아야합니다.

음성 사용자 상호 작용은 시각적 시스템보다 일부 측면에서 더 많은 문제를 제기 할 수 있지만, 점점 더 많이 사용될 상호 작용 모드라는 데는 의심의 여지가 없습니다.

더 알고 싶습니까?

더 많은 정보 얻기