Как стать автором
Обновить

Против всех: in-app голосовые помощники

Время на прочтение5 мин
Количество просмотров6.8K
Всего голосов 10: ↑10 и ↓0+10
Комментарии19

Комментарии 19

Голосовая функция — точно так же ситуативна, как и запуск мобильного приложения. Пользователю может быть удобно запустить какую-то функцию голосом, если
  • Это новый пользователь, и он еще не разобрался со структурой UI вашего приложения
  • Пользователь не помнит, где спрятано нужное меню или кнопка
  • Если ему нужно просто повторить предыдущее действие
  • Если можно сказать два слова вместо 5-ти тапов и скроллов
  • Когда легче объяснить проблему, чем искать ее решение внутри приложения

Имхо, большая часть этих причин — знак о том, что с интерфейсом и дизайном приложения что-то не то. Надо менять специалистов по интерфейсу, а не обмазывать приложение голосовыми помощниками. Кажется, что есть немного реальных случаев, когда работающие голосовые помощники полезны: облегчение жизни инвалидам и работа тогда, когда руками что-то делать неудобно: холодно, они заняты. Для остального есть UX.


Вы пользуетесь каждый день голосовыми помощниками? Я — нет. Хотя разрабатываю их уже более 7-ми лет!

А тут, имхо, причина ещё более простая: в большинстве случаев разработчик может либо делать бесполезные помощники, либо лишиться работы. Поднимите руки, кто хочет второй вариант.

Сегодня пользователи все чаще желают просто выразить свою потребность вместо того, чтобы разбираться в контроллах приложения, отыскивая, как эту потребность решить.

Однажды, например, я показал одному заказчику от ритейла, как пользователь просто говорит ассистенту — «Хочу борщ» вместо того, чтобы сперва искать где-то рецепт, а потом искать в его приложении ингредиенты и заказывать их в нужном количестве. Ассистент делает все это и сразу складывает ингредиенты на сумму в 700 рублей в корзину. Вот вам и UX. Уж не говоря о банковских переводах, где нужно руками набирать телефоны и суммы.
Ассистент делает все это и сразу складывает ингредиенты на сумму в 700 рублей в корзину.
После чего оказывается снесённым потому что вместо того, чтобы получить горячий борщ из расторана пользователь получает вот всю эту кучу ингридиентов…

Уж не говоря о банковских переводах, где нужно руками набирать телефоны и суммы.
Набирать сумы действительно неудобно, но достаточно одного раза, когда деньги улетят чёрт знает куда и нескольких дней на их возврат для того, чтобы привить стойкое нежелание посылать их с помощью голосового помощника.

Собственно основная проблема в ошибках. Если помощник делает не то, не там и не тогда, когда нужно — проще его отключить и забыть, чем понять — когда ему можно доверять, когда нет.
После чего оказывается снесённым потому что вместо того, чтобы получить горячий борщ из расторана пользователь получает вот всю эту кучу ингридиентов…


Вообще-то пользователь как раз и хотел получить ингредиенты в корзине, если уж он запустил приложение ритейлера. А вот если он запустит приложение деливериклаба какого-нибудь — то как раз там ассистент привезет ему горячий борщ из ресторана )

но достаточно одного раза, когда деньги улетят чёрт знает куда


Перед этим приложение естественно покажет экран, на котором будут уже заполнены поля «Кому» и «Сколько» с кнопкой «Перевести».
НЛО прилетело и опубликовало эту надпись здесь

Вы где-то увидели "сложный голосовой интерфейс" в этой статье?) Как раз наоборот. Именно об этом и речь.

НЛО прилетело и опубликовало эту надпись здесь

Ну, тут мало что можно комментировать, к сожалению… Современные технологии NLP конечно же легко справляются с фразами "переведи маме 500 рублей" и "чем вывести пятно".

Голосовой помощник Так-с.
"Так-с, пятихатник мамке кинь"
"Так-с, и как, блин, я, нафиг, от этого, скотина, пятна избавлюсь?"


Предпочитаю не пользоваться голосовыми помощниками, потому что не хочу думать, а как к ним можно обращаться, а как фразу надо строить, а как долго будет выполняться обработка запроса, а сможет ли он угадать и распознать с первой попытки. И совсем ума не приложу, зачем голосовой помощник в приложениях, которые стараешься использовать, не привлекая особого внимания со стороны, навроде тех же банковских. "Отправь маме пятьсот рублей" — "Опа, а вчера у тебя лишних пяти сотен не нашлось".

Однажды, например, я показал одному заказчику от ритейла, как пользователь просто говорит ассистенту — «Хочу борщ» вместо того, чтобы сперва искать где-то рецепт, а потом искать в его приложении ингредиенты и заказывать их в нужном количестве. Ассистент делает все это и сразу складывает ингредиенты на сумму в 700 рублей в корзину.

Имхо, тут упущен один момент: почему вы считаете, что в случае голосового помощника приложение само наполнит корзину, а в случае обычного использования интерфейса — надо искать рецепт? Его с таким же успехом можно засунуть в приложение, сделать доступным из поиска, привязать к нему все ингредиенты. Понятно, что если максимально затруднить жизнь пользователю отсутствием обычных функций, засовывая их в голосовой помощник, то последний можно продать лучше.


Большая проблема в том, что "Хочу борщ" хорошо работает на презентации перед менеджерами, которые хотят премию. В куче случаев это выглядит иначе:
1) Пользователь говорит "Хочу борщ", приложение гудит и через какое-то время складывает продукты в корзину.
2) В лучшем случае, приложение еще и покажет рецепт, а пользователь поймет, что такой борщ он не любит (а предложенная сметана ужасна на вкус, а отдел с охлажденным мясом в этом магазине воняет половыми тряпками, лучше тут не рисковать, выбирая мясо без упаковки), в еще более лучшем случае приложение позволит выбрать рецепт из списка.
3) Пользователь обнаруживает, что он пытается понять по рецепту, сколько борща получится, оказывается, что большая кастрюля. Хорошо, но хочется больше или меньше, начинается квест по изменению количества продуктов в заказе. К сожалению, это не цифры в коде, а мясо не продается по условным 175 грамм, а сметана — по условным 65. Как-то подобрали упаковки, производителей и стоимость, смирились с тем, что кроме борща еще надо будет приготовить что-то из остатков.
4) Потом нужно выкинуть из заказа продукты, которые есть дома, добавить в заказ соль и масло, почему-то куча рецептов считает, что дома они есть. Либо убрать, если умный магазин решил позаботиться о тех, кто ничего не покупает.
5) Проверить список, выбрать время и место доставки, оплатить. И только листая список акций после заказа обнаружить, что сегодня со скидкой другие продукты, жаркое было бы в три раза дешевле борща.


Проблема в том, что голосовой помощник с трудом справился только с одной из пяти задач, а с ней бы справился и простой поиск с динамическими подсказками (и еще бы он показал ниже, что жаркое и деликатесные блюда сегодня будут гораздо дешевле).

Разве Алиса — не In-App ассистент приложения «Яндекс — с Алисой»?
Точно ) только пытается при этом исполнять функции других приложений (сервисов), с чем довольно плохо справляется.
Тогда, может, суть не в том, чтобы сделать In-App ассистента, а в том, чтобы пользователь правильно понимал, какой ассистент с чем справляется?
Попробуй объяснить это пользователям ) У него и так есть приложение, которое ожидаемо справится с нужной функцией. А вот где ее там найти — другой вопрос. С точки зрения архитектуры современных ассистентов — все они пытаются справиться со всем, а в итоге только ограничивают разработчика. Олег вот пошел по другому пути (и не только он один)
Лично для меня голосовой ассистент всегда был программой, которой я могу сказать поставить будильник, включить музыку, изменить громкость музыки не прикасаясь к телефону. Мне кажется плохой идеей встраивать свой голосовой помощник в каждое приложение, это же будет ужас сколько места занимать, разве нет?
Возможно, если уж так хочется иметь «быструю» навигацию по приложению (хотя я почти не встречал людей, которые используют ассистента с целью навигации), было бы круто иметь возможность интегрироваться с системным голосовым ассистентом с учетом контекста текущего запущенного приложения. И тогда не будет: 1) сильного увеличения размера программ; 2) необходимости активировать конкретные навыки — будут своего рода namespaces.
Верно! С точки зрения «контекста» самого устройства — «Поставь будильник» или «Включи музыку» — это те самые голосовые команды, которые должен понимать ассистент самого устройства (встроенный ассистент типа Google Assistant).

Но когда этот же ассистент пытается интегрироваться с вашим сервисом, то получается плохо — сплошные ограничения API ассистента, невозможность запускать локальные вещи (управление локальными сервисами), ограничения интерфейса и так далее.

«Контекст текущего запущенного приложения» — штука очень абстрактная, не правда ли? Просто экран, а что на нем можно сделать? А на нем ли пользователь вообще хочет что-то сделать? Да и как вы представляете себе возможность взаимодействия такого системного ассистента с функциями именно вашего приложения?

И кто вам сказал, что будет «сильное увеличение размера программ»?

Посмотрите на примеры, которые были приведены в статье. Здесь речь не идет только о быстрой навигации.
Я вообще не могу придумать ситуацию, когда какой-то голосовой помощник можно использовать. У меня на работе вокруг люди, и дома люди, и в кафе, и в транспорте. И я не хочу, чтоб они слышали мои команды с каким-то голосовым помощником по целой куче разных причин (от конфиденциальности до нежеления создавать голосовой шум).
Где вы вообще их используете?
НЛО прилетело и опубликовало эту надпись здесь
Причем все больше и больше пользователей по оценкам Amazon, Google и Яндекс, которые производят голосовые колонки, автомобильные устройства и мобильных ассистентов ))
Зарегистрируйтесь на Хабре, чтобы оставить комментарий