Речь не о том, чтобы притворяться, а о том, чтобы придерживаться принципов общения, выработанных людьми.
Простой пример: люди пользуются «тегами» — <Привет/Пока>, чтобы открыть и закрыть диалог. Голосовому помощнику такие теги не очень-то нужны. Но если бот не поймёт «привет/пока» или «спасибо» (о котором часто забывают разработчики навыков), это покажется необычным и вряд ли вызовет доверие для дальнейшего взаимодействия. Поэтому некоторый уровень естественности помощникам в общении с людьми нужен.
«Перед ними, как мне кажется и нет задачи быть человеком» — об этом пишу и я. Мысль в том, что люди в ходе эволюции выработали некоторые принципы, как быть удобным для собеседника в диалоге, как эффективно отвечать на вопросы. Разработчикам конкурсных ботов пришлось эти принципы исследовать, чтобы имитировать человека, а разработчикам голосовых помощников следует учитывать те же принципы, чтобы сделать помощников удобными и эффективными.
«когда все выбирается за тебя» — это вопрос реализации: делаешь ли ты выбор явно, копаясь в настройках, или неявно, передавая боту информацию о твоих предпочтениях через твоё поведение или через социальный граф и поведение твоей социальной группы или ещё как-то. Мысль 1 в том, что хороший разговорный интерфейс должен быть адаптивным. Мысль 2, что попадание манерой общения в целевую аудиторию может повысить удовлетворённость пользователей.
Простейший пример: Соня Гусева, как и Алиса и Google Ассистент, начинает общаться на «вы». Но в любой момент ей можно сказать «Давай на ты?» — и она продолжает разговор, обращаясь на «ты». Гибкость уже на этом уровне современным помощникам недоступна.
Выдавая прогноз погоды в ответ на вопрос про дождь, ассистент нарушает принципы кооперации по Грайсу — и теряет в удобстве.
Что касается имперсонификации, то выбор чуть шире: ассистент может быть не только с яркой личностью или безликим. По аналогии с графическим интерфейсом, где у пользователя есть выбор скинов, в разговорном интерфейсе пользователь мог бы выбирать особенности и черты помощника, которые ему нравятся.
Как хранилище Google Datastore в общем случае выигрывает у Google Docs по многим параметрам. Но если данных немного, а скорость доступа не играет ключевой роли, то преимуществом может быть удобство администрирования. Google Docs в этом смысле хороший вариант для всех, кто привык работать с данными в Google Таблицах.
Спасибо за положительный отзыв. Вы правы, идентификатор сообщения следует просто пробрасывать из запроса — исправил.
Версия протокола, полагаю, должна прежде всего соответствовать формату ответа — если аналогично передавать её из запроса, может возникнуть несоответствие.
По поводу user_id, передаваемого навыкам, из официальной доки Яндекс Диалогов:
Идентификатор экземпляра приложения, в котором пользователь общается с Алисой, максимум 64 символа.
Даже если пользователь авторизован с одним и тем же аккаунтом в приложении Яндекс для Android и iOS, Яндекс.Диалоги присвоят отдельный user_id каждому из этих приложений.
Спасибо за комментарий! Кейс заказа пиццы хрестоматийный для разговорных интерфейсов. Мы в Just AI как раз недавно решили его на нашей платформе, результаты можно видеть в известном голосовом помощнике. Полностью этот кейс решается довольно сложно, учитывая большое количество возможных параметров заказа и глубокую интеграцию, и о нём хочется рассказать отдельно. Aimylogic — пример инструмента для более простых сценариев.
Сейчас Яндекс передаёт разработчикам Яндекс Диалогов только некий идентификатор пользователя, благодаря которому вы внутри навыка технически можете вести историю общения с конкретным пользователем, задавая ему вопросы и запонимая контекст: имена, адреса, телефоны и т.п., — чтобы упростить повторное использование навыка.
DSL остался за рамками этой статьи, о нём тоже хочется написать позднее. Он как раз позволяет достаточно гибко описывать фразы на естественном языке, минимизируя копипаст. В Aimylogic используются алгоритмы, которым достаточно нескольких примеров фраз — вариативность речи компенсируется на уровне системы и функций поиска семантической близости.
В примере из статьи переменные $name и $vacation_date сохраняют себе весь текст пользовательского запроса на определённом шаге диалога. Т.е. на уровне проектирования диалога вы, задавая вопрос про имя, определяете «сохрани следующий ответ в переменную $name». В будущем в инструменте появятся блоки для разных типов данных, так как многие «регулярки», умеющие извлекать нужные данные из запросов (числа, даты, единицы измерения, адреса и т.п.) уже написаны внутри нашей платформы.
Если быть справедливым, похожей модели поведения в разговоре придерживаются и люди в некоторых ситуациях. Для создателей чатботов это самый простой путь избегать откровенных фейлов. Но на то и конкурсы, чтобы искать новые пути и сравнивать их.
Через такую консоль Вы получаете сервис общения. И если Вы оцениваете его как человекоподобное, то можете считать сервис интеллектуальным, а интерфейс чатбота — связью с искусственным интеллектом.
С т.з. смысла жизни и интеллекта как продолжения этой самой жизни, т.е. выживания, модель разговора, который может быть прекращён человеком в любой момент, выглядит интересной для оценки интеллекта.
Челлендж по разговорному ИИ на хакатоне Junction: создай чатбота или голосовой навык и выиграй 10 000 евро
Против всех: in-app голосовые помощники
Против всех: in-app голосовые помощники
За Премией Алисы: 5 инсайтов от победителя
За Премией Алисы: 5 инсайтов от победителя
10 причин сделать свой скилл для голосового помощника
Не знаю. Думаю, это не самая дешёвая фича, чтобы сделать её конкурентной приложению в телефоне.
Виртуальный Джинн на 8 марта — или как удивить своих сотрудниц в самый весенний день
Голосовые помощники не учатся на тесте Тьюринга
Простой пример: люди пользуются «тегами» — <Привет/Пока>, чтобы открыть и закрыть диалог. Голосовому помощнику такие теги не очень-то нужны. Но если бот не поймёт «привет/пока» или «спасибо» (о котором часто забывают разработчики навыков), это покажется необычным и вряд ли вызовет доверие для дальнейшего взаимодействия. Поэтому некоторый уровень естественности помощникам в общении с людьми нужен.
Голосовые помощники не учатся на тесте Тьюринга
«когда все выбирается за тебя» — это вопрос реализации: делаешь ли ты выбор явно, копаясь в настройках, или неявно, передавая боту информацию о твоих предпочтениях через твоё поведение или через социальный граф и поведение твоей социальной группы или ещё как-то. Мысль 1 в том, что хороший разговорный интерфейс должен быть адаптивным. Мысль 2, что попадание манерой общения в целевую аудиторию может повысить удовлетворённость пользователей.
Простейший пример: Соня Гусева, как и Алиса и Google Ассистент, начинает общаться на «вы». Но в любой момент ей можно сказать «Давай на ты?» — и она продолжает разговор, обращаясь на «ты». Гибкость уже на этом уровне современным помощникам недоступна.
Голосовые помощники не учатся на тесте Тьюринга
Что касается имперсонификации, то выбор чуть шире: ассистент может быть не только с яркой личностью или безликим. По аналогии с графическим интерфейсом, где у пользователя есть выбор скинов, в разговорном интерфейсе пользователь мог бы выбирать особенности и черты помощника, которые ему нравятся.
Раз, Два, Три! Чат-бот из Google Таблицы на примере PvP-игры для Алисы
Раз, Два, Три! Чат-бот из Google Таблицы на примере PvP-игры для Алисы
Версия протокола, полагаю, должна прежде всего соответствовать формату ответа — если аналогично передавать её из запроса, может возникнуть несоответствие.
Как создать своего бота без навыков программирования и подключить его к Яндекс.Алисе
Как создать своего бота без навыков программирования и подключить его к Яндекс.Алисе
Идентификатор экземпляра приложения, в котором пользователь общается с Алисой, максимум 64 символа.
Даже если пользователь авторизован с одним и тем же аккаунтом в приложении Яндекс для Android и iOS, Яндекс.Диалоги присвоят отдельный user_id каждому из этих приложений.
Как создать своего бота без навыков программирования и подключить его к Яндекс.Алисе
Сейчас Яндекс передаёт разработчикам Яндекс Диалогов только некий идентификатор пользователя, благодаря которому вы внутри навыка технически можете вести историю общения с конкретным пользователем, задавая ему вопросы и запонимая контекст: имена, адреса, телефоны и т.п., — чтобы упростить повторное использование навыка.
DSL остался за рамками этой статьи, о нём тоже хочется написать позднее. Он как раз позволяет достаточно гибко описывать фразы на естественном языке, минимизируя копипаст. В Aimylogic используются алгоритмы, которым достаточно нескольких примеров фраз — вариативность речи компенсируется на уровне системы и функций поиска семантической близости.
В примере из статьи переменные $name и $vacation_date сохраняют себе весь текст пользовательского запроса на определённом шаге диалога. Т.е. на уровне проектирования диалога вы, задавая вопрос про имя, определяете «сохрани следующий ответ в переменную $name». В будущем в инструменте появятся блоки для разных типов данных, так как многие «регулярки», умеющие извлекать нужные данные из запросов (числа, даты, единицы измерения, адреса и т.п.) уже написаны внутри нашей платформы.
Продажи с помощью голосового помощника Яндекса: создаём навыки для Алисы
О чём Медведеву с искусственным интеллектом говорить?
О чём Медведеву с искусственным интеллектом говорить?
О чём Медведеву с искусственным интеллектом говорить?
С т.з. смысла жизни и интеллекта как продолжения этой самой жизни, т.е. выживания, модель разговора, который может быть прекращён человеком в любой момент, выглядит интересной для оценки интеллекта.
О чём Медведеву с искусственным интеллектом говорить?
Чатбота как тест ИИ предложил Тьюринг, а конкурс — это просто стимул для развития чатботов.