Речь не о том, чтобы притворяться, а о том, чтобы придерживаться принципов общения, выработанных людьми.
Простой пример: люди пользуются «тегами» — <Привет/Пока>, чтобы открыть и закрыть диалог. Голосовому помощнику такие теги не очень-то нужны. Но если бот не поймёт «привет/пока» или «спасибо» (о котором часто забывают разработчики навыков), это покажется необычным и вряд ли вызовет доверие для дальнейшего взаимодействия. Поэтому некоторый уровень естественности помощникам в общении с людьми нужен.
«Перед ними, как мне кажется и нет задачи быть человеком» — об этом пишу и я. Мысль в том, что люди в ходе эволюции выработали некоторые принципы, как быть удобным для собеседника в диалоге, как эффективно отвечать на вопросы. Разработчикам конкурсных ботов пришлось эти принципы исследовать, чтобы имитировать человека, а разработчикам голосовых помощников следует учитывать те же принципы, чтобы сделать помощников удобными и эффективными.
«когда все выбирается за тебя» — это вопрос реализации: делаешь ли ты выбор явно, копаясь в настройках, или неявно, передавая боту информацию о твоих предпочтениях через твоё поведение или через социальный граф и поведение твоей социальной группы или ещё как-то. Мысль 1 в том, что хороший разговорный интерфейс должен быть адаптивным. Мысль 2, что попадание манерой общения в целевую аудиторию может повысить удовлетворённость пользователей.
Простейший пример: Соня Гусева, как и Алиса и Google Ассистент, начинает общаться на «вы». Но в любой момент ей можно сказать «Давай на ты?» — и она продолжает разговор, обращаясь на «ты». Гибкость уже на этом уровне современным помощникам недоступна.
Выдавая прогноз погоды в ответ на вопрос про дождь, ассистент нарушает принципы кооперации по Грайсу — и теряет в удобстве.
Что касается имперсонификации, то выбор чуть шире: ассистент может быть не только с яркой личностью или безликим. По аналогии с графическим интерфейсом, где у пользователя есть выбор скинов, в разговорном интерфейсе пользователь мог бы выбирать особенности и черты помощника, которые ему нравятся.
Как хранилище Google Datastore в общем случае выигрывает у Google Docs по многим параметрам. Но если данных немного, а скорость доступа не играет ключевой роли, то преимуществом может быть удобство администрирования. Google Docs в этом смысле хороший вариант для всех, кто привык работать с данными в Google Таблицах.
Спасибо за положительный отзыв. Вы правы, идентификатор сообщения следует просто пробрасывать из запроса — исправил.
Версия протокола, полагаю, должна прежде всего соответствовать формату ответа — если аналогично передавать её из запроса, может возникнуть несоответствие.
По поводу user_id, передаваемого навыкам, из официальной доки Яндекс Диалогов:
Идентификатор экземпляра приложения, в котором пользователь общается с Алисой, максимум 64 символа.
Даже если пользователь авторизован с одним и тем же аккаунтом в приложении Яндекс для Android и iOS, Яндекс.Диалоги присвоят отдельный user_id каждому из этих приложений.
Спасибо за комментарий! Кейс заказа пиццы хрестоматийный для разговорных интерфейсов. Мы в Just AI как раз недавно решили его на нашей платформе, результаты можно видеть в известном голосовом помощнике. Полностью этот кейс решается довольно сложно, учитывая большое количество возможных параметров заказа и глубокую интеграцию, и о нём хочется рассказать отдельно. Aimylogic — пример инструмента для более простых сценариев.
Сейчас Яндекс передаёт разработчикам Яндекс Диалогов только некий идентификатор пользователя, благодаря которому вы внутри навыка технически можете вести историю общения с конкретным пользователем, задавая ему вопросы и запонимая контекст: имена, адреса, телефоны и т.п., — чтобы упростить повторное использование навыка.
DSL остался за рамками этой статьи, о нём тоже хочется написать позднее. Он как раз позволяет достаточно гибко описывать фразы на естественном языке, минимизируя копипаст. В Aimylogic используются алгоритмы, которым достаточно нескольких примеров фраз — вариативность речи компенсируется на уровне системы и функций поиска семантической близости.
В примере из статьи переменные $name и $vacation_date сохраняют себе весь текст пользовательского запроса на определённом шаге диалога. Т.е. на уровне проектирования диалога вы, задавая вопрос про имя, определяете «сохрани следующий ответ в переменную $name». В будущем в инструменте появятся блоки для разных типов данных, так как многие «регулярки», умеющие извлекать нужные данные из запросов (числа, даты, единицы измерения, адреса и т.п.) уже написаны внутри нашей платформы.
Если быть справедливым, похожей модели поведения в разговоре придерживаются и люди в некоторых ситуациях. Для создателей чатботов это самый простой путь избегать откровенных фейлов. Но на то и конкурсы, чтобы искать новые пути и сравнивать их.
Через такую консоль Вы получаете сервис общения. И если Вы оцениваете его как человекоподобное, то можете считать сервис интеллектуальным, а интерфейс чатбота — связью с искусственным интеллектом.
С т.з. смысла жизни и интеллекта как продолжения этой самой жизни, т.е. выживания, модель разговора, который может быть прекращён человеком в любой момент, выглядит интересной для оценки интеллекта.
Не знаю. Думаю, это не самая дешёвая фича, чтобы сделать её конкурентной приложению в телефоне.
Простой пример: люди пользуются «тегами» — <Привет/Пока>, чтобы открыть и закрыть диалог. Голосовому помощнику такие теги не очень-то нужны. Но если бот не поймёт «привет/пока» или «спасибо» (о котором часто забывают разработчики навыков), это покажется необычным и вряд ли вызовет доверие для дальнейшего взаимодействия. Поэтому некоторый уровень естественности помощникам в общении с людьми нужен.
«когда все выбирается за тебя» — это вопрос реализации: делаешь ли ты выбор явно, копаясь в настройках, или неявно, передавая боту информацию о твоих предпочтениях через твоё поведение или через социальный граф и поведение твоей социальной группы или ещё как-то. Мысль 1 в том, что хороший разговорный интерфейс должен быть адаптивным. Мысль 2, что попадание манерой общения в целевую аудиторию может повысить удовлетворённость пользователей.
Простейший пример: Соня Гусева, как и Алиса и Google Ассистент, начинает общаться на «вы». Но в любой момент ей можно сказать «Давай на ты?» — и она продолжает разговор, обращаясь на «ты». Гибкость уже на этом уровне современным помощникам недоступна.
Что касается имперсонификации, то выбор чуть шире: ассистент может быть не только с яркой личностью или безликим. По аналогии с графическим интерфейсом, где у пользователя есть выбор скинов, в разговорном интерфейсе пользователь мог бы выбирать особенности и черты помощника, которые ему нравятся.
Версия протокола, полагаю, должна прежде всего соответствовать формату ответа — если аналогично передавать её из запроса, может возникнуть несоответствие.
Идентификатор экземпляра приложения, в котором пользователь общается с Алисой, максимум 64 символа.
Даже если пользователь авторизован с одним и тем же аккаунтом в приложении Яндекс для Android и iOS, Яндекс.Диалоги присвоят отдельный user_id каждому из этих приложений.
Сейчас Яндекс передаёт разработчикам Яндекс Диалогов только некий идентификатор пользователя, благодаря которому вы внутри навыка технически можете вести историю общения с конкретным пользователем, задавая ему вопросы и запонимая контекст: имена, адреса, телефоны и т.п., — чтобы упростить повторное использование навыка.
DSL остался за рамками этой статьи, о нём тоже хочется написать позднее. Он как раз позволяет достаточно гибко описывать фразы на естественном языке, минимизируя копипаст. В Aimylogic используются алгоритмы, которым достаточно нескольких примеров фраз — вариативность речи компенсируется на уровне системы и функций поиска семантической близости.
В примере из статьи переменные $name и $vacation_date сохраняют себе весь текст пользовательского запроса на определённом шаге диалога. Т.е. на уровне проектирования диалога вы, задавая вопрос про имя, определяете «сохрани следующий ответ в переменную $name». В будущем в инструменте появятся блоки для разных типов данных, так как многие «регулярки», умеющие извлекать нужные данные из запросов (числа, даты, единицы измерения, адреса и т.п.) уже написаны внутри нашей платформы.
С т.з. смысла жизни и интеллекта как продолжения этой самой жизни, т.е. выживания, модель разговора, который может быть прекращён человеком в любой момент, выглядит интересной для оценки интеллекта.
Чатбота как тест ИИ предложил Тьюринг, а конкурс — это просто стимул для развития чатботов.