Голосовые интерфейсы *

управляем устройствами при помощи голосовых команд

СтатьиПостыНовостиАвторыКомпании

@Enfriz 16 окт 2019 в 09:02

Распознаём дату и время в естественной речи

10 мин

17K

.NET * C# * Natural Language Processing * Алгоритмы * Голосовые интерфейсы *

Задача

Привет, Хабр! Увлёкся я навыками для Алисы и стал думать, какую пользу они бы могли принести. На площадке много разных прикольных игр (в том числе мои), но вот захотелось сделать рабочий инструмент, который действительно нужен в голосовом исполнении, а не просто копирует существующего чат-бота с кнопками.

Голос актуален тогда, когда либо руки заняты, либо нужно выполнять много последовательных операций, особенно на экране телефона. Так возникла идея навыка, который по одной команде выделяет из текста указание на дату и время и добавляет событие с этим текстом в Google Calendar. Например, если пользователь скажет Послезавтра в 11 вечера будет красивый закат, то в календарь на послезавтра в 23:00 уходит строка Будет красивый закат.

Под катом описание алгоритма работы библиотеки Hors: распознавателя даты и времени в естественной русской речи. Хорс — это славянский бог солнца.

Github | NuGet

+43

@and7ey 14 окт 2019 в 13:11

Некоторые особенности разработки навыка для Алисы

3 мин

3.2K

Голосовые интерфейсы *

Живете в Москве и ездите на своем автомобиле? Если да, то как вы оплачиваете парковку? Отправляете SMS? Платите через приложение Парковки Москвы? Используете бот в Telegram? «Это все неудобно» — решил я и создал свой навык для Алисы для оплаты парковки голосом. К тому же, Алиса уже встроена в Яндекс.Навигатор. Теперь можно просто сказать Навигатору что-то типа «Алиса, попроси Парковки Москвы оплатить парковку 3209 на 30 минут».

С чем я столкнулся при разработке навыка?

Узнать подробности

@mzaharov 13 окт 2019 в 21:11

Алиса в стране Битрикс

8 мин

11K

CRM-системы * Node.JS * Голосовые интерфейсы * Программирование * Яндекс API *

Туториал

Сегодня мы:

Создадим приложение (навык) Алисы с использованием нового (октябрь 2019) сервиса Yandex Cloud Functions.
Настроим наше приложение так, чтобы оно отправляло заказы клиентов (т.н. лиды) в CRM Битрикс24.

Наш проект будет использовать Node.js (версия 10.x.x) — он должен быть установлен на вашей локальной машине вместе с npm (по умолчанию npm устанавливается вместе с установкой Node.js, поэтому, скорее всего, отдельно устанавливать его не придётся).

Согласно первому пункту нашего списка мы научимся работать с Cloud Functions, и это имеет смысл: a) ответы из нашего приложения будут приходить Алисе быстрее (она живёт где-то по соседству, возможно даже за стенкой); b) поможет немного (а может быть и много при большой клиентуре) сэкономить: официально объявлено, что при использовании для навыков Алисы, вызовы кода в Cloud Functions не тарифицируются (правда, там есть небольшой подводный камень — о нём я расскажу немного позже).

Второй пункт — это про один из немногих способов заработка денежных знаков с Алисой. На базе полученных сегодня знаний можно будет: a) делать приложения на заказ для клиентов-бизнесменов; b) самостоятельно открыть собственный бизнес (в этом случае вы будете в числе пионеров и поэтому сказочно разбогатеете).

Но если вы ещё не делали навыков для Алисы, или имеете мало опыта — отсылаю вас к первой моей статье из этой серии: «Алиса приобретает навык» — с её помощью вы создадите простое приложение, которое цитирует умных людей, а также имеет кнопку для сбора пожертвований на стимулирование собственных умных мыслей.

Читать дальше →

@Audioman 12 окт 2019 в 11:55

«Стервозная Бетти» и современные аудиоинтерфейсы: почему они говорят женским голосом?

4 мин

16K

Блог компании АудиоманияИнтерфейсы * ЗвукГолосовые интерфейсы * Usability *

Аудиоинтерфейсы окружают нас повсюду: в виде голосовых помощников, навигационной системы в автомобиле и общественном транспорте. Их давно используют в военной технике — речевые информаторы передают команды и подсказки экипажу самолетов с середины двадцатого века.

Военные летчики США прозвали инструменты голосового оповещения «Bitchin’ Betty» — «Стервозной Бетти» — за их требовательную интонацию. Сегодня расскажем об аналогах «Бетти» и разберемся, почему в аудиоинтерфейсах женские голоса встречаются чаще мужских.

+20

@IvanGolubev 10 окт 2019 в 04:29

За Премией Алисы: 5 инсайтов от победителя

5 мин

Разработка игр * Голосовые интерфейсы * DIY или Сделай сам

10 октября 2019 — второй день рождения Алисы. Популяризируя технологии голосовых ассистентов, Яндекс продолжает ежемесячно раздавать деньги разработчикам голосовых приложений в конкурсе “Премия Алисы”.

В погоне за премией разработчикам могут пригодиться замечания автора “Ассоциаций на время”, получивших в сентябрьском конкурсе 1-е место и 100000 ₽ в категории “Игры и развлечения”.

Читать дальше →

@cointegrated 1 окт 2019 в 23:41

Создание stateful навыка для Алисы на serverless функциях Яндекс.Облака и Питоне

7 мин

11K

Python * Голосовые интерфейсы * Облачные сервисы * Программирование * Яндекс API *

Туториал

Начнём с новостей. Вчера Яндекс.Облако анонсировало запуск сервиса бессерверных вычислений Yandex Cloud Functions. Это значит: ты пишешь только код своего сервиса (например, веб-приложения или чатбота), а Облако само создаёт и обслуживает виртуальные машины, где он запускается, и даже реплицирует их, если возрастает нагрузка. Думать вообще не надо, очень удобно. И плата идёт только за время вычислений.

Впрочем, кое-кто может вообще не платить. Это — разработчики внешних навыков Алисы, то есть встроенных в неё чатботов. Написать, захостить и зарегистрировать такой навык может любой разработчик, а с сегодняшнего дня навыки даже не надо хостить — достаточно залить их код в облако в виде той самой бессерверной функции.

Но есть пара нюансов. Во-первых, ваш питонячий код может требовать каких-то зависимостей, и затаскивать их в Облако — нетривиально. Во-вторых, любому нормальному чатботу нужно хранить где-то состояние диалога (stateful поэтому); как сделать это в бессерверной функции проще всего? В третьих, а как вообще можно быстро-грязно написать навык для Алисы или вообще какого-то бота с ненулевым сюжетом? Об этих нюансах, собственно, статья.

Читать дальше →

@vintage 1 сен 2019 в 15:14

Презентация приложения для проведения презентаций

12 мин

9.7K

$mol * TypeScript * Голосовые интерфейсы * ПрезентацииВеб-разработка *

Здравствуйте, меня зовут Дмитрий Карловский и я иногда выступаю на конференциях, митапах, а так же с недавних пор сам вхожу в команду организаторов одного из них — PiterJS. Недавно у нас был юбилей — 40 проведённых митапов. Но вместо того, чтобы расслабиться и получать поздравления, мы запарились и сами подготовили доклады от организаторов.

Тестируем голосовое управление

Но и этого нам мало, поэтому мы решили отметить юбилей по крупному, организовав конференцию на берегах Невы PiterJSConf, которая пройдёт уже в эту субботу 7 сентября 2019. Спешите записываться, пока ещё есть свободные места, ведь участие в ней для вас будет совершенно бесплатно.

Мы всё это делаем не за деньги, а за великую идею, что знания должны быть бесплатны. Поэтому всё, что мы делаем, доступно в Open Source. Мы с радостью делимся своими наработками, знаниями и опытом с другими. И призываем к сотрудничеству организаторов из других городов для создания открытой платформы организации технологических митапов на регулярной основе. Присоединяйтесь к нам в качестве организатора, партнёра, докладчика, волонтёра, патрона или просто слушателя.

А пока, предлагаю вам рассказ про веб приложение для проведения презентаций $hyoo_slides, которое я использую для всех своих выступлений. Видеозапись доступна на YouTube, но там не всё. Можете читать этот рассказ как статью, так и открыть в интерфейсе самого приложения. Далее я расскажу вам, сколько всего оно умеет, и как работает.

Читать дальше →

@mzaharov 28 авг 2019 в 21:05

Алиса приобретает навык

4 мин

13K

Яндекс API * Программирование * Интерфейсы * Голосовые интерфейсы * Node.JS *

Туториал

В этой статье речь пойдёт о голосовых интерфейсах (Voice User Interface — VUI), а также будет показано, как на Node.js можно создать приложение (навык — в терминологии платформы Яндекс.Диалоги) для голосового помощника Алисы. С помощью стороннего API наше приложение будет получать цитаты известных людей и передавать Алисе, а та, в свою очередь, зачитывать их пользователям. Также рассмотрим и один из немногих способов монетизации таких приложений — создание кнопки донации (donation — пожертвование). В общем, все должны остаться довольными.

Читать дальше →

@just_ai 25 авг 2019 в 11:49

Гайд по голосовому UX: ситуации, паттерны, инструменты (и немного моральной поддержки)

12 мин

11K

Блог компании Just AIИскусственный интеллектИнтерфейсы * Голосовые интерфейсы * Usability *

UX и UI-дизайнеры всё ещё со скепсисом смотрят в сторону голосовых интерфейсов. Одним кажется, что это маркетинговый хайп, который скоро сойдёт на нет. Другие не пользуются голосовыми ассистентами и поэтому уверены, что голос — это неудобно и неестественно. Но пока они сомневались, сложилась самостоятельная профессиональная сфера — со своими секретами, паттернами и механиками (и даже рынком труда). Вместе с UX-архитектором Just AI Екатериной Юлиной разбираемся, как подступиться к голосовым технологиям и что в своем мышлении должен изменить UX-дизайнер традиционных интерфейсов, берясь за голосовые.

+14

@just_ai 17 авг 2019 в 10:38

Сын маминой подруги завидует: как дважды выиграть Премию Алисы

8 мин

9.7K

Блог компании Just AIРазработка игр * Продвижение игр * Искусственный интеллектГолосовые интерфейсы *

Вот уже почти год Яндекс вручает денежную Премию Алисы за самые популярные и интересные навыки для своего голосового ассистента. Анна Савинкова, не будучи программистом, гейм-девелопером или ux-дизайнером, разработала голосовой квест «Цитадель» в двух частях, каждой из которых удалось завоевать Премию в категории «Игры и развлечения».

Под катом — ее история про поиск инструмента для разработки, сложности голосовой навигации по игре, проектирование «рюкзака с артефактами» с помощью JavaScript, настройки health points с укусами волков и исцеляющими шматками сала, эксперименты с аудиторией и продвижением голосовой игры в соцсетях. Вдруг этот опыт поможет выиграть и вам. Ну а картинка на тему «Как разработать призовой навык своими руками», а заодно — оригинальная иллюстрация к «Цитадели».

Читать дальше →

+11

@just_ai 8 авг 2019 в 12:05

Голос за геймдев: как мы разработали голосовой квест «Мир Лавкрафта»

8 мин

38K

Блог компании Just AIРазработка игр * Продвижение игр * Дизайн игр * Голосовые интерфейсы *

Пока Google готовил глобальное обновление для русскоязычного Ассистента – с новыми голосами, ~~блэкджеком~~ и встроенными оплатами, мы решили создать для него собственную игру. Мы экспериментировали с жанрами, сюжетом, пасхалками, озвучкой и внутриигровыми платежами. В итоге получился дико интересный опыт, который может повторить каждый, кто хочет сделать первый шаг в геймдев через голос. На примере квеста «Мир Лавкрафта» делимся соображениями об играх для голосовых ассистентов: как разработать и какие есть возможности для монетизации.

+13

@just_ai 14 фев 2019 в 12:51

Вокруг беты за 260 дней: как мы учились прислушиваться к пользователям

10 мин

Блог компании Just AIUsability * Голосовые интерфейсы * Искусственный интеллектУправление разработкой *

Все знают: догфудить собственный продукт (ну, есть корм своей собаки – разрабатывать продукт, который сам же используешь) – это правильный во всех отношениях принцип. Работая над конструктором чатботов Aimylogic, мы в Just AI прекрасно представляли, каким он должен быть, но поначалу не догфудили – наши NLU-инженеры обычно сразу пишут код. И поэтому решили пойти по пути lean startup: выкатить бету, собрать ранний фидбэк от пользователей и писать Aimylogic по-живому. Рассказываем, как мы вместе с пользователями шли от беты к релизу.

+18

@IvanGolubev 2 янв 2019 в 18:41

Первая видеоигра для Алисы, или голосовой помощник как игровой контроллер

3 мин

6.1K

Natural Language Processing * Голосовые интерфейсы * Дизайн игр * Искусственный интеллектРазработка игр *

На работе я занимаюсь созданием полезных навыков для Алисы, а в свободное время попробовал использовать голосового помощника для игры с друзьями, в домашней обстановке. Я уже описывал свою разработку текстовой игры для одного или двух игроков, а в этот раз делюсь опытом создания видеоигры для целой компании.

Читать дальше →

@NexusST 14 ноя 2018 в 20:32

Концепция голосового интерфейса управления вычислительной системой для помощи людям с нарушениями речи

10 мин

5.3K

Python * Голосовые интерфейсы * ЗвукИскусственный интеллектМашинное обучение *

Введение

В настоящее время большое внимание уделяется созданию доступной среды для людей с инвалидностью и ограниченными возможностями здоровья. Важным средством обеспечения доступности и улучшения качества жизни, социального взаимодействия, интеграции в общество для людей с инвалидностью являются средства вычислительной техники и специализированные информационные системы. Анализ литературы показал, что на сегодняшний день ведутся различные разработки для облегчения взаимодействия человека и компьютера, в том числе в направлении разработки голосовых интерфейсов управления вычислительной системой. Однако, данные разработки ориентируются на создание дикторонезависимых систем, обучаемых на больших данных и не учитывающих особенности произношения команд компьютеру людьми с различными нарушениями речевых функций.

Целью научно-исследовательской работы является проектирование дикторозависимого голосового интерфейса управления вычислительной системой на основе методов машинного обучения.

Задачи, решаемые в работе:

Провести обзор голосовых интерфейсов и способы их применения для управления вычислительными системами;
Изучить подходы к персонализации голосового управления вычислительной системой;
Разработать математическую модель голосового интерфейса управления вычислительной системой;
Разработать алгоритм программной реализации.

Методы решения. Для решения поставленных задач используются методы системного анализа, математического моделирования, машинного обучения.

Читать дальше →

@just_ai 15 окт 2018 в 15:43

Весь разговорный AI на первой конференции Conversations

2 мин

3.8K

Блог компании Just AIКонференцииИсследования и прогнозы в IT * Искусственный интеллектГолосовые интерфейсы *

14 ноября в Москве пройдет Conversations – первая в России конференция для разработчиков и бизнеса, посвященная технологиям conversational AI, разговорного искусственного интеллекта. Настоящее и будущее индустрии разговорного AI на Conversations обсудят эксперты Яндекс, Google, Huawei, МТС, Mail.ru, iPavlov, «Кошелек», HeadHunter, Voximplant, «Наносемантика», Digital Intelligence и другие компании. Организатор события – Just AI.

О чем конференция?

К 2019 году, по данным Strategy Analytics и Canalys, доступ к виртуальным голосовым помощникам будут иметь более половины всех смартфонов, а число умных колонок в домах по всему миру превысит 100 миллионов устройств. Не сдают позиции и чатботы: Juniper Research прогнозируют, что экономия от их внедрения к 2022 году вырастет в 400 раз и составит более 8 миллиардов долларов в год.

Чтобы эти прогнозы сбылись, экосистема вокруг разговорного AI должна постоянно развиваться. На конференции Conversations разработчики, вендоры и представители бизнеса – ритейла, финтеха, телекома – смогут вместе разобраться, как превратить разговорный AI из мирового тренда, от которого многого ждут, в инструмент, которым все действительно пользуются.

О чем расскажут хедлайнеры?

Читать дальше →

+13

@redmadrobot 14 авг 2018 в 11:14

From zero to “Actions on Google” hero: ваш код

8 мин

3.6K

Блог компании red_mad_robotAndroid * ХакатоныГолосовые интерфейсы * Интернет вещей

Туториал

В первой части мы разобрались с основными принципами проектирования и разработки приложений для Google Assistant. Теперь пришло время написать собственного помощника, чтобы пользователи могли наконец выбрать фильм на вечер. Разработчики shipa_o, raenardev и дизайнер ComradeGuest продолжают рассказывать.

Читать дальше →

@redmadrobot 10 авг 2018 в 09:43

From zero to “Actions on Google” hero: начало

13 мин

6.8K

Блог компании red_mad_robotИнтернет вещейГолосовые интерфейсы * ХакатоныAndroid *

Туториал

Хакатон Google, и все, что нужно, чтобы начать разрабатывать свои приложения для ассистента.

Google организовал хакатон, посвященный технологии Actions On Google. Это хорошая возможность получить опыт и подумать, как начать делать conversation user interface (CUI) для наших приложений. Поэтому мы собрали команду из двух Android-разработчиков: shipa_o, raenardev и дизайнера comradeguest и отправились участвовать.

Читать дальше →

+19

@jvetrau 12 июл 2018 в 13:25

Полезные материалы по проектированию голосовых интерфейсов

2 мин

4.8K

Блог компании VKUsability * Голосовые интерфейсы * Интерфейсы *

Будущее у голосовых интерфейсов получше, чем у покрывающихся пылью ботов. Продажи устройств бодро растут, а основные платформы стремительно обзаводятся партнёрствами и интеграциями во всё, что подключено к электричеству и интернету. К концу года прогнозируют 100 миллионов устройств; уже 20% американских семей имеют умную колонку. Ну а отечественные хайпожоры позавчера стояли в очереди за Алисой. Были вы там или нет, изучить тему полезно.

Читать дальше →

+27

@ru_vds 29 мая 2018 в 10:15

Интервью с «главным по мозгам Алисы»

14 мин

17K

Блог компании RUVDS.comГолосовые интерфейсы * ИнтервьюИскусственный интеллект

RUVDS совместно с Хабром начинают проект, состоящий из серии интервью с интересными, на наш взгляд, людьми в IT-среде. Сегодня мы представляем интервью с руководителем группы разработки диалоговых систем в Яндексе, Борисом Янгелем.

Почему Алиса, а не Макс, в чем был не прав бывший министр связи Никифиров, зачем запускать Tesla в космос. Ответы в видео и тексте под катом.

Интервью помогли подготовить Лера Негря и редактор Хабра Николай Землянский.

+34

@BarakAdama 29 мая 2018 в 08:30

Яндекс.Станция. Как мы создавали первое устройство с Алисой

8 мин

118K

Блог компании ЯндексГаджетыГолосовые интерфейсы * Искусственный интеллектПоисковые технологии *

Несколько минут назад на конференции YaC 2018 мы впервые рассказали о Яндекс.Станции. Это первое мультимедийное устройство с Алисой, которое воспроизводит музыку и фильмы, рассказывает детям сказки, помогает в повседневных делах, а также поддерживает навыки от сторонних разработчиков.

Может показаться, что для создания подобных устройств достаточно взять голосового помощника, добавить к нему простой микрофон из смартфона и спрятать всё это в корпусе недорогой аудиоколонки. На практике перед разработчиками подобных систем стоят серьёзные технологические проблемы, о решении которых в Станции мы и расскажем сегодня читателям Хабра. Вы также узнаете, что именно представляет собой технологическая платформа Yandex.IO, на основе которой и создано устройство.

Читать дальше →

+149

598

1 2 ...

13 14

Голосовые интерфейсы *

Распознаём дату и время в естественной речи

Задача

Некоторые особенности разработки навыка для Алисы

Алиса в стране Битрикс

«Стервозная Бетти» и современные аудиоинтерфейсы: почему они говорят женским голосом?

За Премией Алисы: 5 инсайтов от победителя

Создание stateful навыка для Алисы на serverless функциях Яндекс.Облака и Питоне

Презентация приложения для проведения презентаций

Алиса приобретает навык

Гайд по голосовому UX: ситуации, паттерны, инструменты (и немного моральной поддержки)

Сын маминой подруги завидует: как дважды выиграть Премию Алисы

Голос за геймдев: как мы разработали голосовой квест «Мир Лавкрафта»

Вокруг беты за 260 дней: как мы учились прислушиваться к пользователям

Первая видеоигра для Алисы, или голосовой помощник как игровой контроллер

Ближайшие события

Концепция голосового интерфейса управления вычислительной системой для помощи людям с нарушениями речи

Введение

Весь разговорный AI на первой конференции Conversations

О чем конференция?

О чем расскажут хедлайнеры?

From zero to “Actions on Google” hero: ваш код

From zero to “Actions on Google” hero: начало

Полезные материалы по проектированию голосовых интерфейсов

Интервью с «главным по мозгам Алисы»

Яндекс.Станция. Как мы создавали первое устройство с Алисой

Вклад авторов