Голосовые интерфейсы *

управляем устройствами при помощи голосовых команд

СтатьиПостыНовостиАвторыКомпании

zoldaten 27 июн в 07:53

Как перевести bluetooth в headset_head_unit на raspberry pi даже если последняя против

3 мин

DIY или Сделай самRaspberry Pi*Голосовые интерфейсы*

Кейс

Иногда при подключении bluetooth устройства к raspberry pi данное устройство по каким-то причинам не хочет записывать аудио через bt, хотя такая возможность на самом устройстве предусмотрена. Это касается bt наушников, гарнитур, у которых имеется режим headset_head_unit.

Читать дальше →

techno_mot 25 июн в 08:02

Интерфейсы без экрана: как разговаривают голосовые ассистенты, когда никто не слышит

8 мин

2.8K

Блог компании SelectelГолосовые интерфейсы*Интернет вещейИскусственный интеллектМашинное обучение*

Обзор

А что если ваш голосовой ассистент никогда не замолкает? Даже когда экран темный, а в комнате мертвая тишина, он ведет свою тайную беседу. Не с вами, а с тысячами серверов. О чем? О вас. В этой статье я предлагаю разобрать механизмы этого фонового «общения»: что именно передается в тишине и как это работает. Детали, как всегда, под катом.

Читать дальше →

+45

Petr_Jogov 5 июн в 08:49

# ИИ в недвижимости: визуал, эмоции, продажи — без ожиданий и барьеров

Простой

4 мин

313

Машинное обучение*Искусственный интеллектГолосовые интерфейсы*Бизнес-модели*

Мнение

Современный рынок недвижимости уходит от продаж "площади по цене за метр". Сегодня побеждают эмоции, атмосфера, ощущение “своего места”. Искусственный интеллект уже меняет способы презентации объектов: визуальные подборки по картинке, голосовые консультации 24/7, генерация 3D-контента за часы, персонализация витрины “на лету”. В статье — практический обзор, как ИИ помогает ускорить маркетинг, повысить конверсию и сделать клиентский путь в недвижимости более плавным и эффективным.

-2

APPKODE 28 мая в 11:41

От театральной импровизации до навыка для Алисы: как я сделал голосовую игру про принцесс, драконов и рыцарей

Простой

6 мин

Голосовые интерфейсы*Занимательные задачкиИскусственный интеллектРазработка игр*Умный дом

Кейс

С вами снова Кирилл Богатов, дизайнер разговорных продуктов в KODE. В прошлом году я записался на курсы по театральной импровизации. Там мы разыгрывали сценки, работали с зажимами и учились не бояться выглядеть нелепо. Наши занятия часто заканчивались игрой в «Принцессу, Дракона, Рыцаря» — это как «камень-ножницы-бумага», только вместо фигур в ней нужно изображать фэнтезийных персонажей. Своего рода мини-спектакль на пару секунд.

Концепция игры показалась мне идеальной для переноса на голосовые колонки. В этой статье расскажу о том, что из этого вышло.

Xalyf 22 мая в 21:04

Рекламация по телевизору BBK 50LED8259/UTS2C с YaOS

Простой

2 мин

3.6K

Голосовые интерфейсы*Искусственный интеллектМониторы и ТВОперационные системыУмный дом

Мнение

Для корпоративного сегмента мне часто приходится приобретать телевизоры. Они используются не для демонстрации развлекательного контента (ТВ‑каналов, YouTube, онлайн‑кинотеатров), а в качестве больших информационных панелей для вывода видео‑ и аудиопотоков со сторонних источников сигнала, подключённых по HDMI. Я не углублялся в особенности установленной операционной системы (Smart TV или обычная), так как это не было важно. Мой выбор всегда основывался на качестве картинки, звука и диагонали экрана при приемлемой цене. После подключения внешнего источника HDMI пульт убирался в коробку, и система работала без нареканий. Пока я не столкнулся с YaOS. Голосовой помощник — «Алиса» быстро дала понять, кто в доме хозяин.

DmitryGreen 30 апр в 18:23

Как я запустил ИИ сервис речевой аналитики который хотели все — и понял: рынка SaaS больше нет. Полный разбор

Средний

8 мин

11K

Управление продажами*Голосовые интерфейсы*

Кейс

Recovery Mode

В этом тексте — живой кейс внедрения речевой аналитики в крупнейшей онлайн-школе EasyCode.

Как мы пытались поднять конверсию, контролируя скрипты.

Почему бинарная проверка «сказал ⁄ не сказал» не спасла продажи.

Откуда взялся феномен «вежливого тумана» — сделка ещё вежлива, но уже мертва.

Как идея тайм-лайна коммуникаций вывела нас к собственным паттернам риска и успеха.

И зачем теперь выгоднее собрать аналитику своими руками (один dev, три дня), чем покупать очередную коробку.

Kual 9 апр в 07:00

Беспрецедентный сдвиг в голосовых интерфейсах ИИ

Простой

6 мин

1.5K

Голосовые интерфейсы*Искусственный интеллектIT-инфраструктура*Исследования и прогнозы в IT*Будущее здесь

Обзор

Перевод

Вы заметили, что уже кричите на голосовых помощников, когда они вас не понимают?

Эра разочаровывающих голосовых интерфейсов заканчивается.

Узнайте, как эта технология изменит всё: от бизнес-коммуникаций до наших социальных навыков.

Это нужно послушать — спор с голосовым ИИ Sesame в реальном времени 🤯

okulovsky 29 мар в 11:15

Как я запускаю 15+ самых разных ИИ на своей машине — open-source, self-hosted, с HTTP-доступом

Средний

16 мин

28K

Искусственный интеллектPython*Open source*Голосовые интерфейсы*

Туториал

Сезон Open source

Я написал BrainBox — local-first сервис поддержки open-source ИИ-систем для генерации изображений, распознавания объектов на снимках, озвучки, распознавания текстов, транскрибирования аудиозаписей и других целей. Эти системы запускаются за фасадом веб-сервера, который устанавливает их и затем принимает и выполняет задачи в едином для всех систем формате. Задачи можно ставить из любого языка программирования с помощью отправки веб-запросов на сервер, а для Python дополнительно разработан удобный API. Проект доступен на pypi https://pypi.org/project/kaia-brainbox/ с подробной документацией и инструкцией на английском языке. Я надеюсь, что BrainBox поможет тем, кто хочет сделать небольшой проект с использованием ИИ, но не хочет разбираться в питоне и торче, или просто не знает, с чего начать.

+72

dev_family 14 мар в 08:06

Будущее v-commerce: как использовать распознавание речи и голосовой поиск в 2025 году

11 мин

717

Разработка под e-commerce*Управление e-commerce*Искусственный интеллектГолосовые интерфейсы*

В этой статье мы рассмотрим успешные кейсы и неудачные примеры, сдерживающие развитие технологии, расскажем про тренды голосового шоппинга и особенности интеграции такого решения.

Вы узнаете:

- Что такое голосовая коммерция?
- Какую пользу она приносит бизнесу?
- Как голосовая коммерция меняет современный ритейл?
- Какие компании уже успешно внедрили голосовой поиск и распознавание речи в свои процессы, а какие решили отказаться от технологии?
- Как изменилась обработка голоса человека с развитием искусственного интеллекта?

555www555 25 янв в 13:33

Путешествия и диктофон

3 мин

2.3K

Программирование*Носимая электроникаЗвукГолосовые интерфейсы*Будущее здесь

Я люблю путешествовать в бэкпэк формате и люблю фотографировать природу и жизнь, вот примерно так: Кавказ Осетия Ингушетия Чечня Дагестан 10_2023

И у меня есть 2 проблемы с этим.

Первая — отсутствие на рынке удобного камерофона для путешествий. Эту проблему я уже описывал в статье на Хабре.

Вторая — отсутствие удобного тулза для создания отчета по путешествию. Писать отчеты — это очень правильно, иначе по прошествии 10–15 лет коллекции фото превращаются просто в наборы красивых картинок так как фактические детали, эмоции стираются из памяти. Я сильно жалею, что частенько ленился писать отчеты.

-1

RivayMark 23 янв в 18:35

Управление компьютером. Голосовое управление ПК. Arduino + voice recognition module v3.1 + EasyHID + DFPlayer

Средний

6 мин

3.8K

Arduino*Голосовые интерфейсы*

Мнение

Устройство для управления компьютером при помощи голосовых команд, и получение отклика, на выполненную инструкцию, голосом Полины из новеллы «Зайчик».

Plotnikov-Lyasotsky 22 янв в 08:48

Сексуальная окраска голоса ИИ

Простой

4 мин

1.3K

Искусственный интеллектГолосовые интерфейсы*Робототехника

Игорь Ашманов еще десять лет назад сказал, что в результате маркетинговых исследований первых роботов-пылесосов пионеры домашней робототехники буду сфокусированы на эмоциональном взаимодействии между домашним роботом и хозяином.

В его примере робот-пылесос формировал эмоциональную привязанность у молодых бабушек. В 50 лет у женщины происходит перестройка организма, и появляется потребность заботиться о внуке – маленьком беспомощном существе. И эту потребность частично закрывает робот-пылесос.

На своих семинарах я часто задаю вопрос: «Через 30 лет молодой одинокий обеспеченный мужчина придет покупать домашнего робота в магазин, где будут представлены все возможные образы роботов – от кошки до бабушки. Какой внешний вид робота будет покупать одинокий мужчина больше других?» Чаще всего слушатели отвечают, что это будут образы красивых девушек.

При этом очевидно, что пул домашних роботов не может состоять только из красивых девушек, которые общаются таким образом, чтобы влюбить в себя хозяина. Для большинства молодых мужчин красивая женщина рядом – это главное, но далеко не единственное в его жизни. Среди домашних роботов будет много мужчин, бабушек, кошечек, собачек, виртуальных персонажей. Если робот – красивая девушка – будет говорить только в эротическом голосовом режиме, хозяину он быстро надоест, и эмоциональная привязанность не сформируется. Важно чередование положительных и отрицательных эмоций в голосе. Важны эмоции уважения, восхищения, признания ценности хозяина. Важны эмоциональное сближение и дистанцирование с хозяином, в частности, за счет чередования разных голосовых режимов.

snakers4 9 янв в 11:46

Делаем быстрый, качественный и доступный синтез на языках России — нужно ваше участие

Простой

1 мин

2.6K

Машинное обучение*КраудсорсингГолосовые интерфейсы*Искусственный интеллектNatural Language Processing*

Привет, Хабр!

В этом году мы делаем проект Фонда Бортника по разработке модели синтеза речи языков России и СНГ. Возможно, нас на Хабре вы знаете по статьям про синтез речи, детектор голоса или через одного популярного бота для озвучки в Телеграме (на всякий не буду ссылку прикладывать).

Наша основная задача - сделать удобный, быстрый, устойчивый, качественный и нетребовательный к вычислительным ресурсам синтез на самых популярных у нас в стране и в ближайшем зарубежье языках.

По итогу проекта планируется публикация общедоступных моделей синтеза языка под свободной лицензией (MIT). Мы бы хотели покрыть как минимум 10 популярных языков. Всего популярных языков (более 100 тысяч носителей) 30+, так что, в принципе, тут есть, где разгуляться.

Поэтому ищем людей, у которых два родных языка (русский и второй родной), которые бы помогли нам с рядом вещей:

С чем?

+21

iVolynkin 19 дек 2024 в 08:00

Анатомия виртуального сотрудника: от смыслов до каналов

Простой

7 мин

1.5K

Блог компании МТСОблачные сервисы*Голосовые интерфейсы*Будущее здесьИскусственный интеллект

Обзор

Привет, Хабр! Меня зовут Илья Волынкин, я технический директор МТС Exolve. Когда мы говорим про коммуникации, то обычно представляем себе двух человек, общающихся либо в чате, либо голосом. В современном мире такая схема встречается все реже: появляются разные боты, новые каналы связи, которые еще и действуют параллельно. Так возникают сложные системы для голосовых коммуникаций — омниканальные роботы. В статье я расскажу об их основных архитектурных паттернах, применении ИИ-моделей и возникновении новых и непривычных решений.

+10

Pazus 12 дек 2024 в 08:06

Смарт-функции в Алисе: как LLM помогает понять, чего хочет пользователь

41 мин

7.5K

Блог компании ЯндексИскусственный интеллектМашинное обучение*Natural Language Processing*Голосовые интерфейсы*

✏️ Технотекст 7

Так уж вышло, что раз в несколько лет мы переписываем сервис, отвечающий за диалоговое взаимодействие в Алисе. В прошлый раз мы распиливали монолит на микросервисы, переходили от концепции интента к концепции сценария и улучшали качество классификации. Этот рефакторинг позволил нам научиться горизонтально масштабироваться, ускорил выпуск фичей и дал возможность существенно улучшить качество работы диалогового движка. На этой инфраструктуре мы жили 5 лет.

Совсем недавно мы начали новый виток развития Алисы: мы хотим поместить в самое сердце (точнее, в самый мозг) нашего диалогового движка большую языковую модель. В этом году мы уже добавили в Алису возможность отвечать с помощью LLM на любые вопросы, а теперь взялись за то, чтобы Алиса стала более универсальной и могла выполнять любые задачи пользователя.

Например, пользователь может сказать: «Алиса, выключи телевизор, когда закончится этот матч». До появления смарт‑функций Алиса ответила бы, что «этого пока не умеет», так как подобной задаче её не обучали. Теперь нейросеть сама разложит запрос на два действия — посмотрит, сколько осталось до конца, и поставит таймер выключения на это время. Или если в запросе будут разного типа задачи, например одна про контент, а другая — про звук, Алиса тоже разложит их на понятные для нее части и выполнит: «Алиса, включи первый фильм на громкости 20».

Дальше я расскажу, как мы это собираемся делать.

+52

PlayingPlate6667 5 дек 2024 в 06:18

Голосовой ассистент на python

Простой

3 мин

Искусственный интеллектГолосовые интерфейсы*Python*

Туториал

Всем привет, я программист-любитель, изучающий язык python уже многие годы.

Не буду долго тянуть с приветствием и сразу перейду к делу. Этот гайд является по сути пошаговой инструкцией для создания базового кода голосового ассистента, который можно будет потом расширять и дополнять.

Читать

+12

inetstar 26 ноя 2024 в 13:01

«Я — робот Вертер» или Нулевой закон робототехники

Простой

8 мин

11K

Блог компании RUVDS.comIT-стандарты*Будущее здесьГолосовые интерфейсы*Законодательство в IT

Мнение

✏️ Победитель Технотекста 7

В этой статье речь пойдёт не об Азимове и его законах. Великий фантаст не мог предусмотреть всё. А о порочной практике, когда текстовые и голосовые роботы представляются человеческими именами. Или вообще не представляются. Разработчики и собственники таких роботов рассчитывают на то, что люди, собеседники роботов, будут введены в заблуждение, что говорят с человеком. Это даёт небольшой шанс владельцу робота что-то продать или предложить потребителям, сэкономив деньги на зарплате сотруднику колл-центра.

Разберём подробно, как правильно должны представляться роботы и почему это важно.

А также обсудим пути к созданию цивилизованной среды, в которой взаимодействие с роботами будет приносить больше пользы.

Почему же роботы ВСЕГДА должны говорить о том, что они роботы?

+110

113

Katerina_Guzhina19 28 окт 2024 в 22:05

Как научить голосовой помощник Алиса рассказывать отзывы выпускников Яндекс Практикума

Простой

5 мин

3.1K

Python*Serverless*Голосовые интерфейсы*Микросервисы*Облачные сервисы*

Из песочницы

✏️ Технотекст 7

Меня зовут Екатерина Александрова, я интернет‑маркетолог, выпускница курса «Интернет‑маркетолог» и «SMM‑продвижение в Телеграмм», и Станислав Козырев — ведущий инженер‑программист, дата‑аналитик и саентист ЦУНБ им. Некрасова, выпускник курса «Специалист по Data Science».

Наша команда «Проактивные практики», состоящая из пяти увлеченных и энергичных участников, проходит обучение в амбассадорской программе Яндекса. Заключительным этапом программы стала выпускная работа.

snakers4 17 окт 2024 в 04:00

Сравнение систем распознавания русского языка 2024

Средний

3 мин

5.1K

Машинное обучение*Искусственный интеллектГолосовые интерфейсы*Яндекс API*

Аналитика

После значительной паузы, опять пришло время обновить наше исследование (прошлое, позапрошлое) качества систем распознавания русского языка. Опять же, мы не думали, что добежим до этого момента и были удивлены результатами.

В этот раз ситуация такая:

Какая?

+10

FabrLik 17 сен 2024 в 09:15

Эволюция чат-ботов в Бизнесе: от теории к практике

Простой

5 мин

1.4K

IT-компанииБизнес-модели*Будущее здесьГолосовые интерфейсы*Искусственный интеллект

Из песочницы

Изначально чат-боты напоминали обычные автоответчики. Бизнес рассматривал их лишь для замены рутинных операций по перенаправлению пользователя с одного оператора на другого.

Первый прорыв случился с распространением в Телеграм «кнопочного интерфейса ботов», который «де-факто» стал стандартом в области текстовых ботов.

Вторым прорывом можно считать распространение систем преобразования голоса в текст (speech to text), благодаря которым появилась возможность взаимодействовать с системами с помощью голосовых команд.

Третий прорыв возник в области искусственного интеллекта (ИИ), боты стали «человечнее» и взаимодействие с ними перешло из разряда «робот» в разряд «помощник».

2 3 ...

13 14

Голосовые интерфейсы *

Как перевести bluetooth в headset_head_unit на raspberry pi даже если последняя против

Новости

Интерфейсы без экрана: как разговаривают голосовые ассистенты, когда никто не слышит

# ИИ в недвижимости: визуал, эмоции, продажи — без ожиданий и барьеров

От театральной импровизации до навыка для Алисы: как я сделал голосовую игру про принцесс, драконов и рыцарей

Рекламация по телевизору BBK 50LED8259/UTS2C с YaOS

Как я запустил ИИ сервис речевой аналитики который хотели все — и понял: рынка SaaS больше нет. Полный разбор

Беспрецедентный сдвиг в голосовых интерфейсах ИИ

Как я запускаю 15+ самых разных ИИ на своей машине — open-source, self-hosted, с HTTP-доступом

Будущее v-commerce: как использовать распознавание речи и голосовой поиск в 2025 году

Путешествия и диктофон

Управление компьютером. Голосовое управление ПК. Arduino + voice recognition module v3.1 + EasyHID + DFPlayer

Сексуальная окраска голоса ИИ

Делаем быстрый, качественный и доступный синтез на языках России — нужно ваше участие

Ближайшие события

Анатомия виртуального сотрудника: от смыслов до каналов

Смарт-функции в Алисе: как LLM помогает понять, чего хочет пользователь

Голосовой ассистент на python

«Я — робот Вертер» или Нулевой закон робототехники

Как научить голосовой помощник Алиса рассказывать отзывы выпускников Яндекс Практикума

Сравнение систем распознавания русского языка 2024

Эволюция чат-ботов в Бизнесе: от теории к практике

Вклад авторов