Как стать автором
Поиск
Написать публикацию
Обновить
23.7

Голосовые интерфейсы *

управляем устройствами при помощи голосовых команд

Сначала показывать
Порог рейтинга

Spotify намекает на то, что в будущем голосовой ИИ станет более «разговорчивым»

Время на прочтение2 мин
Количество просмотров315

Spotify намекает, что развитие генеративного искусственного интеллекта может в будущем привести к появлению более разговорного интерфейса со стриминговым сервисом. Об этом рассказали во время отчёта о доходах за второй квартал, предоставленным во вторник.

Читать далее

Новости

Исследователи Яндекса раскрыли принципы работы нейросети для распознавания голосовых команд на фоне шума

Время на прочтение2 мин
Количество просмотров773

Исследователи Яндекса опубликовали научную статью с подробным описанием нейросетевой технологии, которая позволяет распознавать голосовые команды даже на фоне шума. Статью приняли на крупнейшую международную конференцию по речевым технологиям Interspeech 2025, которая пройдёт в этом году в Нидерландах. На конференции будут представлены также работы Microsoft, Google DeepMind, Google AR и других технологических компаний и научных центров.

Технология, описанная в научной работе, применяется в умных колонках и ТВ Станциях Яндекса и давно доказала свою эффективность на практике. С её помощью устройства с Алисой распознают команды даже при наличии посторонних шумов: музыки, льющейся воды, вечеринки или стройки за окном. Например, пользователю не нужно выключать пылесос или перекрикивать песню, чтобы быть услышанным.

Читать далее

Lada Iskra c сервисами «Яндекс» поступит в продажу 20 июля 2025 года

Время на прочтение2 мин
Количество просмотров5.9K

Продажи Lada Iskra с платформой «Яндекс Авто» и голосовым ассистентом Алисой стартуют 20 июля 2025 год. В машине будут доступны сервисы «Яндекса»: Навигатор, Музыка, Книги, Браузер, а также ИИ‑ассистент Алиса.

Управлять сервисами можно через дисплей автомобиля или голосом. Это избавляет от необходимости брать в руки смартфон и отвлекаться от дороги. Алиса умеет звонить абоненту из списка контактов. Она помогает управлять другими сервисами «Яндекса», доступными в «Яндекс Авто».

Читать далее

Voxtral — новая модель распознавания речи от Mistral, которая дешевле проприетарных аналогов

Время на прочтение3 мин
Количество просмотров2.3K

Французская компания Mistral, специализирующаяся на искусственном интеллекте, представляет Voxtral — модель распознавания речи с открытым исходным кодом. Она обещает заменить проприетарные решения, предлагая при этом вдвое меньшую стоимость.

Читать далее

Mozilla перевела репозиторий с кодом движка по распознаванию речи DeepSpeech на GitHub в архивный режим (Public archive)

Время на прочтение1 мин
Количество просмотров1K

Mozilla перевела репозиторий с открытым движком распознавания речи по распознаванию речи DeepSpeech на GitHub в архивный режим (Public archive).

Читать далее

Elevenlabs представил 11ai — голосового помощника с MCP для интеграции в инструменты цифрового документооборота

Время на прочтение3 мин
Количество просмотров673

Компания ElevenLabs представляет новый продукт — 11ai, который представляет собой голосового ИИ-помощника, предназначенного для активного участия в цифровых рабочих процессах. Альфа-версия предназначена для демонстрации возможностей технологии, ориентированной на голос, и интеграции с API.

Читать далее

Samsung выпустила прошивку с распознаванием голосов членов семьи для своих умных холодильников

Время на прочтение1 мин
Количество просмотров452

Южнокорейская Samsung развернула прошивку для своих умных холодильников, которые теперь умеют распознавать голоса членов семьи. Функция работает на базе голосового помощника Bixby, который можно использовать для вывода персонализированной информации на встроенные интеллектуальные дисплеи в зависимости от того, кто из членов семьи обращается к устройству.

Читать далее

В Apple объяснили причины задержки выхода персонализированной Siri

Время на прочтение1 мин
Количество просмотров426

Вице‑президент Apple Крейг Федериги на конференции WWDC 2025 объяснил, почему до сих пор так и не вышла персонализированная версия голосового помощника Siri. По его словам, задержки объясняются несоответствием высоким стандартам компании.

Читать далее

Microsoft начала тестировать голосовой запуск «Hey, Copilot!» в Windows

Время на прочтение1 мин
Количество просмотров579

Microsoft тестирует функцию для Copilot Voice, которая позволит пользователям Windows 11 начать разговор с приложением с фразы «Привет, Copilot!». Функция доступна участникам программы Windows Insiders.

Читать далее

Голосовой ввод в Windows 11 позволит отключать фильтр ненормативной лексики

Время на прочтение1 мин
Количество просмотров767

Microsoft изменит способ работы фильтра ненормативной лексики для голосового ввода в Windows 11, чтобы пользователи могли отключать его при необходимости.

Читать далее

Баг: обновлённая «Алиса» говорит на английском с сильным акцентом, если попросить её общаться шёпотом

Время на прочтение1 мин
Количество просмотров9.6K

15 апреля «Яндекс» запустил новую опцию своего фирменного голосового помощника. Теперь «Алиса» может общаться на английском языке без акцента и даже выступать в роли репетитора разговорного английского. На самом деле акцент есть и довольно сильный, но появляется он только в режиме общения шёпотом.

Читать далее

«Яндекс» показал прототип обновлённой мультимедийной платформы «Яндекс Авто»

Время на прочтение1 мин
Количество просмотров2.8K

«Яндекс» представил прототип обновлённой мультимедийной платформы «Яндекс Авто». С её помощью автолюбители могут управлять голосом не только сервисами компании, но и системами авто. Например, можно попросить отрегулировать климатическую систему, открыть окно, включить обогрев руля, подсветку или разблокировать двери. В компании отмечают, что с голосовым управлением водителю не придётся отвлекаться.

Читать далее

Anthropic готовит конкурента голосовому режиму OpenAI в ChatGPT

Время на прочтение1 мин
Количество просмотров224

Anthropic готовится представить новую функцию «голосового режима», которая может составить конкуренцию аналогичной функции OpenAI в ChatGPT, согласно Bloomberg. Сообщается, что голосовой помощник на базе ИИ будет доступен в чат-боте Claude AI и может начать работу «уже в этом месяце».

Читать далее

Ближайшие события

Обновление «Алисы»: поддержка английского языка, работа с файлами, рассуждения и Live-режим

Время на прочтение3 мин
Количество просмотров3.5K

«Яндекс» представил обновление нейросетевого ассистента «Алисы». Компания добавила поддержку английского языка, рассуждения, поиск, возможность работать с файлами и Live-режим. Обновления показали 15 апреля 2025 года в рамках презентации умных устройств «Яндекса».

Читать далее

Имитированные голоса Маска и Цукерберга звучат со взломанных кнопок пешеходных переходов

Время на прочтение2 мин
Количество просмотров2K

Кнопки на пешеходных переходах как минимум в трёх городах Калифорнии, судя по всему, были взломаны в эти выходные, чтобы придать им голоса, сгенерированные искусственным интеллектом, генерального директора Tesla Илона Маска и генерального директора Meta* Марка Цукерберга.

Читать далее

Amazon представила Nova Sonic: новую модель генеративного ИИ для обработки голоса

Время на прочтение3 мин
Количество просмотров591

Во вторник компания Amazon представила новую модель генеративного искусственного интеллекта Nova Sonic, способную обрабатывать голос и генерировать естественную речь. Amazon утверждает, что производительность Sonic сопоставима с передовыми моделями обработки голоса от OpenAI и Google по таким показателям, как скорость, распознавание речи и качество общения.

Читать далее

41% россиян пользуются умными колонками, основной эффект — экономия времени

Время на прочтение2 мин
Количество просмотров6.6K

Чаще всего пользователи общаются с ними дружелюбно или нейтрально, каждый пятый использует повелительный тон.

77% респондентов пользуются умными технологиями, 41% — умными колонками, а самой востребованной технологией стало Smart TV. Такие результаты показало исследование образовательной платформы «Нетология», в котором приняли участие более 1500 респондентов в возрасте от 18 лет. 

Читать далее

«Додо Пицца» внедрила заказы голосовыми сообщениями через Telegram-бота

Время на прочтение1 мин
Количество просмотров2.8K

Сеть пиццерий «Додо» объявила о запуске новой функции — заказ голосом через Telegram-бота. Пользователи смогут быстро и удобно оформить заказ, отправив боту голосовое сообщение, рассказали Хабру в пресс‑службе компании.

Читать далее

«Алиса, что нового?»: Яндекс 15 апреля проведёт первую конференцию о развитии виртуального ассистента и умных устройств

Время на прочтение1 мин
Количество просмотров1.3K

Команда «Алисы» и разработчики умных устройств «Яндекса» проведут свою первую конференцию 15 апреля в 12:00 МСК в Москве.

Читать далее

OpenAI выпускает новое поколение аудиомоделей: улучшенное распознавание и настройка стиля речи ИИ

Время на прочтение2 мин
Количество просмотров1.5K

Компания OpenAI выпустила новое поколение аудиомоделей, которые позволяют разработчикам настраивать речь своих ИИ-помощников. Обновление включает улучшенное распознавание речи и возможность управлять стилем речи ИИ с помощью простых текстовых команд.

Читать далее
1
23 ...