Все потоки

Голосовые интерфейсы *

управляем устройствами при помощи голосовых команд

СтатьиПостыНовостиАвторыКомпании

Travis_Macrif 6 ноя в 08:08

Apple Intelligence будет использовать модифицированную версию Google Gemini

2 мин

708

Искусственный интеллектУправление продуктом * Голосовые интерфейсы *

Apple планирует платить около $1 млрд в год за использование в Apple Intelligence модифицированной версии модели искусственного интеллекта Gemini от Google, сообщил обозреватель Bloomberg Марк Гурман со ссылкой на источники. Сотрудничество должно помочь провести модернизацию голосового помощника Siri.

Читать далее

0

Travis_Macrif 29 сен в 07:02

Чат-бот Apple под названием Veritas предназначен для тестирования ИИ-обновлений Siri и доступен сотрудникам компании

2 мин

383

Искусственный интеллектГолосовые интерфейсы * Управление продуктом * ГаджетыСмартфоны

Сотрудники Apple используют чат-бот под названием Veritas для тестирования обновлённых функций на базе искусственного интеллекта голосового помощника Siri, рассказал обозреватель Bloomberg Марк Гурман со ссылкой на источники. Veritas предоставляет корпорации возможность быстро разрабатывать, тестировать и собирать отзывы о новых функциях Siri.

Читать далее

+3

mefdayy 31 июл в 10:10

Spotify намекает на то, что в будущем голосовой ИИ станет более «разговорчивым»

2 мин

607

Блог компании BotHubИскусственный интеллектЗвукМашинное обучение * Голосовые интерфейсы *

Spotify намекает, что развитие генеративного искусственного интеллекта может в будущем привести к появлению более разговорного интерфейса со стриминговым сервисом. Об этом рассказали во время отчёта о доходах за второй квартал, предоставленным во вторник.

Читать далее

+1

NatalieVT 30 июл в 07:00

Исследователи Яндекса раскрыли принципы работы нейросети для распознавания голосовых команд на фоне шума

2 мин

933

Блог компании ЯндексМашинное обучение * Искусственный интеллектЗвукГолосовые интерфейсы *

Исследователи Яндекса опубликовали научную статью с подробным описанием нейросетевой технологии, которая позволяет распознавать голосовые команды даже на фоне шума. Статью приняли на крупнейшую международную конференцию по речевым технологиям Interspeech 2025, которая пройдёт в этом году в Нидерландах. На конференции будут представлены также работы Microsoft, Google DeepMind, Google AR и других технологических компаний и научных центров.

Технология, описанная в научной работе, применяется в умных колонках и ТВ Станциях Яндекса и давно доказала свою эффективность на практике. С её помощью устройства с Алисой распознают команды даже при наличии посторонних шумов: музыки, льющейся воды, вечеринки или стройки за окном. Например, пользователю не нужно выключать пылесос или перекрикивать песню, чтобы быть услышанным.

Читать далее

+10

Lexx_Nimofff 20 июл в 15:13

Lada Iskra c сервисами «Яндекс» поступит в продажу 20 июля 2025 года

2 мин

6.2K

ТранспортГолосовые интерфейсы * Автомобильные гаджеты

Продажи Lada Iskra с платформой «Яндекс Авто» и голосовым ассистентом Алисой стартуют 20 июля 2025 год. В машине будут доступны сервисы «Яндекса»: Навигатор, Музыка, Книги, Браузер, а также ИИ‑ассистент Алиса.

Управлять сервисами можно через дисплей автомобиля или голосом. Это избавляет от необходимости брать в руки смартфон и отвлекаться от дороги. Алиса умеет звонить абоненту из списка контактов. Она помогает управлять другими сервисами «Яндекса», доступными в «Яндекс Авто».

Читать далее

+4

mefdayy 16 июл в 11:50

Voxtral — новая модель распознавания речи от Mistral, которая дешевле проприетарных аналогов

3 мин

2.7K

Блог компании BotHubИскусственный интеллектМашинное обучение * Голосовые интерфейсы *

Французская компания Mistral, специализирующаяся на искусственном интеллекте, представляет Voxtral — модель распознавания речи с открытым исходным кодом. Она обещает заменить проприетарные решения, предлагая при этом вдвое меньшую стоимость.

Читать далее

+3

denis-19 26 июн в 04:45

Mozilla перевела репозиторий с кодом движка по распознаванию речи DeepSpeech на GitHub в архивный режим (Public archive)

1 мин

1K

Искусственный интеллектМашинное обучение * Голосовые интерфейсы * Open source * Управление разработкой *

Mozilla перевела репозиторий с открытым движком распознавания речи по распознаванию речи DeepSpeech на GitHub в архивный режим (Public archive).

Читать далее

+1

mefdayy 25 июн в 11:13

Elevenlabs представил 11ai — голосового помощника с MCP для интеграции в инструменты цифрового документооборота

3 мин

784

Блог компании BotHubИскусственный интеллектМашинное обучение * Голосовые интерфейсы *

Компания ElevenLabs представляет новый продукт — 11ai, который представляет собой голосового ИИ-помощника, предназначенного для активного участия в цифровых рабочих процессах. Альфа-версия предназначена для демонстрации возможностей технологии, ориентированной на голос, и интеграции с API.

Читать далее

+2

Travis_Macrif 12 июн в 12:26

Samsung выпустила прошивку с распознаванием голосов членов семьи для своих умных холодильников

1 мин

466

Голосовые интерфейсы * Производство и разработка электроники * Умный дом

Южнокорейская Samsung развернула прошивку для своих умных холодильников, которые теперь умеют распознавать голоса членов семьи. Функция работает на базе голосового помощника Bixby, который можно использовать для вывода персонализированной информации на встроенные интеллектуальные дисплеи в зависимости от того, кто из членов семьи обращается к устройству.

Читать далее

+3

avouner 11 июн в 12:03

В Apple объяснили причины задержки выхода персонализированной Siri

1 мин

429

Голосовые интерфейсы * Искусственный интеллект

Вице‑президент Apple Крейг Федериги на конференции WWDC 2025 объяснил, почему до сих пор так и не вышла персонализированная версия голосового помощника Siri. По его словам, задержки объясняются несоответствием высоким стандартам компании.

Читать далее

+6

maybe_elf 15 мая в 07:07

Microsoft начала тестировать голосовой запуск «Hey, Copilot!» в Windows

1 мин

596

Голосовые интерфейсы * Искусственный интеллектWindows *

Microsoft тестирует функцию для Copilot Voice, которая позволит пользователям Windows 11 начать разговор с приложением с фразы «Привет, Copilot!». Функция доступна участникам программы Windows Insiders.

Читать далее

+3

maybe_elf 26 апр в 05:07

Голосовой ввод в Windows 11 позволит отключать фильтр ненормативной лексики

1 мин

790

Windows * Голосовые интерфейсы * Управление продуктом *

Microsoft изменит способ работы фильтра ненормативной лексики для голосового ввода в Windows 11, чтобы пользователи могли отключать его при необходимости.

Читать далее

+5

daniilshat 17 апр в 10:55

Баг: обновлённая «Алиса» говорит на английском с сильным акцентом, если попросить её общаться шёпотом

1 мин

10K

Умный домГолосовые интерфейсы *

15 апреля «Яндекс» запустил новую опцию своего фирменного голосового помощника. Теперь «Алиса» может общаться на английском языке без акцента и даже выступать в роли репетитора разговорного английского. На самом деле акцент есть и довольно сильный, но появляется он только в режиме общения шёпотом.

Читать далее

+10

daniilshat 16 апр в 22:11

«Яндекс» показал прототип обновлённой мультимедийной платформы «Яндекс Авто»

1 мин

3K

ТранспортГолосовые интерфейсы *

«Яндекс» представил прототип обновлённой мультимедийной платформы «Яндекс Авто». С её помощью автолюбители могут управлять голосом не только сервисами компании, но и системами авто. Например, можно попросить отрегулировать климатическую систему, открыть окно, включить обогрев руля, подсветку или разблокировать двери. В компании отмечают, что с голосовым управлением водителю не придётся отвлекаться.

Читать далее

+5

mefdayy 16 апр в 06:55

Anthropic готовит конкурента голосовому режиму OpenAI в ChatGPT

1 мин

236

Блог компании BotHubИскусственный интеллектГолосовые интерфейсы *

Anthropic готовится представить новую функцию «голосового режима», которая может составить конкуренцию аналогичной функции OpenAI в ChatGPT, согласно Bloomberg. Сообщается, что голосовой помощник на базе ИИ будет доступен в чат-боте Claude AI и может начать работу «уже в этом месяце».

Читать далее

+1

daniilshat 15 апр в 22:56

Обновление «Алисы»: поддержка английского языка, работа с файлами, рассуждения и Live-режим

3 мин

3.9K

Искусственный интеллектМашинное обучение * Голосовые интерфейсы * Гаджеты

«Яндекс» представил обновление нейросетевого ассистента «Алисы». Компания добавила поддержку английского языка, рассуждения, поиск, возможность работать с файлами и Live-режим. Обновления показали 15 апреля 2025 года в рамках презентации умных устройств «Яндекса».

Читать далее

+12

mefdayy 14 апр в 08:35

Имитированные голоса Маска и Цукерберга звучат со взломанных кнопок пешеходных переходов

2 мин

2K

Блог компании BotHubИскусственный интеллектГолосовые интерфейсы * Звук

Кнопки на пешеходных переходах как минимум в трёх городах Калифорнии, судя по всему, были взломаны в эти выходные, чтобы придать им голоса, сгенерированные искусственным интеллектом, генерального директора Tesla Илона Маска и генерального директора Meta* Марка Цукерберга.

Читать далее

+2

mefdayy 8 апр в 13:36

Amazon представила Nova Sonic: новую модель генеративного ИИ для обработки голоса

3 мин

627

Блог компании BotHubИскусственный интеллектГолосовые интерфейсы *

Во вторник компания Amazon представила новую модель генеративного искусственного интеллекта Nova Sonic, способную обрабатывать голос и генерировать естественную речь. Amazon утверждает, что производительность Sonic сопоставима с передовыми моделями обработки голоса от OpenAI и Google по таким показателям, как скорость, распознавание речи и качество общения.

Читать далее

+1

mariavvv 4 апр в 14:14

41% россиян пользуются умными колонками, основной эффект — экономия времени

2 мин

6.6K

Блог компании НетологияГаджетыУмный домИсследования и прогнозы в IT * Голосовые интерфейсы *

Чаще всего пользователи общаются с ними дружелюбно или нейтрально, каждый пятый использует повелительный тон.

77% респондентов пользуются умными технологиями, 41% — умными колонками, а самой востребованной технологией стало Smart TV. Такие результаты показало исследование образовательной платформы «Нетология», в котором приняли участие более 1500 респондентов в возрасте от 18 лет.

Читать далее

+2

LizzieSimpson 25 мар в 08:19

«Додо Пицца» внедрила заказы голосовыми сообщениями через Telegram-бота

1 мин

2.8K

Мессенджеры * Голосовые интерфейсы *

Сеть пиццерий «Додо» объявила о запуске новой функции — заказ голосом через Telegram-бота. Пользователи смогут быстро и удобно оформить заказ, отправив боту голосовое сообщение, рассказали Хабру в пресс‑службе компании.

Читать далее

+15

1

2 3 ...