Обновить
18.65

Голосовые интерфейсы *

управляем устройствами при помощи голосовых команд

Сначала показывать
Порог рейтинга

Apple Intelligence будет использовать модифицированную версию Google Gemini

Время на прочтение2 мин
Количество просмотров708

Apple планирует платить около $1 млрд в год за использование в Apple Intelligence модифицированной версии модели искусственного интеллекта Gemini от Google, сообщил обозреватель Bloomberg Марк Гурман со ссылкой на источники. Сотрудничество должно помочь провести модернизацию голосового помощника Siri.

Читать далее

Новости

Чат-бот Apple под названием Veritas предназначен для тестирования ИИ-обновлений Siri и доступен сотрудникам компании

Время на прочтение2 мин
Количество просмотров383

Сотрудники Apple используют чат-бот под названием Veritas для тестирования обновлённых функций на базе искусственного интеллекта голосового помощника Siri, рассказал обозреватель Bloomberg Марк Гурман со ссылкой на источники. Veritas предоставляет корпорации возможность быстро разрабатывать, тестировать и собирать отзывы о новых функциях Siri.

Читать далее

Spotify намекает на то, что в будущем голосовой ИИ станет более «разговорчивым»

Время на прочтение2 мин
Количество просмотров607

Spotify намекает, что развитие генеративного искусственного интеллекта может в будущем привести к появлению более разговорного интерфейса со стриминговым сервисом. Об этом рассказали во время отчёта о доходах за второй квартал, предоставленным во вторник.

Читать далее

Исследователи Яндекса раскрыли принципы работы нейросети для распознавания голосовых команд на фоне шума

Время на прочтение2 мин
Количество просмотров933

Исследователи Яндекса опубликовали научную статью с подробным описанием нейросетевой технологии, которая позволяет распознавать голосовые команды даже на фоне шума. Статью приняли на крупнейшую международную конференцию по речевым технологиям Interspeech 2025, которая пройдёт в этом году в Нидерландах. На конференции будут представлены также работы Microsoft, Google DeepMind, Google AR и других технологических компаний и научных центров.

Технология, описанная в научной работе, применяется в умных колонках и ТВ Станциях Яндекса и давно доказала свою эффективность на практике. С её помощью устройства с Алисой распознают команды даже при наличии посторонних шумов: музыки, льющейся воды, вечеринки или стройки за окном. Например, пользователю не нужно выключать пылесос или перекрикивать песню, чтобы быть услышанным.

Читать далее

Lada Iskra c сервисами «Яндекс» поступит в продажу 20 июля 2025 года

Время на прочтение2 мин
Количество просмотров6.2K

Продажи Lada Iskra с платформой «Яндекс Авто» и голосовым ассистентом Алисой стартуют 20 июля 2025 год. В машине будут доступны сервисы «Яндекса»: Навигатор, Музыка, Книги, Браузер, а также ИИ‑ассистент Алиса.

Управлять сервисами можно через дисплей автомобиля или голосом. Это избавляет от необходимости брать в руки смартфон и отвлекаться от дороги. Алиса умеет звонить абоненту из списка контактов. Она помогает управлять другими сервисами «Яндекса», доступными в «Яндекс Авто».

Читать далее

Voxtral — новая модель распознавания речи от Mistral, которая дешевле проприетарных аналогов

Время на прочтение3 мин
Количество просмотров2.7K

Французская компания Mistral, специализирующаяся на искусственном интеллекте, представляет Voxtral — модель распознавания речи с открытым исходным кодом. Она обещает заменить проприетарные решения, предлагая при этом вдвое меньшую стоимость.

Читать далее

Mozilla перевела репозиторий с кодом движка по распознаванию речи DeepSpeech на GitHub в архивный режим (Public archive)

Время на прочтение1 мин
Количество просмотров1K

Mozilla перевела репозиторий с открытым движком распознавания речи по распознаванию речи DeepSpeech на GitHub в архивный режим (Public archive).

Читать далее

Elevenlabs представил 11ai — голосового помощника с MCP для интеграции в инструменты цифрового документооборота

Время на прочтение3 мин
Количество просмотров784

Компания ElevenLabs представляет новый продукт — 11ai, который представляет собой голосового ИИ-помощника, предназначенного для активного участия в цифровых рабочих процессах. Альфа-версия предназначена для демонстрации возможностей технологии, ориентированной на голос, и интеграции с API.

Читать далее

Samsung выпустила прошивку с распознаванием голосов членов семьи для своих умных холодильников

Время на прочтение1 мин
Количество просмотров466

Южнокорейская Samsung развернула прошивку для своих умных холодильников, которые теперь умеют распознавать голоса членов семьи. Функция работает на базе голосового помощника Bixby, который можно использовать для вывода персонализированной информации на встроенные интеллектуальные дисплеи в зависимости от того, кто из членов семьи обращается к устройству.

Читать далее

В Apple объяснили причины задержки выхода персонализированной Siri

Время на прочтение1 мин
Количество просмотров429

Вице‑президент Apple Крейг Федериги на конференции WWDC 2025 объяснил, почему до сих пор так и не вышла персонализированная версия голосового помощника Siri. По его словам, задержки объясняются несоответствием высоким стандартам компании.

Читать далее

Microsoft начала тестировать голосовой запуск «Hey, Copilot!» в Windows

Время на прочтение1 мин
Количество просмотров596

Microsoft тестирует функцию для Copilot Voice, которая позволит пользователям Windows 11 начать разговор с приложением с фразы «Привет, Copilot!». Функция доступна участникам программы Windows Insiders.

Читать далее

Голосовой ввод в Windows 11 позволит отключать фильтр ненормативной лексики

Время на прочтение1 мин
Количество просмотров790

Microsoft изменит способ работы фильтра ненормативной лексики для голосового ввода в Windows 11, чтобы пользователи могли отключать его при необходимости.

Читать далее

Баг: обновлённая «Алиса» говорит на английском с сильным акцентом, если попросить её общаться шёпотом

Время на прочтение1 мин
Количество просмотров10K

15 апреля «Яндекс» запустил новую опцию своего фирменного голосового помощника. Теперь «Алиса» может общаться на английском языке без акцента и даже выступать в роли репетитора разговорного английского. На самом деле акцент есть и довольно сильный, но появляется он только в режиме общения шёпотом.

Читать далее

Ближайшие события

«Яндекс» показал прототип обновлённой мультимедийной платформы «Яндекс Авто»

Время на прочтение1 мин
Количество просмотров3K

«Яндекс» представил прототип обновлённой мультимедийной платформы «Яндекс Авто». С её помощью автолюбители могут управлять голосом не только сервисами компании, но и системами авто. Например, можно попросить отрегулировать климатическую систему, открыть окно, включить обогрев руля, подсветку или разблокировать двери. В компании отмечают, что с голосовым управлением водителю не придётся отвлекаться.

Читать далее

Anthropic готовит конкурента голосовому режиму OpenAI в ChatGPT

Время на прочтение1 мин
Количество просмотров236

Anthropic готовится представить новую функцию «голосового режима», которая может составить конкуренцию аналогичной функции OpenAI в ChatGPT, согласно Bloomberg. Сообщается, что голосовой помощник на базе ИИ будет доступен в чат-боте Claude AI и может начать работу «уже в этом месяце».

Читать далее

Обновление «Алисы»: поддержка английского языка, работа с файлами, рассуждения и Live-режим

Время на прочтение3 мин
Количество просмотров3.9K

«Яндекс» представил обновление нейросетевого ассистента «Алисы». Компания добавила поддержку английского языка, рассуждения, поиск, возможность работать с файлами и Live-режим. Обновления показали 15 апреля 2025 года в рамках презентации умных устройств «Яндекса».

Читать далее

Имитированные голоса Маска и Цукерберга звучат со взломанных кнопок пешеходных переходов

Время на прочтение2 мин
Количество просмотров2K

Кнопки на пешеходных переходах как минимум в трёх городах Калифорнии, судя по всему, были взломаны в эти выходные, чтобы придать им голоса, сгенерированные искусственным интеллектом, генерального директора Tesla Илона Маска и генерального директора Meta* Марка Цукерберга.

Читать далее

Amazon представила Nova Sonic: новую модель генеративного ИИ для обработки голоса

Время на прочтение3 мин
Количество просмотров627

Во вторник компания Amazon представила новую модель генеративного искусственного интеллекта Nova Sonic, способную обрабатывать голос и генерировать естественную речь. Amazon утверждает, что производительность Sonic сопоставима с передовыми моделями обработки голоса от OpenAI и Google по таким показателям, как скорость, распознавание речи и качество общения.

Читать далее

41% россиян пользуются умными колонками, основной эффект — экономия времени

Время на прочтение2 мин
Количество просмотров6.6K

Чаще всего пользователи общаются с ними дружелюбно или нейтрально, каждый пятый использует повелительный тон.

77% респондентов пользуются умными технологиями, 41% — умными колонками, а самой востребованной технологией стало Smart TV. Такие результаты показало исследование образовательной платформы «Нетология», в котором приняли участие более 1500 респондентов в возрасте от 18 лет. 

Читать далее

«Додо Пицца» внедрила заказы голосовыми сообщениями через Telegram-бота

Время на прочтение1 мин
Количество просмотров2.8K

Сеть пиццерий «Додо» объявила о запуске новой функции — заказ голосом через Telegram-бота. Пользователи смогут быстро и удобно оформить заказ, отправив боту голосовое сообщение, рассказали Хабру в пресс‑службе компании.

Читать далее
1
23 ...