Microsoft изменит способ работы фильтра ненормативной лексики для голосового ввода в Windows 11, чтобы пользователи могли отключать его при необходимости.

Голосовые интерфейсы *
управляем устройствами при помощи голосовых команд
Новости
Баг: обновлённая «Алиса» говорит на английском с сильным акцентом, если попросить её общаться шёпотом
15 апреля «Яндекс» запустил новую опцию своего фирменного голосового помощника. Теперь «Алиса» может общаться на английском языке без акцента и даже выступать в роли репетитора разговорного английского. На самом деле акцент есть и довольно сильный, но появляется он только в режиме общения шёпотом.
«Яндекс» показал прототип обновлённой мультимедийной платформы «Яндекс Авто»

«Яндекс» представил прототип обновлённой мультимедийной платформы «Яндекс Авто». С её помощью автолюбители могут управлять голосом не только сервисами компании, но и системами авто. Например, можно попросить отрегулировать климатическую систему, открыть окно, включить обогрев руля, подсветку или разблокировать двери. В компании отмечают, что с голосовым управлением водителю не придётся отвлекаться.
Anthropic готовит конкурента голосовому режиму OpenAI в ChatGPT

Anthropic готовится представить новую функцию «голосового режима», которая может составить конкуренцию аналогичной функции OpenAI в ChatGPT, согласно Bloomberg. Сообщается, что голосовой помощник на базе ИИ будет доступен в чат-боте Claude AI и может начать работу «уже в этом месяце».
Обновление «Алисы»: поддержка английского языка, работа с файлами, рассуждения и Live-режим

«Яндекс» представил обновление нейросетевого ассистента «Алисы». Компания добавила поддержку английского языка, рассуждения, поиск, возможность работать с файлами и Live-режим. Обновления показали 15 апреля 2025 года в рамках презентации умных устройств «Яндекса».
Имитированные голоса Маска и Цукерберга звучат со взломанных кнопок пешеходных переходов

Кнопки на пешеходных переходах как минимум в трёх городах Калифорнии, судя по всему, были взломаны в эти выходные, чтобы придать им голоса, сгенерированные искусственным интеллектом, генерального директора Tesla Илона Маска и генерального директора Meta* Марка Цукерберга.
Amazon представила Nova Sonic: новую модель генеративного ИИ для обработки голоса

Во вторник компания Amazon представила новую модель генеративного искусственного интеллекта Nova Sonic, способную обрабатывать голос и генерировать естественную речь. Amazon утверждает, что производительность Sonic сопоставима с передовыми моделями обработки голоса от OpenAI и Google по таким показателям, как скорость, распознавание речи и качество общения.
41% россиян пользуются умными колонками, основной эффект — экономия времени

Чаще всего пользователи общаются с ними дружелюбно или нейтрально, каждый пятый использует повелительный тон.
77% респондентов пользуются умными технологиями, 41% — умными колонками, а самой востребованной технологией стало Smart TV. Такие результаты показало исследование образовательной платформы «Нетология», в котором приняли участие более 1500 респондентов в возрасте от 18 лет.
«Додо Пицца» внедрила заказы голосовыми сообщениями через Telegram-бота

Сеть пиццерий «Додо» объявила о запуске новой функции — заказ голосом через Telegram-бота. Пользователи смогут быстро и удобно оформить заказ, отправив боту голосовое сообщение, рассказали Хабру в пресс‑службе компании.
«Алиса, что нового?»: Яндекс 15 апреля проведёт первую конференцию о развитии виртуального ассистента и умных устройств

Команда «Алисы» и разработчики умных устройств «Яндекса» проведут свою первую конференцию 15 апреля в 12:00 МСК в Москве.
OpenAI выпускает новое поколение аудиомоделей: улучшенное распознавание и настройка стиля речи ИИ

Компания OpenAI выпустила новое поколение аудиомоделей, которые позволяют разработчикам настраивать речь своих ИИ-помощников. Обновление включает улучшенное распознавание речи и возможность управлять стилем речи ИИ с помощью простых текстовых команд.
Утечка встречи Apple показывает, насколько ужасна ситуация с Siri на самом деле

Apple планировала подготовить ключевые ИИ‑функции голосового помощника Siri к весне 2025 года, но теперь публичного релиза может не быть до следующего года. Об этом стало известно из разговора старшего директора Apple Робби Уокера с командой разработки Siri, пишет Bloomberg.
Бизнес заявил, что текущая редакция законопроекта о борьбе с кибермошенничеством нарушает права человека
Текущая редакция законопроекта о борьбе с кибермошенничеством нарушает права человека, так как предусматривает прослушку и запись звонков россиян, говорится в письме Ассоциации разработчиков программных продуктов (АРПП) «Отечественный софт» в Госдуму, Минцифры и Общественную палату. Копия есть у РБК, её подлинность подтвердил представитель ассоциации.
Ближайшие события
Сообщается, что Anthropic готовит голосовой режим для Claude

Согласно отчёту, стартап Anthropic, занимающийся искусственным интеллектом, работает над голосовыми возможностями своего чат-бота Claude на базе искусственного интеллекта.
Amazon: пользователи Echo больше не смогут настраивать свои устройства на локальную обработку запросов Alexa

Amazon сообщила, что c 28 марта пользователи умных колонок Echo больше не смогут настраивать свои устройства на локальную обработку запросов голосового ассистента Alexa и, следовательно, избегать отправки голосовых записей в облако Amazon.
Записи автоответчиков стали использовать для создания дипфейков
Мошенники могут использовать персональные голосовые приветствия на автоответчиках для создания дипфейков — об этом предупредили эксперты. Эти записи позволяют злоумышленникам при помощи нейросетей имитировать голос потенциальной жертвы и в дальнейшем использовать его при атаках на её окружение, пишут «Известия».
Следующие модели Llama от Meta* могут получить улучшенные голосовые функции

Марк Цукерберг намерен в этом году расширить голосовые возможности искусственного интеллекта Meta, продвигая амбициозные планы по монетизации стремительно развивающихся технологий.
По словам осведомлённых источников, в ближайшие недели компания представит обновлённые голосовые функции в новой версии своей открытой языковой модели Llama 4, делая ставку на то, что ИИ-агенты будущего будут вести диалог в разговорном формате, а не ограничиваться текстовыми взаимодействиями.
Особое внимание Meta уделяет тому, чтобы общение пользователя с голосовой моделью стало максимально естественным, напоминая живой диалог, в котором допускаются реплики и перебивания, а не строгий формат вопрос-ответ, сообщил один из собеседников.
Microsoft представила голосовой ИИ Dragon Copilot для врачей
Microsoft анонсировала Dragon Copilot, нового помощника на основе искусственного интеллекта, который объединяет возможности Dragon Medical One (DMO) и DAX Copilot (DAX). Он предназначается для оптимизации работы врачей.
Вышло февральское обновление «Алисы» и умных устройств «Яндекса»

Состоялось февральское обновление голосового ассистента «Алисы» и умных устройств «Яндекса» с алгоритмом для умного климата и новыми быстрыми командами.
Вышел ElevenLabs Scribe: распознавание речи лучше Whisper v3 и Gemini 2.0

Компания ElevenLabs представила Scribe — свою первую модель автоматического распознавания речи (ASR), которая уже признана самой точной в мире. Scribe поддерживает 99 языков, обеспечивая временные метки, разделение по спикерам и распознавание аудио-событий (например, смеха) для удобной интеграции в любые системы.
В ходе тестирования на бенчмарках FLEURS и Common Voice модель превзошла лидеров рынка, включая Gemini 2.0 Flash, Whisper Large V3 и Deepgram Nova-3.
Она демонстрирует самый низкий уровень ошибок в таких языках, как итальянский (98,7%), английский (96,7%) и еще 97 других.