Как стать автором
Обновить
9.45

Голосовые интерфейсы *

управляем устройствами при помощи голосовых команд

Сначала показывать
Порог рейтинга

Голосовой ввод в Windows 11 позволит отключать фильтр ненормативной лексики

Время на прочтение1 мин
Количество просмотров695

Microsoft изменит способ работы фильтра ненормативной лексики для голосового ввода в Windows 11, чтобы пользователи могли отключать его при необходимости.

Читать далее

Новости

Баг: обновлённая «Алиса» говорит на английском с сильным акцентом, если попросить её общаться шёпотом

Время на прочтение1 мин
Количество просмотров9.1K

15 апреля «Яндекс» запустил новую опцию своего фирменного голосового помощника. Теперь «Алиса» может общаться на английском языке без акцента и даже выступать в роли репетитора разговорного английского. На самом деле акцент есть и довольно сильный, но появляется он только в режиме общения шёпотом.

Читать далее

«Яндекс» показал прототип обновлённой мультимедийной платформы «Яндекс Авто»

Время на прочтение1 мин
Количество просмотров2.5K

«Яндекс» представил прототип обновлённой мультимедийной платформы «Яндекс Авто». С её помощью автолюбители могут управлять голосом не только сервисами компании, но и системами авто. Например, можно попросить отрегулировать климатическую систему, открыть окно, включить обогрев руля, подсветку или разблокировать двери. В компании отмечают, что с голосовым управлением водителю не придётся отвлекаться.

Читать далее

Anthropic готовит конкурента голосовому режиму OpenAI в ChatGPT

Время на прочтение1 мин
Количество просмотров211

Anthropic готовится представить новую функцию «голосового режима», которая может составить конкуренцию аналогичной функции OpenAI в ChatGPT, согласно Bloomberg. Сообщается, что голосовой помощник на базе ИИ будет доступен в чат-боте Claude AI и может начать работу «уже в этом месяце».

Читать далее

Обновление «Алисы»: поддержка английского языка, работа с файлами, рассуждения и Live-режим

Время на прочтение3 мин
Количество просмотров3.2K

«Яндекс» представил обновление нейросетевого ассистента «Алисы». Компания добавила поддержку английского языка, рассуждения, поиск, возможность работать с файлами и Live-режим. Обновления показали 15 апреля 2025 года в рамках презентации умных устройств «Яндекса».

Читать далее

Имитированные голоса Маска и Цукерберга звучат со взломанных кнопок пешеходных переходов

Время на прочтение2 мин
Количество просмотров2K

Кнопки на пешеходных переходах как минимум в трёх городах Калифорнии, судя по всему, были взломаны в эти выходные, чтобы придать им голоса, сгенерированные искусственным интеллектом, генерального директора Tesla Илона Маска и генерального директора Meta* Марка Цукерберга.

Читать далее

Amazon представила Nova Sonic: новую модель генеративного ИИ для обработки голоса

Время на прочтение3 мин
Количество просмотров531

Во вторник компания Amazon представила новую модель генеративного искусственного интеллекта Nova Sonic, способную обрабатывать голос и генерировать естественную речь. Amazon утверждает, что производительность Sonic сопоставима с передовыми моделями обработки голоса от OpenAI и Google по таким показателям, как скорость, распознавание речи и качество общения.

Читать далее

41% россиян пользуются умными колонками, основной эффект — экономия времени

Время на прочтение2 мин
Количество просмотров6.5K

Чаще всего пользователи общаются с ними дружелюбно или нейтрально, каждый пятый использует повелительный тон.

77% респондентов пользуются умными технологиями, 41% — умными колонками, а самой востребованной технологией стало Smart TV. Такие результаты показало исследование образовательной платформы «Нетология», в котором приняли участие более 1500 респондентов в возрасте от 18 лет. 

Читать далее

«Додо Пицца» внедрила заказы голосовыми сообщениями через Telegram-бота

Время на прочтение1 мин
Количество просмотров2.7K

Сеть пиццерий «Додо» объявила о запуске новой функции — заказ голосом через Telegram-бота. Пользователи смогут быстро и удобно оформить заказ, отправив боту голосовое сообщение, рассказали Хабру в пресс‑службе компании.

Читать далее

«Алиса, что нового?»: Яндекс 15 апреля проведёт первую конференцию о развитии виртуального ассистента и умных устройств

Время на прочтение1 мин
Количество просмотров1.3K

Команда «Алисы» и разработчики умных устройств «Яндекса» проведут свою первую конференцию 15 апреля в 12:00 МСК в Москве.

Читать далее

OpenAI выпускает новое поколение аудиомоделей: улучшенное распознавание и настройка стиля речи ИИ

Время на прочтение2 мин
Количество просмотров1.4K

Компания OpenAI выпустила новое поколение аудиомоделей, которые позволяют разработчикам настраивать речь своих ИИ-помощников. Обновление включает улучшенное распознавание речи и возможность управлять стилем речи ИИ с помощью простых текстовых команд.

Читать далее

Утечка встречи Apple показывает, насколько ужасна ситуация с Siri на самом деле

Время на прочтение2 мин
Количество просмотров13K

Apple планировала подготовить ключевые ИИ‑функции голосового помощника Siri к весне 2025 года, но теперь публичного релиза может не быть до следующего года. Об этом стало известно из разговора старшего директора Apple Робби Уокера с командой разработки Siri, пишет Bloomberg.

Читать далее

Бизнес заявил, что текущая редакция законопроекта о борьбе с кибермошенничеством нарушает права человека

Время на прочтение2 мин
Количество просмотров2.1K

Текущая редакция законопроекта о борьбе с кибермошенничеством нарушает права человека, так как предусматривает прослушку и запись звонков россиян, говорится в письме Ассоциации разработчиков программных продуктов (АРПП) «Отечественный софт» в Госдуму, Минцифры и Общественную палату. Копия есть у РБК, её подлинность подтвердил представитель ассоциации.

Читать далее

Ближайшие события

Сообщается, что Anthropic готовит голосовой режим для Claude

Время на прочтение1 мин
Количество просмотров649

Согласно отчёту, стартап Anthropic, занимающийся искусственным интеллектом, работает над голосовыми возможностями своего чат-бота Claude на базе искусственного интеллекта.

Читать далее

Amazon: пользователи Echo больше не смогут настраивать свои устройства на локальную обработку запросов Alexa

Время на прочтение2 мин
Количество просмотров1.5K

Amazon сообщила, что c 28 марта пользователи умных колонок Echo больше не смогут настраивать свои устройства на локальную обработку запросов голосового ассистента Alexa и, следовательно, избегать отправки голосовых записей в облако Amazon.

Читать далее

Записи автоответчиков стали использовать для создания дипфейков

Время на прочтение2 мин
Количество просмотров635

Мошенники могут использовать персональные голосовые приветствия на автоответчиках для создания дипфейков — об этом предупредили эксперты. Эти записи позволяют злоумышленникам при помощи нейросетей имитировать голос потенциальной жертвы и в дальнейшем использовать его при атаках на её окружение, пишут «Известия».

Читать далее

Следующие модели Llama от Meta* могут получить улучшенные голосовые функции

Время на прочтение3 мин
Количество просмотров566

Марк Цукерберг намерен в этом году расширить голосовые возможности искусственного интеллекта Meta, продвигая амбициозные планы по монетизации стремительно развивающихся технологий.

По словам осведомлённых источников, в ближайшие недели компания представит обновлённые голосовые функции в новой версии своей открытой языковой модели Llama 4, делая ставку на то, что ИИ-агенты будущего будут вести диалог в разговорном формате, а не ограничиваться текстовыми взаимодействиями.

Особое внимание Meta уделяет тому, чтобы общение пользователя с голосовой моделью стало максимально естественным, напоминая живой диалог, в котором допускаются реплики и перебивания, а не строгий формат вопрос-ответ, сообщил один из собеседников.

Читать далее

Microsoft представила голосовой ИИ Dragon Copilot для врачей

Время на прочтение2 мин
Количество просмотров1K

Microsoft анонсировала Dragon Copilot, нового помощника на основе искусственного интеллекта, который объединяет возможности Dragon Medical One (DMO) и DAX Copilot (DAX). Он предназначается для оптимизации работы врачей.

Читать далее

Вышло февральское обновление «Алисы» и умных устройств «Яндекса»

Время на прочтение2 мин
Количество просмотров5.2K

Состоялось февральское обновление голосового ассистента «Алисы» и умных устройств «Яндекса» с алгоритмом для умного климата и новыми быстрыми командами.

Читать далее

Вышел ElevenLabs Scribe: распознавание речи лучше Whisper v3 и Gemini 2.0

Время на прочтение2 мин
Количество просмотров5K

Компания ElevenLabs представила Scribe — свою первую модель автоматического распознавания речи (ASR), которая уже признана самой точной в мире. Scribe поддерживает 99 языков, обеспечивая временные метки, разделение по спикерам и распознавание аудио-событий (например, смеха) для удобной интеграции в любые системы.

В ходе тестирования на бенчмарках FLEURS и Common Voice модель превзошла лидеров рынка, включая Gemini 2.0 Flash, Whisper Large V3 и Deepgram Nova-3.

Она демонстрирует самый низкий уровень ошибок в таких языках, как итальянский (98,7%), английский (96,7%) и еще 97 других.

Читать далее
1
23 ...