
Голосовые интерфейсы *
управляем устройствами при помощи голосовых команд
Samsung работает над функцией клонирования голоса для ответа на вызовы

Компания Samsung представила функцию для мобильного помощника Bixby, которая позволяет отвечать на голосовые вызовы при помощи преобразования текста в речь. В настоящий момент опция доступна только на корейском языке в виде приложения Bixby Custom Voice Creator для последних Samsung Galaxy S23, S23+ и S23 Ultra.
Из-за ошибки несколько HomePod в одном доме отвечают хором, а не выбирают приоритетный источник
Пользователи умных колонок HomePod жалуются, что после обновления устройства начали отвечать хором и больше не выбирают приоритетный источник, находящийся ближе всего к пользователю. Ошибка появилась в версии прошивки 16.3.2.
Российские дикторы предложили разработать регулирование синтеза голосов с помощью ИИ

Союз дикторов России направил главе комитета Госдумы по информполитике Александру Хинштейну письмо, с которым ознакомился «Коммерсантъ». В документе дикторы предложили разработать регулирование синтеза голосов с помощью ИИ.
Разработчик создал умного помощника с помощью Siri и GPT-3

Разработчик Мате Маршалко поделился на Medium, как ему удалось создать умного голосового ассистента на базе Siri и нейросети GPT-3. Для этого ему не понадобилось программировать: было достаточно объяснить GPT-3, что нужно сделать для управления «умным» домом.
Голосовой ассистент «Алиса» поможет найти потерянный дома смартфон

«Яндекс» научил голосовой ассистент «Алиса» искать потерянный дома смартфон. В компании пояснили, что «Алиса» может быть полезна в самых разных ситуациях: с ней можно учиться новому, развлекаться и решать повседневные задачи. Теперь разработчики добавили в неё возможность позвонить на мобильное устройство пользователя.
Сервисы «Яндекса» стали доступнее незрячим пользователям
Брайлевский дисплей с восьмиклавишной клавиатурой — на ней символы вводятся нажатием комбинации клавиш. Фото: Sigmund / Unsplash.Сервисы «Яндекса» стали доступнее незрячим пользователям. В компании пояснили, что для этого разработчики «Яндекса» адаптировали сервисы для специальных программ — скринридеров, которые озвучивают содержимое экрана и позволяют воспринимать интерфейс на слух. В рамках этого проекта обновились «Такси», «Поиск», «Браузер», «Лавка», веб-версия «Карт», мобильные приложения «Диска», «Почты» и «Переводчика», а также «Умная камера» и приложение «Яндекс с Алисой». Подробнее об этом можно узнать в публикации «Рассказ незрячего тестировщика о том, как сервисы „Яндекса“ становятся доступнее».
Каждый десятый телевизор в России имеет отечественное голосовое управление

В этом году россияне приобрели более 3,2 млн телевизоров с поддержкой Smart TV – умные ТВ заняли рекордные 75% от общих продаж телевизоров в натуральном выражении в России. По данным «М.Видео-Эльдорадо» за III квартал, доля Smart TV с российским ПО составила 10% против 1,5–2% в тот же период прошлого года.
Orion на пути к Луне активировал систему Callisto

Беспилотный космический корабль НАСА Orion в рамках миссии «Артемида-1» продолжает свой путь к Луне. Инженеры активировали систему Callisto — демонстрацию технологии от Lockheed Martin в сотрудничестве с Amazon и Cisco. Callisto находится в кабине Orion и будет тестировать голосовые и видеотехнологии для будущих космических миссий.
В ОС «Аврора» появилась система распознавания голоса

Системный интегратор iCore разработал компонент распознавания голосового ввода AVERS (Aurora VoicE Recognition Soft) для приложений в ОС «Аврора 4.0» и выше, сообщается на сайте компании «Открытая мобильная платформа». Компонент позволяет передавать команды и текстовые данные без использования ручного ввода. AVERS представляет собой набор библиотек для ОС «Аврора» и демо-приложение для записи голосового сообщения и перевода его в текст в офлайн-режиме.
От мультиязычных моделей до проектирования блок-схем на языке Дракон: Сбер, DeepPavlov, Ozon и другие на Conversations

2 декабря в Москве в онлайн- и офлайн-формате состоится Conversations – ежегодная конференция по разговорному AI для разработчиков и бизнеса. Про NLP-сервисы, диалоговые платформы и фреймворки, синтез и распознавание речи, UX и проектирование разговорных интерфейсов, генеративные модели и не только расскажут KODE, MTS AI, Альфа-Банк, Сбер, Yandex Cloud, DeepPavlov и другие эксперты. В нашем анонсе – особо интригующие спойлеры и промокод на скидку.
СМИ: Apple планирует сократить голосовую команду «Привет, Сири» для вызова голосового помощника только по имени

Журналисты Bloomberg сообщили, что Apple планирует сократить фразу «Привет, Сири» до обращения по имени. По информации издания, компания работает над обновлением последние несколько месяцев.
Российские учёные из ТУСУРа заявили, что разработали систему распознания речи, превосходящую мировые аналоги

Специалисты Томского государственного университета систем управления и радиоэлектроники (ТУСУР) разработали математическую модель распознавания речи, сообщает «РИА Новости» со ссылкой на Проектный офис «Приоритет 2030» ТУСУР. Как заверили в вузе, погрешность при распознавании основного тона речи у новой системы в четыре раза меньше, чем у лучших мировых аналогов. Таким образом, решение «намного лучше» справляется с распознаванием обычной спонтанной речи или пения.
Ближайшие события
«АТС» и «Доктор Рядом» научили голосовой бот на базе Yandex SpeechKit собирать анамнез у пациентов

Разработчик диалоговых систем «АТС» и медицинская компания «Доктор Рядом» запустили голосовой «Анамнез-бот», созданный на базе сервиса синтеза и распознавания речи Yandex SpeechKit, сообщили Хабру в пресс-службе Yandex Cloud. Благодаря боту перед приёмом у врача пациенты смогут голосом внести сведения о личном анамнезе в электронную медицинскую карту. Как указали в Yandex Cloud, решение позволяет врачам на 30% быстрее проводить опрос пациента и заполнять документы во время приёма. Новый голосовой бот уже доступен в более чем 500 российских клиниках.
Учёные разрабатывают интерфейс для беззвучной передачи команд на устройства

Команда учёных из Нью-Йоркского университета под руководством Чжанпэня Цзиня начала разрабатывать интерфейс EarCommand, который позволит беззвучно передавать команды на различные устройства.
В Google Meet появилась опция автоматической расшифровки устной речи

В сервис видеоконференций Google Meet добавили функцию автоматической расшифровки речи говорящих. Пока она доступна только на английском языке.
Голосовой ассистент «Алиса» научилась узнавать всех членов семьи

11 октября 2022 года «Яндекс» рассказал, что голосовой ассистент «Алиса» научилась узнавать всех членов семьи, а все умные колонки компании с «Алисой» получили функцию совместного использования.
Голосовому ассистенту «Алиса» от «Яндекса» исполнилось 5 лет

10 октября 2022 года голосовому ассистенту «Алиса» от компании «Яндекс» исполнилось 5 лет. Этот сервис теперь умеет намного больше, чем разработчики себе представляли на старте проекта.
«ВКонтакте» открыла доступ к технологии распознавания речи сторонним разработчикам

Технический директор «ВКонтакте» Александр Тоболь на открытии конференции Saint HighLoad++ рассказал, что теперь разработчики могут бесплатно использовать в своих проектах технологию, считывающую голос и переводящую его в текст. Отмечается, что нейросеть хорошо справляется с большим количеством сленга, сокращений и фильтрует шумы.
Yandex Cloud совместно с Just AI интегрировали решения для запуска голосовых AI-проектов в контуре заказчика

Yandex Cloud и Just AI, являющаяся вендором технологий разговорного искусственного интеллекта, совместно запустили партнерскую интеграцию продуктов. Пользователи сервиса для распознавания и синтеза речи Yandex SpeechKit смогут разворачивать полномасштабные голосовые AI-проекты как в облаке, так и в собственном контуре.
Данная интеграция позволяет создавать виртуальных операторов для контакт-центров «под ключ». Кроме того, с её помощью можно создавать голосовых ассистентов для бизнеса и реализовывать любые голосовые проекты для информирования, лидогенерации, возврата и удержания клиентов.
Вклад авторов
snakers4 892.1BarakAdama 444.0janvarev 288.0AlexBobovnikov 138.0just_ai 117.6inetstar 111.0Vasyutka 103.0AlexxIT 100.0vvkiri 75.0okulovsky 72.0
