denis-19 Nov 29 2022 at 18:01

«Сбер» открыл публичный доступ к платформе синтеза и распознавания речи SaluteSpeech

3 min

3.6K

Machine learning*Cloud services*IT-companies

29 ноября 2022 года «Сбер» открыл публичный доступ к платформе синтеза и распознавания речи SaluteSpeech для реализации некоммерческих проектов и для разработчиков-физлиц. В рамках бесплатного публичного доступа к платформе SaluteSpeech команда SberDevices ввела ограничения в месяц на каждого пользователя. Эти рамки достаточны для предварительного тестирования сервиса и выполнения небольших проектов.

Ранее получить доступ к платформе SaluteSpeech могли только юридические лица и индивидуальные предприниматели. Для некоммерческого использования речевых технологий платформы потребуется только регистрация на портале сервиса Studio.

В «Сбере» пояснили, что открытый доступ к платформе SaluteSpeech поможет пользователям быстро и эффективно решать множество задач. Студенты могут транскрибировать лекции, блогеры — озвучивать ролики, авторы — создавать аудиокниги.

Также есть сценарии использования публичной версии для бизнеса. Средний и малый бизнес может озвучить презентационные материалы либо транскрибировать аудиозаписи встреч или интервью для последующей работы с текстом. Крупный бизнес получает возможность оперативно протестировать технологию «Сбера» до принятия решения о дальнейшем сотрудничестве в рамках корпоративных тарифов.

«Наша команда очень много выступает на мероприятиях перед студентами — мы рассказываем им о речевых технологиях, — и я очень рад, что теперь они могут полноценно их протестировать и создать свои первые проекты, которые, уверен, положат начало чему-то большому и важному в будущем. Также это отличный инструмент для людей, у которых возникает бытовая потребность в переводе текста в голос и наоборот. Отмечу, что таких немало. И, конечно, ещё одна важная задача этого проекта — дать бизнесу возможность для тестирования платформы SaluteSpeech. Благодаря свободному доступу все желающие в удобный для них момент могут подключиться к платформе и оценить качество работы её технологий», — пояснил директор дивизиона В2В-продуктов Салют SberDevices Денис Афанасьев.

Публичный доступ к платформе SberDevices открыт только для некоммерческого использования. Распознавание речи в этом формате для физических лиц ограничено 100 минутами в месяц. К примеру, продолжительность одной лекции — 60 минут, а деловая встреча в среднем длится от 40 до 60 минут. Синтезировать можно текст на 200 000 символов в месяц — этого достаточно, чтобы создать небольшую аудиокнигу примерно на 100 страниц.

Доступ к SaluteSpeech для реализации коммерческих проектов исключает эти ограничения. При работе с облачной версией платформы клиент платит по количеству секунд для распознавания речи и по числу символов для её генерации. Если заказчик разворачивает систему в своём контуре (on-prem), он платит за количество лицензий.

Платформа SaluteSpeech позволяет подключать речевые технологии в интерактивном голосовом меню (IVR), автоответчике, чатах, телемаркетинговых компаниях, голосовых интерфейсах взаимодействия, для озвучивания контента и команд или голосового ввода на устройствах и сайтах. Сервисы платформы распознают и синтезируют речь, а также способны воспринимать подсказки, помогающие максимально правильно понимать пользователя в зависимости от конкретной ситуации. Технологии распознавания и синтеза речи SaluteSpeech можно использовать как вместе, так и по отдельности.

28 ноября SberDevices запустила обновлённую платформу умного дома Sber на базе собственных разработок. Новая умная платформа SberDevices автономна и не зависит от сторонних инфраструктурных и технологических иностранных решений, включая ранее используемую Tuya. В SberDevices уточнили, что разработчики смогли за несколько месяцев полностью перевести платформу умного дома Sber на собственное ПО, свою контролируемую облачную инфраструктуру и российские серверы.

Tags:

Hubs:

If this publication inspired you and you want to support the author, do not hesitate to click on the button