Pull to refresh

Голосовой ассистент Варвара от «Центра речевых технологий» составит конкуренцию Алисе, Марусе и Олегу

Sound


«Центр речевых технологий» (ЦРТ) разрабатывает платформу для создания голосовых ассистентов под рабочим названием «Варвара», рассказали «Коммерсанту» два собеседника, близких к компании. Варвара должна составить достойную конкуренцию Алисе от «Яндекса», а также американским «девушкам» Сири (Apple), Алексе (Amazon) и Кортане (Microsoft).
Читать дальше →
Total votes 19: ↑17 and ↓2 +15
Views 6.5K
Comments 21

МВД довольно распознаванием лиц в Москве: удалось задержать более 100 человек

Information Security *Image processing *Legislation in IT Cyberpunk The future is here


Как известно, в Москве планируется развернуть единую систему видеонаблюдения с распознаванием лиц. В этом году власти собираются подключить к системе распознавания лиц 200 000 уличных видеокамер, сообщали государственные СМИ.

Насколько эффективны такие системы? Каковы результаты тестов? Вчера МВД раскрыло результаты тестового внедрения систем распознавания лиц в метро и на улицах Москвы. В целом система весьма эффективна. Благодаря распознаванию лиц удалось задержать свыше 100 человек, а большинство из них действительно оказались преступниками в розыске.
Читать дальше →
Total votes 23: ↑21 and ↓2 +19
Views 6.9K
Comments 26

РИС: Кафедра речевых информационных технологий ИТМО

Studying in IT

Санкт-Петербургский государственный университет информационных технологий, механики и оптики (ИТМО) открывает прием в магистратуру по программе «Речевые информационные системы».


Обучение производится на бюджетной основе [бесплатно].
В конце обучения будет предложена работа в «Центре речевых технологий».
Иногородним студентам предоставляется общежитие.
Предоставляется отсрочка от армии.

Учебный план включает, в частности, следующие курсы:
Цифровая обработка речевых сигналов
Распознавание и синтез речи
Распознавание диктора
Искусственный интеллект
Мультимодальная биометрия
Организация проектирования и разработки ПО
Многопоточное программирование
Гибкие модели разработки программного обеспечения
Проектирование информационных систем
Системный анализ и моделирование информационных процессов

Дополнительная информация
Total votes 10: ↑8 and ↓2 +6
Views 3K
Comments 0

Русский голос TED

Self Promo


Всегда приятно, когда видео с какого-нибудь мероприятия переводят на русский язык. Вдвойне приятно, когда делают качественную озвучку. Но если в этом замешаны высокие технологии — тогда вообще замечательно.

Недавно Центр речевых технологий — компания, одна из немногих имеющая собственные системы синтеза и распознавания речи, — начала озвучивание на русский язык материалов конференции TED, используя технологию синтеза русской речи. Озвученные роботом материалы размещаются в блоге «Фабрика речи» (VoiceFabric).
Читать дальше →
Total votes 85: ↑82 and ↓3 +79
Views 1.1K
Comments 64

Синтез точка всё. Хабрахабр в прямом эфире

Self Promo

Представляем бесплатное мобильное приложение Radio RSS для iPhone и iPad, читающее в прямом эфире новости Хабрахабра, Яндекса, Спортбокса, Сноба и Коммерсанта.

И другие сервисы синтеза русской речи...
Total votes 92: ↑84 and ↓8 +76
Views 1.2K
Comments 72

Слушайте хабр по «радио»

Self Promo
На одном сайте, который мне внутренний голос нашептал одним воскресным утром, нашёл ссылку на RSS радио. В настройках помимо всего прочего есть и хабр, и тот самый сайт.
Мне понравилось.

Есть приложение для iPhone или iPad
image
Сделано в Центре речевых технологий.
Total votes 56: ↑38 and ↓18 +20
Views 495
Comments 20

«Центр речевых технологий» предоставляет речевые базы для создания прототипа системы распознавания речи

Центр речевых технологий (ЦРТ) corporate blog Programming *Algorithms *
Recovery mode
С целью найти талантливых специалистов, готовых посвятить себя деятельности по развитию речевых технологий в России, Центр речевых технологий (ЦРТ) предоставляет собственные речевые базы. Они содержат не просто звуковые файлы с текстовками, но и разметку по времени, выполненную специалистами ЦРТ.
Читать дальше →
Total votes 20: ↑11 and ↓9 +2
Views 7.4K
Comments 6

Дорогой «Читатель», тебе исполнился год. Поздравляем!

Центр речевых технологий (ЦРТ) corporate blog


Друзья! Нашему приложению «Читатель» на iPhone и iPad исполнился год!
Скачать в iTunes: itunes.apple.com/ru/app/id533851555 В конце поста — подарок.

За год мы приобрели 100 тыс. пользователей и их количество продолжает расти. Спасибо вам, друзья!
Читать дальше →
Total votes 17: ↑7 and ↓10 -3
Views 4.2K
Comments 8

Radio RSS для iPhone и iPad: все актуальные новости за рулем. Уже два года!

Центр речевых технологий (ЦРТ) corporate blog Development of mobile applications *


Друзья, уже ровно два года мы озвучиваем все самые актуальные новости всех самых популярных российских новостных порталов (Хабр в том числе!) при помощи бесплатного мобильного приложения Radio RSS для iPhone и iPad.

Расширенная версия приложения дает доступ к более чем 50-ти популярным новостным порталам, а теплый ламповый проигрыватель помогает переключаться между каналами.

Читать дальше →
Total votes 16: ↑11 and ↓5 +6
Views 4.6K
Comments 9

Биометрическая система на мобильном телефоне

Information Security *Algorithms *Image processing *
Sandbox
Я работаю в области биометрических технологий и хочу описать одно из решений, претендующее на то, чтобы в скором будущем прочно войти в наш обиход. Речь идет о биметрической системе аутентификации пользователя, которой можно пользоваться на любом современном смартфоне, и которая предназначена для удобного (!) и надежного разграничения доступа к различным мобильным сервисам, как банковским, медицинским, так и любым другим приложениям.

В последнее время все большее количество компаний используют возможности сети интернет для предоставления своих услуг. Как правило, архитектура таких приложений представляет собой использование технологии «тонкий клиент», которая подразумевает централизованное хранение данных клиента и предоставление доступа к ним только по специальному запросу. Клиент с помощью удаленного терминала (это может быть обычный ноутбук, планшет или смартфон) и специальной программы или стандартного веб-браузера может просматривать и изменять информацию на удаленном сервере.

Для обеспечения безопасности передаваемых данных, как правило, используется протокол SSL (Secure Sockets Layer). Кроме того, если система представляет собой приложение, доступ в него может быть защищен логином и паролем. Для повышения безопасности может использоваться ЭЦП (Электронно-Цифровая Подпись) – бинарная последовательность данных, формируемая криптографическим алгоритмом.

К сожалению, зачастую, клиенты хранят данные доступа прямо на ноутбуке или смартфоне, и при его утере или краже, доступ к сервисам легко могут получить третьи лица. Еще одним недостатком паролей или ЭЦП является невысокое удобство использования — необходимость помнить пароль или хранить файл ЭЦП на отдельном носителе. Именно поэтому сейчас на рынок обеспечения безопасности доступа начинают выходить биометрические технологии.
Читать дальше →
Total votes 21: ↑19 and ↓2 +17
Views 19K
Comments 40

SNMP + Java – личный опыт. Пишем парсер MIB-файлов

Programming *Java *
Sandbox
Tutorial
SNMP – не самый юзер-френдли протокол: MIB-файлы слишком длинные и запутанные, а OID'ы просто невозможно запомнить. А что если возникла необходимость работать с SNMP на Java? Например, написать автотесты для проверки API SNMP-сервера.

Путём проб и ошибок при наличии довольно скудного количества информации по теме мы все же придумали, как подружить Java и SNMP.

В этой серии статей я постараюсь поделиться полученным опытом работы с протоколом. Первая статья в серии будет посвящена реализации парсера MIB-файлов на Java. Во второй части я расскажу о написании SNMP-клиента. В третьей части речь пойдёт о реальном примере использования написанной библиотеки: автотестах для проверки взаимодействия с устройством по протоколу SNMP.


Читать дальше →
Total votes 10: ↑10 and ↓0 +10
Views 5.4K
Comments 9

Как из четырёх минут речи мы воссоздали голос молодого Леонида Куравлёва

Сбер corporate blog Machine learning *Natural Language Processing *Voice user interfaces *
Всем привет! Меня зовут Олег Петров, я руковожу группой R&D в Центре речевых технологий. Мы давно работаем не только над распознаванием речи, но и умеем синтезировать голоса. Самый простой пример, для чего это нужно бизнесу: чтобы для каждого нового сценария, которому обучают голосовых роботов, не нужно было организовывать новую запись с человеком, который его когда-то озвучил. Ещё мы развиваем продукты на основе голосовой и лицевой биометрии и аналитики по голосовым данным. В общем, работаем над серьёзными и сложными задачами для разного бизнеса.



Но недавно к нам пришли коллеги из Сбера с предложением поучаствовать в развлекательной истории — «озвучить» героя Леонида Куравлёва в новом ролике. Для него лицо Куравлева было воссоздано по кадрам из фильма «Иван Васильевич меняет профессию» и наложено на лицо другого актера с помощью технологии Deepfake. Чтобы мы смогли не только увидеть, но и услышать в 2020 году Жоржа Милославского, мы решили помочь коллегам. Ведь с годами голос у всех нас меняется и даже если бы Леонид Вячеславович озвучил героя, эффект был бы не тот.

Под катом я расскажу, почему эта, уже во многом привычная задача голосового синтеза, оказалась чуть сложнее, чем мы ожидали, и поясню, почему такие голоса не смогут обмануть качественные системы биометрической авторизации.
Total votes 56: ↑48 and ↓8 +40
Views 19K
Comments 74