• Введение в задачу распознавания эмоций

    Распознавание эмоций – горячая тема в сфере искусственного интеллекта. К наиболее интересным областям применения подобных технологий можно отнести: распознавание состояния водителя, маркетинговые исследования, системы видеоаналитики для умных городов, человеко-машинное взаимодействие, мониторинг учащихся, проходящих online-курсы, носимые устройства и др.


    В этом году компания ЦРТ посвятила этой теме свою летнюю школу по машинному обучению. В этой статье я постараюсь дать краткий экскурс в проблему распознавания эмоционального состояния человека и расскажу и подходах к ее решению.


    image
    Читать дальше →
  • ЦРТ и Университет ИТМО приглашают в Летнюю школу машинного обучения

      Лето — отличное время, чтобы отдохнуть и подтянуть профессиональные навыки. Поэтому мы открываем прием заявок в Летнюю школу машинного обучения, которая пройдет в Петербурге с 2 по 15 августа при поддержке Университета ИТМО. Заявки принимаем до 23 июля!


      Студентов Школы, которые справятся с тестовым заданием и успешно пройдут конкурсный отбор, будет ждать масса положительных эмоций, новых знаний и возможностей для дальнейшего роста.
      Читать дальше →
    • Битва титанов наших дней: спор В. Вапника и Л. Джейкела о будущем SVM и нейронных сетей

        Воспоминания о том, как спорили Нильс Бор с Альбертом Эйнштейном, а Джордж Вестингауз и Никола Тесла с Томасом Эдисоном, давно превратились в легенды. Эти научные дискуссии не забыты до сих, потому что, с одной стороны, разрешить их смогло только время. С другой стороны, их исход определил развитие технологий на десятилетия вперед. Существуют ли подобные дискуссии в наши дни? Существуют. И они столь же горячи и интересны, как и сто лет назад.


        Пожалуй, самым интересным спором современности является спор Владимира Вапника (изобретателя метода опорных векторов или SVM — support vector machine), с Ларри Джейкелом, его боссом в компании “Bell Labs” и сторонником сверточных нейронных сетей.

        Читать дальше →
      • ЦРТ объявляет конкурс по синтезу речи

          image

          Приглашаем поучаствовать в конкурсе по синтезу живой русской речи на основе технологий глубоких нейронных сетей. Конкурс рассчитан на студентов старших курсов, молодых специалистов и всех желающих, интересующихся машинным обучением и речевыми технологиями. Победитель получит 100 000 рублей!

          Участникам TTS challenge предстоит создать и обучить систему синтеза и озвучить с её помощью несколько десятков предложений русского текста. Базу голоса для обучения предоставляет ЦРТ, методы достижения результата участники выбирают самостоятельно. О том, как сделать нейросетевой синтез своими руками, мы недавно рассказывали в этой статье.
          Читать дальше →
          • +15
          • 2,4k
          • 1
        • Нейросетевой синтез речи своими руками

          Синтез речи на сегодняшний день применяется в самых разных областях. Это и голосовые ассистенты, и IVR-системы, и умные дома, и еще много чего. Сама по себе задача, на мой вкус, очень наглядная и понятная: написанный текст должен произноситься так, как это бы сделал человек.

          Некоторое время назад в область синтеза речи, как и во многие другие области, пришло машинное обучение. Выяснилось, что целый ряд компонентов всей системы можно заменить на нейронные сети, что позволит не просто приблизиться по качеству к существующим алгоритмам, а даже значительно их превзойти.



          Я решил попробовать сделать полностью нейросетевой синтез своими руками, а заодно и поделиться с сообществом своим опытом. Что из этого получилось, можно узнать, заглянув под кат.
          Читать дальше →
        • Речевая аналитика как инструмент управления KPI контакт-центра. Кейс «Ростелеком»



            Сегодня мы расскажем о том, как «Ростелеком Северо-Запад» повысил бизнес-показатели своего Единого Контакт-центра (ЕКЦ) с помощью инновационных технологий речевой аналитики. Подведены итоги консалтингового проекта, в рамках которого специалисты ЦРТ с помощью инструментов речевой аналитики Speech Analytics Lab проанализировали обращения клиентов в ЕКЦ «Ростелеком» и предложили методику улучшения качества обслуживания.

            Зачем в КЦ нужна речевая аналитика?


            ЕКЦ Северо-Западного филиала «Ростелеком» — огромная система, которая ежедневно обрабатывает тысячи обращений. При контроле качества супервизоры могут проанализировать только случайную выборку звонков, которая, как правило, составляет до 2% от общего числа обращений. А это не всегда даёт объективную картину.

            С помощью инструментов речевой аналитики специалисты могут работать со 100% обращений. Для этого все диалоги ЕКЦ переводятся в текст и анализируются с помощью системы Speech Analytics Lab. Благодаря инструментам поиска в массивах неструктурированной речевой информации аналитик может отработать гипотезы (найти ключевые слова) на выборках в сотни тысяч фонограмм за несколько секунд.

            На основе такого анализа можно разработать программу изменений для действующих в ЕКЦ процедур и процессов и оптимизировать системы самообслуживания (IVR, Личный кабинет, сайт).
            Читать дальше →
          • Голосовая биометрия в контакт-центре банка. Кейс внедрения



              Всем привет! В прошлом году мы внедрили свое решение для голосовой верификации пользователей контакт-центров VoiceKey.Agent в Приорбанк (это один из крупнейших коммерческих банков Беларуси, входящий в австрийскую группу «Райффайзен») и теперь хотим рассказать вам о том, как мы это сделали и зачем это все понадобилось банку. На территории России и СНГ это второе внедрение голосовой биометрии в КЦ банка, поэтому мы стали практически первопроходцами.

              Зачем банку биометрия


              Не будем в очередной раз рассказывать, что традиционные технологии верификации пользователя (то есть подтверждение личности по знаниям: паролям, пин-кодам, кодовым словам и пр.) громоздки и не дают гарантированного результата. Крайне сложно удостовериться, действительно ли на другом конце провода находится тот самый человек, за которого он себя выдает. Оператор контакт-центра может лишь задавать уточняющие вопросы и сопоставлять голос человека с его полом, возрастом и другими особенностями. Достаточно очевидно, что для защиты финансовой информации этого мало.
              Читать дальше →
            • Пиши голосом правильно

              • Tutorial

              Всем привет!


              У многих из нас мало опыта в так называемом голосовом письме – на диктофон свои мысли раньше записывали разве что психоаналитики. Теперь диктовка становится привычнее – к ней приучил сервис голосового набора в смартфонах. Участвуя как product owner в процессе создания продукта для распознавания русской слитной речи, общаясь с разработчиками алгоритмов и с клиентами, проводя различные тесты систем распознавания, наблюдая за тем, как пользователи диктуют свои тексты и имея свой большой опыт ввода текста в компьютер с помощью голоса, я набрал много интересных наблюдений. Чтобы лучше понимать, как правильно пользоваться автоматическим распознаванием речи давайте посмотрим, как устроено распознавание речи. Описание будет очень упрощенным, но зато поможет понять, какие ошибки люди совершают при диктовке. И еще: данную статью я буду писать с помощью диктовки, внося правки с клавиатуры только в тех местах, где без этого будет не обойтись.
              Читать дальше →
            • Мобильное приложение «Читатель» теперь для Android



                Три года назад мы выпустили мобильное приложение «Читатель» для iOS и от многих пользователей нам стали приходить письма с вопросом, собираемся ли мы выпустить версию под Android. Разработка завершена, и состоялся официальный запуск «Читателя» в Google Play.
                Читать дальше →
              • VoiceFabric: технология синтеза речи из облака



                  Сегодня поговорим про перспективы и возможности облачного сервиса VoiceFabric для разработчиков и пользователей. Сервис озвучивает любую текстовую информацию синтезированным голосом в режиме реального времени. Под катом мы подробно расскажем о нашем синтезе, сценариях его использования (стандартных и не очень) и как подключить его к своим проектам, а так же о том, чем он уникален.
                  Читать дальше →
                • Вышла новая версия мобильного приложения «Читатель» для iOS



                    Немного предыстории
                    Два года назад мы выпустили для iOS первую версию «Читателя» (Ссылка на iTunes). Это мобильное приложение, которое читает вслух загруженные в него книги и текстовые документы с помощью технологии синтеза русской речи. По сути дела, он позволяет озвучить в реальном времени любую книгу (.txt, .doc, .fb2). Книги озвучиваются прямо в мобильном устройстве, постоянный доступ в интернет при этом не нужен. За это время «Читатель» установили порядка 100 тысяч пользователей.
                    Читать дальше →
                  • Конкурс разработчиков «Родная речь» — внимание, полуфинал!

                      Уважаемые участники конкурса!

                      Полуфинальная выборка доступна для скачивания.

                      Обращаем ваше внимание, что пароль к выборке будет объявлен на сайте www.m2ies.com в день старта полуфинала 1.04.2014 в 14-00 по московскому времени.

                      Результаты работы вашей системы можно будет присылать до 14-00 2.04.2014.

                      Подробности — в конкурсной документации.

                      Удачи!

                      image
                    • Конкурс разработчиков «Родная речь» — начинаем обратный отсчет!

                        Важная информация для всех участников.

                        15 февраля в общий доступ выложена конкурсная база, с которой вам предстоит работать. Пароль для скачивания: SKT38G9MC28

                        image

                        Задание нужно выполнить до конца марта. Дедлайн отправки готового задания организаторам – 2 апреля. 3 апреля состоится полуфинал.

                        Напоминаем, что участники должны будут создать работоспособный алгоритм преобразования распознанной последовательности фонем в текст, соответствующий нормам русского языка. Подробнее о задаче в одном из предыдущих постов.
                        Читать дальше →
                      • Конкурс «Родная речь» — неделя до старта!

                          Дорогие участники конкурса разработчиков! До открытия доступа к конкурсной базе осталась всего одна неделя!

                          image

                          У вас еще семь дней на то, чтобы изучить задачу, пример, задать на форуме все интересующие вопросы и настроиться на творческий лад!
                          Не забудьте официально зарегистрироваться на портале m2ies.com: подробная инструкция здесь.

                          Напоминаем вам, что участники конкурса должны будут создать работоспособный алгоритм преобразования распознанной последовательности фонем в текст, соответствующий нормам русского языка. Подробнее о конкурсном задании можно прочитать в нашем предыдущем посте.

                          Читать дальше →
                        • Распознай это! Конкурс «Родная речь» 2014


                            Всем привет!

                            В прошлом посте мы анонсировали конкурс разработчиков «Родная речь-2014», участники которого должны будут создать работоспособный алгоритм преобразования распознанной последовательности фонем в текст, соответствующий нормам русского языка.
                            Регистрация уже началась, и чтобы помочь сомневающимся определиться с решением: принимать ли участие, я попробую объяснить, что же нужно сделать в рамках конкурса.
                            Читать дальше →
                          • Конкурс «Родная речь-2014»: на старт, внимание, марш!

                              Родная речь 2014
                              Всем привет!

                              15 января открылась регистрация участников ежегодного конкурса разработчиков – «Родная речь-2014». Победитель получит 120 000 рублей, серебряный призер – iPhone 5, а финалист, занявший третье место, – iPad 4.

                              Заполнить заявку самостоятельно или от имени команды можно на сайте деловой сети Marketing to Innovation, Education, Science, оказывающей конкурсу техническую поддержку.

                              Процедура регистрации подробно описана в инструкции.
                              Читать дальше →
                              • –1
                              • 3,1k
                              • 9
                            • Станиславский для робота. Как использовать возможности эмоционального синтеза

                                Поздравляем всех с наступающими праздниками! Этот пост будет не столько технический, сколько сказочно-новогодний. По традиции, накануне Нового года мы придумываем подарки для наших партнеров и клиентов. Но также нам хочется сделать что-то приятное для более широкой аудитории. Самый лучший подарок – сделанный своими руками. А дарить подарки приятнее всего детям. Поэтому в этом году мы придумали проект «Робот читает сказки детям». Мы взяли 12 новогодних сказок, озвучили их с помощью синтеза речи и разместили на нашем портале Voice Fabric.

                                image

                                Как известно, Центр речевых технологий создал несколько голосов TTS (text-to-speech), которые используются в системах IVR контакт-центров, системах голосового оповещения, мобильных приложениях — «Radio RSS» и «Читатель».

                                Как подбирались голоса

                                Всего в команде «голосовых роботов» на данный момент 5 женских и 2 мужских голоса. У каждого голоса свое имя. Преобладание женских голосов объясняется тем, что в информационных системах именно женские голоса комфортнее для восприятия пользователями.
                                Индивидуальность каждого голоса обеспечивается несколькими факторами. Во-первых, тембр голоса сохраняется при студийной записи диктора, голос которого используется в качестве прототипа. Во-вторых, мы сохраняем интонационные особенности голоса диктора, применяя статистически рассчитанную модель голоса, которая создается именно по студийным фонограммам этого диктора.В итоге, для озвучивания сказок мы отобрали 6 голосов: Владимира, Анну, Юлию, Марию, Викторию и Александра.Выбирая сказки, мы руководствовались, конечно, новогодне-рождественской темой, отсутствием копирайтов, а также личными предпочтениями. Коллекция получилась пестрая: это и известные русские народные сказки («Два Мороза», «Лисичка-сестричка», «Снегурочка»), и европейская классика братьев Гримм и Г.Х. Андерсена. Также мы нашли менее известные у нас, но очаровательные рождественские сказки «Портной из Глостера» и «Мышонок Твикли». И, конечно, не могли обойти стороной замечательную притчу О. Генри «Дары волхвов», которая не совсем сказка, но очень трогательная история о настоящей любви.



                                Читать дальше →
                              • «Родная речь-2014» — шанс заявить о себе для молодых разработчиков

                                  Победители получат ценные призы и работу мечты!


                                  image

                                  Весной 2014 года пройдет второй открытый конкурс по разработке речевых систем для молодых ученых – «Родная речь». Победитель получит 120 000 рублей или участие в международной летней школе по речевым технологиям, серебряный призер – iPhone 5, а финалист, занявший третье место, – iPad 4.

                                  График проведения конкурса:

                                  15 января 2014 — начало регистрации участников
                                  15 февраля 2014 —открытие доступа к конкурсной базе, начало работы
                                  1-3 апреля 2014 — полуфинал
                                  26-28 апреля — финал, который состоится в Санкт-Петербурге

                                  Ознакомиться с условиями участия и получить всю необходимую информацию можно на странице конкурса на сайте ЦРТ spch.pro/x1fm2
                                  Обязательным условием участия является вступление в группу ЦРТ ВКонтакте vk.com/speechpro

                                  Для того чтобы принять участие, достаточно иметь навыки программирования, живое, творческое мышление и желание решать интересные, нестандартные задачи на стыке нескольких дисциплин, таких, как динамическое программирование, статистическое моделирование и др.

                                  Организатор «Родной речи» – компания «Центр речевых технологий», абсолютный лидер российского и значимый игрок международного рынка речевых технологий и мультимодальной биометрии, ведущий разработчик речевых систем в России. Всем трем лауреатам конкурса будет предложено присоединиться к команде ЦРТ.

                                  Читать дальше →
                                • Речевые технологии. Голосовая биометрия для чайников на примере работы в контактном центре

                                  • Tutorial
                                  image

                                  Всем привет.
                                  Недавно я написал вот такую статью про распознавание слитной речи, а сейчас хотел бы написать про голосовую биометрию, т.е. подтверждение личности человека по голосу и узнавание человека по голосу.
                                  Читать дальше →
                                  • +4
                                  • 16,6k
                                  • 7
                                • Radio RSS для iPhone и iPad: все актуальные новости за рулем. Уже два года!



                                    Друзья, уже ровно два года мы озвучиваем все самые актуальные новости всех самых популярных российских новостных порталов (Хабр в том числе!) при помощи бесплатного мобильного приложения Radio RSS для iPhone и iPad.

                                    Расширенная версия приложения дает доступ к более чем 50-ти популярным новостным порталам, а теплый ламповый проигрыватель помогает переключаться между каналами.

                                    Читать дальше →

                                  Самое читаемое