Eleven — сервис автоматического перевода речи в текст

    Привет. Мы, Боря и Полина, расскажем о нашем проекте Eleven.

    Мы разрабатываем Eleven — сервис автоматического перевода речи в текст и плагин для Skype. Сервис связывается со Skype во время звонка, обрабатывает голосовой разговор и возвращает пользователю в текстовом виде в течение 5-7 секунд. Текстовый лог разбит на привычные блоки: ваши слова и слова вашего собеседника. Связь со Skype нужна для определения начала и конца разговора.

    image

    Идея распознавания речи не нова, и в мире ведётся интенсивная разработка сервисов по голосовому набору с весьма разнообразным функционалом. Наш же продукт предназначен для фрилансеров — разработчиков и дизайнеров — и направлен на повышения удобства в их работе.

    Как это работает

    image
    Всё очень просто: режем ваш голос и отправляем на сервер по HTTP. Обратно получаем ответ и сохраняем его в облаке. Сам плагин подключается к Скайпу и отслеживает начало и окончание разговора. Но мы думаем, лучше один раз увидеть.

    Почему мы делаем это

    Неприятная ситуация:
    — Работа требует изменений.
    — А раньше нельзя было сказать?
    — Я говорил.
    — Пруф?

    Фрилансеры часто сталкиваются с проблемой забытой задачи. После показа результата заказчику выясняется, что некоторые детали не точны. Дело в том, что неподготовленный человек может держать в памяти не более 3-4 пунктов. Мелочи со временем в памяти не удерживаются совсем. Eleven решает очень актуальную задачу — фиксирует факт переговоров.

    Ах да. Засмотренный нами до дыр ролик, который мы показываем на всех презентациях, подаривший нам название.
    www.youtube.com/embed/G2Y0oqZOyl0
    Eleven
    Компания
    Реклама
    AdBlock похитил этот баннер, но баннеры не зубы — отрастут

    Подробнее

    Комментарии 31

      +11
      А в итоге, распознается-то шотландский английский корректно? :)
        +4
        Интересно еще, выбор названия был мотивирован тем самым роликом?
          +1
          Конечно! Вся модель завязана не нем.
        0
        По разному — сейчас есть проблемы, но со следующей версии будет лучше и удобнее.
          +4
          Гм. Я за вас рад, в принципе, но честно говоря — ожидал увидеть в статье нечто более полезное, чем вашу рекламу и блок-схему работы сервиса.

          В результате:
          -я не знаю вашего прейскуранта
          -я не уверен, что ваш сервис корректно распознает конкретно мой русский язык, а в статье нет никакой информации о том, как бы я мог это проверить
          -я даже сайта вашего не знаю

          Если предполагается, что я сейчас брошусь все это гуглить, то ваш хитрый план на мне дал осечку. Я не брошусь. Но eleven-app для меня стал очередным синонимом фразы «время, потраченное впустую».
            +3
            Здравствуйте. Это наш первый пост на Хабре — прошу великодушно нас извинить если что то не соответствует формату.
            По существу:
            — Прайс: для всех пользователей до 11 минут разговора на каждый звонок — абсолютно бесплатно. Длинные разговоры более 11 минут — 11 долларов в год.
            — Распознавание: да — тут сложно. Не всё распознается, не все работает как надо — мы работаем над качеством.
            — сайт: www.elevenapp.com

            У нас нет никакого хитрого плана.

              0
              Я собственно к тому, что если вы добавите эту информацию в статью — остальным посетителям будет немного интереснее читать.
                +1
                Мы не хотели грузить пользователей лишней инфой. Кому интересно — спросит (как вам).

                ПЫ.СЫ — данная версия продукта абсолютно бесплатна в ней есть ограничения по времени (11 мин), но за share в соцсетях — 6 месяцев премиума.
                +1
                А вот же пост в «я пиарюсь» двухмесячной давности про eleven на хабре — habrahabr.ru/post/193384/

                Со все так же не отвеченными вопросами по отсутствию работоспособности программы в комментариях…
                  0
                  Да — это тоже про нас с аккаунта одного из основателей. Я лично не мог комментировать этот пост, так что если есть вопросы — добро пожаловать.
                    0
                    Попробую сформулировать…

                    Неясно, куда нажимать, чтобы получить текст.

                    В окне программы после тестового звонка появляется строка, что, мол, звонок был. При нажатии на эту строку начинает крутиться сине-белое колесо, словно что-то подгружается. Через несколько секунд оно пропадает. И никакого текста нигде нет. Как я понял, предыдущую тему обсуждения — я не один такой.

                    Просьба записать инструкцию со скриншотами.
                    –4
                    Слава — добавь меня в ФБ. У нас много общего. Алан!
                      –2
                      с удовольствием добавил!
                0
                С русским как? API есть?
                Весьма интересно.
                  –3
                  Внешнего API нет — мы пользуемся гуглом как рапознавалкой.
                  С русским как — по разному. Иногда просто 100% иногда 20% распознавания. Зависит от настроения спикера.
                    +5
                    Ну раз гуглом, то такое и самому запилить можно. Спасибо.
                      –2
                      Дерзайте! Буду рад адекватным конкурентам, честно.
                        +3
                        Да мне не для конкуренции, а для конкретной задачи. Но раз вы используете гугл, то проще будет с ними напрямую работать, без посредника.
                      +2
                      Хорошо, что я прочитал этот комментарий до того, как плюсанул топик.
                        –1
                        Бывает.
                    –4
                    Дерзайте! Буду рад адекватным конкурентам, честно.
                      +8
                      Не всё распознается, не все работает как надо — мы работаем над качеством.
                      мы пользуемся гуглом как рапознавалкой

                      Вы меня запутали. Над чем вы работаете?
                        0
                        Не совсем понял вопроса — плагин для перевода голоса в текст. Читайте выше.
                          0
                          /del, не туда
                            0
                            Вы писали, что
                            Распознавание: да — тут сложно. Не всё распознается, не все работает как надо — мы работаем над качеством.

                            и
                            <Ответ на вопрос про качество распознавания шотландского английского>
                            По разному — сейчас есть проблемы, но со следующей версии будет лучше и удобнее.

                            Из этого складывается ощущение, что вы улучшаете сам движок распознавания речи в текст. Однако выше вы написали, что используете гугловский. Об этом и вопрос.
                              0
                              Нет — мы работаем над нашей имплементацией нарезки файлов. Мы улучшаем наше «натягивание» гугловского API. С самим гуглом мы ничего не делаем.
                          +2
                          Продукт конечно интересный, но что делать после того, как Skype Desktop API перестанет работать?
                            +2
                            Да и для гугла, я думаю, русский язык не особо приоритетный…
                              0
                              Я не думаю что 40% европейского рынка можно просто так взять и сказать что он «не особо приоритетный»
                              0
                              Привет. Я связался со всеми производителями плагинов для записи. 30% — им все равно. 30% — используйте старую версию скайпа и отмените автоообновление, 40% — мы закроемся. Что произойдет на самом деле — узнаем 1 января, когда обновление произойдет. Кроме того, я задействовал все свои связи (и на уровне разрабов и деректоров) и вразумительного ответа не получил. Все производители плагинов ждут с замиранием сердца. Если ВСЕ перестанет работать, то предо мной будет стоять еще более амбициозная задача — Скайп для бизнеса.
                                +1

                              Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                              Самое читаемое