• Распознавание речи от Яндекса. Под капотом у Yandex.SpeechKit

      imageНа Yet another Conference 2013 мы представили разработчикам нашу новую библиотеку Yandex SpeechKit. Это публичный API для распознавания речи, который могут использовать разработчики под Android и iOS. Скачать SpeechKit, а также ознакомиться с документацией, можно здесь.

      Yandex SpeechKit позволяет напрямую обращаться к тому бэкэнду, который успешно применяется в мобильных приложениях Яндекса. Мы достаточно долго развивали эту систему и сейчас правильно распознаем 94% слов в Навигаторе и Мобильных Картах, а также 84% слов в Мобильном Браузере. При этом на распознавание уходит чуть больше секунды. Это уже весьма достойное качество, и мы активно работаем над его улучшением.

      image

      Можно утверждать, что уже в скором времени голосовые интерфейсы практически не будут отличаться по надежности от классических способов ввода. Подробный рассказ о том, как нам удалось добиться таких результатов, и как устроена наша система, под катом.

      Как устроено распознавание речи в Яндексе
    • Динамическое программирование в алгоритмах распознавания речи

        В системах распознавания речи, содержащих слова, распознавание требует сравнения между входным словом и различными словами в словаре. Эффективное решение проблемы лежит в динамических алгоритмах сравнения, целью которого является введение временных масштабов двух слов в оптимальное соответствие. Алгоритмы такого типа являются динамическими алгоритмами трансформации временной шкалы. В данной статье представлено два варианта реализации алгоритма предназначенные для распознавания отдельных слов.

        Читать дальше →
        • +22
        • 29,9k
        • 3
      • Распознавание речи для чайников

        • Tutorial

        В этой статье я хочу рассмотреть основы такой интереснейшей области разработки ПО как Распознавание Речи. Экспертом в данной теме я, естественно, не являюсь, поэтому мой рассказ будет изобиловать неточностями, ошибками и разочарованиями. Тем не менее, главной целью моего «труда», как можно понять из названия, является не профессиональный разбор проблемы, а описание базовых понятий, проблем и их решений. В общем, прошу всех заинтересовавшихся пожаловать под кат!

        Читать дальше →
      • Кто там? — Идентификация человека по голосу



          Здравствуй, дорогой читатель!

          Предлагаю твоему вниманию интересную и познавательную статью об отдельно взятом методе распознавания говорящего. Всего каких-то пару месяцев назад я наткнулся на статью о применении мел-кепстральных коэффициентов для распознавании речи. Она не нашла отклика, вероятно, из-за недостаточной структурированости, хотя материал в ней освещен очень интересный. Я возьму на себя ответственность донести этот материал в доступной форме и продолжить тему распознавания речи на Хабре.

          Под катом я опишу весь процесс идентификации человека по голосу от записи и обработки звука до непосредственно определения личности говорящего.
          Так чего же мы ждем? Поехали!
        • Мел-кепстральные коэффициенты (MFCC) и распознавание речи

          Недавно я наткнулся на интересную статью, опубликованную rgen3, в которой описан DTW-алгоритм распознавания речи. В общих чертах, это сравнение речевых последовательностей с применением динамического программирования.

          Заинтересовавшись темой, я попробовал применить этот алгоритм на практике, но на этом пути меня поджидало некоторое количество граблей. Прежде всего, что именно нужно сравнивать? Непосредственно звуковые сигналы во временной области — долго и не очень эффективно. Спектрограммы — уже быстрее, но не намного эффективнее. Поиски наиболее рационального представления привели меня к MFCC или Мел-частотным кепстральным коэффициентам, которые часто используются в качестве характеристики речевых сигналов. Здесь я попытаюсь объяснить, что они из себя представляют.
          Читать дальше →
          • +15
          • 47k
          • 9
        • doubleTwist или как троллить Стива Джобса

            Angre Steve Больше года назад на хабре была статья про Йона Йохансена, изветсного так же как DVD-Йон и его участие в стартапе DoubleTwist.
            Вкратце, DVD-Йон, уже знаменитый своей программой взлома защиты DVD дисков (и последовавшей серией безуспешных судебных исков), занимался ни много ни мало а взломом DRM защиты музыкальных (и не только) файлов.
            Причем, в первую очередь — защиты iTunes.
            Уже только это, само по себе способно изрядно разозлить многих борцов за DRM и защиту сверхприбылей правообладателей.

            Но, как оказалось, это — только начало серьезной «вирусной» рекламной кампании очень интересного продукта. Особенно интересно в ней целенаправленная атака на Apple, которая знаменита своей любовью «подшучивать» над другими и при этом свято оберегать свои интеллектуальные права. В общем, мишень выбрана знатная.

            Буквально вчера на youtube появился следующий ролик.

            В общем, «послание» этого ролика понять несложно. Пародируя знаменитую рекламу Apple 1984 года, авторы ролика меняют все местами.
            В роли «оболваниваемых» выступают пользователи айподов, а в роли большого брата теперь кто-то напоминающий самого Стива Джоббса.
            В конце ролика говорится что 6 октября doubleTwist предоставит всем возможность выбора.
            Эти же ребята успели отметиться рекламой на стене AppleStore в Сан-Франциско, гласившей «лекарство от iTunes зависимости»

            Что и говорить, выглядит это все достаточно интригующе.
            Что же можно обнаружить, зайдя на сайт www.doubletwist.com?
            Очень интересную программу!
          • Евросоюз может запретить iPhone

            • Перевод
            image
            Европейская комиссия начала официальное расследование по факту предполагаемого взрыва Apple-телефона в начале этого года, и потребовала объяснений. Пока есть только три зарегистрированных случаев взрыва устройства: в Великобритании, во Франции и в Германии соответственно.
            Миссис Meglena Kuneva, Европейский комиссар по делам потребителей и их прав заявила, что испытания и тесты ведутся в данный момент. И даже если случай подтвердится хотя бы в одной стране, то этот телефон будет запрещен на рынке ЕС из-за возможного нанесения вреда гражданам ЕС.
            Apple не отреагировала на угрозу ЕС. Европейский союз отнюдь не рынок, которым можно пренебречь, и возможный запрет комиссии может означать конец всех наград и рейтинга устройства, особенно, если другие страны последуют этому примеру.
          • Нанотехнологии, говорите?

              Некоторое время назад студент Массачусетского технологического института Эрик К.Дрекслер высказал идею о необходимости перевода технических систем с макро- на микроуровень, путем создания молекулярных машин — искусственных подобий биологических молекул, работающих в живых клетках.

              Э.К.Дрекслер с небольшой группой энтузиастов начал работы по нанотехнологии в Стэнфордском университете.
              Читать дальше →
            • Разработка дополнений только что стала проще

              • Перевод
              [Developer Hub Logo]С превеликой радостью объявляем, что мы только что запустили Add-on Developer Hub (beta) — всеобъемлющий сборник сведений, где разработчики дополнений могут выяснить, зачем они пожелали бы изготовить дополнение, и как делают дополнения, и управлять списками своих дополнений.

              Читать дальше →
            • 30 сентября: что нам готовит превью-версия Google Wave

                На сайте readwriteweb.com появилась информация о том, какие новости о Волне нас ждут 30 сентября (спасибо Алексею Исаченко за нахождение этой статьи).

                Автор статьи побеседовал с командой Google Wave и сообщает такие подробности:
                • Google разошлет около 100 000 инвайтов, начиная с 30 сентября.
                  Их планируется примерно такое количество, но команда GW предполагает, что инвайтов в итоге может оказаться и больше. Все будет зависеть от успешности работ над стабильностью системы.
                • инвайты получат три группы пользователей: нынешние участники «песочницы», те пользователи, которые заполняли заявку на доступ к GW в течение нескольких последних месяцев (получат аккаунт в режиме «раньше пришел, раньше обслужили») и некоторое количество отобранных корпоративных (enterprise) пользователей с аккаунтами Google Apps.
                • дополнительные инвайты будут рассылаться по мере того, как команда GW будет увеличивать производительность Волны.
                • пользователи не смогут непосредственно рассылать инвайты друзьям, но каждый пользователь Волны сможет «номинировать» восемь (8) своих друзей Оушена, которых переставят в начало очереди на получение новых аккаунтов.
                • все нынешние аккаунты из «песочницы» будут перемещены на домен wave.google.com.
                  Новые фичи здесь, конечно, появятся в ближайшие месяцы, но по-прежнему главное внимание сейчас уделяется масштабированию системы. Не исключается появление креш-сообщений («Все хорошо, прекрасная маркиза») и будут периодические отключения системы для обновления, как сейчас в девелоперской версии.
                • система управления контактами будет интегрирована с Google Contacts.
                  Пока там будут показываться только пользователи, имеющие аккаунты в Google Wave.
                • команда Google Wave отберет некоторое количество роботов и виджетов, созданных разработчиками.
                  Сейчас в Волне не будет AppStore или рынка роботов и виджетов. Пользователи смогут устанавливать себе лишь небольшое число отобранных командой GW приложений.
                • пользователям Internet Explorer будет выдаваться предупреждение о необходимости установить и использовать Chrome Frame.
                  Вот об этом плагине по-русски на Хабре.

                Еще о предстоящих изменениях можно прочитать в сообщении Ларса Расмуссена и Стефани Хеннон в официальном блоге Гугла и в сообщении Стефани Хеннон в блоге разработчиков Google Wave (на английском языке).

                По-русски новости о Волне появляются в нашем блоге или в группе.
              • Начинается масштабное тестирование Google Wave

                  Как и обещалось, Google расширяет программу бета-тестирования приложения Google Wave до 100 000 человек. Один из авторов системы Ларс Расмуссен сообщил, что сегодня компания разошлёт приглашения разработчикам, индивидуальным тестерам и некоторым корпоративным пользователям Google Apps, которые изъявили желание посмотреть на Google Wave в действии. Недостатка в желающих не наблюдается. Для участия в бета-тестировании записались уже более миллиона человек.

                  Как известно, Google Wave — ни на что не похожее веб-приложение для коммуникаций в реальном режиме времени, сочетающее в себе элементы чата, вики, блогов и фотообменных сайтов. См. обзоры и обсуждение на Хабре (1, 2, 3). Авторы программы — австралийцы братья Расмуссены, известные также как авторы неплохой программы Google Maps, ставшей после своего выхода стандартом де-факто для картографических веб-приложений.
                  Читать дальше →
                • Использование промышленных роботов в строительстве

                    image
                    Сегодня, 30 сентября 2009 в 19.00 в «Storefront for Art and Architecture» («Витрина Архитектуры и Искусства») Нью-Йорк, состоялось открытие новой выставки на которой было продемонстрировано исследование, проведенное в течение последних 3 лет в ETH Zurich швейцарскими архитекторами Грамацио и Колер (Gramazio & Kohler): полномасштабное архитектурное производство с использованием промышленных роботов. В это же время на Pike st. NYC был запущен первый архитектурный проект в США, который будет построен полностью с применением промышленного робота.
                    Читать дальше →
                  • Почему российский Яндекс – наиболее быстро растущая поисковая система?

                    • Перевод
                    Взгляд Search Engine Watch на поисковую систему Яндекс, её рост и развитие. Автор статьи — Энди Аткинс-Крюгер (Search Engine Watch) Перевод выполнен при поддержке компании Marketing Drive

                    ComScore опубликовал данные за Август, показывающие существенный рост поисковой активности во всем мире – история, которая породила множество публикаций. Однако в этом релизе осталось незамеченным утверждение: «…российская поисковая система Яндекс растет наиболее быстро (94%) среди поисковиков десятки лидеров». Так почему же Яндекс развивается так быстро?

                    Читать дальше →
                  • Архитетктурная САПР программа 1963 года

                      image
                      46 лет назад, для своей докторской диссертации Айвен Сазерленд разработал программу Sketchpad (aka Robot Draftsman), она помогла изменить способ взаимодействия людей с компьютерами и заложили основу для создания пользовательского графического интерфейса.
                      Читать дальше →
                    • В США появится сеть АЗС для электромобилей

                        image
                        В настоящее время одной из главных проблем для широкого распространения электромобилей является отсутствие развитой сети электрозаправок. В США намерены решить эту проблему. Компания SolarCity совместно с Rabobank, при поддержке исполнительного директора Tesla Motors, Элона Маска (Elon Musk), объявила, что строит коридор из быстро-зарядных станций для электромобилей.
                        Добавил: видео, рус. электромобиль
                        Читать дальше →
                      • Вышел SPB Mobile Shell 3.5

                          Добрый день!

                          Хочу поделиться с вами хорошей новостью. В свет вышла новая версия всем известного продукта SPB Mobile Shell (теперь с циферками 3.5)

                          Эта версия программы полностью замещает стандартный экран «сегодня» и предоставляет удобный доступ к программам, прогнозу погоды, календарю и т.д.
                          А так же появились новые виджеты: задачи, фоторамка (виджет и полноэкранный режим), статусы Facebook и Twitter, напоминания о днях рождения, имя сотового оператора, будильник и дата. Улучшены виджеты: контакты, менеджер беспроводных модулей и погода.
                          Кроме того, дебютировали: 3D-просмотрщик e-mail и SMS, доступ в онлайн-каталог фоновых рисунков, поддержка сенсора движения в 3D-карусели, корзина для удаления виджетов (в режиме редактирования вида рабочего стола) и многое другое.



                          Было устранено много ошибок и устранены проблемы производительностью и утечкой памяти.
                          Программа стала явно шустрее (заметно даже на глаз) и намного приятнее!

                          Спешу поделиться с вами волшебной ссылкой: нажать сюда

                          Пользуйтесь на здоровье!
                        • Анонимный web-серфинг с Android

                          • Перевод
                          image
                          Группа разработчиков Digital Technology Group (DTG) от Кембриджского Университета выпустила приложение для платформы Android, которое позволяет пользователям данной платформы анонимно путешествовать по сети, используя The Onion Router, который часто называют просто TOR. Это свободная программа, разработанная с целью предоставить пользователям возможность анонимного серфинга. Данная программа работает на основе технологии peer2peer, это значит, что используя соединение через распределенную сеть серверов, поддерживаемыми энтузиастами со всего мира, предотвращается возможность опеределения сайтами физического положения пользователя.
                          Читать дальше →
                        • ФСБ сможет аннулировать домен по звонку?

                            EyeРунет заполнен негодованием по срокам, содержащимся в новым законопроекте. Похоже многие баловались травкой и дефейсом в молодости :)
                            Но в предлагаемом законе не только ужесточение наказание за неправомерный доступ. Он фактически передает государственным органам, осуществляющим оперативно-разыскную деятельность полный контроль за рунетом — они не только смогут получить любую информацию, ни смогут также вполне законно надавить на любой сайт, вплоть до его уничтожения. Ведь домен для сайта — всё !?
                            подробнее
                          • 29 сентября 2009 в 10:02

                            UTP — Технический Подкаст от Umputun, Выпуск 1

                            Переход на распределенные системы контроля версий, часть 1

                            — с какой целью и для кого
                            — ограничения разговорного жанра
                            — зачем переходить на распределенные системы
                            — 9 радостей перехода
                            — Проблемы тоже есть, о них в части #2

                            * Linus Torvalds on git (видео)
                            * Линус Торвальдс о GIT, видеоперевод 8 частей (спасибо Vadikus)

                            подкаст живет на utp.umputun.com
                            прослушан 612 раз