Про применение систем распознавания речи в спецслужбах я могу только многозначительно промолчать. Если уж Google позволил себе сделать свободно-доступной систему логов телефонных разговоров, то за ширмой, я думаю, уже выжали из этой технологии все что возможно. И анализ эмоций, и распознавание диктора, и поиск по «слову-маркеру»…
В той ссылке которую вы дали, насколько я понял, ведется речь об анализе речи на предмет эмоциональной насыщенности. При этом, про распознавание слов и речи ничего не говорится.
Скорее всего, оно уже реализовано, и если вы по междугородге говорите на чистейшем англицком — то, скорее всего, вы уже записаны ;0) А вот с русскими словарями, к сожалению, пока что проблемы…
А что промолчать? По Гуглу и сужу. Русский во времена холодной войны был приоритетным по прослушке, так что вполне могли сделать. И еще не пришло время рассекречивать такие проекты — конечно в статьях основанных на фактах, а не на домыслах, не будет речи о распознавании.
Почему именно по междугородке? Думаете у «них» есть технология прослушивания проводных переговоров? У «нас» то есть СОРМ, а у «них» есть что то кроме радиоразведки?
Это вы к чему? Мой пост был комментарием к фразе: «У «нас» то есть СОРМ, а у «них» есть что то». Пожалуйста, знакомтесь что есть у них и как называется. А skype дело темное и исследоваию не подлежит. Хотите спать спокойно молчите ;). Ну или как минимум только открытые технологии.
Америка давно не скрывает, что слушает и распознаёт переговоры по сот. Подробностей не помню — в инете много инфы про это. Это не скрывают. Как всегда говорят против терроризма :)
Наши, сотовые тоже давно слушают, и не скрывают сильно это. И текст распознают тоже.
Помню как-то по орт даже репортаж был, мол готовилось заказное убийство на какого-то серьёзного человека нашей страны, и спалили это благодаря тому, что обсуждали заказ открытым текстом по сот телефону. Я тогда ещё удивился, как так, зачем рассказали это массам про эту технологию.
Ну на самом деле, поскольку эта система узкоспециализированная — то ей не нужно быть супервысокотехнологичной: если просто надиктовывать ей текст то скорее всего она большую часть его не распознает, или будет работать ужасно медленно (с большим словарем); а вот на ограниченном словаре фраз типа «застрелить, оружие, взрыв, ...» — в самый раз. А этого достаточно, что бы пометить конкретный разговор, который впоследствии будет перепроверен «вручную». А раз достаточно — то тратится на приближение к универсальному распознаванию вряд ли кто-то будет, т.к. при высокой универсальности еще надо как минимум сохранить ту узкоспециализированность, а это сложно. Усложнять себе работу без улучшения результата (им то нужно потенциальных преступников отлавливать, а не софт для перевода речи в тест, разработать) — бессмысленные затраты времени и денег. Соответственно ничего сверхкрутого у спецслужб быть не обязано (хотя, в принципе, и может).
Посмотрим как пойдет.
Мат аппарат будет обязательно (правда, боюсь с формулами тут придется повозиться).
Хотя бы в общих чертах расскажу про цепи маркова, вейвлеты, фильтрацию. От нейросетей тоже никуда не деться.
А с реализованными библиотеками будет труднее: без испытания про них говорить нечего, а на это требуется тьма времени…
Великолепная статья! Очень жду продолжения.
А нет ли у вас ссылок хороших по теме? Было бы очень интересно почитать про это дело по-глубже, про вейвлет-преобразование то же…
Ах эти вейвлеты…
Да, про них буду писать. К сожалению, сил пока нет скомпоновать всю библиографию, но для затравки — самое оно (практически библия распознавателя речи):
Huang Xuedong. Spoken language processing: a guide to theory, algorithm and system development. –New Jersey: Prentice Hall PTR, 2001. – 980 с.
У меня где-то была, как найду — выложу обязательно.
Взял на себя смелость перезалить, ибо Рапидшара как-то совсем сдает, 5-минутные задержки — это круто.
narod.ru/disk/10964878000/Spoken%20Language%20Processing%2C%20A%20Guide%20to%20Theory%2C%20Algorithm%20and%20System%20Development%20-%20ISBN%200130226165%20-%20965s%20-%20Laxxuss.pdf.html
А Evernote — наша разработка?
Вообще, было бы очень интересно узнать, для распознавания они используют «коробочные» решения или сами реализуют?..
Глубоко сомневаюсь, что сегодня ради такой системки будет свою библиотеку распознавания речи писать, обучать и т.п.
При чем тут чья разработка Evernote? Я говорил о том, что vselisdelal.ru распознают для Evernote — видел рекламу в клиенте :) vselisdelal.ru/Evernote.aspx
А что они используют написано по ссылке приведенной выше. Цитирую: «П.с. 1. так как этот сервис идет на базе технических решений другого (основного) проекта, то мы смогли отстоять возможность пользоваться им бесплатно.»
Очень хорошее введение! Спасибо!
Надеюсь, эта статья поднимет новую волну разработок.
Действительно, очень не хватает русскоязычных движков.
Очень не хватает!
Для тех кого интересует распознование речи: voxforge.org — opensource проект, нужны добровольцы, нужно наговаривать текст онлайн, прямо на странице. Многие opensource программы нуждаются в этой базе (например: Julius, Sphinx, HTK)
Ох, как я не навижу эти распозновалки в колинг центрах.
У меня произношение очень даже на уровне, а они даже Yes или No часто не могут разобрать не говоря уже о выборе варианта adviser из меню. Уж тупо на диалпаде быстрее было. а что больше всего огорчает, что менеджер все равно переспрашивает, как правило, все что ты мучался вбивал и надиктовывал за крайне редким исключением.
Для своего психологического (магистратура РГГУ) исследования думаю попробовать написать инструмент. Хотел просто понять, насколько это сложно, сам программист с 10-летним стажем. У меня задача на первый взгляд кажется упрощенной — мне надо в записи терапевтической сессии выделять некие ключевые слова, сказанные клиентом — например, «я». именно отдельные слова, как «Я программист», а чтобы слова «Молния!» пропускались. Или «сам», «сам себе». А так же, возможно, другие местоимения и их формы. Не посоветуете, куда посмотреть, что почитать? 4 года прошло, но вдруг у вас есть что-то новое по теме.
Распознавание речи. Часть 1. Классификация систем распознавания речи