Comments 40
Эшелон то распознает. Не исключено что и Русскую речь.
habrahabr.ru/blogs/lenta/1986/
habrahabr.ru/blogs/lenta/1986/
Про применение систем распознавания речи в спецслужбах я могу только многозначительно промолчать. Если уж Google позволил себе сделать свободно-доступной систему логов телефонных разговоров, то за ширмой, я думаю, уже выжали из этой технологии все что возможно. И анализ эмоций, и распознавание диктора, и поиск по «слову-маркеру»…
В той ссылке которую вы дали, насколько я понял, ведется речь об анализе речи на предмет эмоциональной насыщенности. При этом, про распознавание слов и речи ничего не говорится.
Скорее всего, оно уже реализовано, и если вы по междугородге говорите на чистейшем англицком — то, скорее всего, вы уже записаны ;0) А вот с русскими словарями, к сожалению, пока что проблемы…
В той ссылке которую вы дали, насколько я понял, ведется речь об анализе речи на предмет эмоциональной насыщенности. При этом, про распознавание слов и речи ничего не говорится.
Скорее всего, оно уже реализовано, и если вы по междугородге говорите на чистейшем англицком — то, скорее всего, вы уже записаны ;0) А вот с русскими словарями, к сожалению, пока что проблемы…
А что промолчать? По Гуглу и сужу. Русский во времена холодной войны был приоритетным по прослушке, так что вполне могли сделать. И еще не пришло время рассекречивать такие проекты — конечно в статьях основанных на фактах, а не на домыслах, не будет речи о распознавании.
Почему именно по междугородке? Думаете у «них» есть технология прослушивания проводных переговоров? У «нас» то есть СОРМ, а у «них» есть что то кроме радиоразведки?
Почему именно по междугородке? Думаете у «них» есть технология прослушивания проводных переговоров? У «нас» то есть СОРМ, а у «них» есть что то кроме радиоразведки?
Промолчу, ибо не компетентен :0)
И про прослушку знаю не больше, чем в «Популярной Механике» пишут.
И про прослушку знаю не больше, чем в «Популярной Механике» пишут.
Если интересно:
www.computerra.ru/414976/?phrase_id=10675692
www.computerra.ru/414976/?phrase_id=10675692
Америка давно не скрывает, что слушает и распознаёт переговоры по сот. Подробностей не помню — в инете много инфы про это. Это не скрывают. Как всегда говорят против терроризма :)
Наши, сотовые тоже давно слушают, и не скрывают сильно это. И текст распознают тоже.
Помню как-то по орт даже репортаж был, мол готовилось заказное убийство на какого-то серьёзного человека нашей страны, и спалили это благодаря тому, что обсуждали заказ открытым текстом по сот телефону. Я тогда ещё удивился, как так, зачем рассказали это массам про эту технологию.
Наши, сотовые тоже давно слушают, и не скрывают сильно это. И текст распознают тоже.
Помню как-то по орт даже репортаж был, мол готовилось заказное убийство на какого-то серьёзного человека нашей страны, и спалили это благодаря тому, что обсуждали заказ открытым текстом по сот телефону. Я тогда ещё удивился, как так, зачем рассказали это массам про эту технологию.
Ну на самом деле, это еще далеко не факт что там применялось именно распознавание. Ну или баба клава на проводе :)
Или они там прямо про парсеры говорили?
Или они там прямо про парсеры говорили?
ты представляешь сколько нужно баб Клав?
Да, так и говорили про распознание текста по словарю.
Да, так и говорили про распознание текста по словарю.
Ну на самом деле, поскольку эта система узкоспециализированная — то ей не нужно быть супервысокотехнологичной: если просто надиктовывать ей текст то скорее всего она большую часть его не распознает, или будет работать ужасно медленно (с большим словарем); а вот на ограниченном словаре фраз типа «застрелить, оружие, взрыв, ...» — в самый раз. А этого достаточно, что бы пометить конкретный разговор, который впоследствии будет перепроверен «вручную». А раз достаточно — то тратится на приближение к универсальному распознаванию вряд ли кто-то будет, т.к. при высокой универсальности еще надо как минимум сохранить ту узкоспециализированность, а это сложно. Усложнять себе работу без улучшения результата (им то нужно потенциальных преступников отлавливать, а не софт для перевода речи в тест, разработать) — бессмысленные затраты времени и денег. Соответственно ничего сверхкрутого у спецслужб быть не обязано (хотя, в принципе, и может).
очень милая статья, автор молодец перелопатив материал
немного забегу вперед и спрошу, нетерпится — сколько планируется их в цикле? про что еще поведаете?
немного забегу вперед и спрошу, нетерпится — сколько планируется их в цикле? про что еще поведаете?
Сколько — пока не знаю точно.
Пока думаю что не меньше 3-4 частей обзорных.
Дальше — война план покажет.
Что расскажу — вот тут написал: domage.habrahabr.ru/blog/64572/#comment_1797664
Пока думаю что не меньше 3-4 частей обзорных.
Дальше — война план покажет.
Что расскажу — вот тут написал: domage.habrahabr.ru/blog/64572/#comment_1797664
а про мат аппарат будет? и про реализованные библиотеки для распознования речи
Посмотрим как пойдет.
Мат аппарат будет обязательно (правда, боюсь с формулами тут придется повозиться).
Хотя бы в общих чертах расскажу про цепи маркова, вейвлеты, фильтрацию. От нейросетей тоже никуда не деться.
А с реализованными библиотеками будет труднее: без испытания про них говорить нечего, а на это требуется тьма времени…
Мат аппарат будет обязательно (правда, боюсь с формулами тут придется повозиться).
Хотя бы в общих чертах расскажу про цепи маркова, вейвлеты, фильтрацию. От нейросетей тоже никуда не деться.
А с реализованными библиотеками будет труднее: без испытания про них говорить нечего, а на это требуется тьма времени…
Великолепная статья! Очень жду продолжения.
А нет ли у вас ссылок хороших по теме? Было бы очень интересно почитать про это дело по-глубже, про вейвлет-преобразование то же…
А нет ли у вас ссылок хороших по теме? Было бы очень интересно почитать про это дело по-глубже, про вейвлет-преобразование то же…
Ах эти вейвлеты…
Да, про них буду писать. К сожалению, сил пока нет скомпоновать всю библиографию, но для затравки — самое оно (практически библия распознавателя речи):
Huang Xuedong. Spoken language processing: a guide to theory, algorithm and system development. –New Jersey: Prentice Hall PTR, 2001. – 980 с.
У меня где-то была, как найду — выложу обязательно.
Да, про них буду писать. К сожалению, сил пока нет скомпоновать всю библиографию, но для затравки — самое оно (практически библия распознавателя речи):
Huang Xuedong. Spoken language processing: a guide to theory, algorithm and system development. –New Jersey: Prentice Hall PTR, 2001. – 980 с.
У меня где-то была, как найду — выложу обязательно.
Нашел… :) Спасибо больше, постараюсь что-нибудь прочитать и усвоить, надеюсь знания языка хватит :)
Желаю вам ещё много хороших статей! :)
Желаю вам ещё много хороших статей! :)
Можешь сразу ссылку кинуть сюда?
а vselisdelal.ru разве не распознает?
О!
Да.
Распознает.
habrahabr.ru/blogs/startup/36752/
Если знаете еще подобные сервисы, ориентированные на русский язык, было бы интересно узнать и о них.
Да.
Распознает.
habrahabr.ru/blogs/startup/36752/
Если знаете еще подобные сервисы, ориентированные на русский язык, было бы интересно узнать и о них.
О!
Да.
Распознает.
habrahabr.ru/blogs/startup/36752/
Если знаете еще подобные сервисы, ориентированные на русский язык, было бы интересно узнать и о них.
Да.
Распознает.
habrahabr.ru/blogs/startup/36752/
Если знаете еще подобные сервисы, ориентированные на русский язык, было бы интересно узнать и о них.
На сколько я понимаю, распознает. Даже в Evernote предлагают создавать заметки по телефону голосом.
А Evernote — наша разработка?
Вообще, было бы очень интересно узнать, для распознавания они используют «коробочные» решения или сами реализуют?..
Глубоко сомневаюсь, что сегодня ради такой системки будет свою библиотеку распознавания речи писать, обучать и т.п.
Вообще, было бы очень интересно узнать, для распознавания они используют «коробочные» решения или сами реализуют?..
Глубоко сомневаюсь, что сегодня ради такой системки будет свою библиотеку распознавания речи писать, обучать и т.п.
При чем тут чья разработка Evernote? Я говорил о том, что vselisdelal.ru распознают для Evernote — видел рекламу в клиенте :) vselisdelal.ru/Evernote.aspx
А что они используют написано по ссылке приведенной выше. Цитирую: «П.с. 1. так как этот сервис идет на базе технических решений другого (основного) проекта, то мы смогли отстоять возможность пользоваться им бесплатно.»
А что они используют написано по ссылке приведенной выше. Цитирую: «П.с. 1. так как этот сервис идет на базе технических решений другого (основного) проекта, то мы смогли отстоять возможность пользоваться им бесплатно.»
Но судя по предоставляемым возможностям, там человек сидит.
Очень хорошее введение! Спасибо!
Надеюсь, эта статья поднимет новую волну разработок.
Действительно, очень не хватает русскоязычных движков.
Очень не хватает!
Надеюсь, эта статья поднимет новую волну разработок.
Действительно, очень не хватает русскоязычных движков.
Очень не хватает!
Для тех кого интересует распознование речи: voxforge.org — opensource проект, нужны добровольцы, нужно наговаривать текст онлайн, прямо на странице. Многие opensource программы нуждаются в этой базе (например: Julius, Sphinx, HTK)
Хуанг Хуедонг и ДонгСук хех, представляю как они ржут с наших «Иван Сидоров»,…
Ох, как я не навижу эти распозновалки в колинг центрах.
У меня произношение очень даже на уровне, а они даже Yes или No часто не могут разобрать не говоря уже о выборе варианта adviser из меню. Уж тупо на диалпаде быстрее было. а что больше всего огорчает, что менеджер все равно переспрашивает, как правило, все что ты мучался вбивал и надиктовывал за крайне редким исключением.
У меня произношение очень даже на уровне, а они даже Yes или No часто не могут разобрать не говоря уже о выборе варианта adviser из меню. Уж тупо на диалпаде быстрее было. а что больше всего огорчает, что менеджер все равно переспрашивает, как правило, все что ты мучался вбивал и надиктовывал за крайне редким исключением.
Для своего психологического (магистратура РГГУ) исследования думаю попробовать написать инструмент. Хотел просто понять, насколько это сложно, сам программист с 10-летним стажем. У меня задача на первый взгляд кажется упрощенной — мне надо в записи терапевтической сессии выделять некие ключевые слова, сказанные клиентом — например, «я». именно отдельные слова, как «Я программист», а чтобы слова «Молния!» пропускались. Или «сам», «сам себе». А так же, возможно, другие местоимения и их формы. Не посоветуете, куда посмотреть, что почитать? 4 года прошло, но вдруг у вас есть что-то новое по теме.
Sign up to leave a comment.
Распознавание речи. Часть 1. Классификация систем распознавания речи