Как стать автором
Обновить

Комментарии 13

Судя по обилию комментариев — не очень (грустная улыбка).
Интересная, интересная, продолжайте! Однако, советую глянуть на предшествующие и работы по теме компьютерного разбора текстов на естественном языке, некоторые из них описывались и на Хабре тоже. В частности, по грамматической и семантической разметке, корпусной лингвистике, идеям Ричарда Монтегю и другим смежным темам.
В частности, можете посмотреть вот эту вещь: tech.yandex.ru/tomita/
Предполагаю, что данная тема способна заинтересовать не столько людей, сколько хотелось бы. Но от этого она не становится менее интересной.
Вам может быть интересна разработка языка LSPL, её делают на ВМК МГУ. Там тоже задаются шаблоны в формате грамматик, и есть рабочий интерпретатор (во всяком случае, когда я им занимался, он работал). Правда, интерпретатор на Java, но можно состыковать через командную строку (тоже делал).
Идея правильная, и даже ведущая к хорошим результатам. Проблема в том, что для получения точности разметки в 96% нужно более 2-х тысяч правил, что не есть гуд. Люди, прошедшие по этому пути ранее, в конце концов свернули в сторону статистической лингвистики, где и получили точности выше 98%.

kelijah.livejournal.com/149864.html

Спасибо, отличная статья. Расскажите подробнее как у вас по части определения смысла. И ещё если кому то интересно — в питоне есть хорошая библиотека pymorphy.
Насколько я понимаю, pymorphy является морфологическим анализатором, а не синтаксическим (как у автора публикации)?
Спасибо за интересную публикацию! Порекомендуйте, пожалуйста, синтаксический анализатор для английского языка.
К сожалению, ничего не могу вам посоветовать. Я в какой-то мере дилетант в этой области, несмотря на данную работу. Почти всё приличное, насколько я знаю, проприетарное и платное. Напрашиваются наработки Яндекса и Lingvo, но там, кажется, больше упор на русский язык, впрочем, могу ошибаться. Бесплатно распространяется Томита-парсер, но без правил (правила, видимо и есть главная ценность, которая под проприетарной лицензией).
Возьмите code.google.com/p/berkeleyparser или nlp.stanford.edu/software/lex-parser.shtml
Есть еще неплохой dependency-парсер для русского языка на базе malt parser.
corpus.leeds.ac.uk/mocky
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории