Комментарии 13
Очень интересная тема, делаю доклад на очень похожую тему на конференции «Стачка»: nastachku.ru/lectures?lecture_id=318#lecture_318
Судя по обилию комментариев — не очень (грустная улыбка).
Интересная, интересная, продолжайте! Однако, советую глянуть на предшествующие и работы по теме компьютерного разбора текстов на естественном языке, некоторые из них описывались и на Хабре тоже. В частности, по грамматической и семантической разметке, корпусной лингвистике, идеям Ричарда Монтегю и другим смежным темам.
В частности, можете посмотреть вот эту вещь: tech.yandex.ru/tomita/
Предполагаю, что данная тема способна заинтересовать не столько людей, сколько хотелось бы. Но от этого она не становится менее интересной.
Идея правильная, и даже ведущая к хорошим результатам. Проблема в том, что для получения точности разметки в 96% нужно более 2-х тысяч правил, что не есть гуд. Люди, прошедшие по этому пути ранее, в конце концов свернули в сторону статистической лингвистики, где и получили точности выше 98%.
kelijah.livejournal.com/149864.html
kelijah.livejournal.com/149864.html
Спасибо, отличная статья. Расскажите подробнее как у вас по части определения смысла. И ещё если кому то интересно — в питоне есть хорошая библиотека pymorphy.
Спасибо за интересную публикацию! Порекомендуйте, пожалуйста, синтаксический анализатор для английского языка.
К сожалению, ничего не могу вам посоветовать. Я в какой-то мере дилетант в этой области, несмотря на данную работу. Почти всё приличное, насколько я знаю, проприетарное и платное. Напрашиваются наработки Яндекса и Lingvo, но там, кажется, больше упор на русский язык, впрочем, могу ошибаться. Бесплатно распространяется Томита-парсер, но без правил (правила, видимо и есть главная ценность, которая под проприетарной лицензией).
Возьмите code.google.com/p/berkeleyparser или nlp.stanford.edu/software/lex-parser.shtml
Есть еще неплохой dependency-парсер для русского языка на базе malt parser.
corpus.leeds.ac.uk/mocky
corpus.leeds.ac.uk/mocky
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Разбор естественного языка: грамматическая нотация