Comments 13
Очень интересная тема, делаю доклад на очень похожую тему на конференции «Стачка»: nastachku.ru/lectures?lecture_id=318#lecture_318
+1
Судя по обилию комментариев — не очень (грустная улыбка).
0
Интересная, интересная, продолжайте! Однако, советую глянуть на предшествующие и работы по теме компьютерного разбора текстов на естественном языке, некоторые из них описывались и на Хабре тоже. В частности, по грамматической и семантической разметке, корпусной лингвистике, идеям Ричарда Монтегю и другим смежным темам.
+1
В частности, можете посмотреть вот эту вещь: tech.yandex.ru/tomita/
0
Предполагаю, что данная тема способна заинтересовать не столько людей, сколько хотелось бы. Но от этого она не становится менее интересной.
0
Вам может быть интересна разработка языка LSPL, её делают на ВМК МГУ. Там тоже задаются шаблоны в формате грамматик, и есть рабочий интерпретатор (во всяком случае, когда я им занимался, он работал). Правда, интерпретатор на Java, но можно состыковать через командную строку (тоже делал).
+1
Идея правильная, и даже ведущая к хорошим результатам. Проблема в том, что для получения точности разметки в 96% нужно более 2-х тысяч правил, что не есть гуд. Люди, прошедшие по этому пути ранее, в конце концов свернули в сторону статистической лингвистики, где и получили точности выше 98%.
kelijah.livejournal.com/149864.html
kelijah.livejournal.com/149864.html
+2
Спасибо, отличная статья. Расскажите подробнее как у вас по части определения смысла. И ещё если кому то интересно — в питоне есть хорошая библиотека pymorphy.
0
Спасибо за интересную публикацию! Порекомендуйте, пожалуйста, синтаксический анализатор для английского языка.
0
К сожалению, ничего не могу вам посоветовать. Я в какой-то мере дилетант в этой области, несмотря на данную работу. Почти всё приличное, насколько я знаю, проприетарное и платное. Напрашиваются наработки Яндекса и Lingvo, но там, кажется, больше упор на русский язык, впрочем, могу ошибаться. Бесплатно распространяется Томита-парсер, но без правил (правила, видимо и есть главная ценность, которая под проприетарной лицензией).
0
Возьмите code.google.com/p/berkeleyparser или nlp.stanford.edu/software/lex-parser.shtml
0
Есть еще неплохой dependency-парсер для русского языка на базе malt parser.
corpus.leeds.ac.uk/mocky
corpus.leeds.ac.uk/mocky
0
Only those users with full accounts are able to leave comments. Log in, please.
Разбор естественного языка: грамматическая нотация