ababo Apr 7 2015 at 07:46

Разбор естественного языка: грамматическая нотация

6 min

16K

Compilers * Go *

+18

Comments 13

a11aud Apr 7 2015 at 09:08

Очень интересная тема, делаю доклад на очень похожую тему на конференции «Стачка»: nastachku.ru/lectures?lecture_id=318#lecture_318

ababo Apr 7 2015 at 09:15

Судя по обилию комментариев — не очень (грустная улыбка).

Ostrie_Brevna Apr 7 2015 at 09:33

Интересная, интересная, продолжайте! Однако, советую глянуть на предшествующие и работы по теме компьютерного разбора текстов на естественном языке, некоторые из них описывались и на Хабре тоже. В частности, по грамматической и семантической разметке, корпусной лингвистике, идеям Ричарда Монтегю и другим смежным темам.

Ostrie_Brevna Apr 7 2015 at 09:37

В частности, можете посмотреть вот эту вещь: tech.yandex.ru/tomita/

zuyac Apr 7 2015 at 16:12

Предполагаю, что данная тема способна заинтересовать не столько людей, сколько хотелось бы. Но от этого она не становится менее интересной.

janvarev Apr 7 2015 at 09:28

Вам может быть интересна разработка языка LSPL, её делают на ВМК МГУ. Там тоже задаются шаблоны в формате грамматик, и есть рабочий интерпретатор (во всяком случае, когда я им занимался, он работал). Правда, интерпретатор на Java, но можно состыковать через командную строку (тоже делал).

ServPonomarev Apr 7 2015 at 10:03

Идея правильная, и даже ведущая к хорошим результатам. Проблема в том, что для получения точности разметки в 96% нужно более 2-х тысяч правил, что не есть гуд. Люди, прошедшие по этому пути ранее, в конце концов свернули в сторону статистической лингвистики, где и получили точности выше 98%.

kelijah.livejournal.com/149864.html

MikeLP Apr 8 2015 at 00:46

Спасибо, отличная статья. Расскажите подробнее как у вас по части определения смысла. И ещё если кому то интересно — в питоне есть хорошая библиотека pymorphy.

AlbertMHLT Apr 8 2015 at 08:14

Насколько я понимаю, pymorphy является морфологическим анализатором, а не синтаксическим (как у автора публикации)?

AlbertMHLT Apr 8 2015 at 08:13

Спасибо за интересную публикацию! Порекомендуйте, пожалуйста, синтаксический анализатор для английского языка.

ababo Apr 8 2015 at 08:23

К сожалению, ничего не могу вам посоветовать. Я в какой-то мере дилетант в этой области, несмотря на данную работу. Почти всё приличное, насколько я знаю, проприетарное и платное. Напрашиваются наработки Яндекса и Lingvo, но там, кажется, больше упор на русский язык, впрочем, могу ошибаться. Бесплатно распространяется Томита-парсер, но без правил (правила, видимо и есть главная ценность, которая под проприетарной лицензией).

buriy Apr 15 2015 at 05:18

Возьмите code.google.com/p/berkeleyparser или nlp.stanford.edu/software/lex-parser.shtml

Donskoy Apr 15 2015 at 10:25

Есть еще неплохой dependency-парсер для русского языка на базе malt parser.
corpus.leeds.ac.uk/mocky