Интересная, интересная, продолжайте! Однако, советую глянуть на предшествующие и работы по теме компьютерного разбора текстов на естественном языке, некоторые из них описывались и на Хабре тоже. В частности, по грамматической и семантической разметке, корпусной лингвистике, идеям Ричарда Монтегю и другим смежным темам.
Вам может быть интересна разработка языка LSPL, её делают на ВМК МГУ. Там тоже задаются шаблоны в формате грамматик, и есть рабочий интерпретатор (во всяком случае, когда я им занимался, он работал). Правда, интерпретатор на Java, но можно состыковать через командную строку (тоже делал).
Идея правильная, и даже ведущая к хорошим результатам. Проблема в том, что для получения точности разметки в 96% нужно более 2-х тысяч правил, что не есть гуд. Люди, прошедшие по этому пути ранее, в конце концов свернули в сторону статистической лингвистики, где и получили точности выше 98%.
Спасибо, отличная статья. Расскажите подробнее как у вас по части определения смысла. И ещё если кому то интересно — в питоне есть хорошая библиотека pymorphy.
К сожалению, ничего не могу вам посоветовать. Я в какой-то мере дилетант в этой области, несмотря на данную работу. Почти всё приличное, насколько я знаю, проприетарное и платное. Напрашиваются наработки Яндекса и Lingvo, но там, кажется, больше упор на русский язык, впрочем, могу ошибаться. Бесплатно распространяется Томита-парсер, но без правил (правила, видимо и есть главная ценность, которая под проприетарной лицензией).
Разбор естественного языка: грамматическая нотация