Как стать автором
Обновить

О смысле. Деревья синтаксического подчинения (деревья подчинения)

Время на прочтение 2 мин
Количество просмотров 2.5K
В предыдущем посте я обмолвился о деревьях подчинения и использовал (возможно, зря) спорный пример с «туманностью».
Теперь просто необходимо объяснить, почему я интерпретировал данный текст таким образом. Хотя, как оказалось, по комментариям специалистов в творчестве Пушкина – неверно, но будем рассматривать данный пример не в аспекте исторической точности, а в аспекте способов интерпретации текста на естественном языке машиной.
Начнём с определения того, что же такое деревья синтаксического подчинения (в простонородье – деревья подчинения)? Это упорядоченный граф (т.е. дерево), где узлами являются слова предложения, а их иерархия и система подчинения определяет, какие слова являются главными в предложении и какие от каких зависят.
Для наглядности приведу пару снимков того, что я имею в виду:

Вариант представления номер 1:
image
Вариант представления номер 2:
image

Все остальные примеры буду приводить во втором варианте (хотя сам считаю первый более удобным), но так как большая часть материала имеется во втором – то не взыщите.

Главным словом в такой схеме всегда является сказуемое – так, что каждое предложение рассматривается как процесс чего-либо (рождения, дарения, приезжания и т.д.), из которого потом извлекается вся дополнительная информация. Подобно тому, как из триплетов онтологий начинают хвататься за середину (связку субъектов и объектов).

Основным критерием оценки правильности построения и _интерпретации_ предложения в такой схеме – это свойство проективности дерева подчинения. Упрощенно можно сказать, что дерево подчинения проективно, когда его ветки не пересекаются.
Проективно:
image

Не проективно:
image

Это, конечно же, упрощённая модель – существуют математически описанные степени проективности (строго проективные и слабо проективные деревья), которые определяют разные ограничения на структуру предложения, чтобы оно могло считаться проективным.
Модель проективных деревьев мало применима к художественной литературе и к поэзии, где автор, пытаясь выразить свои переживания или придать предложению больше экспрессии, нарушает многие правила синтаксиса и принятого порядка слов.
image
image
Хотя в обычных текстах отсутствие проективности – признак недостаточной грамотности его составителя.
image
В художественной литературе проективные деревья – скорее редкость.
Ну а теперь тот самый спорный пример:
image
Заметьте, что верхнее дерево подчинения (со стандартным смыслом) – как раз проективно.

Модель деревьев подчинения стара как мир (не менее 60 лет) – она имеет кучу замечаний, кучу оговорок и не является моделью применимой для всех случаев – существуют более современные (и более сложные модели): например, системы составляющих. Но благодаря данной модели можно получить достаточно большое количество характеристик самого предложения.

Во многих современных алгоритмах семантического анализа данная модель в чистом виде не используется (да и правила проективности многими отброшены и заменены на другие), но основные идеи всё так же живы.
Теги:
Хабы:
+12
Комментарии 4
Комментарии Комментарии 4

Публикации

Истории

Ближайшие события

Московский туристический хакатон
Дата 23 марта – 7 апреля
Место
Москва Онлайн
Геймтон «DatsEdenSpace» от DatsTeam
Дата 5 – 6 апреля
Время 17:00 – 20:00
Место
Онлайн
PG Bootcamp 2024
Дата 16 апреля
Время 09:30 – 21:00
Место
Минск Онлайн
EvaConf 2024
Дата 16 апреля
Время 11:00 – 16:00
Место
Москва Онлайн