В предыдущем посте я обмолвился о деревьях подчинения и использовал (возможно, зря) спорный пример с «туманностью».
Теперь просто необходимо объяснить, почему я интерпретировал данный текст таким образом. Хотя, как оказалось, по комментариям специалистов в творчестве Пушкина – неверно, но будем рассматривать данный пример не в аспекте исторической точности, а в аспекте способов интерпретации текста на естественном языке машиной.
Начнём с определения того, что же такое деревья синтаксического подчинения (в простонородье – деревья подчинения)? Это упорядоченный граф (т.е. дерево), где узлами являются слова предложения, а их иерархия и система подчинения определяет, какие слова являются главными в предложении и какие от каких зависят.
Для наглядности приведу пару снимков того, что я имею в виду:
Вариант представления номер 1:

Вариант представления номер 2:

Все остальные примеры буду приводить во втором варианте (хотя сам считаю первый более удобным), но так как большая часть материала имеется во втором – то не взыщите.
Главным словом в такой схеме всегда является сказуемое – так, что каждое предложение рассматривается как процесс чего-либо (рождения, дарения, приезжания и т.д.), из которого потом извлекается вся дополнительная информация. Подобно тому, как из триплетов онтологий начинают хвататься за середину (связку субъектов и объектов).
Основным критерием оценки правильности построения и _интерпретации_ предложения в такой схеме – это свойство проективности дерева подчинения. Упрощенно можно сказать, что дерево подчинения проективно, когда его ветки не пересекаются.
Проективно:

Не проективно:

Это, конечно же, упрощённая модель – существуют математически описанные степени проективности (строго проективные и слабо проективные деревья), которые определяют разные ограничения на структуру предложения, чтобы оно могло считаться проективным.
Модель проективных деревьев мало применима к художественной литературе и к поэзии, где автор, пытаясь выразить свои переживания или придать предложению больше экспрессии, нарушает многие правила синтаксиса и принятого порядка слов.

Хотя в обычных текстах отсутствие проективности – признак недостаточной грамотности его составителя.

В художественной литературе проективные деревья – скорее редкость.
Ну а теперь тот самый спорный пример:

Заметьте, что верхнее дерево подчинения (со стандартным смыслом) – как раз проективно.
Модель деревьев подчинения стара как мир (не менее 60 лет) – она имеет кучу замечаний, кучу оговорок и не является моделью применимой для всех случаев – существуют более современные (и более сложные модели): например, системы составляющих. Но благодаря данной модели можно получить достаточно большое количество характеристик самого предложения.
Во многих современных алгоритмах семантического анализа данная модель в чистом виде не используется (да и правила проективности многими отброшены и заменены на другие), но основные идеи всё так же живы.
Теперь просто необходимо объяснить, почему я интерпретировал данный текст таким образом. Хотя, как оказалось, по комментариям специалистов в творчестве Пушкина – неверно, но будем рассматривать данный пример не в аспекте исторической точности, а в аспекте способов интерпретации текста на естественном языке машиной.
Начнём с определения того, что же такое деревья синтаксического подчинения (в простонородье – деревья подчинения)? Это упорядоченный граф (т.е. дерево), где узлами являются слова предложения, а их иерархия и система подчинения определяет, какие слова являются главными в предложении и какие от каких зависят.
Для наглядности приведу пару снимков того, что я имею в виду:
Вариант представления номер 1:

Вариант представления номер 2:

Все остальные примеры буду приводить во втором варианте (хотя сам считаю первый более удобным), но так как большая часть материала имеется во втором – то не взыщите.
Главным словом в такой схеме всегда является сказуемое – так, что каждое предложение рассматривается как процесс чего-либо (рождения, дарения, приезжания и т.д.), из которого потом извлекается вся дополнительная информация. Подобно тому, как из триплетов онтологий начинают хвататься за середину (связку субъектов и объектов).
Основным критерием оценки правильности построения и _интерпретации_ предложения в такой схеме – это свойство проективности дерева подчинения. Упрощенно можно сказать, что дерево подчинения проективно, когда его ветки не пересекаются.
Проективно:

Не проективно:

Это, конечно же, упрощённая модель – существуют математически описанные степени проективности (строго проективные и слабо проективные деревья), которые определяют разные ограничения на структуру предложения, чтобы оно могло считаться проективным.
Модель проективных деревьев мало применима к художественной литературе и к поэзии, где автор, пытаясь выразить свои переживания или придать предложению больше экспрессии, нарушает многие правила синтаксиса и принятого порядка слов.


Хотя в обычных текстах отсутствие проективности – признак недостаточной грамотности его составителя.

В художественной литературе проективные деревья – скорее редкость.
Ну а теперь тот самый спорный пример:

Заметьте, что верхнее дерево подчинения (со стандартным смыслом) – как раз проективно.
Модель деревьев подчинения стара как мир (не менее 60 лет) – она имеет кучу замечаний, кучу оговорок и не является моделью применимой для всех случаев – существуют более современные (и более сложные модели): например, системы составляющих. Но благодаря данной модели можно получить достаточно большое количество характеристик самого предложения.
Во многих современных алгоритмах семантического анализа данная модель в чистом виде не используется (да и правила проективности многими отброшены и заменены на другие), но основные идеи всё так же живы.