『Совесть — не ослик: и не такое вывезет.』
_(с) Р. Суржиков Полари_
⋮ Дисклеймер:
Беспристрастность. Анализ не претендует на безошибочную точность и не рекламирует труд писателей. Перевод романа "Игра престолов" книги_1 из цикла "Песнь льда и огня" (далее "ПЛИО") с английского Ю. Соколов. Скрипты для NLP-анализа написаны мной, в основном пользовался ими для анализа и поддержания качества собственных материалов, а также парсил международные лонгриды для сравнения и оценки авторитетности персон.
Преамбула
Видел некоторые баталии в комментариях от читателей на профильных ресурсах: частое сравнение между собой двух высокооценённых циклов в жанре эпическое фэнтези/средневековье — "ПЛИО" VS "Полари". Сходства и различия сводились к тематике, эпохе, локациям, чертам главных героев, слогу и другим очевидным и/или нетривиальным литературным приёмам и ходам. В этой статье добавлю контраста на художку и с математической точки зрения.
Публикую разбор дебютных книг из вышеупомянутых циклов:
Краткие аннотации.
"ИП": "При странных обстоятельствах умирает десница владыки Вестероса. Король Роберт со свитой отправляется на север к давнему другу Эддарду Старку, чтобы предложить тому занять место погибшего... Скрывающиеся в вольных ��ородах потомки свергнутой Робертом династии Таргариенов вынашивают планы возвращения Железного Трона, но для этого им нужно заручиться поддержкой самого могущественного кхала великой степи. За спинами героев уже плетутся сети интриг, и никому не известно, какая фигура окажется очередной жертвой в игре престолов. А между тем зима приближается..."
"СМИ": "Полари — мир фантастического Средневековья. Суровые и жестокие нравы здесь соседствуют с диковинными ростками будущего, мечи и арбалеты — с первыми электростанциями и железными дорогами. Император Адриан ведет государство нелёгким путём реформ и прогресса. Могущественные феодалы плетут изощрённые интриги, поднимают мятежи в борьбе за власть. Церковь также пользуется огромным влиянием, ведь в мире Полари никто не сомневается в существовании богов. Боги не стоят в стороне: они шлют людям дары — непостижимые Священные Предметы. Писание гласит: в Предметах таится великая сила, способная исцелять болезни, управлять стихиями, разрушать преграды. Секрет этой силы утерян много веков назад…"
Экспертиза
Год публикации романов и возраст авторов
"ИП" — вышел в 1996г. (48 лет писателю).
"СМИ" — вышел в 2016г. (29 лет писателю).
Премии
"ИП" — 5.
"СМИ"— 2.
Оценки критиков

Таблица основных метрик
параметр | "ИП" | "СМИ" | прим. |
кол-во предложений | 12_989 | 33_171 (+155% | в 2.5 раз.) | |
ср. длина предложений | 9.5 слов (+11% | в 1.1 раз.) | 8.4 слов | |
самое длинное предложение | 451 | 456 (+1% | на 5 зн.) | [4] |
кол-во слов | 124_277 | 277_807 (+123% | в 2.2 раз.) | |
доля эмоционального тона | 3.1% | 10.2% (+229% | в 3.3 раз.) | [1] |
кол-во уникальных лемм | 19%/на 50К слов | 33%/на 50К слов (+73% | в 1.7 раз.) | [2] |
доля диалогов | 60.7% (+29% | в 1.3 раз.) | 47% | [3] |
часто употребляемое ругательство | "седьмое пекло" | "тьма(сожри)" | |
самое длинное слово | "противоестественное/незаконнорожденного" 19 | "облагодетельствовать", 20 (+5% | на 1 зн.) | |
имена ГГ, входящие в ТОП-10 слов (часто встречающиеся) | Джон; Нед; Бран; Тирион | Эрвин; Мира; Хармон |
Использование алфавита по буквам
"ИП": буква, кол-во, процент | "СМИ": буква, кол-во, процент |
('о', (72339, '11.146%')), | ('о', (154049, '10.384%')), |
[1] Доля эмоционального тона (ДЭТ) — процент предложений с восклицательными и вопросительно восклицательными знаками, но не чисто вопросительными, например, "!/!!!/?!!...". У автора "СМИ" Р. Суржикова ДЭТ — довольно внушительная. Для сравнения: в классике Л. Толстого "Война и мир" — {ДЭТ ~5.1%}, а у Ф. Достоевского в "Преступление и наказание" — {ДЭТ ~17.5%}, на редкость поражающе высокая.
[2] Кол-во уникальных лемм (КУЛ) — активный словарный запас автора, или попросту — богатая речь. Расчёт сделан после приведения всех слов к базовой форме, на сколько позволил корпус русского языка OpenCorpora.

Р. Суржиков в "СМИ" сумел обогатить текст до незыблемых высот. Такого высокого показателя метрики у кого-либо ещё, на вскидку, я не припоминаю. Для сравнения: у столетнего романа Г. Хаггарда "Дочь Монтесумы" — {КУЛ ~20.3%/50К слов}, а у современных писателей А. Пехова и его подруг в дебютном "Летос" — {КУЛ ~18.9%/50К слов}.
[3] Доля диалогов (ДД) у обоих авторов высокая, у Мартина в "ИП" даже впечатляющая. Для сравнения: в дебютной фэнтезийной художке Д. Аберкромби "Кровь и железо" — {ДД ~48%}, а в классике Ф. Достоевского "Преступление и наказание" — {ДД ~62.6%}.
[4] Самые длинные предложения в романах. В качестве сравнения: у Ф. Достоевского в "Преступление и наказание" — {СДП 736}, а у С. Кинга в "Противостояние" — {СДП 1575}.
"ИП" — {СДП 451}: «Пока птицы кружили над его головой, а внизу жила своей жизнью крепость, Бран мог целые часы проводить между источенных дождями горгулий, в задумчивости приглядывавших за Первой Твердыней: правильно ли люди обрабатывают дерево и сталь во дворах, следят ли садовники за овощами в стеклянном саду, снуют ли без отдыха псы взад и вперед, молчалива ли по-прежнему богороща и не изменились ли сплетни девиц, обменивающихся ими во время стирки возле колодца?»
"СМИ" — {СДП 456}: «Почти без помощи со стороны Хармона он вспомнил, что при встрече с графом следует отвесить поясной поклон, а кастеляну и рыцарям достаточно низкого кивка головой; что руку для пожатия протягивать не нужно — это дерзость; что Джоакин, как воин, имеет право звать графа "милорд", но учтивей все-таки говорить "ваша милость"; что место за столом Джоакину укажут, и сесть он должен никак не раньше, чем задница последнего из графских рыцарей коснется скамейки.»
Облако лемм
Вычищены местоимения, союзы, предлоги и некоторые междометия. Баланс масштабирования слов намерено максимально смещён в пользу красоты заполнения пространства, нежели реального масштабирования слов на основе их частоты.
Habr агрессивно пережимает изображения до низкого качества, посмотреть исходные визуализации в высоком качестве -> ("ИП" / "СМИ").


В качестве заключения
Дебютная книга Мартина "ИП" по большей части состоит из диалогов/сухих, а дебютная книга Суржикова "СМИ" по объёму, как две "ИП", с меньшим количеством диалогов, но более эмоциональных, а также могучей богатой речью, не смотря на юный возраст писателя.
Прелесть экономичного NLP-анализа в том, что от начала и до конца он локальный и доступен на ладони.

𝕋𝕙𝕖 𝕖𝕟𝕕

💎 Опробовать поисковую систему, разработанную автором статьи.