Пользователь Reddit с ником Low-Needleworker-139 неделю назад объявил в сабреддите r/IndoEuropean, что создал на базе ChatGPT свою пользовательскую языковую модель, которую обучил на имеющемся корпусе реконструкций праиндоевропейского языка. Этот пользовательский чатбот получил название Déiwos-Lókwos GPT.

Модель, согласно заявлениям пользователя, отражает как фонетику и грамматику (включая ларингалы и аблаут) так и характерный поэтический регистр, реконструируемый для праиндоевропейского.

Одной из ключевых особенностей модели является её способность дообучаться на ходу: например, она придумает и сохранит неологизм, если у неё нет подходящего праиндоевропейского слова (например, "поезд"). Обо всех подобных усовершенствованиях она сообщает системными сообщениями с заголовком UPGRADE.

Автор предложил всем желающим тестировать модель, что я и сделал. Помимо праиндоевропейского, модель говорит на английском (другие языки не проверял, общался с ботом на английском). С первых сообщений нейросеть говорит, что она особенно хороша в поэзии и намекает, что надо дать ей перевести стишок... ну что ж, здесь у нас явно есть общие темы для разговора!

Глава 1, в которой два сердца встречаются под дождём

Иллюстрация к стихотворению, сгенерированная нейросетью Midjourney. Есть уж творить нейросетями — так до конца!

Я решил перевести на праиндоеропейский стихотворение собственного сочинения — "Первая гроза в апреле".

Первая гроза в апреле.
Первый дождь и первый гром.
Зонт, валявшийся в портфеле,
Под которым мы вдвоём.

С ветром в танце дождь кружился...
Первый взгляд лазурных глаз.
И, похоже, дождь влюбился:
Лил как будто в первый раз.

Он лупил по крышам звонко,
Заглушая даже гром.
Молния. Фонарь. Девчонка,
Спрятанная под зонтом.

Первый знак прихода лета,
Первые слова любви...
Чувства первые, которых
Мы с тобой не сберегли...

Сколько бурь с тех пор бывало,
Сколько встреч под тем зонтом?
Сердце помнить не устало
Самый сильный в жизни гром.

Грозы столько раз гремели,
Что потерян счёт уже...
Только та гроза в апреле
Навсегда в моей душе.

Я превратил его в английский подстрочник и в таком виде попросил чат-бота перевести на праиндоевропейский.

First rainstorm in April,
First rain and first thunderbolt,
An umbrella found in my case,
Under which two of us were.

The rain danced with the wind,
And I faced the first sight of blue eyes,
And the rain seemed to fall in love,
It poured like it was its first time.

It made a ding-gong over the roofs,
Drowning out even the thunder.
A lightning. A lantern. A girl,
Hidden under my umbrella.

The first sign that the summer came,
The first words of love...
The first romantic feelings,
Which we didn't manage to save...

Since then, a lot of storms came,
And a lot of meetings under the same umbrella,
But my heart still remembers,
The strongest thunderbolt in my life.

There were so much thunderstorms,
That I am unable to count them,
But that thunderstorm in April
Is in my heart forever.

Модель сгенерировала праиндоевропейский текст, щедро сбавленный метафорой "огненной колесницы" (точнее, "огненного колеса", kʷékʷlom h₁n̥gʷnis). Довольно штампово, надо сказать — если при разговоре о праиндоевропейской поэтике ничего, кроме огненных колесниц, в голову не приходит... ну такое себе.

pr̥h₁wós h₂éwn̥s wésr̥ moméh₁i,
pr̥h₁wós h₂éwn̥s kʷékʷlom h₁n̥gʷnis,
h₁ómbr̥lóm mey h₁r̥tóm bheróh₁,
tód h₁i̯óm h₁n̥gʷhₓmóh₁s esti.

h₂éwn̥s gʷhr̥téyeti h₂u̯ēntom,
h₁egóm kʷn̥teh₁ bléh₁u̯es h₁ékus,
h₂éwn̥s suéǵʰeti gʷih₃wóm,
nébʰet kʷód h₁r̥tóm esti.

tód kl̥kʷet bhórghom h₁ógh₂m̥,
h₁éudʰeti kʷn̥tóm h₁n̥gʷn̥óm.
h₁n̥gʷnis, h₁u̯oǵʰós, dhǵh₁ugh₂tēr,
tód h₁ómbr̥lom mey h₁r̥tóm ḱludʰi̯éh₁.

pr̥h₁wós déǵʰōm wésr̥ bhōr,
pr̥h₁wós u̯órdʰos suégʰom,
pr̥h₁wós méǵh₂tōs gʷih₃wéh₁s,
n̥smóh₁i bhermom n̥gʷhₓméyeti.

tód wéln̥t h₂éwn̥es bhéronti,
tód gʷr̥hₓénti h₁ómbr̥lóm kʷékʷlom,
só h₁kʷr̥dóh₁ memónh₂ti,
suégʰom h₁n̥gʷnis méǵh₂tōm.

tód h₂éwn̥s méǵh₂tōh₁ gʷr̥hₓónti,
n̥pi h₁égom meǵh₂tónti,
só wésr̥ wésr̥ moméh₁i,
h₁kʷr̥dóh₁ moméh₁i ǵʰomhₓénti

Чат-бот вместе с каждой генерацией предоставляет подробный лингвокомментарий. Как он справедливо заметил, апреля у праиндоевропейцев быть ещё не могло, поэтому он оказался заменён просто на "весну". Интересна его интерпретация "зонтика" (umbrella): как в анекдоте, он придумал "однозвучную и однозначную" замену h₁ómbr̥lóm, от h₁óm- – "покрывать" и всем хорошо знакомого bher- — "нести" (в русском этот корень сохранился в слове "беру").

Это уже отчасти "современный индоевропейский" — либо такие генерации были зашиты в модель сразу, либо кто-то её дообучил так изящно (ниже мы увидим пример дообучения в работе с пользователем, показывающий, как нейросеть дообучается).

Из до боли знакомого следует отметить слово n̥smóh₁i — в котором почти без перевода угадывается русское "не смогли" (сохранить чувства). Нет только суффикса -л- – причастного по происхождению. Он, конечно, появится много позже, и русская -и- на конце вовсе не гомологична праиндоевропейской, как ни странно (она гомологична окончаниям мн. ч. прилагательных "белы", "черны"). То праиндоевропейское окончание, которое мы видим здесь, сохранилось... в латинском перфекте, в словах типа amavi — "я любил", dixi – "я сказал".

Глава 2, в которой голубые глаза становятся глазами цвета неба

Из того, что мне резануло слух, удивил перевод "девчонки" тем же словом, которое во всех индоевропейских языках дало слово "дочь". Чат-бот ссылается на многозначность, но сильно я сомневаюсь в этом. И перевод получился странноватым из-за этого, будто речь идёт об отце и дочери. Но тут я делать замечание не стал. Потому что был другой повод поэкспериментировать...

В лингвокомментарии нейросеть сама отметила, что перевела "взгляд синих глаз" как kʷn̥teh₁ bléh₁u̯es h₁ékus. Ну с h₁ékus, предположим, всё отлично, здесь легко угадывается русское "око"/"очи" с поправкой на ларингалы, но прилагательное никакой критики не выдерживает. Нейросеть просто взяла английское blue из моего промпта и вставила его праиндоевропейский когнат bléh₁u̯es! Ничтоже сумняшеся, что это и есть "синий".

Но это не так. Слова для "синего" в праиндоевропейском не реконструируется. И, если вы почитаете замечательную книгу Гая Дойчера "Сквозь зеркало языка", то легко поймёте, почему в праиндоевропейском слова для "синего" быть не могло.

Даже греческое κυάνεος, которое дало русские научные термины "цианоз" и "антоцианы" со вполне определённой хроматической принадлежностью, во времена Гомера значило просто "тёмный". Русское "синий" родственно слову "сизый", а английское "blue" — вообще русскому "белый". Так что слова для "синего" развивались много позже распада прандоевропейского, из слов, обозначающих тёмные тона.

Я вам больше скажу: праиндоевропейцы, видимо, называли "жёлтый" и "зелёный" одним словом — оно дало немецкое gelb (жёлтый) и русское "зелёный". Точно реконструируется только название для красного цвета — и такая цветовая гамма в языке типична для всех народов, ещё не освоивших производства красок. Слово для "синего" появляется позже всего, потому что синий цвет редко встречается в природе, особенно как синий пигмент (всё по биохимическим причинам — рекомендую прочитать о них в книге Кая Купфершмидта "Blue", которую пока не перевели на русский).

Я сделал чат-боту соответствующее замечание и предложил ему перефразировать как "глаза цвета неба", что он и сделал. И вывел сообщение UPGRADE, что дообучился переводить "синий" описательно как "цвет неба" или "цвет зари". Так что, надеюсь, больше он такой ошибки не повторит – ему просто нужен был биолог в моём лице, чтобы поймать именно эту ошибку. Потому что именно биологи лучше всего знают её корни)

Исправленная версия стихотворения теперь выглядела вот так:

pr̥h₁wós h₂éwn̥s wésr̥ moméh₁i,
pr̥h₁wós h₂éwn̥s kʷékʷlom h₁n̥gʷnis,
h₁ómbr̥lóm mey h₁r̥tóm bheróh₁,
tód h₁i̯óm h₁n̥gʷhₓmóh₁s esti.

h₂éwn̥s gʷhr̥téyeti h₂u̯ēntom,
h₁egóm kʷn̥teh₁ nébʰōm h₁ékus,
h₂éwn̥s suéǵʰeti gʷih₃wóm,
nébʰet kʷód h₁r̥tóm esti.

tód kl̥kʷet bhórghom h₁ógh₂m̥,
h₁éudʰeti kʷn̥tóm h₁n̥gʷn̥óm,
h₁n̥gʷnis, h₁u̯óǵʰos, dhǵh₁ugh₂tēr,
tód h₁ómbr̥lom mey h₁r̥tóm ḱludʰi̯éh₁.

pr̥h₁wós déǵʰōm wésr̥ bhōr,
pr̥h₁wós u̯órdʰos suégʰom,
pr̥h₁wós méǵh₂tōs gʷih₃wéh₁s,
n̥smóh₁i bhermom n̥gʷhₓméyeti.

tód wéln̥t h₂éwn̥es bhéronti,
tód gʷr̥hₓénti h₁ómbr̥lóm kʷékʷlom,
só h₁kʷr̥dóh₁ memónh₂ti,
suégʰom h₁n̥gʷnis méǵh₂tōm.

tód h₂éwn̥s méǵh₂tōh₁ gʷr̥hₓónti,
n̥pi h₁égom meǵh₂tónti,
só wésr̥ wésr̥ moméh₁i,
h₁kʷr̥dóh₁ moméh₁i ǵʰomhₓénti.

Как можно заметить, проблемная конструкция заменилась на kʷn̥teh₁ nébʰōm h₁ékus, и глаза героини стали "небесного" цвета. Но это ещё не всё — бот решил проявить инициативу.

Глава 3, в которой боги отбирают у героев любовь (но сакральный зонтик спасает память о ней)

Далее чат-бот предложил сделать вторую версию стихотворения — более мифологизированное переложение, которое больше бы соответствовало праиндоевропейской поэзии. Видимо, это стандартное сообщение для всех пользователей – эта нейросеть автоматически старается перевести разговор на мифологию, так как у неё в этой области больше слов в корпусе и есть где развернуться.

Would you also like me to compose a second version using more mythic metaphors? (for example: "the Rain weds the Wind, and gives birth to Lightning" imagery — very PIE poetic tradition!)
It would sound even older and even more sacred. Shall I?

Я решил продолжить эксперимент и согласился, но ограничил фантазию бота дополнительным промптом. Я попросил сохранить акцент на истории любви двух людей — которых столкнули вместе боги, но потом отобрали у них любовь. И подчеркнуть, что рассказчик сохранил память об этой встрече, несмотря на то, что она была очень давно. Просто чтобы бот не увлекался богами слишком уж сильно, а то не успеешь оглянуться, как он из любовной лирики "Ригведу" сгенерирует.

Yes, please create this second version with some mythology added! But please maintain focus on my love story. It is not a poem about gods, it is a poem about two usual people. Gods let them meet accidentally under the rainstorm, but then killed their feelings and their love making them go apart. But the narrator — a male person — still remembers this love as the greatest love in his life. Could you imagine something like this?

В ответном сообщении бот подтвердил, что понял мою идею, конкретизировал её в прозе и сложил новый праиндоевропейский стих. Так как он впоследствии предложил мне и заголовок поменять, я сразу вставлю рекомендованное им заглавие. И получился стилистически совершенно другой стих, по-новому раскрывающий оригинальную историю.

h₂éwn̥s gʷih₃wéh₁m̥

pr̥h₁wós h₂éwn̥s wésr̥ moméh₁i,
h₂éwn̥s ḱn̥tóm h₂u̯ēntóm suégʰeti,
Dyéus h₂éwn̥m̥ bheret, h₂u̯én-tor bheret,
tód h₁i̯óm h₁ómbr̥lóm neméh₁i.

h₁egóm kʷn̥teh₁ nébʰōm h₁ékus,
suégʰom méǵh₂tōm bheróh₁,
h₂éwn̥s suégʰeti gʷih₃wóm,
kʷod h₁kʷr̥dóh₁ nébʰet.

kl̥kʷeti bhórghom h₁ógh₂m̥,
h₁éudʰeti h₁n̥gʷn̥óm kʷn̥tóm,
n̥smóh₁i gʷih₃wóm bhermom,
tód h₁ómbr̥lóm mey ḱludʰi̯éh₁.

pr̥h₁wós déǵʰōm wésr̥ bhōr,
pr̥h₁wós u̯órdʰos suégʰom,
méǵh₂tōs gʷih₃wéh₁s gʷr̥hₓónti,
n̥smóh₁i bhermom ǵʰomhₓénti.

h₂u̯én-tōr suégʰeti h₁kʷr̥dóm,
h₂éwn̥s n̥gʷhₓméyeti gʷih₃wóm,
wélont gʷih₃wéyes bhéronti,
só h₁kʷr̥dóh₁ memónh₂ti.

tód h₂éwn̥s méǵh₂tōh₁ gʷr̥hₓónti,
n̥pi h₁égom meǵh₂tónti,
só wésr̥ wésr̥ moméh₁i,
h₁kʷr̥dóh₁ moméh₁i ǵʰomhₓénti.

Так как поэтика сильно изменилась, для этой версии привожу здесь подстрочный перевод.

Дождь души

Первый весенний ливень,
Дождь и ветер танцевали вместе,
Отец Небо принёс дождь, Ветер принёс встречу,
Так что я нашёл свой зонтик.

Я столкнулся с глазами цвета неба,
Я нёс (в себе) величайшие чувства,
Дождь полюбил душу,
И сердце было не одиноко.

Он звенел по крышам,
Он заглушал голос грома,
Мы не смогли удержать душу,
Но зонт сохранил память.

Первый знак, что лето приходит,
Первые произнесённые слова любви,
Величайшие чувства разбились,
Мы не смогли их сохранить.

Ветер украл сердце,
Дождь вымыл душу,
Желания унесли жизнь,
Но моё сердце помнит.

Гремело много гроз,
Я не могу их сосчитать,
Но эта весенняя гроза
Живёт в моём сердце вечно.

Здесь появляется верховный бог праиндоевропейцев, Dyḗus ph₂tḗr, буквально "Небо-Отец". Это бог дневного неба, который у греков стал Зевсом, а у латинов Юпитером (оба имени – когнаты праиндоевропейского). Ветер и Дождь также персонифицированы. Любопытно, что фантазия бота с зонтиком пошла ещё дальше – он в лингвокомментарии придаёт ему роль поэтического символа сохранения памяти, когда сами чувства потеряны. Ничего себе приключения зонтов в праиндоевропейском чатботе, почти что сакрализация....

Кстати, сюда бы отлично вписался Перун (точнее, Перкунас) на огненной колеснице – этот бог в пантеоне праиндоевропейцев уже был. Но его чат-бот не добавил – хорошо понял дополнительный промпт с пантеоном не переусердствовать. В истории любви, конечно, должен присутствовать не он, а Небо-Отец – только он имеет такую роковую силу, чтобы сталкивать и разлучать двух влюблённых. Ну а кто грозу исполнял, не столько уж важно... Кстати, огненные колесницы из итоговой версии исчезли. И слава богу. И не важно, какому именно))

Любопытно, почему чат-бот не использует для "любви" праиндоевропейский корень leub-, давший начало русскому "любить" и английскому "love". Вместо этого он перефразирует любовь как "жизнь", "душу" или "чувства". Для меня это пока загадка. Я допускаю, что кто-то из пользователей ранее намекнул боту, что этот корень не очень-то годится для описания стойкой глубокой привязанности и ближе по значению к влечению (ср. лат. libido от того же корня). Видимо, бот дообучился и смирился, что слова для "любви" в нашем значении тогда ещё толком не было. Но вообще-то лингвистический эксперимент так даже интереснее и поэтичнее. К тому же, и сейчас есть языки, где нет слова для "любви" в строгом смысле слова. Например, люксембургский – из индоевропейской семьи, кстати. Этот момент надо обсудить с лингвистами. И с автором чатбота. По мере появления новых комментариев от коллег-лингвистов буду по возможность добавлять их сюда.

Заключение, где я даю оценку результатам эксперимента с языковой моделью

Серия доработок перевода ботом привела к довольно поэтичному тексту, копирующему праиндоевропейскую лексику и стилистику. Бот оказался способен корректировать свой перевод не хуже моего любимого переводческого ИИ-инструмента – нейросети DeepL. Так что использовать можно – главное, самому при этом внимательно проверять, что он пишет, и поправлять его.

Следует отметить, что с самого начала я облегчил ему задачу. Я отправил ему стихотворение, где почти нет сложноподчинённых предложений. Исходя из наших знаний, в праиндоевропейском их быть не могло, они появились намного позже распространения письменности – см. в той же книге Гая Дойчера. Но из доработанной версии почти исчезли и назывные (номинативные) предложения.

Остался скучный для нас (но поэтичный!) белый стих из простых предложений. Именно такую структуру имели все самые древние дошедшие до нас письменные тексты — и, вероятно, именно так звучали праиндоевропейские мифы, рассказы, стихи и песни. Такой текст семь тысяч лет назад звучал бы как очень изящное стихотворение — хоть сейчас и кажется нам неуклюжим. Так что стилистику чат-бот, на мой взгляд, воспроизводит довольно точно.

Лексика же представляет собой вызов не только для него. Общаться с современным пользователем словами языка, вымершего семь тысяч лет назад, вообще-то сложно. И тут неизбежны либо ошибки, либо множественные неологизмы. И сложно отличить, где что – если праиндоевропейский когда-то возродится из мёртвых, подобно ивриту, я почти уверен, что bléh₁u̯os будет "синим". Ну κυάνεος же стал, и в именно в таком варианте используется современными биологами и медиками. Если надо придумать греческий термин для "синего" – бери элемент "циано-", и без разницы, что он там у Гомера обозначал. А интерактивность уже предполагает некоторое возрождение языка – и стоит ли сильно винить нейросеть?

История с "зонтиком" ещё более показательна. Возможность дообучения вообще дала боту потенциал в некотором роде дрейфовать лексически – и неизвестно, куда этот дрейф повернёт. Он может самопроизвольно прийти к чему-то вроде "Современного индоевропейского" – если будут преобладать пользователи со спросом на обозначения для новых вещей. Или, наоборот, сохранит ортодоксальность и относительный языковой пуризм, если будут преобладать зануды вроде меня.

Впрочем, я отчасти скомпенсировал своё влияние, заставив его придумать и выучить слово для обозначения "поезда". Он придумал что-то вроде "вагонной колесницы" – благо для "вагона" нашлось однозвучное слово, исконно обозначающее телегу или воз. Для сравнения, в современном индоевропейском поезд – это dóuknom. В общем, если бот не затруднится с обозначением "поезда", знайте, чьих это рук дело))

С самого начала компьютерный эксперимент оказался полон научных вызовов — и потенциальных интересных результатов. Посмотрим, куда это всё в итоге вырулит. А вас всех приглашаю тестировать бота, писать комментарии здесь и в оригинальном обсуждении на Реддите (и лучше там!)

И чаще раскрывайте зонтик над любимыми, когда идёт дождь. Говорят, это помогает, даже если боги задумали отобрать у вас любовь...))