Как стать автором
Обновить

ChatGPT теперь говорит на праиндоевропейском (и перевёл на праиндоевропейский моё стихотворение)

Уровень сложностиСредний
Время на прочтение11 мин
Количество просмотров4.8K
Всего голосов 7: ↑7 и ↓0+8
Комментарии29

Комментарии 29

интересна динамика обучения, вероятно возможно не только моделирование прото санскрита, но и исторического развитие индо-европейских языков на его основе как последовательности моделей обучения

Что Вы понимаете под прото-санскритом?

Что касается моделирования исторического развития – конечно, в теории это возможно, и идея интересная, но площадка ChatGPT, конечно, для такого не подходит. Если чат-бот будет активно обучаться, его язык может "исторически развиться", но вряд ли он будет рекапиптулировать настоящее развитие индоевропейских языков.

прото санскрит примерно = пра индоевропейский, больше вопрос терминологии, конечно ChatGPT как есть сейчас не очень подходит, но сам подход обучения развитых моделей кажется перспективным именно для изучения исторической динамики языков

Вот не согласен с классификацией праиндоевропейского как прото-санскрита, это заблуждение из XIX века. С тем же успехом его можно было бы назвать прото-латинским или прото-литовским, например)

Между праиндоевропейским и гипотетическим "прото-санскритом" имеется ещё одна чётко очерченная стадия — праиндоиранский язык, общий предок санскрита и таджикского. На нём говорили носители археологической культуры Синтаншта на Южном Урале. И лишь после распада этой общности можно говорить об условном "прото-санскрите". Такой "прото-санскрит" уже отличался бы от праиндоевропейского так же сильно, как, например, праславянский. И его реконструкция не имеет с обсуждаемым чат-ботом ничего общего.

отличный комментарий, кто же знал, что Вы полностью в теме :)

про Синтаншта супер интересно, не просветите какие именно доказательства того, на чем именно они говорили?

мои знания предмета примерно в объеме David Anthony "The horse, the wheel, and language ..."

На литовский то в итоге похож или нет?

Любимый вопрос индоевропеиста))

Как Вы видите по стихам, в чат-бота заложена реконструкция с ларингалами, да ещё с целыми тремя. Такая фонетика соответствовала раннему праиндоевропейскому, до отделения анатолийской ветви. Попробуйте прочесть это вот с тремя разными гортанными звуками (почти как в арабском!) и слоговыми сонорными. Думаю, фонетически на литовский будет так себе похоже.

Но вместе с тем чат-бот уже имеет в своём составе "колёсную" лексику — а она развилась по больше части уже после отделения хеттов. То есть лексически он отражает скорее всего праиндоевропейский в его "среднем", "классическим" периоде, в периоде "расцвета". И большой вопрос, были ли там ларингалы — если даже у хеттов сохранился лишь один, а у других индоевропейцев ни одного. Возможно, к моменту начала активного использования колёс ларингалы уже были благополучно проглочены и ассимилировались в гласные. И такая версия действительно могла очень отдалённо напоминать современный литовский за счёт его архаичных черт, точно так же как современный болгарский в чём-то напоминает нам старославянский. Но это всё равно некая вульгаризация – мы пытаемся подсознательно "спроецировать" праиндоевропейский на "плоскость" современных индоевропейских языков. И в этой "плоскости" он оказывается ближе к литовскому – несмотря на то, что с учётом всех переменных был от него далёк как Альфа Центавра от Солнца.

Говоря о сочетании черт разных периодов в одном чат-боте, я вовсе не имею в виду его дефект. Это консенсусная реконструкция праиндоевропейского в современной лингвистике. Дело в том, что любой метод реконструкции приводит к появлению вот такой "сборной солянки" из разных периодов развития языка, и получается что-то типа "Я есмь блогер-инфлюэнсер, а ты где подвизаешься?" Это неизбежно, иначе целостную картинку языка не собрать.

Я думаю, что последняя версия стиха, самая непротиворечивая, скорее похожа на раннюю индо-хеттскую стадию развития праиндоевропейского. Так получилось чисто случайно за счёт отказа от "огненных колесниц" и выпадения того же корня *-leub- "любить". Так что в итоге, наверное, всё-таки не литовский, а ранний праиндоевропейский получился))

Как Соссюр до ларингалов то по письменным источникам вообще мог дойти, я не представляю. до этиих самых "исчезнувших сонантных коэффициентов "

Кстати, радовался как ребенок по поводу письменного и устного звучания вот этой картинке из дидактического материала ддля 3 класса от знакомой ("лежит у каждого ребенка в портфеле")

Носители сразу отвечали, а люди с любым уровнем неродного английского жестко зависали.

возможно потому, что sharpener супер редко используется взрослыми людьми

а так?

former Prince of Wales

встречный вопрос - какой смысл в этой строчке из Java Jive:

"Woops, Mr. Moto, I'm a coffee pot,

Shoot me the pot, and I'll pour me a shot ..."

:)

мимо,

подсказка - это аллюзия, Mr Moto герой фильмов и анекдотов, типа Штирлица

До этого агента 30х годов я дошел, но кроме версии драг дилера шифрующегося от полиции, других не вижу:) все таки песня почти народная, как выяснилось по Яндекс музыке, с 40 х годов может быть много версий , что происходит в кофейне Java Jive. Сухой закон уже вроде кончился, так что подозревать в желании втихаря сделать whiskey shot с кофейком я бы не стал. Ну a cup a cup это мент мент мент.

да нет, это современные фантазии насчет "pot" и прочего,

немного проще - "jive" это не только танец тех времен, но и в переносном смысле "болтовня", т.е. текст имитирует обычные разговоры за кофейной стойкой в баре,

Mr. Moto японец (на что намекает имя, сравни - Yamamoto), разыгрывает из себя американца, но неудачно, ему говорят, типа если Вы американец, то я "coffee pot", несколько по-расистски, что характерно для тех времен, какой-нибудь шофер такси, или бармен, известный до анекдота сюжет,

"shoot the pot" типа по гладкому прилавку в баре "отфутболить" стакан или кружку клиенту, в вестернах это любят показывать

Но в кавере Джонни мерсера поется mr. Mercer так что это немного бессмысенно, певец не азиат

Мне кажется там что то про копа под прикрытием ( мр Коломбо я бы сказал немного в тему)

не совсем понял, Johnny Mercer примерно как все, про копа под прикрытием все же перебор, Java Jive это популярный mainstream для широкой аудитории, тогда и битников даже не было, Colombo лет на 30 позже, чем Java Jive стал исполняться

Woops mr Mercer в его кавере он сам поет.

Упс мистер Мерсер, я полон кофе до горла, если шмальнешь мне я сам себе смогу кофейку сбацать.

Вот вариант без усложений

To potshot это шмальнуть

То есть выстрелить в сторону не прицельно

Вот игра слов - второе pot никак не читается, это разделенный глагол в повелительном наклонении potshot

А вот сам потшот " шмальнуть" забавно пересекается с русским словом "шмаль"

Один из вариантов от Яндекса
Один из вариантов от Яндекса

ЗЫ Коломбо это аналогия со Штирлицем, но с кофейным привкусом

ну и ладно, если Вам так больше нравится,

хотя Colombo по сюжету всего Lieutenant LAPD, а Штирлиц целый штурмбанфюрер СС :)

Как Соссюр до ларингалов-то по письменным источникам вообще мог дойти, я не представляю. До этих самых "исчезнувших сонантных коэффициентов"

Это называется внутренней реконструкцией.

Дело в том, что не всегда нам доступны данные по каким-то внешним группам, по ближайшим "родственникам" группы или семьи языков. И тогда классическая сравнительная реконструкция – которая называется внешней реконструкцией – просто недоступна. Постараюсь популярно, с IT-аналогиями (так как нахожусь на Хабре), объяснить, как это работает.

Это похоже на обратную разработку методом "баг на баг". За тысячи лет слова меняются в одном и том же языке (и в одной и тоже же семье языков) по-разному в зависимости от позиции тех или иных звуков. В итоге получаются кластеры слов, которые без проблем идентифицируются как родственные, но между ними остаются на первый взгляд необъяснимые несоответствия. Проще говоря – "баги".

Вот на эти-то "баги" и опирается внутренняя реконструкция: лингвисты пытаются представить, какой звук должен был присутствовать в словах праязыка в заданной позиции, чтобы в языках-потомках получилась такая чехарда.

Что сделал Соссюр? Он заметил, что во многих индоевропейских языках система гласных имеет одни и те же "баги", которые явно являются праиндоевропейским легаси. Но как они могли возникнуть? Когда-то же система была стройной?

Единственный способ сделать её стройной — предположить, что в праязыке были какие-то неизвестные звуки, которые потом исчезли – но повлияли на последующие гласные. Соссюр не знал, что это такое, и назвал их просто "коэффициентами". Его ожидаемо не оценили. Получился какой-то сферический конь в вакууме, который к тому же не сохранился ни в одном из современных индоевропейских языков.

В 1912 году А. Кюни сужает поиск — он доказывает, что эти "коэффициенты" должны быть согласными фонемами. Но опять непонятно, какими.

Соссюр не дожил до триумфального подтверждения своих имей более 10 лет. В 19220-х годах семитолог Бедржих Грозный расшифровывал надписи, найденные при раскопках в Анатолии (территория нынешней Турции). Он работал со странным набором клинописи, относящейся явно к одному языку – и он предполагал, что семитскому. А кого, кроме семитов, можно было ожидать там встретить тысячи лет назад?

Но ни с одним семитским языком получившиеся расшифровки не вязались, пока он не наткнулся на табличку, гласившую:

ну 🍞🥐 ан эззатени вадар ма экутени

Я не случайно поставил здесь эмодзи "хлеба" – в оригинале тоже была логограмма "хлеб" с неясным звучанием, вот как в моей записи. А всё остальное было записано силлабически, но что это значило? Ни с одним семитским языком такое не вязалось.

Внезапно Грозного осенило: "вадар" – это же "вода", "water"! Тогда "эззатени" – это "ешьте", "essen"! Любой индоевропеист без труда прочитает это как "(теперь) вы будете есть хлеб и пить воду". Но ведь, значит, и язык – индоевропейский.

Дело расшифровки пошло быстрее. В 1927 году Ежи Курилович публикует работу по фонетике найденного языка – хеттского. Среди находок фигурирует "хрипящий" заднеязычный звук, похожий на "х" – который находится прямо на тех местах, где у Соссюра был один из "коэффициентов". Занавес. Немая сцена.

Позже в хеттском обнаружились дополнительные "баги" – следы недавней утраты второго "коэффициента". Когда присмотрелись повнимательнее, их нашли и в ведических гимнах. Стало ясно, что Соссюр был прав.

Сочетание хеттских данных и данных по фонетике других языков указывает, что такую картину дают именно ларингальные согласные. Такие есть, например, в иврите – и они могут изменять соседствующие гласные, хотя сами при этом и не исчезают. Так что пока консенсус в том, что три непонятных звука в вакууме – это ларингальные согласные, которые произносились глубоко в гортани, как в арабском и иврите. Вот только как именно они звучали... до конца не понятно. Обычно пользуются условными чтениями, как для древнеегипетских гласных – то есть подставляют знакомые звуки, наиболее подходящие к имеющимся реконструкциям.

Но одно понятно: работа Соссюра оказалась пророческой. Мораль сей басни такова, что в науке часто открытия могут быть оценены или окончательно опровергнуты спустя длительное время после публикации. И почти любая научная новизна означает долгое время, пока новые находки станут частью общепринятой теории.

Анатолийские языки отделились от праиндоевропейского очень рано, задолго до его распада. Предки хеттов ушли в Анатолию в гордом одиночестве, в то время как индоевропейские племена ещё веками после этого колесили по степям в районе нынешней Украины и южной части России. Их язык менялся, и к моменту распада на германскую, италийскую, балтославянскую, индоиранскую и прочие ветви совсем не напоминал тот, который прихватили с собой предки хеттов. Ларингалов, видимо, на тот момент уже не было.

До сих пор они являются неоценимым источником знаний о раннем праиндоевропейском, о самой ранее доступной нам стадии его развития. Недавно появилось сообщение об открытии нового языка анатолийской группы. Так что точка в изучении анатолийских языков пока не поставлена – как и точка в изучении ранних стадий развития праиндоевропейского языка.

ну гортанью можно только Р и КХ ,а третий даже не могу предпоположить.. какойто смешанный вариант с Т . Я думаю что детский логопед бы в этом разобрался, ведь древние языки как эмбрионы , проходят стадии эволюции. У них должно быть много звуков от детской речи

ну гортанью можно только Р и КХ ,а третий даже не могу предпоположить.. 

Здесь и перечень (возможностей намного больше трёх), и аудиозаписи: https://en.wikipedia.org/wiki/Pharyngeal_consonant

Из согласных : К-ха , П-кха Р-хэ. Круто, понятно

Собственно чистых ларингалов я слышу все равно два: кх и р.

Напишите отдельную статью на Хабре про всё это. Очень интересно.

Спасибо огромное за интерес! Поставлю статью про ларингалы (и, возможно, серию статей про индоевропейские языки) в свой личный контент-план) Не переключайтесь!

Такие есть, например, в иврите – и они могут изменять соседствующие гласные, хотя сами при этом и не исчезают. Так что пока консенсус в том, что три непонятных звука в вакууме – это ларингальные согласные, которые произносились глубоко в гортани, как в арабском и иврите.

Немножко поправлю: из иврита к концу 20в эти согласные точно так же исчезли (сохранившись лишь в орфографии), как и из ПИЕ, так что фонетическая картина один к одному: изменения гласных "на ровном месте".

Лучше все таки писать стих на древнем языке с подстрочником, чтобы было легче сопоставлять.

Читать это конечно нормальным людям невозможно, только лингвистам, я предпочитаю что-то вроде басни Шлейхера. Да, пусть ценой лингвистической точности, но это будет гораздо читабельнее.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации