Комментарии 29
интересна динамика обучения, вероятно возможно не только моделирование прото санскрита, но и исторического развитие индо-европейских языков на его основе как последовательности моделей обучения
Что Вы понимаете под прото-санскритом?
Что касается моделирования исторического развития – конечно, в теории это возможно, и идея интересная, но площадка ChatGPT, конечно, для такого не подходит. Если чат-бот будет активно обучаться, его язык может "исторически развиться", но вряд ли он будет рекапиптулировать настоящее развитие индоевропейских языков.
прото санскрит примерно = пра индоевропейский, больше вопрос терминологии, конечно ChatGPT как есть сейчас не очень подходит, но сам подход обучения развитых моделей кажется перспективным именно для изучения исторической динамики языков
Вот не согласен с классификацией праиндоевропейского как прото-санскрита, это заблуждение из XIX века. С тем же успехом его можно было бы назвать прото-латинским или прото-литовским, например)
Между праиндоевропейским и гипотетическим "прото-санскритом" имеется ещё одна чётко очерченная стадия — праиндоиранский язык, общий предок санскрита и таджикского. На нём говорили носители археологической культуры Синтаншта на Южном Урале. И лишь после распада этой общности можно говорить об условном "прото-санскрите". Такой "прото-санскрит" уже отличался бы от праиндоевропейского так же сильно, как, например, праславянский. И его реконструкция не имеет с обсуждаемым чат-ботом ничего общего.
На литовский то в итоге похож или нет?
Любимый вопрос индоевропеиста))
Как Вы видите по стихам, в чат-бота заложена реконструкция с ларингалами, да ещё с целыми тремя. Такая фонетика соответствовала раннему праиндоевропейскому, до отделения анатолийской ветви. Попробуйте прочесть это вот с тремя разными гортанными звуками (почти как в арабском!) и слоговыми сонорными. Думаю, фонетически на литовский будет так себе похоже.
Но вместе с тем чат-бот уже имеет в своём составе "колёсную" лексику — а она развилась по больше части уже после отделения хеттов. То есть лексически он отражает скорее всего праиндоевропейский в его "среднем", "классическим" периоде, в периоде "расцвета". И большой вопрос, были ли там ларингалы — если даже у хеттов сохранился лишь один, а у других индоевропейцев ни одного. Возможно, к моменту начала активного использования колёс ларингалы уже были благополучно проглочены и ассимилировались в гласные. И такая версия действительно могла очень отдалённо напоминать современный литовский за счёт его архаичных черт, точно так же как современный болгарский в чём-то напоминает нам старославянский. Но это всё равно некая вульгаризация – мы пытаемся подсознательно "спроецировать" праиндоевропейский на "плоскость" современных индоевропейских языков. И в этой "плоскости" он оказывается ближе к литовскому – несмотря на то, что с учётом всех переменных был от него далёк как Альфа Центавра от Солнца.
Говоря о сочетании черт разных периодов в одном чат-боте, я вовсе не имею в виду его дефект. Это консенсусная реконструкция праиндоевропейского в современной лингвистике. Дело в том, что любой метод реконструкции приводит к появлению вот такой "сборной солянки" из разных периодов развития языка, и получается что-то типа "Я есмь блогер-инфлюэнсер, а ты где подвизаешься?" Это неизбежно, иначе целостную картинку языка не собрать.
Я думаю, что последняя версия стиха, самая непротиворечивая, скорее похожа на раннюю индо-хеттскую стадию развития праиндоевропейского. Так получилось чисто случайно за счёт отказа от "огненных колесниц" и выпадения того же корня *-leub- "любить". Так что в итоге, наверное, всё-таки не литовский, а ранний праиндоевропейский получился))
Как Соссюр до ларингалов то по письменным источникам вообще мог дойти, я не представляю. до этиих самых "исчезнувших сонантных коэффициентов "
Кстати, радовался как ребенок по поводу письменного и устного звучания вот этой картинке из дидактического материала ддля 3 класса от знакомой ("лежит у каждого ребенка в портфеле")

Носители сразу отвечали, а люди с любым уровнем неродного английского жестко зависали.
возможно потому, что sharpener супер редко используется взрослыми людьми
а так?

former Prince of Wales
встречный вопрос - какой смысл в этой строчке из Java Jive:
"Woops, Mr. Moto, I'm a coffee pot,
Shoot me the pot, and I'll pour me a shot ..."
:)
Сделка по Mary Jane наверное
Если чисто по тексту
мимо,
подсказка - это аллюзия, Mr Moto герой фильмов и анекдотов, типа Штирлица
До этого агента 30х годов я дошел, но кроме версии драг дилера шифрующегося от полиции, других не вижу:) все таки песня почти народная, как выяснилось по Яндекс музыке, с 40 х годов может быть много версий , что происходит в кофейне Java Jive. Сухой закон уже вроде кончился, так что подозревать в желании втихаря сделать whiskey shot с кофейком я бы не стал. Ну a cup a cup это мент мент мент.
да нет, это современные фантазии насчет "pot" и прочего,
немного проще - "jive" это не только танец тех времен, но и в переносном смысле "болтовня", т.е. текст имитирует обычные разговоры за кофейной стойкой в баре,
Mr. Moto японец (на что намекает имя, сравни - Yamamoto), разыгрывает из себя американца, но неудачно, ему говорят, типа если Вы американец, то я "coffee pot", несколько по-расистски, что характерно для тех времен, какой-нибудь шофер такси, или бармен, известный до анекдота сюжет,
"shoot the pot" типа по гладкому прилавку в баре "отфутболить" стакан или кружку клиенту, в вестернах это любят показывать
Но в кавере Джонни мерсера поется mr. Mercer так что это немного бессмысенно, певец не азиат
Мне кажется там что то про копа под прикрытием ( мр Коломбо я бы сказал немного в тему)
не совсем понял, Johnny Mercer примерно как все, про копа под прикрытием все же перебор, Java Jive это популярный mainstream для широкой аудитории, тогда и битников даже не было, Colombo лет на 30 позже, чем Java Jive стал исполняться

Woops mr Mercer в его кавере он сам поет.
Упс мистер Мерсер, я полон кофе до горла, если шмальнешь мне я сам себе смогу кофейку сбацать.
Вот вариант без усложений
To potshot это шмальнуть
То есть выстрелить в сторону не прицельно
Вот игра слов - второе pot никак не читается, это разделенный глагол в повелительном наклонении potshot
А вот сам потшот " шмальнуть" забавно пересекается с русским словом "шмаль"

ЗЫ Коломбо это аналогия со Штирлицем, но с кофейным привкусом
PS Скорее всего это песенка кофейника в джазовой забегаловке.
Как Соссюр до ларингалов-то по письменным источникам вообще мог дойти, я не представляю. До этих самых "исчезнувших сонантных коэффициентов"
Это называется внутренней реконструкцией.
Дело в том, что не всегда нам доступны данные по каким-то внешним группам, по ближайшим "родственникам" группы или семьи языков. И тогда классическая сравнительная реконструкция – которая называется внешней реконструкцией – просто недоступна. Постараюсь популярно, с IT-аналогиями (так как нахожусь на Хабре), объяснить, как это работает.
Это похоже на обратную разработку методом "баг на баг". За тысячи лет слова меняются в одном и том же языке (и в одной и тоже же семье языков) по-разному в зависимости от позиции тех или иных звуков. В итоге получаются кластеры слов, которые без проблем идентифицируются как родственные, но между ними остаются на первый взгляд необъяснимые несоответствия. Проще говоря – "баги".
Вот на эти-то "баги" и опирается внутренняя реконструкция: лингвисты пытаются представить, какой звук должен был присутствовать в словах праязыка в заданной позиции, чтобы в языках-потомках получилась такая чехарда.
Что сделал Соссюр? Он заметил, что во многих индоевропейских языках система гласных имеет одни и те же "баги", которые явно являются праиндоевропейским легаси. Но как они могли возникнуть? Когда-то же система была стройной?
Единственный способ сделать её стройной — предположить, что в праязыке были какие-то неизвестные звуки, которые потом исчезли – но повлияли на последующие гласные. Соссюр не знал, что это такое, и назвал их просто "коэффициентами". Его ожидаемо не оценили. Получился какой-то сферический конь в вакууме, который к тому же не сохранился ни в одном из современных индоевропейских языков.
В 1912 году А. Кюни сужает поиск — он доказывает, что эти "коэффициенты" должны быть согласными фонемами. Но опять непонятно, какими.
Соссюр не дожил до триумфального подтверждения своих имей более 10 лет. В 19220-х годах семитолог Бедржих Грозный расшифровывал надписи, найденные при раскопках в Анатолии (территория нынешней Турции). Он работал со странным набором клинописи, относящейся явно к одному языку – и он предполагал, что семитскому. А кого, кроме семитов, можно было ожидать там встретить тысячи лет назад?
Но ни с одним семитским языком получившиеся расшифровки не вязались, пока он не наткнулся на табличку, гласившую:
ну 🍞🥐 ан эззатени вадар ма экутени
Я не случайно поставил здесь эмодзи "хлеба" – в оригинале тоже была логограмма "хлеб" с неясным звучанием, вот как в моей записи. А всё остальное было записано силлабически, но что это значило? Ни с одним семитским языком такое не вязалось.
Внезапно Грозного осенило: "вадар" – это же "вода", "water"! Тогда "эззатени" – это "ешьте", "essen"! Любой индоевропеист без труда прочитает это как "(теперь) вы будете есть хлеб и пить воду". Но ведь, значит, и язык – индоевропейский.
Дело расшифровки пошло быстрее. В 1927 году Ежи Курилович публикует работу по фонетике найденного языка – хеттского. Среди находок фигурирует "хрипящий" заднеязычный звук, похожий на "х" – который находится прямо на тех местах, где у Соссюра был один из "коэффициентов". Занавес. Немая сцена.
Позже в хеттском обнаружились дополнительные "баги" – следы недавней утраты второго "коэффициента". Когда присмотрелись повнимательнее, их нашли и в ведических гимнах. Стало ясно, что Соссюр был прав.
Сочетание хеттских данных и данных по фонетике других языков указывает, что такую картину дают именно ларингальные согласные. Такие есть, например, в иврите – и они могут изменять соседствующие гласные, хотя сами при этом и не исчезают. Так что пока консенсус в том, что три непонятных звука в вакууме – это ларингальные согласные, которые произносились глубоко в гортани, как в арабском и иврите. Вот только как именно они звучали... до конца не понятно. Обычно пользуются условными чтениями, как для древнеегипетских гласных – то есть подставляют знакомые звуки, наиболее подходящие к имеющимся реконструкциям.
Но одно понятно: работа Соссюра оказалась пророческой. Мораль сей басни такова, что в науке часто открытия могут быть оценены или окончательно опровергнуты спустя длительное время после публикации. И почти любая научная новизна означает долгое время, пока новые находки станут частью общепринятой теории.
Анатолийские языки отделились от праиндоевропейского очень рано, задолго до его распада. Предки хеттов ушли в Анатолию в гордом одиночестве, в то время как индоевропейские племена ещё веками после этого колесили по степям в районе нынешней Украины и южной части России. Их язык менялся, и к моменту распада на германскую, италийскую, балтославянскую, индоиранскую и прочие ветви совсем не напоминал тот, который прихватили с собой предки хеттов. Ларингалов, видимо, на тот момент уже не было.
До сих пор они являются неоценимым источником знаний о раннем праиндоевропейском, о самой ранее доступной нам стадии его развития. Недавно появилось сообщение об открытии нового языка анатолийской группы. Так что точка в изучении анатолийских языков пока не поставлена – как и точка в изучении ранних стадий развития праиндоевропейского языка.
ну гортанью можно только Р и КХ ,а третий даже не могу предпоположить.. какойто смешанный вариант с Т . Я думаю что детский логопед бы в этом разобрался, ведь древние языки как эмбрионы , проходят стадии эволюции. У них должно быть много звуков от детской речи
ну гортанью можно только Р и КХ ,а третий даже не могу предпоположить..
Здесь и перечень (возможностей намного больше трёх), и аудиозаписи: https://en.wikipedia.org/wiki/Pharyngeal_consonant
Напишите отдельную статью на Хабре про всё это. Очень интересно.
Такие есть, например, в иврите – и они могут изменять соседствующие гласные, хотя сами при этом и не исчезают. Так что пока консенсус в том, что три непонятных звука в вакууме – это ларингальные согласные, которые произносились глубоко в гортани, как в арабском и иврите.
Немножко поправлю: из иврита к концу 20в эти согласные точно так же исчезли (сохранившись лишь в орфографии), как и из ПИЕ, так что фонетическая картина один к одному: изменения гласных "на ровном месте".
DEL
Лучше все таки писать стих на древнем языке с подстрочником, чтобы было легче сопоставлять.
Читать это конечно нормальным людям невозможно, только лингвистам, я предпочитаю что-то вроде басни Шлейхера. Да, пусть ценой лингвистической точности, но это будет гораздо читабельнее.
ChatGPT теперь говорит на праиндоевропейском (и перевёл на праиндоевропейский моё стихотворение)