Comments 9
И что мы должны иметь в итоге?
В промпте жесткая зависимость от библиотек питон. Результат немного предсказуем
А чего было ожидать? По карме, нужно хорошенько расплатиться за бездумное размножение языков.
DSL всегда конкурировали с кодогенерацией - тем же DSL, вид сбоку. БЯМ не помогает DSL и помогает кодогенератору. И лучшим и единственным DSL будет английский.
Кроме того, разбираясь что за ерунда вышла, в обоих случаях можно почитать код, только для DSL он на ассемблере, а для кодогенератора - на основном языке.
Сама идея подгонки средств, включая ЯП, под задачу - устаревает. Под систему управления, под психологию работников, под систему контроля качества и прочая - сколько угодно, под задачу - отнюдь. Ибо подгонка под задачу использует эффект масштаба ценой потери гибкости, а тренд - развитие гибкости для уменьшения эффекта масштаба и работы на хвостах рынков.
(del)
В статье предложен метод повышения производительности для этих «слабо представленных» языков путём генерации синтетических данных.
WTF!? слово-дробилка (LLM) написала кучу говокода, что бы увеличить объем данных для тренировки слово-дробилки? Они серьезно считают, что это УЛУЧШИТ генерацию кода?
Скорее всего речь уже идёт не строгих языках а фактически тех которые имеют характер описания и разметки. Вообщем эра текстовых редакторов уровня перевод строки и возврат каретки 0D0A ◙♪ с виртуальной машиной, определяемой первой двадцаткой управляющих символов ASCII уходит в прошлое, и то, что мы видим на экране есть результат отображения уже обработанного абстрактного синтаксического дерева. В этом случае ИИ тренируется уже не на слова/мнемоники а на представление алгоритма, данных в виде соответствующего дерева. Любой компилятор неявно содержит в себе модель вычислителя как на HDL-языке с разметкой количества тактов, целостности кэша, работы с аппаратурой.
Разработка языков программирования в эру больших языковых моделей: ренессанс посредственности?