Комментарии 2
Интересная тема, хоть и не новая:
Для редких или молодых языков нет обучающих данных. Их генерят перекодировкой с других языков, проверяют компилятором и гоняют тесты.
И когда-нибудь они начнут обучаться на общении в чате / песочнице. Ведь и по диалогу/ реальным проектам можно многому научиться.
Да, согласен. Для редких/молодых языков синтетика + “верификация компилятором/тестами” — почти единственный способ быстро набрать качественные пары “задача→решение”. Следующий шаг логичный: обучение на следах реального использования — диалоги, правки, запуск тестов в песочнице, итерации “предложил → проверил → исправил”. Но это, скорее, пойдёт в донастройку (tool-use / RL по фидбеку), потому что там сразу включаются вопросы приватности и лицензий. (В посте я как раз упоминал логи взаимодействий как один из самых ценных будущих источников.)

На чём будут учиться нейросети в 2026