Asouei Feb 26 at 13:08

Я просто хотел, чтобы код от Claude не поломался через месяц. Пришлось сделать runtime для воспроизводимости AI-кода

Medium

12 min

14K

DevOps * Node.JS * Open source *

Case

+10

Comments 22

AllFiction Feb 26 at 14:04

как хорошо что благодаря таким людям, специалисты будут еще более востребованы)

как плохо что благодаря таким людям нас ждет эпоха нейрослоповых приложений. уже началась, плеймаркет забит в топах сгенерированным шлаком где только иконки отличаются зато пейвол загружается первым при старте

akod67 Feb 26 at 14:06

Маркеты стали клонами сомнительного качества забиваться сильно раньше ИИ.

AllFiction Feb 26 at 14:27

раньше их было 6-8 на десяток апок, сейчас цифры уже трехзначные.

вчера искал простой тестер для микрофона что бы можно было переключать источники записи прям в апке и записывать звук что бы понимать как записало.

более двух десятков апок с разными названиями, иконками и скринами (и авторами) которые выглядят одинаково - той же самый пейвол и функционал просто под разными шкурками
под сотню разного "нового" что опубликовано до пары месяцев назад прям явно нейронное аж по скринам видно
апку я так и не нашел, в итоге через звонок на другой телефон и запись там тестил

Asouei Feb 26 at 15:03

но если индустрия всё равно идёт туда - вопрос становится инфраструктурным. Так или иначе все рано или поздно перейдут на такой способ написания. В том или ином виде

AllFiction Feb 26 at 15:15

такой как у вас точно нет.
если бы у вас было четко прописанные правила по архитекруте и требованиям, то такой фигни бы у вас не было. это смотрю по тому что оно успешно сгенерировало с первого раза, то есть у вас там функционала и бизнес-логики жменька.

реальный большой проект сможет сделать только "по мотивам". а уж патчить, править и тд только если расписать промт километровый со всеми краевыми условиями

кстати, то что оно у вас для фикса переписывало все в ноль это тоже проблема в первую очередь постановки задачи

Asouei Feb 26 at 15:20

Спасибо, это справедливое замечание.

Я как раз и столкнулся с тем, что при маленьком проекте проблема уже проявляется, а на больших она становится только хуже. Даже при нормальной архитектуре и требованиях AI всё равно генерирует решение в контексте конкретного состояния экосистемы: версии зависимостей, инструментов, среды.

Continuum не пытается заменить архитектуру или постановку задачи. Он скорее фиксирует сам процесс получения результата: какой план действий привёл к рабочему состоянию и как это состояние потом воспроизвести или диагностировать, когда среда изменилась.

Про переписывание с нуля согласен. Это тоже симптом плохой постановки задачи и отсутствия механизма инкрементального ремонта. Собственно, идея как раз родилась из раздражения, что каждый раз происходил reset вместо минимального исправления.

Большие проекты, скорее всего, действительно будут работать только "по мотивам". Я пока и рассматриваю это как слой вокруг генерации и воспроизводимости, а не как замену нормального engineering процесса.

Буду рад, если подскажете реальные кейсы, где такой подход точно развалится. Сейчас как раз интересно найти границы применимости.

AllFiction Feb 26 at 15:32

я думаю это у вас скорее от отсутствия релевантного опыта. лично для меня нейронки это просто очень быстрые но туповатые джуны))

нарезал задачи, потом проверил и поправил по месту (или зарядил заново) то все ожидаемо. исследование идеи и накидать прототип тоже ок. но отпускать в свободное плаванье или подпускать к бизнесу что бы он навесил на уши свои космические корабли - точно нет

на сейчас если я что то с нуля делаю при помощи нейронки с расчетом что это не прототип, то я сначала сам прописываю основной скелет руками, а потом уже сажусь за промт. просто потому что прописать базовую архитектуру быстрее чем словами прописывать что ты хочешь и краевые условия.
и то потом полученное поделие я руками довожу потому.

а проблем с фиксами и патчами нет, если ты знаешь проект, понимаешь как оно все работает и знаешь что именно надо починить. прописываешь конкретный промт и все ок, точечно правит и все работает.

Stan91 Mar 1 at 10:11

Про нейрослоп - мне кажется рыночек сам порешает. Не будет ценности - не будут пользоваться, не будет автору дохода

akod67 Feb 26 at 14:41

А что, если на это всё смотреть в контексте "у кода теперь нет ценности, есть ценность у результата"? Может и бог с ним, что моделька будет переписывать одно и то же по нескольку раз в год, если результат от этого не ломается? Тогда контекст вопроса перемещается в другую плоскость - как обеспечить целостность результата? (не поплыли экраны, не изменилась бизнес логика и т.п.) Даже если модель вдруг решит переписать всё с условного питона на rust ибо в новой версии она на нём мыслит, может оно и норм?

igorp1024 Feb 27 at 06:06

Написать спецификацию на специализированном языке спецификаций. Ой, получается же высокоуровневое программирование. :)

Kahelman Feb 27 at 06:59

Автор поясните, а когда вы руками код написали и версии окружения зафиксировали, у вас код не перестает работать? А когда LLm то же делает- перестает. Я что-то не понял в чем фокус?

Единственный вариант вы когда руками пишете то версии жестко не фиксируете и оно типа работает.

так что-ли?

MbongoMutombo Feb 27 at 07:19

Раньше я ходил на Хабр, чтобы читать умные статьи и узнавать новое.

Сейчас Хабр заполонили такого рода писаки с журналистскими жёлтыми заголовками типа "я построил дом инструментами фирмы Х, и он развалился", а потом в статье выясняется, что гвозди он перфоратором забивал, а фундамент не построил.

Есть же известная фраза: если вам захотелось написать статью на Хабр - не пишите...

Recklgor Feb 27 at 09:19

Проблема притянута за уши. Ну или от и незнания экосистемы, и неумения ставить задачи ии.

Lockfile с запиненными транзитивными зависимостями в момент генерации - это дефолт в npm (ну и любом другом менеджере пакетов для js). Как раз для воспроизводимости.

Нужен патч безопасности и обновления? Ну так милости просим:

npm audit fix, обновит в пределах, на которые согласны все зависимости, включая транзитивные.
npm update (ну или регенерация локфайла) тоже обновляет зависимости только до тех, на что согласны все остальные зависимости.

Хотите обновить на версию, которая выходит за эти ограничения? Подумайте 3 раза, надо ли оно, почитайте breaking changes.

Это вроде касается и разработки кожаными мешками. Как ии тут отличается?
Почему он будет переписывать код совсем по-другому? Вы не задали ему конкретную задачу? У вас нет контроля версий? У вас нет спеки проекта? У вас тесты уровня "статус 200 и ладно?".

Я пару раз делал большие апдейты на сгенерированном claude code пет-проекте (около 100к строк кода) - оно меняло только в пределах реально сломанных частей, не пыталось изобрести велосипед. Но я и при изначальной разработке заставлял его вести дизайн-док и историю сессий. Если я пытаюсь сделать что-то абсурдно трудозатратное (ну, например, поменять ui либу) - оно, наоборот, пытается меня остановить.

PNoryk Mar 2 at 05:27

Полностью поддерживаю. Хрень какую-то автор написал. Устанавливай из лока и обновляй вручную. Всё. Нет проблемы

Vvlad1973 Feb 27 at 09:48

Странное ощущение, что описана проблема буквально высосанная из пальца. Ибо:

Код не может ломаться сам по себе. Ну вот нет такого, что он полежал месяц после "зелёных" тестов и внезапно испортился. Тут либо тесты косые, либо одно из двух
Мажорные версии пакетов не появляются внезапно. И перед любым таким upgrade просто обязательно вникнуть во все breaking changes, понять и поправить все то, что с новыми версиями несовместимо. И да, lock-файл к пакету - это то, без чего нормальная разработка в принципе невозможна (IMHO) (засада может быть и в минорных, но тут стоит подумать, надо ли с такими пакетами вообще связываться)
Но если код таки ломается, стоит не cicd наворачивать, а задуматься о том, не фигню ли я с помощью нейронки навайбкодил.
Гниение не в нейронках, а в заполоняющей социум иллюзии, что темерь напрягаться не обязательно, что теперь агенты будут кодить, а мы их будем просто попинывать

sickfar Feb 27 at 14:28

Об этом уже писали выше, но это проблема не нейронки, а js экосистемы. Я с этим сталкивался еще за годы до выхода нейронок, и тут было только два решения - фиксировать зависимости, а потом страдать раз в N месяцев, когда обнаружена критическая уязвимость/браузер перестал поддерживать старый движок итд; или же страдать каждый день по-чуть-чуть, держа зависимости всегда актуальными.

Характерно, что за пределами JS экосистемы таких проблем нет, что как бы говорит о том, что LLM ни при чем

akod67 Feb 28 at 12:38

Проблемы с зависимостями - это не изобретение js, в js это просто сильно бОльнее из-за адовой сущности самого JS.

Kahelman Feb 28 at 14:39

Мыши плакали, кололись но продолжали есть кактус….

Tamerlan666 Feb 28 at 15:49

Это не баг. Это фундаментальное свойство любого сгенерированного артефакта, у которого нет механизма адаптации.

Вы не делаете код воспроизводимым. Вы делаете окружение статичным. Это разные вещи.

Это не артефакт. Это тепловой шум.

Интересно, почему нейронки так любят противопоставления в своих текстах, кто-то в курсе?

sunnyfox Mar 2 at 07:09

Автор, пожалуйста, пожалуйста, используй для обработки статей тоже клод, а не чатжпт, раз уж самому лень писать. У него хоть стиль пока поприятнее. Все эти "не потому что, а потому что", "это не то, это это" и кучи списков на ровном месте уже заставляют глаза слезиться.

Samhuawei Mar 4 at 06:39

Хм, у меня теория заговора. А что если авторы Express в доле с авторами llm и намеренно ломают код в новой версии чтобы программисты тратили токены? А что если код Express генерится той же конторой которая генерит код для автора и в llm зашито правило увеличить доход конторы? А что если экономия на зарплатах программистов в итоге осядет в карманах владельцев llm?

Googlonator Mar 4 at 19:55

Мне нравится как вайбкодеры придумывают целые пайплайны разработки для проблемы, которая решается 2 командами