Комментарии 4
Да заметил тоже такое , я даже пишу специально , проведи анализ и дай на выбор лучшие решения. А в промпт вставляю ревью от другого агента .. видимо его промпт воспринимается как конфликт правила уж я не знаю , но он игнорирует первые предложения в том плане , что сначала давай подумаем и выберем , а не приступать к первому попавшемуся решению , которое еще и может сломать что либо параллельно.
Поэтому свод актуальных правил должен отдаваться автоматом, AI-индустрия к этому идет, но пока что большинство застряли в skills.md. Я для себя пишу на эту тему инструмент, и он реально помогает.
Наступал на это ровно три месяца назад. Попросил агента проверить почему падает один тест, через пять минут он переписал три файла, добавил хелпер и вынес конфиг. Тест прошёл, но в проде это выявило регрессию, потому что никто не ожидал изменений в этих файлах и ревью проходило по-другому. Решение, которое сработало: в CLAUDE.md жёсткий протокол для диагностических задач, агент останавливается после постановки диагноза, показывает список файлов которые собирается трогать, ждёт явного подтверждения. Замедляет цикл на 30 секунд, но снимает именно эту проблему. Способность сделать и право сделать разные вещи, и без явного барьера в инструкциях агент их не разграничивает.
Лично я пошёл по самому простому пути - делегирование. За написание кода у меня полностью отвечает агент. Код получается ужасный. Но... он работает.
На мой взгляд, дело не в полномочиях агента, не в разрешениях. Дело в минимизации ущерба, когда он возникнет. В общем, я думаю, примерно с такими же проблемами сейчас сталкиваются руководители софтварных "галер" на несколько десятков команд, работающих одновременно над несколькими проектами, иногда даже конкурирующих друг с другом заказчиков. И у них уже есть решения. Просто разработчики вращаются в другой среде и этих решений не знают.

Самая опасная ошибка AI‑агента — не плохой код