Comments / Profile of caveboy / Habr

Николай Лаптев@caveboy

тыжпрограммист

Самая опасная ошибка AI‑агента — не плохой код

Тут все немного сложнее:
1. Большинство популярных CLI помимо основного тела запроса пользователя агенту добавляют много сопутствующей информации, считаемой авторами CLI нужной и полезной.
2. Многие пользователи бездумно добавляют MCP, skills и прочий балласт, в надежде, что это улучшит ответ модели.
3. LLM на самом деле воспринимает ограничения как рекомендации, т.е. "нельзя, но если хочется то можно".
4. Пользователь часто не хочет или не может досконально описать все условия постановки задачи. Эту проблему очень хорошо демонстрирует фильм "Ослепленный желаниями".

Наложение вышеперечисленных факторов, часто взаимоисключающих. позволяет LLM трактовать коллизии в свою пользу.

Я попытался изготовить PCB на CNC3018 под Linux. Всё оказалось сложнее, чем я думал

caveboy Jun 20 at 08:07

Mach3 - основная система с которой я работаю, поэтому с высоты своего опыта могу сказать, что в Mach3 концевики лимитов и поиск нуля настраиваются в пару кликов мыши, запуск обнуления - одна команда RefCombination в скрипте; также поиск по поверхности - скрипт на пяток строк кода, если назначить на макрокоманду. Руками - команда G31, затем g10, но лучше скрипт. Если хочется кнопочки в интерфейсе, тогда еще придется поучиться скрины рисовать. Основной минус Mach3 - необходимость искать под него комп на помойке.

Я попытался изготовить PCB на CNC3018 под Linux. Всё оказалось сложнее, чем я думал

caveboy Jun 16 at 14:56

Ну я написал, что актуальность моих знаний о GBRL осталась в 2016-м, тогда она основана была на на 328-й атмеге, со всем вытекающим дефицитом портов, рады были датчику касания, потом он на arduino mega вроде передрейфовал, а там и до arm архитектуры недалеко, в общем я рад, что проект развивается, для меня пока Mach3 и LinuxCNC фавориты, и я на них собаку съел.

Я попытался изготовить PCB на CNC3018 под Linux. Всё оказалось сложнее, чем я думал

caveboy Jun 15 at 07:03

Каждый человек в познании предметной области проходит 3 этапа:
1. Я ничего не знаю.
2. Да я все знаю!
3. Как много оказывается еще предстоит узнать.

Опаснее всего вторые.

Приведу пример, аналогии вашего высказывания:
Какая телега, все ездят на авто!

Однако не всегда было так.

Когда я ковырял GBRL, это было лет 10 назад, может больше, автономных контроллеров к GBRL в продаже не было, единственными средствами управления были программы Candle, да UDS, может что-то еще, но мне хватало candle. Датчиков обнуления осей в прошивку GBRL вроде никто не завез, поэтому ловить начало координат после сбоя управляющей программы это пытка. Отваливалось часто, может вибрация, может помехи. Плюнул и купил промышленный контролер начального уровня, благо недорого, примерно тыс 5. Да и 3018 по размерам тогда уже перерос.

Я попытался изготовить PCB на CNC3018 под Linux. Всё оказалось сложнее, чем я думал

caveboy Jun 14 at 19:57

не обязательно полноценный комп, достаточно малины или аналогов. Сразу скажу, для простого использования достаточно GBRL, хотя я с ним в свое время намучался, постоянно посреди работы отваливался коннект, хз мож провод, мож помехи виноваты, а еще меня ненавидели соседи :) Но если хочется углубиться в изучение ЧПУ. то стоит обратить внимание на что-то посерьезнее.

Я попытался изготовить PCB на CNC3018 под Linux. Всё оказалось сложнее, чем я думал

caveboy Jun 14 at 16:54

программу генерации g-кода, я впервые написал еще лет 10 назад, руками, когда наигравшись 3d-принтером купил на пробу 3018, сейчас у меня станки примерно 3.5 на 2 метра. И задачки посложнее. Зато ИИ есть, тогда не было.:)

Я попытался изготовить PCB на CNC3018 под Linux. Всё оказалось сложнее, чем я думал

caveboy Jun 14 at 11:34

Если очень хочется, можно заморочиться и написать свой инструмент. вайбкодинг сейчас модно. G-код - простой как валенок, если глубоко не в него не лезть, векторные форматы, типа DXF, SVG, тоже предельно просты. Маска для станка по сути лазер вкл/выкл. Можно пойти другим путем, переделать станок с GBRL на linuxcnc, он умеет из коробки растровое изображение растровое изображение обрабатывать. Бонусом получите все плюшки промышленных станков. Лично я бы как "решение за вечер" предпочел написать свой. Нужна помощь, косультация, с удовольствием отвечу.

Самая опасная ошибка AI‑агента — не плохой код

caveboy Jun 13 at 14:37

09:17 значит дефекты надо устранить, если они есть, создавай задачу
09:19 продолжай
09:26 да

Именно это я считаю программированием на вайбе

Самая опасная ошибка AI‑агента — не плохой код

caveboy Jun 13 at 14:27

Эту статью поймут те, кто кнопку plan mode давно перерос. Разве у вас не бывало так, что включил план мод, вроде все описал, переключился в act, и получил поломанный проект. причем проект ломаться постепенно, иногда заметить это можно случайно, когда уже на гит надежды нет. Время потрачено, токены потрачены, настроение испорчено.

Сейчас будет немного длинно, но вот пример диалога с агентом в режиме act:

значит дефекты надо устранить, если они есть, создавай задачу

четверг 09:17

Работал на протяжении 1m 55s

Задача создана через SloplessCode MCP:

1054b22f-f11b-457d-93b7-195afd9644e8

Название: Semantic artifact retrieval and orphan-reference diagnostics
Статус: open, не взята в работу.

Зафиксированы два дефекта:

семантические запросы ошибочно сводятся к нефильтрованному лексическому поиску;
устаревшие ссылки вторичного индекса не диагностируются как orphaned refs.

SQLite остаётся единственным source of truth, Qdrant только выдаёт кандидатов. Write-тесты разрешены исключительно в Docker.

четверг 09:19

продолжай

четверг 09:25

Работал на протяжении 20s

Постановка задачи 1054b22f

Проблема: семантические запросы ошибочно маршрутизируются в лексический list_artifacts/list_open_tasks. Дефект снова воспроизведён при получении контекста этой задачи.

Цель:

отдельный маршрут семантического поиска;
Qdrant только формирует кандидатов;
каждый кандидат проверяется и загружается из SQLite;
orphaned refs доступны лишь как диагностические, не как существующие задачи.

В объёме: маршрутизация, ранжирование, подавление служебных слов, aliases, все статусы и типы артефактов, диагностические receipts.

Вне объёма: восстановление или удаление данных, миграция рабочей базы, признание индекса источником истины.

Критерии готовности:

запрос про reconstruction bundle находит релевантные материалы;
нет скрытого отката к lexical search;
8f39fa86-... показывается только как orphan diagnostic;
точный lookup остаётся fail-closed;
все write-тесты выполняются только в Docker.

Риск: утечка или ложное признание артефакта существующим. Защита: обязательная SQLite-валидация.

Первое действие: после claim исследовать текущие маршруты поиска и диагностический контур без записи в рабочую БД.

Подтверждаете старт реализации этой постановки?

четверг 09:26

да

четверг 09:27

Работал на протяжении 22m 42s

Задача 1054b22f-f11b-457d-93b7-195afd9644e8 выполнена и закрыта, claim освобождён.

Реализовано:

отдельный semantic_artifact_lookup;
Qdrant используется только для кандидатов;
SQLite-валидация tasks, improvements, memories и project-tree;
stale candidates отбрасываются;
orphan refs показываются как неавторитетная диагностика и не удаляются автоматически;
обычный exact lookup остаётся fail-closed.

Проверка: 503 passed в Docker. Рабочая БД не использовалась. Live restart не выполнялся, поскольку отдельного разрешения на live validation не было.

-1

Самая опасная ошибка AI‑агента — не плохой код

caveboy Jun 13 at 14:20

Серьезно.
интерено, дочитали ли вы до фразы

Если продолжить аналогию, plan mode — это выключатель света, конечный автомат — логика умного дома, а чекпоинты — журнал его событий.

-1

Почему мы спорим о памяти для AI-агентов

caveboy Jun 13 at 09:49

Я рад, что большая часть комментариев не от хейтеров, а от собратьев по AI-оружию.

Почему мы спорим о памяти для AI-агентов

caveboy Jun 13 at 09:30

Верно, про harness - вот только harness(пояс) может быть пеньковой веревкой, а может быть тактическим ремнем. Назначение одно, удобство разное.
Остальное - задача человека. На мой утопичный взгляд, задача человека, сказать: "Я хочу...", все остальное задача машины: спросить, что хочешь, предложить варианты, сопроводив их комментариями об эффективности и ограничениях, оформить и сохранить постановку задачи. При этом не забыв про Liskov Substitution и декларативный код. :)

Почему мы спорим о памяти для AI-агентов

caveboy Jun 13 at 09:17

Не переживай, мой массам тоже не зашел, 99% пул-реквестов с гитхаба - боты, так, что ждите мои идеи в антропике или дипсике:) Как-то пару лет назад в одной онлайн-конференции спросил, почему еще никто не додумался до узкоспециализированных SLM, вопрос тогда вообще не понят был, проходит полтора года, мы видим преймущество MOE- моделей.

Почему мы спорим о памяти для AI-агентов

caveboy Jun 13 at 06:20

task-state/checkpoint лишь вершина айсберга. Все это тоже есть, но скрыто. То, что ты копаешь сам - похвально. Лишь сделав инструмент самостоятельно, ты постигаешь тайный функционал его работы.

Почему мы спорим о памяти для AI-агентов

caveboy Jun 13 at 06:01

за меня лучше скриншот ответит:

Почему мы спорим о памяти для AI-агентов

caveboy Jun 13 at 05:55

"Спокойной", как синоним "относительно статичной". Я рад, что "нейрослоп", на написание которого ушло несколько дней бесценной для меня жизни, нашел отклик в вашей душе настолько, что пару абзацев в ночью в выходной, вы сочли должным в ответ мне чиркнуть.

По существу отвечу что:
1. Спор существует, и вы это сами прекрасно доказали.

2. Я не хочу, чтобы моя работа вместо полета мыслей состояла из создания файлов "этооченьважныйфайл.прочтинемедленно".

3. почти все llm с этим умеют работать, им плевать что откуда читать. Это неверно, т.к. либо агент делает grep по директории проекта, получив пару процентов нужной информации и 98 связанного мусора, порою спотыкаясь о фортели Powershell. Либо специализированная система памяти сама выдаст ему только то, что нужно в данный момент.

4. И суперагенты пишут под себя тулзы - пишут. А потом читаю в новостях: команда разработчиков потратила 2 миллиона долларов на LLM за месяц. Слегка завидуя их бюджету и утирая скупую мужскую слезу, открываю страницу оплаты подписки на GPT Plus.

5. Практический пример, почему надо разделять контуры документации проекта и оперативно рабочей информации: мне добрый китайский нейропомощник заботливо положил api-ключи в маркдаун файл с примером проверки доступности облачной нейросети через curl. А я это заметил, когда с Гитхаба алерт прилетел, что у меня конфиденциальное в публичном доступе.

6. Через БД, удобно автоинформировать агента о том, что другой программист работает сейчас над этой задачей, и агент не должен даже случайно реализовать еще и ее.

7. Время течет, все меняется, когда я писал диплом, "золотым стандартом" хранения информации был DBF, и кто сейчас его вспомнит за исключением программистов из пенсионного фонда? Сейчас у нас есть SQL, noSQL, semantic search и много всякого другого. Публично сказать, что SQL лучше noSQL, можно такой ларец Пандоры открыть, что лучше и не спрашивать совсем.

К слову сказать что я более чем уверен, что вы прекрасный специалист, хорошо знакомы с методологией оценки рисков и собаку съели на AI-assisted кодинге. Но, процитирую одного уважаемого мною кинокритика: "Если вам не понравилось это кино, значит оно снято не для вас".

Почему мы спорим о памяти для AI-агентов

caveboy Jun 12 at 19:12

Я не спорю, каждый работает так, как привык, как ему удобнее, в крайнем случае,как заставляют? чтобы не быть голословным.
вот реальный фрагмент из сессии, где ни единого md, все только в БД, причем такую информацию мне даже 2b модель способна выдать:

что известно по проекту sloplesscode в памяти

Работал на протяжении 2m 47s

Что хранится о SloplessCode

SloplessCode задуман как MCP-система проектной памяти и управляемого рабочего процесса для AI-агентов. Она хранит контекст, правила, задачи, решения, подтверждения и подсказывает безопасное следующее действие. Система рассчитана на произвольные проекты, не только на собственную разработку.

Состояние памяти

Готовность: limited_pilot_ready, 55/100
Задачи: 32
Предложения улучшений: 30
Активные правила: 12
Decision memoirs: 20
Разделы документации: 3
Компоненты: 0
Runtime hints: 0

То есть рабочий процесс и накопленные решения описаны неплохо, но архитектурная карта компонентов пока не загружена.

Основные принципы

MCP является каноническим каналом памяти и управления работой.
Агентский UX проверяется через публичный MCP-интерфейс.
Live-runtime действия требуют явного согласия оператора.
Docker-проверки отделяются от экспериментов с живыми данными.
Универсальные спецификации не должны содержать детали конкретного проекта.
Нужно исправлять причины, а не симптомы.
Частные случаи должны решаться общими, data-driven механизмами.
Автономность агента нельзя выводить из фраз вроде «продолжай»: она должна быть явно ограничена областью и временем.

Последние открытые направления

34d8175c-... — явные границы автономного режима агента.
26ec82c4-... — диагностика ошибочной маршрутизации через публичные incident-пакеты.
c22ec2dd-... — компактные stage-aware подсказки вместо повторения полного контекста.
4568b52c-... — профили совместимости для stateless MCP-клиентов.
4a17e4af-... — периодические проверки того, помнит ли агент актуальный контекст.

-1

Самая опасная ошибка AI‑агента — не плохой код

caveboy Jun 12 at 19:03

Поэтому свод актуальных правил должен отдаваться автоматом, AI-индустрия к этому идет, но пока что большинство застряли в skills.md. Я для себя пишу на эту тему инструмент, и он реально помогает.

Почему мы спорим о памяти для AI-агентов

caveboy Jun 12 at 18:48

В дополнению спрошу, как часто ходите в театр? Насколько чаще смотрите кино? Сыграть пьесу ведь намного трудозатратнее, чем прокрутить фильм. Однако явно популярнее второе. По сути так и с LLM, большой плюс в том, что они дают возможность выражать наши обрывочные мысли связным текстом. Генерят нам красивые КДПВ. Мой друг с дисграфией теперь на Дзене пишет, а он без 3 ошибок в слове не может сообшение написать.

Могу еще пример привести, сейчас почти все на "автомате" ездят, и я все реже слышу мнение "Только механика, только хардкор!", кстати этих "механиков" в потоке лекго видно, они движение на свеnофоре замедляют :)

-1

Почему мы спорим о памяти для AI-агентов

caveboy Jun 12 at 18:27

Согласен, без LLM сейчас никуда, он лучше расставит пунктуацию, получит 5 в грамматике, но он пока не сформулирует идею как это может человек. В этом тексте опыт мой, и знания. а то что я свой черновик подсунул на доделку нейросетке, ну чтож такова современная реальность, человеческая жизнь дороже подписки, не стоит тратить ее день на то, что искусственный разум сделает за 5 минут.