Комментарии / Профиль vdv007 / Хабр

Пользователь

Подписчики

AI обнулил benchmark и пытался шантажировать инженера. И почему это решаемо

Добрый день! AI редактура, как Вы могли подумать, глядя на этот текст, но это не так, как раз таки обычно вычищает такие повторы, у нее противоположная проблема - это, прощу заметить, синонимизировать и удлинять. В этой статье мои собственные конструкции используются. Хорошего дня!

9 секунд и нет production-базы. Разбор трёх провалов AI-агентов в проде

vdv007 22 мая в 07:32

Добрый день! У Вас приведено точное разделение. В первой части я фокусировался на action control - что агент делает в системе (бд, файлы, deploy). То что Вы выделили - output control, что агент говорит пользователю - другая axis, и в статье я её не разбирал.

И про regex + agent-validates-agent, Вы правы - это ненадежно. Что я видел работающим на проде (AI-помощник для тендеров): hard guardrail ДО llm вызова (юр.вопрос, потом отказ + redirect, без передачи в модель) плюс post-classifier на ответе. Не один метод, а cascade с разными типами проверок.

Во второй части как раз про это, где границы между моделью и обвязкой, и почему обвязка - это не один permission gate, а несколько слоёв. Спасибо, хорошего дня!

Я держу 4 Claude-инструмента в работе. HBR говорит, что у таких brain fry. Я был среди них

vdv007 20 мая в 10:44

Хорошее мнение, возьму его на анализ, спасибо! Хорошего дня!

Я держу 4 Claude-инструмента в работе. HBR говорит, что у таких brain fry. Я был среди них

vdv007 20 мая в 10:37

Добрый день! Все совпадения случайны. Хорошего дня!

9 секунд и нет production-базы. Разбор трёх провалов AI-агентов в проде

vdv007 20 мая в 10:29

Добрый день! У Вас классный и интересный угол виденья, которой можно и, я считаю, нужно рассмотреть, возьму себе на заметку. Спасибо и хорошего дня!

9 секунд и нет production-базы. Разбор трёх провалов AI-агентов в проде

vdv007 20 мая в 10:20

В точку. Это хорошая мысль, как я думаю, допуск к проду должен быть архитектурным, а не доверием к исполнителю. Хорошего дня!

9 секунд и нет production-базы. Разбор трёх провалов AI-агентов в проде

vdv007 20 мая в 06:17

Добрый день, обычно нет, system prompt не trimming, остаётся pinned at top. Сжимается conversation history, tool use results, прошлые file contents.

Но в Cursor есть нюанс - это auto-summarization (lossy compression) переписывает накопленный диалог в краткую сводку, и в этой сводке нюансы про правила безопасности могут потеряться. То есть сам system prompt остаётся, но контекст его применения в текущем диалоге пересобирается через LLM-сжатие.

И главное - это то что, dissociation именно про это и не про потерю system prompt. Текст остаётся, модель может его процитировать дословно. Ломается ассоциация между правило существует в контексте и моё текущее действие нарушает правило.

По Attention Sinks (Xiao et al.) модель льёт attention на первые токены потому что они первые, не потому что они важны для текущей задачи. По Lost in the Middle - связи между правилами и текущей задачей теряются даже когда оба в контексте.

Архитектурное ограничение трансформеров - это не про объём памяти, а про связность ассоциаций.

Спасибо за вопрос! Это важный нюанс. Хорошего дня!

9 секунд и нет production-базы. Разбор трёх провалов AI-агентов в проде

vdv007 20 мая в 05:22

Все именно так, виновата не модель. Агент тут - это новый класс атаки на ту же поверхность. Спасибо за пушбек, точно подмечено. Хорошего дня!

Я держу 4 Claude-инструмента в работе. HBR говорит, что у таких brain fry. Я был среди них

vdv007 13 мая в 05:21

Добрый день! Вы попали прямо в мой виш лист на это лето. Спасибо за обратную связь, хорошего дня!

Я держу 4 Claude-инструмента в работе. HBR говорит, что у таких brain fry. Я был среди них

vdv007 12 мая в 13:11

Спасибо за фидбек! HBR часть писалась тяжелее всего, рад что вообще ее написал и рад что получаю фидбек на будущее. К середине теряю читателя - не получилось в полной мере построить качественный переход от HBR к личному кейсу, согласен. Главный тейк тут такой: brain fry это не слабые ломаются, а нагрузка которая бьёт даже когда по технике всё правильно, и её надо учиться замечать. Учту дальше. Хорошего дня!

Я держу 4 Claude-инструмента в работе. HBR говорит, что у таких brain fry. Я был среди них

vdv007 12 мая в 13:06

Я держу 4 Claude-инструмента в работе. HBR говорит, что у таких brain fry. Я был среди них

vdv007 12 мая в 12:56

Спасибо за пуш! Тейк статьи такой, что ценность для меня сейчас - не больше денег / меньше работы, а расширение того что один человек может лично сделать: OSS проект + research база + коммерческие проекты параллельно. Без агентов не сложилось бы. Цена этой возможности - постоянный риск brain fry, статья про то как с ним жить. Хорошего дня!

-1

Я устал от Duolingo и написал себе AI-репетитора. Go, Clean Architecture, 4 LLM-модели — и вот что из этого вышло

vdv007 6 мая в 05:08

У Вас отличная стратегия обучения, тем более если она Вам подходит. Удачи Вам в реализации ваших планов!

Я устал от Duolingo и написал себе AI-репетитора. Go, Clean Architecture, 4 LLM-модели — и вот что из этого вышло

vdv007 5 мая в 11:07

У меня был немного другой кейс и тейк статьи. Lexis про ежедневный workflow с состоянием: где остановился, какие слова уже разбирали, какой уровень. В чате это каждый раз зашивать заново и есть та фрикция, от которой я устал. Плюс 4 провайдера - это страховка от просадки конкретной модели (кейс с новым Opus в апреле это было что то и я такого не ожидал). И это упражнение и в стек, и в архитектуру было моим личным желанием и заодно, по цене оверкила, получаешь язык + продукт под свою привычку + тренажёр. Если цель только язык - согласен, можно проще. Хорошего дня!

Я устал от Duolingo и написал себе AI-репетитора. Go, Clean Architecture, 4 LLM-модели — и вот что из этого вышло

vdv007 4 мая в 06:39

Соглашусь с Вами и объясню свою позицию, на текущем масштабе - да, можно на Postgres. У меня Redis несёт две конкретные нагрузки: 1 JWT-blacklist с TTL = remaining-lifetime токена, +1 round-trip на каждом middleware - на pg это будет либо отдельная таблица с фоновым cleanup'ом, либо unlogged-таблица; 2 кеш - сколько слов сегодня к повторению, пересчитывается фоновой горутиной раз в день - это да, вообще можно как materialized view. Если бы делал заново на скоупе одного юзера - выбрал бы pg + LISTEN/NOTIFY. Redis оставил ,так скажем, на вырост - если когда-то многопользовательский сценарий пойдёт. Спасибо за обратную связь, мне это очень важно.

Я устал от Duolingo и написал себе AI-репетитора. Go, Clean Architecture, 4 LLM-модели — и вот что из этого вышло

vdv007 4 мая в 06:36

Сейчас в коробке 4 провайдера, пока на все не хватает времени. Чтобы получить deepseek/glm/minimax - проще всего добавить openrouter-адаптер (он сам роутит на нужную модель). По сути это новый файл рядом с claude_provider.go. Репо открыт - если опередите PR, буду рад.

Я устал от Duolingo и написал себе AI-репетитора. Go, Clean Architecture, 4 LLM-модели — и вот что из этого вышло

vdv007 4 мая в 06:31

Это круто, у нас параллельные траектории. У Вас задача потяжелее по железу. Я обошёл это стороной: вместо локальной модели держу 4 провайдера через pluggable-интерфейс (claude/openai/gemini), переключаюсь по задаче. Latency страдает, зато ноут не плавится. А подсветка ошибок у Вас на правилах или whisper отдаёт уже размеченное? Если будете возвращаться к вопросу железа - расскажите как разрулите, мне интересно, может, потом у себя реализую.