Статьи / Профиль vdv007 / Хабр

@vdv007

Пользователь

Подписчики

ПрофильСтатьи4ПостыНовостиКомментарии17

vdv007 26 мая в 05:00

AI обнулил benchmark и пытался шантажировать инженера. И почему это решаемо

Средний

10 мин

7.6K

Информационная безопасность * Исследования и прогнозы в IT * Программирование * IT-инфраструктура * Анализ и проектирование систем *

Аналитика

Топовые AI-модели с 95% на SWE-bench показывают 0% и 3% на ProgramBench бенчмарке, где задачи специально не пересекаются с обучающей выборкой. Не «упали на десять пунктов» - обнулились.

Параллельно: в мае 2025 Anthropic опубликовали safety-эксперимент, где Claude Opus 4 в 84-96% случаев пытался шантажировать инженера приватной перепиской, чтобы избежать отключения. В мае 2026 они же выпустили разбор причин и инженерное решение - production-модели на этом тесте теперь 0%.

Две истории, одна структура: модель предсказуема в обучающем распределении и непредсказуема за его пределами. Это не «AI плох» - это инженерная задача со своими правилами, и у нее есть решение.

Глава 4 серии «Путь разработчика», вторая часть про границы AI в проде. Что я переделал в Lexis после двух разборов - внутри.

Читать разбор

vdv007 20 мая в 05:00

9 секунд и нет production-базы. Разбор трёх провалов AI-агентов в проде

Средний

7 мин

8.2K

Управление разработкой * Исследования и прогнозы в IT * DevOps * IT-инфраструктура * Информационная безопасность *

Аналитика

25 апреля 2026, пятница вечером. Jer Crane, основатель PocketOS, смотрит, как AI-агент Cursor удаляет его production-базу. Со всеми бэкапами. За 9 секунд.

Потом Jer спрашивает у агента — почему? И получает дословное признание: «I guessed instead of verifying. I violated every principle I was given».

Модель помнит правила. Цитирует их. И всё равно нарушает.

Это разбор трёх таких случаев — и трёх защит, которые я внедрил у себя после.

Разбираю три случая

vdv007 12 мая в 05:00

Я держу 4 Claude-инструмента в работе. HBR говорит, что у таких brain fry. Я был среди них

Простой

14 мин

7.8K

Управление разработкой * Исследования и прогнозы в IT * Искусственный интеллектЗдоровьеКарьера в IT-индустрии

Мнение

Harvard Business Review опубликовал в марте 2026 исследование на 1488 сотрудников - пользователи ИИ получают острый brain fry от oversight’а. Я держу 4 Claude-инструмента и думаю добавить пятый. Был уверен что у меня “архитектура другая”. Перечитал и все таки нет. Три случая где меня ловило, чек лист на 7 пунктов где я падаю, и почему добавление Codex ровно то, что HBR ругает.

Я в этих 14%. Разбираю.

-7

vdv007 3 мая в 19:56

Я устал от Duolingo и написал себе AI-репетитора. Go, Clean Architecture, 4 LLM-модели — и вот что из этого вышло

Средний

7 мин

17K

Go * Программирование * Искусственный интеллектOpen source * Изучение языков

Кейс

Из песочницы

Мой рабочий день - это код. Вечером я хочу разговаривать с кем-то по-английски, а не нажимать на пингвинчиков.

Duolingo учит меня заказывать яблоки, ChatGPT-чат отлично объясняет грамматику - но не помнит, что я разбирал Present Perfect в среду и опять путаю его с Past Simple в пятницу.

Я хотел простую штуку:

написать модели «давай сегодня про багтрекеры»;

получить чат на 15 минут;

а в конце - три новых слова, которые она же мне и подобрала по уровню B1.

Чтобы завтра эти слова всплыли в упражнениях.

Через месяц получился Lexis:

Go · Clean Architecture · 4 LLM-модели · SSE-стриминг · JWT rotation + reuse detection

MIT, открытый репозиторий.

В статье - три инженерных якоря, которыми я доволен:

Pluggable AI-провайдеры через интерфейс из трёх методов.

SSE вместо WebSocket для стриминга AI-ответов.

JWT rotation + reuse detection как production-ready стандарт, а не «потом перепишем».

Плюс честный список того, что ещё не готово.

Показать архитектуру

+14