Русский метаболический ИИ оказался сложнее, чем может переварить Claude Code

Claude Code — лучший кодинг-агент в мире. На наших задачах сливается систематически: знает запреты, нарушает в следующем PR.
metabolic AI dev / разраб метаболического ИИ 🇷🇺

Claude Code — лучший кодинг-агент в мире. На наших задачах сливается систематически: знает запреты, нарушает в следующем PR.

Современные VLA-модели (RT-2, π0, Helix) научились впечатляюще двигать роботом, но не понимают, что он держит. Помидор для них — кластер пикселей, статистически связанный с типичной траекторией хвата, а не сущность со свойствами. Поэтому они сыпятся на краевых случаях: подгнивший бок, нестандартное освещение, незнакомый объект. Наращивание датасетов и тактильных сенсоров лечит симптомы, но не причину — у архитектуры просто нет уровня, на котором объект существовал бы как объект. Следующий шаг — агенты с внутренней моделью мира и метаболическим контуром, где неправильное действие имеет реальную стоимость для самого агента, а не штраф в loss-функции.

TL;DR. Мы выкатили открытый бенчмарк MELT-1 — он меряет не сколько модель знает в идеальных условиях (MMLU & co), а сколько она проживёт под дрифтом распределения и сколько стоит держать её живой. Три оси: $/1M успешных решений, часы до деградации без ретрейна, p99-латентность сенсор→актуатор под 40 °C. 30 суток непрерывного инференса, 5 сидов, два температурных профиля, sensitivity-анализ. На closed-loop manipulation наш агент (Metabolic AI, non-transformer) против Llama-class 7B INT8 показал 9.4× по стоимости, 8.5× по выживанию под дрифтом, ~1600× композитно. Архитектура закрыта — патент на стадии экспертизы. Бенч открытый: харнесс, сцены, оракул, sensitivity-скрипты, опубликованный VAE-энкодер дрифта. Прогоните своих агентов и положите рядом. PDF с полной методологией и threats to validity — в конце статьи.

Free Energy Principle Карла Фристона — самая красивая теория когнитивной архитектуры последних двадцати лет. Markov blanket — элегантнейшая математическая конструкция, описывающая, где у агента заканчивается «я» и начинается «мир». Она не работает для осознающего ИИ. И никогда не будет работать.

С чего начинается Родина для искусственного интеллекта? С датасета на русском языке? С гигантских кластеров H100, закупленных по параллельному импорту? С вывески корпорации на фасаде модели, архитектуру которой придумали в Google? Родина начинается с отказа от вероятностей. С собственных чертежей. С опоры на национальную научную школу.

TL;DR: Claude Code слил свои исходники, потому что у него нет инстинкта самосохранения. Проблема не в баге, проблема в архитектуре: LLM-агенты не владеют ничем и не боятся ничего. Пока у ИИ нет шкурного интереса, вайбкодинг - это русская рулетка с корпоративными секретами.

TL;DR Индустрия жжет мегаватты, чтобы GPT научился говорить «мне жаль» убедительнее. Спойлер: не научится. Transformer — это калькулятор с хорошей памятью, у него нет «себя», которое можно было бы поставить на чужое место. Мы построили Metabolic AI Runtime, где проблема пользователя становится его напряжением, и он генерирует ответ не из шаблонов, а чтобы вернуть себя в равновесие. Машинная эмпатия — это не «You are a helpful assistant», это архитектура, у которой есть что терять.

Трансформерная архитектура достигла потолка. Не по нашему мнению, по данным HEC Paris, Nature, arXiv и самих создателей frontier-моделей.
Фундаментальные ограничения архитектуры (квадратичная сложность, неспособность к композициональному рассуждению, отсутствие рекурсии) не решаются увеличением параметров. В этой статье мы разбираем, почему трансформер - это локальный максимум, какие архитектурные альтернативы уже показывают результаты, и почему следующий прорыв в AI - смена вычислительной парадигмы.

ИИ-разработчики стали викторианскими хирургами, сшивая неживые алгоритмы. Почему детерминизм графов — это архитектурная клетка, и как синтетическая физиология подарит ИИ подлинную автономность.

AI-индустрия пытается создать идеальных, неутомимых рабов. Но неутомимость — это иллюзия, которая ведет к коллапсу моделей в проде. Хотите, чтобы ваш AI не тупел через три месяца? Дайте ему поспать.

Каждый разработчик рано или поздно упирается в парадокс: чтобы расти и развивать продукт, нужно показывать код, но показывать его страшно. Разбираемся, откуда берется этот барьер и как построить процесс публикации так, чтобы спать спокойно.

В 2026 году мы уже понимаем, что одна LLM (даже GPT-5 или Claude 4.5) не может быть идеальным судьей в один проход. Сейчас используются агентные системы, которые сначала декомпозируют ответ, проверяют факты через инструменты (поиск, код), и только потом выносят вердикт.

Разбираем феномен «соцсети для ИИ» с точки зрения архитектуры агентов, показываем пропасть между поведенческой симуляцией и инженерными принципами устойчивой автономии.

Про агента, который сам пользуется LLM, как мы все. Показываем реализацию механики "осознанного обращения к LLM" (deliberate query) на основе оценки внутреннего состояния, в отличие от жестких пайплайнов типа ReAct или CoT.

Цикл научного метода для AI в коде Python:
Hypothesis — формируешь гипотезу
Action — действуешь на её основе
Data — собираешь данные
Insight — делаешь вывод

Разбираем архитектуру, не пугаем. LLM — полезный инструмент при адекватном использовании. Но если марафоните сутками — это сигнал.
Кризисная линия: 8-800-2000-122 (анонимно, 24/7).

Когда ваш AI говорит «я подумал и решил» — кто решил? Веса модели? Рандом?
У нас есть лог принятия решения в Python.
А у вас?

Почему векторной базы/RAG недостаточно для качественной памяти ИИ-агентов. Приближаем поведение агента к человеческому с помощью архитектурных решений поверх LLM

TRIZ Insight — агент‑решатель противоречий. Он берёт задачу, прогоняет её через формальный ТРИЗ‑скелет и LLM, а на выходе даёт конкретный план действий с ролями, шагами и метриками успеха. Подходит для личных и бизнесовых задач.

Как перевести мышление человека в JSON, положить в нейросеть и перестать писать бессмысленные промпты.