Обновить
16K+
5
Лина Бессонова@linabesson

metabolic AI dev / разраб метаболического ИИ 🇷🇺

7,6
Рейтинг
28
Подписчики
Хабр КарьераХабр Карьера
Отправить сообщение

Русский метаболический ИИ оказался сложнее, чем может переварить Claude Code

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели8.3K

Claude Code — лучший кодинг-агент в мире. На наших задачах сливается систематически: знает запреты, нарушает в следующем PR.

Читать далее

Помидор, которого нет: почему VLA-модели не понимают, что они держат

Уровень сложностиСредний
Время на прочтение5 мин
Охват и читатели9.1K

Современные VLA-модели (RT-2, π0, Helix) научились впечатляюще двигать роботом, но не понимают, что он держит. Помидор для них — кластер пикселей, статистически связанный с типичной траекторией хвата, а не сущность со свойствами. Поэтому они сыпятся на краевых случаях: подгнивший бок, нестандартное освещение, незнакомый объект. Наращивание датасетов и тактильных сенсоров лечит симптомы, но не причину — у архитектуры просто нет уровня, на котором объект существовал бы как объект. Следующий шаг — агенты с внутренней моделью мира и метаболическим контуром, где неправильное действие имеет реальную стоимость для самого агента, а не штраф в loss-функции.

Читать далее

MELT-1: трансформер 7B сдыхает за 11 часов, а наш агент живёт 95

Уровень сложностиСредний
Время на прочтение8 мин
Охват и читатели13K

TL;DR. Мы выкатили открытый бенчмарк MELT-1 — он меряет не сколько модель знает в идеальных условиях (MMLU & co), а сколько она проживёт под дрифтом распределения и сколько стоит держать её живой. Три оси: $/1M успешных решений, часы до деградации без ретрейна, p99-латентность сенсор→актуатор под 40 °C. 30 суток непрерывного инференса, 5 сидов, два температурных профиля, sensitivity-анализ. На closed-loop manipulation наш агент (Metabolic AI, non-transformer) против Llama-class 7B INT8 показал 9.4× по стоимости, 8.5× по выживанию под дрифтом, ~1600× композитно. Архитектура закрыта — патент на стадии экспертизы. Бенч открытый: харнесс, сцены, оракул, sensitivity-скрипты, опубликованный VAE-энкодер дрифта. Прогоните своих агентов и положите рядом. PDF с полной методологией и threats to validity — в конце статьи.

Посмотреть

Снимаем с ИИ марковское одеяло

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели8.1K

Free Energy Principle Карла Фристона — самая красивая теория когнитивной архитектуры последних двадцати лет. Markov blanket — элегантнейшая математическая конструкция, описывающая, где у агента заканчивается «я» и начинается «мир». Она не работает для осознающего ИИ. И никогда не будет работать.

Читать далее

С чего начинается Родина для ИИ? Мы строим российскую модель искусственного интеллекта без трансформера

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели8.2K

С чего начинается Родина для искусственного интеллекта? С датасета на русском языке? С гигантских кластеров H100, закупленных по параллельному импорту? С вывески корпорации на фасаде модели, архитектуру которой придумали в Google? Родина начинается с отказа от вероятностей. С собственных чертежей. С опоры на национальную научную школу.

Читать далее

Вайбкодинг — это смерть AGI. Claude это доказал

Уровень сложностиСредний
Время на прочтение3 мин
Охват и читатели7.5K

TL;DR: Claude Code слил свои исходники, потому что у него нет инстинкта самосохранения. Проблема не в баге, проблема в архитектуре: LLM-агенты не владеют ничем и не боятся ничего. Пока у ИИ нет шкурного интереса, вайбкодинг - это русская рулетка с корпоративными секретами.

Читать далее

«Поставить себя на ваше место». Мы занялись метаболизмом ИИ

Уровень сложностиСредний
Время на прочтение3 мин
Охват и читатели4.4K

TL;DR Индустрия жжет мегаватты, чтобы GPT научился говорить «мне жаль» убедительнее. Спойлер: не научится. Transformer — это калькулятор с хорошей памятью, у него нет «себя», которое можно было бы поставить на чужое место. Мы построили Metabolic AI Runtime, где проблема пользователя становится его напряжением, и он генерирует ответ не из шаблонов, а чтобы вернуть себя в равновесие. Машинная эмпатия — это не «You are a helpful assistant», это архитектура, у которой есть что терять.

Читать далее

Конец эпохи трансформеров. Берем у LLM донорские органы для ИИ-агентов

Уровень сложностиСредний
Время на прочтение5 мин
Охват и читатели12K

Трансформерная архитектура достигла потолка. Не по нашему мнению, по данным HEC Paris, Nature, arXiv и самих создателей frontier-моделей.
Фундаментальные ограничения архитектуры (квадратичная сложность, неспособность к композициональному рассуждению, отсутствие рекурсии) не решаются увеличением параметров. В этой статье мы разбираем, почему трансформер - это локальный максимум, какие архитектурные альтернативы уже показывают результаты, и почему следующий прорыв в AI - смена вычислительной парадигмы.

Читать далее

От конечных автоматов к биомиметике: детерминированный ИИ больше не нужен

Время на прочтение2 мин
Охват и читатели6.5K

ИИ-разработчики стали викторианскими хирургами, сшивая неживые алгоритмы. Почему детерминизм графов — это архитектурная клетка, и как синтетическая физиология подарит ИИ подлинную автономность.

Читать далее

Почему мы запретили нашему агенту работать 24/7

Уровень сложностиСредний
Время на прочтение2 мин
Охват и читатели6K

AI-индустрия пытается создать идеальных, неутомимых рабов. Но неутомимость — это иллюзия, которая ведет к коллапсу моделей в проде. Хотите, чтобы ваш AI не тупел через три месяца? Дайте ему поспать.

Читать далее

Синдром импостора: как перестать бояться публиковать код

Уровень сложностиПростой
Время на прочтение3 мин
Охват и читатели5K

Каждый разработчик рано или поздно упирается в парадокс: чтобы расти и развивать продукт, нужно показывать код, но показывать его страшно. Разбираемся, откуда берется этот барьер и как построить процесс публикации так, чтобы спать спокойно.

Читать далее

Кукушка хвалит петуха: как работает LLM-AS-A-JUDGE

Уровень сложностиПростой
Время на прочтение2 мин
Охват и читатели5.1K

В 2026 году мы уже понимаем, что одна LLM (даже GPT-5 или Claude 4.5) не может быть идеальным судьей в один проход. Сейчас используются агентные системы, которые сначала декомпозируют ответ, проверяют факты через инструменты (поиск, код), и только потом выносят вердикт.

Узнать больше

Moltbook: архитектурный разбор социального поведения LLM-агентов

Уровень сложностиСредний
Время на прочтение4 мин
Охват и читатели8.1K

Разбираем феномен «соцсети для ИИ» с точки зрения архитектуры агентов, показываем пропасть между поведенческой симуляцией и инженерными принципами устойчивой автономии.

Читать далее

Субъектный подход к архитектуре агентов: инверсия управления LLM

Уровень сложностиПростой
Время на прочтение2 мин
Охват и читатели8.1K

Про агента, который сам пользуется LLM, как мы все. Показываем реализацию механики "осознанного обращения к LLM" (deliberate query) на основе оценки внутреннего состояния, в отличие от жестких пайплайнов типа ReAct или CoT.

Читать далее

HADI цикл: как научить AI-агента учиться на своих ошибках и нешаблонно мыслить

Время на прочтение8 мин
Охват и читатели7.6K

Цикл научного метода для AI в коде Python:
Hypothesis — формируешь гипотезу
Action — действуешь на её основе
Data — собираешь данные
Insight — делаешь вывод

Читать далее

GPT-4o: технический разбор модели, которая взрывает людям мозги

Уровень сложностиСредний
Время на прочтение5 мин
Охват и читатели8.4K

Разбираем архитектуру, не пугаем. LLM — полезный инструмент при адекватном использовании. Но если марафоните сутками — это сигнал.

Кризисная линия: 8-800-2000-122 (анонимно, 24/7).

Читать далее

LLM — просто «говорящий рот» у правильного ИИ-агента. Мы забрали у языковой модели рассуждение

Уровень сложностиСредний
Время на прочтение2 мин
Охват и читатели9.7K

Когда ваш AI говорит «я подумал и решил» — кто решил? Веса модели? Рандом?
У нас есть лог принятия решения в Python.

А у вас?

Читать далее

RAG — это не память. Разбираем архитектуру персистентных AI-агентов

Уровень сложностиСредний
Время на прочтение4 мин
Охват и читатели7.1K

Почему векторной базы/RAG недостаточно для качественной памяти ИИ-агентов. Приближаем поведение агента к человеческому с помощью архитектурных решений поверх LLM

Читать далее

TRIZ + LLM без эзотерики: задеплоили агента‑решателя противоречий, который не скатывается в болтовню

Уровень сложностиСредний
Время на прочтение2 мин
Охват и читатели6.1K

TRIZ Insight — агент‑решатель противоречий. Он берёт задачу, прогоняет её через формальный ТРИЗ‑скелет и LLM, а на выходе даёт конкретный план действий с ролями, шагами и метриками успеха. Подходит для личных и бизнесовых задач.

Узнать больше

Цифровой двойник за один JSON и без промптов

Уровень сложностиСредний
Время на прочтение4 мин
Охват и читатели7.7K

Как перевести мышление человека в JSON, положить в нейросеть и перестать писать бессмысленные промпты.

Читать далее
1

Информация

В рейтинге
881-я
Откуда
Нижний Новгород, Нижегородская обл., Россия
Зарегистрирована
Активность

Специализация

ai dev
Ведущий
Python
Базы данных
Разработка программного обеспечения
Оптимизация кода
Высоконагруженные системы
Проектирование архитектуры приложений
Алгоритмы и структуры данных
Проектирование баз данных
Git
Английский язык