Как китайские ИИ-модели обогнали американские по реальному потреблению / Хабр

Призрачная модель под названием Hunter Alpha только что покорила мир ИИ.

Никто не знает, кто её создал.

Данные OpenRouter подтверждают сдвиг: китайские модели на прошлой неделе выдали 4,69 триллиона токенов. Американские — 3,29 триллиона. Вторую неделю подряд.

Дочитайте до конца — и вы поймёте, почему эра агентов перевернула доску, и получите чек-лист, чтобы не строить на устаревшем стеке.

Если вы выкатываете ИИ-фичи в продакшен, эти данные меняют вашу дорожную карту.

Появление призрака

11 марта 2026 года модель под названием Hunter Alpha появилась на OpenRouter. Через четыре дня — 0,666 триллиона токенов в неделю. Больше, чем у большинства американских моделей. Ни сайта. Ни блога. Ни названия компании.

США не просто проиграли одну неделю. Они потеряли опору.

Но настоящая история — не в цифрах. Она — в призраке.

Мираж бенчмарков

Вы видели заголовки. OpenAI на вершине рейтингов. Gemini сравнялся с докторами наук. Американский нарратив жив и здоров.

Продакшен-данные рассказывают другую историю.

MiniMax M2.5 — первое место на OpenRouter пять недель подряд, 1,75 триллиона токенов. Step 3.5 Flash — рост на 79% неделя к неделе. DeepSeek V3.2 — рост на 25%.

Это не малоизвестные исследовательские лаборатории. Это рабочие лошадки производственного ИИ.

Рынок проголосовал. Просто не сообщил об этом прессе.

Генеральный директор Airbnb Брайан Чески в декабре сказал прямо: «Мы во многом полагаемся на модель Qwen от Alibaba. Она очень хорошая… быстрая и дешёвая. Мы используем новейшие модели OpenAI, но обычно не применяем их в продакшене».

CEO крупной американской технологической компании только что признал, что OpenAI сидит на скамейке запасных. Ирония того, что американские компании тренируют китайские модели на своих данных, похоже, не ускользнула ни от кого.

Чтобы понять почему, нужно посмотреть, что на самом деле движет adoption: агенты.

Китай строил для агентов. США строили для чата

Общепринятая мудрость измеряет ИИ по чат-бенчмаркам. Продакшен-нагрузкам нет дела до викторин.

OpenClaw, опенсорсный фреймворк для агентов, взорвался в начале 2026-го. Все крупные китайские лаборатории запустили OpenClaw-совместимые продукты за считанные недели. Moonshot AI. MiniMax. Zhipu. Tencent.

Вот почему это важно. Агентные задачи потребляют от 100 000 до более чем миллиона токенов за один запуск. Это в 10–100 раз больше, чем простой чат. По данным Open Source Securities, потребление токенов выросло в 300 раз за 18 месяцев. IDC прогнозирует 22,16 миллиарда активных агентов к 2030 году.

Эра агентов вознаграждает одну вещь: стоимость за задачу.

Математика жёсткая. MiniMax M2.5: $0,30 на вход, $1,10 на выход за миллион токенов. Claude Opus 4.6: $5 на вход, $25 на выход. Запустите миллионы агентных задач — и это разница между прибыльным и невозможным.

Команда OpenRouter подтвердила сдвиг: «Китай стал серьёзной силой — не только за счёт внутреннего потребления, но и за счёт производства глобально конкурентоспособных моделей».

Но значит ли «дешевле» — «достаточно хорошо»?

Неправильный вопрос. Правильный: достаточно ли хороши китайские модели для вашего юзкейса при 10% стоимости? Для большинства продакшен-нагрузок ответ — да.

Именно поэтому имеет смысл тестировать разные модели самостоятельно — а не полагаться на бенчмарки и чужие отчёты. BotHub собирает ведущие мировые нейросети — и западные, и не только — GPT-5.4, Claude 4.6 и другие — в одном интерфейсе. Сравнивайте модели на собственных задачах, считайте реальную стоимость, принимайте решения на основе данных, а не заголовков.

Для доступа не требуется VPN, можно использовать российскую карту.

По ссылке вы можете получить 300 000 бесплатных токенов для первых задач и приступить к работе с нейросетями прямо сейчас!

Американские разработчики — 47% пользователей OpenRouter — сами движут китайское доминирование.

Лучшая модель — та, которую вы можете позволить себе запускать в масштабе.

Эта математика ведёт к призраку.

Кто такой Hunter Alpha?

11 марта неизвестная сущность загрузила модель с 1 триллионом параметров на OpenRouter. Имя: Hunter Alpha. Характеристики: оптимизирована для агентных приложений. Контекст — миллион токенов. Полная совместимость с OpenClaw.

За 96 часов: 0,666 триллиона токенов в неделю. Седьмое место в общем зачёте. Выше Kimi. Выше большинства американских моделей.

Никаких следов: ни сайта, ни блога, ни названия компании. Просто модель, которая мгновенно стала одной из самых используемых на планете.

Контекст имеет значение. Китайские модели с открытыми весами теперь составляют 17% глобальных скачиваний на Hugging Face и аналогичных платформах. Американские — 15,8%. Впервые Китай обогнал США по adoption открытых моделей — за месяцы до токенового «флиппенинга».

Один разработчик на Hacker News уловил настроение: «Я только что перенёс весь наш агентный стек на MiniMax. Счёт за токены упал на 80% за ночь. Мне страшно и радостно одновременно».

Очевидный контраргумент: американские экспортные ограничения на продвинутые чипы в конечном счёте задушат способность Китая обучать модели нового поколения.

Это предполагает, что обучение важнее инференса. Это не так. У Китая уже достаточно чипов для обслуживания текущего спроса. Их энергетическая инфраструктура — двойное потребление электроэнергии по сравнению с США при 47% из возобновляемых источников — даёт структурное преимущество по стоимости, которое никакое количество чипов не сотрёт.

Дело не только в моделях. Дело в энергии и экосистеме

Можно подумать, что это просто ценовая война. Это не так.

Капитальные затраты американских облаков на ИИ к 2027 году, по прогнозам, достигнут 700 миллиардов долларов. Китайские — примерно 35 миллиардов. Разрыв в расходах — 20 к 1.

При этом китайские модели соответствуют или превосходят американские по производительности за долю стоимости. Kimi K2 Thinking обучена менее чем за 5 миллионов долларов. Сопоставимые американские модели стоят в 10 раз дороже.

Инфраструктура «восточно-западных вычислений» даёт структурное преимущество. Потребление электроэнергии в Китае вдвое больше, чем в США, причём почти половина — из возобновляемых источников. Когда ваши затраты на энергию ниже, а модели эффективнее, вы выигрываете войну инференса.

В январе ВМС США запретили DeepSeek из-за соображений конфиденциальности. Тем временем инженеры одного оборонного подрядчика тихо тестировали ту же модель для оптимизации логистики. Рынок не ждёт разрешения от политиков.

Аргумент в пользу американского ИИ

Прежде чем списывать со счетов США целиком, стоит учесть несколько вещей.

Американские экспортные ограничения на чипы NVIDIA ужесточаются. Некоторые утверждают, что это в конечном счёте ограничит способность Китая обучать модели нового поколения. Аппаратное преимущество может поставить потолок над их долгосрочным потенциалом.

И геополитический риск реален. ВМС США запретили DeepSeek. Дальнейшие государственные ограничения вероятны. Компании в регулируемых отраслях могут остаться с американскими вендорами чисто из соображений комплаенса.

Один технический директор из Кремниевой долины сказал мне: «Мы не можем позволить себе ставить бизнес на модели, которые могут быть запрещены за одну ночь. Надёжность и доверие по-прежнему важны».

Если вы в регулируемой отрасли — обратите внимание.

Но доверие — это роскошь. Стоимость — необходимость.

ВМС США запретили DeepSeek. Ваша компания может использовать его завтра.

Как выжить в «флиппенинге»

Флиппенинг — не прогноз. Это реальность. Вот как реагировать.

Сдвиг мышления. Перестаньте оценивать модели по бенчмаркам или по логике «лучшая в классе». Эра агентов работает на стоимости за задачу и совместимости экосистемы. Лучшая модель — та, которую вы можете позволить себе запускать в масштабе. Прямо сейчас это китайские модели.

Немедленные шаги:

Проведите аудит расходов на токены. Вытащите логи API за последние 30 дней. Посчитайте стоимость за миллион токенов для каждой нагрузки. Если вы используете OpenAI или Claude для массовых агентных задач, вы переплачиваете в 4–10 раз.
Протестируйте одну китайскую модель. Запустите некритичную агентную нагрузку на MiniMax M2.5 или DeepSeek V3.2. Сравните стоимость, задержку и качество. Не верьте бенчмаркам. Верьте собственным метрикам.
Проверьте совместимость с OpenClaw. Если вы строите агентов, убедитесь, что ваш фреймворк OpenClaw-совместим. Экосистема стандартизируется. Если вы за бортом — вы строите на вчерашнем стеке.

Для команд и руководителей:

Создайте пайплайн оценки. Песочница, где команда может безопасно тестировать китайские модели без риска для данных. Документируйте производительность, сбои и неожиданное поведение.
Диверсифицируйте поставщиков. Не позволяйте ни одному провайдеру моделей — американскому или китайскому — стать узким местом. Архитектурируйте агентный стек так, чтобы менять провайдеров на уровне API. Победитель в ИИ — не лучшая модель. Это компания, которая завтра сможет переключиться на то, что дешевле.

Антипаттерны:

Не считайте, что «лучший на бенчмарках» = лучший для продакшена. Бенчмарки тестируют чат. Продакшен требует агентов. Разные игры.
Не ждите разрешения от регуляторов. Рынок двинулся в феврале 2026-го. Ваши конкуренты уже тестируют китайские модели.

Честное ограничение. Если вы в оборонке, финансах или здравоохранении, вопросы суверенитета данных пока могут перевесить ценовое преимущество. Компромисс реален. Признайте его.

Новая карта

Флиппенинг — не разовое событие. Это новая базовая линия.

Объём токенов — это окончательное голосование доверия. Разработчики только что проголосовали своими API-ключами. Они выбрали стоимость. Они выбрали агентов. Они выбрали Китай.

США могут жаловаться на нечестные преимущества или адаптироваться. Адаптация начинается с признания: правила игры изменились. Дело больше не в бенчмарках. Дело в том, кто управляет инфраструктурой, которую мир реально использует.

Hunter Alpha сегодня — призрак. Завтра он может оказаться единственной игрой в городе.

Мой прогноз: создатель Hunter Alpha будет раскрыт в течение 60 дней. И это будет не один из обычных подозреваемых.

Вопрос: вы строите на правильном стеке?

Как китайские ИИ-модели обогнали американские по реальному потреблению