Сатирическая иллюстрация 
Сатирическая иллюстрация 

24 марта OpenAI объявила о закрытии Sora, и многие сразу записали это в доказательства того, что AI-пузырь начал сдуваться. Мол, хайп закончился, экономика не сошлась, и вот оно — начало конца.

А за неделю до этого Дженсен Хуанг, основатель и CEO NVIDIA, со сцены GTC 2026 бросил тезис, который рынок ещё долго будет переваривать: если инженер с зарплатой $500k тратит на токены меньше $250k в год — это тревожный сигнал. Если тратит $5k — вообще катастрофа.

На первый взгляд не очень понятно как это связано с закрытием Sora. Один из самых влиятельных людей в AI говорит: тратьте больше токенов, а OpenAI почти сразу после этого закрывает один из самых ресурсоёмких AI-продуктов.

Но на самом деле эти две новости говорят об одном и том же: токены надо тратить больше — но только туда, где они дают реальную отдачу. ☝️


Токены стали дешевле. Почему тогда дефицит вычислений только вырос?

Чтобы понять механику, нужно посмотреть на цены. Вот как изменилась стоимость токенов с 2023 по 2026 год:

Модель

Цена за 1 млн входящих токенов

GPT-4 (март 2023)

$30

GPT-4o (август 2024)

$2,5

Gemini 2.0 Flash (февраль 2025)

$0,1

DeepSeek с кэшированием (февраль 2025)

$0,07

Казалось бы, если токены ТАК подешевели, то дефицит вычислений должен был бы снизиться. Но произошло ровно обратное.

Этот эффект ещё в XIX веке описал Уильям Стэнли Джевонс:

Когда использование ресурса становится эффективнее и дешевле, его начинают не меньше экономить, а больше потреблять. Потому что открываются задачи, которые раньше были нерентабельны.

Поэтому реакция рынка была не «ну отлично, значит теперь будем меньше тратить на GPU». А наоборот: если сильные модели можно запускать дешевле, то теперь экономически оправданы в десять раз больше AI-сценариев. 🚀 А если раньше у вас окупались десять задач, а теперь окупаются сто — суммарное потребление вычислений только растёт. Именно поэтому удешевление токенов не снимает дефицит вычислений, а только усиливает его.

Это видно и на корпоративных расходах. По данным Menlo Ventures, бизнес-траты на генеративный AI выросли с $11,5 млрд в 2024 году до $37 млрд в 2025-м. Токены дешевеют, а суммарный счёт за AI — растёт. И с растущим чеком в дело всё активнее вмешиваются скучные люди с калькуляторами — и начинают на языке денег объяснять AI-фантазёрам, за что реально стоит платить.

И это только официальная статистика. Параллельно растёт «теневой» AI: по данным исследования BlackFog (2000 сотрудников в США и Великобритании, январь 2026), 49% признают, что используют несанкционированные AI-инструменты, а 51% подключают их к корпоративным системам в обход IT — нередко загружая туда данные под NDA. 🥲 То есть реальные расходы на AI в компаниях ещё выше, чем показывает официальная бухгалтерия. Просто часть из них идёт через личные карты сотрудников.

Сатирическая иллюстрация 
Сатирическая иллюстрация 

Почему под нож первым пошло именно видео

Ответ довольно очевиден. Точные коэффициенты зависят от модели и железа, но порядок величин один: видео в разы тяжелее текста по стоимости вычислений.

Тип задачи

Ориентировочная нагрузка

Текстовый ответ LLM (~1000 слов)

Генерация изображения

~3–11×

Генерация видео, 1 минута, 30 fps

~10–100×

OpenAI генерирует более $13 млрд выручки — но стоимость обработки пользовательских запросов (инференса) в 2025 году выросла в четыре раза, а скорректированная валовая маржа просела с 40% до 33% вместо целевых 46%. В такой ситуации компания неизбежно начинает задавать очень скучные, но очень важные вопросы: какой продукт сколько стоит, сколько приносит, и нельзя ли эти вычисления потратить рациональнее? 🤔


Токены как метрика работы: спорно, но не бессмысленно

Вернёмся к заявлению Хуанга. Его легко считать рекламным тезисом: CEO крупнейшего в мире продавца GPU говорит, что нужно тратить больше на GPU. Конфликт интересов очевиден.

Но абстрагируйтесь от мотива — и посмотрите на суть. Инженер, который не использует AI-агентов для рутинных задач — это как разработчик чипов, рисующий схемы от руки. Современный чип содержит миллиарды транзисторов, маршруты которых просчитываются алгоритмами месяцами. Нарисовать это карандашом — примерно как написать операционную систему на перфокартах. Технически возможно, исторически так и было. Только конкуренты за это время выпустят три поколения продуктов.

Так что да, расход токенов — метрика кривая, и накрутить её легко. Но за ней стоит вполне нормальный вопрос: инженер вообще использует инструменты, которые уже стали новой нормой, или всё ещё работает так, будто на дворе 2020 год?


Что будет дальше

Происходящее — не кризис и не конец AI. Это переход к более взрослой фазе рынка.

Если в 2023–2024 годах AI-продукты можно было запускать в логике «вроде прикольно, давайте посмотрим, что получится», то в 2026-м уже придётся отвечать на другой вопрос: сколько это стоит в вычислениях и какую отдачу это приносит.

Sora стала первой большой публичной жертвой этой новой рациональности. Но точно не последней. AI не заканчивается. Заканчивается эпоха, в которой за красивую демонстрацию никто не спрашивал счёт.

Сатирическая иллюстрация 
Сатирическая иллюстрация 

P.S. Если вас интересует, откуда возьмутся вычислительные мощности для всего этого роста, — вот мой разбор про орбитальные дата-центры и будущую инфраструктуру AI: Когда вычисления станут бесконечными: разбор интервью Илона Маска от 5.02.26

Только зарегистрированные пользователи могут участвовать в опросе. Войдите, пожалуйста.
Как у вас в компании на самом деле устроен AI?
28.57%🟢 По‑взрослому — дали нормальный доступ и/или бюджет на токены4
14.29%🟡 По‑корпоративному — AI разрешён, но так заботливо задушен безами, что проще без него2
0%🔴 По‑тихому — официально нельзя, неофициально все давно сидят в личных аккаунтах0
57.14%⚪️ По‑классике — ничего не используем, свято верим, что AI нас не заменит8
Проголосовали 14 пользователей. Воздержались 5 пользователей.