По данным The Information, DeepSeek использует несколько тысяч чипов Nvidia Blackwell для разработки следующей модели — условной DeepSeek V4 (или R2, если придерживаться старого варианта именования). Эти новейшие чипы запрещено экспортировать в Китай — но, как утверждают шесть источников издания, их ввозят контрабандой: серверы с Blackwell сначала отправляют в дата-центры стран, где экспорт разрешен, там разбирают и переправляют компоненты в Китай по частям.

Часть сотрудников DeepSeek рассчитывает выпустить новую модель к китайскому Новому году — концу января. Впрочем, основатель компании Лян Вэньфэн жесткий дедлайн не ставит и, по словам источников, ставит качество выше сроков. В сентябре DeepSeek выпустила V3.2-Exp — экспериментальную модель, которую сама компания называет "промежуточным шагом к следующему поколению". Но перенос нового подхода на большие модели идёт медленно.

Ключевая ставка DeepSeek — архитектура DeepSeek Sparse Attention (DSA), которая должна резко удешевить запуск модели для конечных пользователей за счет разреженных вычислений. Blackwell для этого подходит идеально: чипы B200 ускоряют такие операции примерно вдвое по сравнению с предыдущим поколением и дают в 2,5 раза больше производительности на инференсе LLM, чем H200.

Буквально только что Трамп разрешил Nvidia продавать H200 в Китай с 25-процентным сбором в пользу США. Но даже эти чипы не станут для китайских компаний "серебряной пулей". По данным Financial Times, Пекин сам ограничит к ним доступ: компаниям придется доказывать, что отечественных чипов недостаточно, а госзаказчиков будут подталкивать к решениям Huawei и других локальных производителей. В итоге китайские AI-компании продолжают жить на "лоскутном" железе: старые запасы Nvidia, локальные чипы, тренировка моделей за рубежом, нелегально ввезенные чипы. Запуск DeepSeek V4 покажет, смогла ли ИИ-индустрия страны адаптироваться к такой ситуации.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.