DeepSeek V4 обещает превзойти Claude и GPT в кодинге — релиз ожидается в феврале / Хабр

Китайский стартап DeepSeek готовится выпустить флагманскую модель V4 в середине февраля, сообщает The Information со ссылкой на два источника, знакомых с планами компании. По результатам внутренних тестов, новая модель превосходит Claude от Anthropic и серию GPT от OpenAI в задачах программирования. Также V4 демонстрирует прорыв в обработке очень длинных промптов с кодом, что может стать серьезным преимуществом для разработчиков сложных проектов.

Тайминг релиза повторяет прошлогоднюю тактику: год назад DeepSeek выпустила R1 20 января — за неделю до китайского Нового года. Модель мгновенно захватила внимание технологического сообщества и обрушила акции Nvidia на $600 млрд за сутки. V4 планируют представить к 17 февраля, когда в Китае начнутся праздничные каникулы.

Новая модель знаменует смену стратегии компании. Если R1 делала ставку на "чистое рассуждение" — математику и логику, то V4 переключается на прикладной инжиниринг. DeepSeek явно целится в корпоративный рынок, где качество генерации кода напрямую конвертируется в деньги. Сейчас лидером по бенчмарку SWE-bench Verified остается Claude Opus 4.5 с результатом 80,9% — чтобы занять первое место, V4 придется показать не только генерацию кода, но и агентные способности в отладке и работе с репозиториями.

Перед анонсом DeepSeek расширила техническую документацию по R1 на 60 страниц, раскрыв полный пайплайн обучения. Среди прочего компания признала, что Monte Carlo Tree Search и Process Reward Model — два самых горячих направления в RL за последний год — не сработали для задач общего рассуждения. Проблема в "гранулярности шагов": эти методы хороши для шахмат или формальных доказательств, но плохо переносятся на открытые задачи.

Главная интрига — сохранит ли V4 формат открытых весов. Если да и одновременно покажет обучаемые результаты на бенчмарках кодинга, это будет большой удар по бизнес-модели закрытых лабораторий — бесплатная открытая модель, которая пишет код лучше платных конкурентов.

P.S. Поддержать меня можно подпиской на канал "сбежавшая нейросеть", где я рассказываю про ИИ с творческой стороны.

DeepSeek V4 обещает превзойти Claude и GPT в кодинге — релиз ожидается в феврале

Другие новости

Ближайшие события