DeepSeek-V4: Тихий гигант

Привет, Хабр! 👋
Вышел DeepSeek V4 - открытая языковая модель с 1.6 трлн параметров (MoE, 384 эксперта) и контекстом в 1 млн токенов. В статье разбираем, почему V4 - не революция, а мощный эволюционный шаг: в 10 раз более эффективное внимание (DSA2), впечатляющие бенчмарки (Codeforces 3206, Apex 90,2%), копеечное API ($1,74/$3,48 за 1M токенов) и открытый вес под лицензией MIT.
Главные компромиссы: отсутствие мультимодальности, отставание от топ‑закрытых моделей в креативных задачах и «сухость» стиля. Однако для агентного кодинга, анализа длинных документов и экономичных AI‑сервисов DeepSeek‑V4 сегодня — лучший выбор в открытом доступе. А также -первая китайская модель, валидированная на NPU Huawei Ascend, что сулит ещё более низкие цены в будущем.