Pull to refresh
8K+
-13
Марина@Smartor

User

-1,3
Rating
1
Subscribers
Send message

DeepSeek-V4: Тихий гигант

Reading time5 min
Reach and readers12K

Привет, Хабр! 👋
Вышел DeepSeek V4 - открытая языковая модель с 1.6 трлн параметров (MoE, 384 эксперта) и контекстом в 1 млн токенов. В статье разбираем, почему V4 - не революция, а мощный эволюционный шаг: в 10 раз более эффективное внимание (DSA2), впечатляющие бенчмарки (Codeforces 3206, Apex 90,2%), копеечное API ($1,74/$3,48 за 1M токенов) и открытый вес под лицензией MIT.

Главные компромиссы: отсутствие мультимодальности, отставание от топ‑закрытых моделей в креативных задачах и «сухость» стиля. Однако для агентного кодинга, анализа длинных документов и экономичных AI‑сервисов DeepSeek‑V4 сегодня — лучший выбор в открытом доступе. А также -первая китайская модель, валидированная на NPU Huawei Ascend, что сулит ещё более низкие цены в будущем.

Читать далее

Information

Rating
Does not participate
Registered
Activity

Specialization

Specialist
From 1,000,000 ₽