Когда DeepSeek готовила свой технический отчет, она сама выбирала, на каких бенчмарках будет сравнивать модель с конкурентами. NIST так делать не стал
NIST точно так же выбрали бенчмарки, в которых будут тестировать, то что они сделали это некоторое время назад не делает их выбор более честным и правильным. Тем более после того, когда поняли что у них графики не будут красиво смотреться, докинули ещё пару бенчей в которых нужные модели хорошо справляются, а не нужные плохо. И о чудо DeepSeek реально показывал себя на одном уровне в тех бенчмарках, в которые раньше юзал NIST, а вот в новеньких просадочка вышла, эх отстают на 8 месяцев...
Ну хоть спасибо, что про цену что-то написали. Получается, что DeepSeek в некоторых задачах даёт лучшую эффективность по цене/качеству. И если у тебя только эти задачи, а не задачи на визуальны головоломки, кибербезопасность или переписывание кода с одного языка на другой, то почему бы не использовать его?
Пофиг, кто там не согласен, пока они не стоят дорого, они не будут поднимать цены на железо
NIST точно так же выбрали бенчмарки, в которых будут тестировать, то что они сделали это некоторое время назад не делает их выбор более честным и правильным. Тем более после того, когда поняли что у них графики не будут красиво смотреться, докинули ещё пару бенчей в которых нужные модели хорошо справляются, а не нужные плохо. И о чудо DeepSeek реально показывал себя на одном уровне в тех бенчмарках, в которые раньше юзал NIST, а вот в новеньких просадочка вышла, эх отстают на 8 месяцев...
Ну хоть спасибо, что про цену что-то написали. Получается, что DeepSeek в некоторых задачах даёт лучшую эффективность по цене/качеству. И если у тебя только эти задачи, а не задачи на визуальны головоломки, кибербезопасность или переписывание кода с одного языка на другой, то почему бы не использовать его?