Когда DeepSeek готовила свой технический отчет, она сама выбирала, на каких бенчмарках будет сравнивать модель с конкурентами. NIST так делать не стал
NIST точно так же выбрали бенчмарки, в которых будут тестировать, то что они сделали это некоторое время назад не делает их выбор более честным и правильным. Тем более после того, когда поняли что у них графики не будут красиво смотреться, докинули ещё пару бенчей в которых нужные модели хорошо справляются, а не нужные плохо. И о чудо DeepSeek реально показывал себя на одном уровне в тех бенчмарках, в которые раньше юзал NIST, а вот в новеньких просадочка вышла, эх отстают на 8 месяцев...
Ну хоть спасибо, что про цену что-то написали. Получается, что DeepSeek в некоторых задачах даёт лучшую эффективность по цене/качеству. И если у тебя только эти задачи, а не задачи на визуальны головоломки, кибербезопасность или переписывание кода с одного языка на другой, то почему бы не использовать его?
Но как она могла зайти в тупик, если они создали ИИ с которым можно прекрасно общаться на таком уровне?
Пофиг, кто там не согласен, пока они не стоят дорого, они не будут поднимать цены на железо
NIST точно так же выбрали бенчмарки, в которых будут тестировать, то что они сделали это некоторое время назад не делает их выбор более честным и правильным. Тем более после того, когда поняли что у них графики не будут красиво смотреться, докинули ещё пару бенчей в которых нужные модели хорошо справляются, а не нужные плохо. И о чудо DeepSeek реально показывал себя на одном уровне в тех бенчмарках, в которые раньше юзал NIST, а вот в новеньких просадочка вышла, эх отстают на 8 месяцев...
Ну хоть спасибо, что про цену что-то написали. Получается, что DeepSeek в некоторых задачах даёт лучшую эффективность по цене/качеству. И если у тебя только эти задачи, а не задачи на визуальны головоломки, кибербезопасность или переписывание кода с одного языка на другой, то почему бы не использовать его?