Happynood7 часов назадЯ устал писать одноразовые скрипты для бенчмарков LLM и собрал харнесс, который сам считает Pareto-frontУровень сложностиСреднийВремя на прочтение9 минОхват и читатели6.6KМашинное обучение * Python * Open source * Высоконагруженные системы * DevOps * ТуториалВсего голосов 3: ↑3 и ↓0+3Добавить в закладки5ПоделитьсяКомментарии1
Snyppi22 часа назадЕсть итоговое сравнение бенчмарков разных ИИ или их только 1 к 1 можно сравнивать?
Я устал писать одноразовые скрипты для бенчмарков LLM и собрал харнесс, который сам считает Pareto-front