xNoperx Mar 28 2023 at 12:10

Как мы катили roBERT'у в прод по полю граблей

Easy

10 min

2.2K

Домклик corporate blogMachine learning*Data Engineering*

Case

+27

Comments 3

zeaa Apr 10 2023 at 10:08

Спасибо, отличная статья. Вопрос немного не по теме: как проверить статистическую значимость улучшений в случае больших языковых моделей? Или в данном случае ресурсы позволяют выполнить большое количество валидаций для получения удовлетворяющего доверительного интервала?

xNoperx Apr 27 2023 at 14:02

В нашем случае мы проверяли статзначимость улучшений на бизнес метриках.

Наша ml-метрика f-beta коррелируют с нашей бизнес метрикой, по этому при повышении f-beta с некоторой долей вероятности повысится и бизнес метрика. По этому первоначальная проверка просто по f-beta, а дальше обычный AB-test.

xNoperx Apr 27 2023 at 14:00

del