Обновить

Комментарии 1

Спасибо за обстоятельный пересказ - очень полезно.

Не в упрёк автору, но замечу, что тестирование всех приложений, и безопасность облачных, было обязательным требованием к проду. Почему это стало необязательным при разработке LLM не очень понятно.

Из моего опыта - чатбот даёт правильный ответ в 95% сценариев, а оставшиеся 5% ошибок делают его абсолютно непригодным к проду. Поэтому мы сделали 50+ разных сценариев беседы, и тестируем их автоматически. Не уверен кстати, что этого достаточно. Идти в прод, пару раз прогнав вручную, я бы поостерёгся.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации