Как стать автором
Обновить
0
0

Пользователь

Отправить сообщение

Интересная статья, автору спасибо! В глоссарии указано, что "RM, Reward Model - GPT-3". То есть для RM использовалась такая же модель, что и для BC?

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность