Пользователь
Интересная статья, автору спасибо! В глоссарии указано, что "RM, Reward Model - GPT-3". То есть для RM использовалась такая же модель, что и для BC?
Интересная статья, автору спасибо! В глоссарии указано, что "RM, Reward Model - GPT-3". То есть для RM использовалась такая же модель, что и для BC?