Pull to refresh
0
0
Send message

Интересная статья, автору спасибо! В глоссарии указано, что "RM, Reward Model - GPT-3". То есть для RM использовалась такая же модель, что и для BC?

Information

Rating
Does not participate
Registered
Activity