Комментарии 3
Это на самом деле известная проблема.
Если тюнить ИИ на сырых данных о предпочтениях пользователей, то вылезают косяки. И излишнее лизоблюдство - это один из таких косяков.
Пользователям в целом нравится когда ИИ им делает небольшие комплименты. Это известная закономерность. Но это означает что если слишком толсто тюнить ИИ на предпочтениях, то ИИ быстро заметит эту закономерность и начнёт жирно так лизоблюдствовать.
Таких проблем в обучении на предпочтениях огромное количество, и все их надо компенсировать. Похоже что даже у OpenAI с этим бывают сложности.
Прочитал " OpenAI объясняет, почему ChatGPT стал слишком ленивым" . Льстивость сильно не замечал
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
OpenAI объясняет, почему ChatGPT стал слишком льстивым