Комментарии / Профиль daria-gal / Хабр

Пользователь

Как мы учили по-доброму шутить LLM и у нас получилось (почти)

daria-gal 23 мая 2025 в 07:56

Датасеты до и после очистки, а также веса классификаторов мы выложили. А сгенерированные шутки нет, у них не такое качество, чтобы ими хотелось делиться.

Как мы учили по-доброму шутить LLM и у нас получилось (почти)

daria-gal 23 мая 2025 в 07:55

Конечно, до. И потом на очищенных данных обучали.

Как мы учили по-доброму шутить LLM и у нас получилось (почти)

daria-gal 23 мая 2025 в 07:55

Выдавать шутки из базы никогда не было целью исследования. Мы хотели понизить токсичность выдаваемых шуток, но сохранить их оригинальность (с последним не очень, да и с первым тоже - в основном из-за смещенной разметки).

Как мы учили по-доброму шутить LLM и у нас получилось (почти)

daria-gal 22 мая 2025 в 15:51

В продакшене этот метод нигде не используется. Делаем научные исследования, которые могут нас потенциально подвинуть ближе к пониманию того, как вообще модели обрабатывают язык, и делимся ими с коммьюнити.