Все потоки

Rummar21 фев в 19:11

От RLHF к DPO и дальше: как мы разучились бояться и полюбили выравнивание LLM

Сложный

26 мин

7.8K

Natural Language Processing * Open source * Python * Искусственный интеллектМашинное обучение *

Обзор

+5

Комментарии 1

avshkol 23 фев в 08:03

Отличная обзорная статья по методам файнтюнинга!

Но задача "как собрать хороший датасет" остаётся приоритетной...

Зарегистрируйтесь на Хабре, чтобы оставить комментарий