Comments 3
Интересный эксперимент. Судя по всему, астрологи объявили сегодня, 13-е февраля, днём обучения размышлениям LLM на Хабре. Только что опубликовал перевод LIMO: Меньше — значит больше для рассуждающих LLM . Попробуйте взять их датасет из 800+ вопросов-рассуждений-ответов (https://github.com/GAIR-NLP/LIMO) и обучить маленькую модель (хотя они делают упор на то, что модель все же должна быть большая и начитанная учебниками по математике...)
мегахорош, идею взял на вооружение
Sign up to leave a comment.
Как научить модель рассуждать, не переобучая её, меньше чем за 10$