Комментарии 4
А чем мой метод плох? https://habr.com/ru/articles/948894/
Даже на 8 ГБ VRAM будет работать
А есть какой-то репозиторий с примерами кода для дообучения или хоть что-то воспроизводимое? Иначе практической пользы от статьи 0. Рассказ о том, что крупный банк умеет дообучать модели через LoRA - это не какое-то сверхдостижение, достойное статьи.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Как мы дистиллировали Qwen для автоматического протоколирования совещаний