Обновить

Как мы дистиллировали Qwen для автоматического протоколирования совещаний

Уровень сложностиСредний
Время на прочтение4 мин
Охват и читатели8.7K
Всего голосов 4: ↑4 и ↓0+5
Комментарии4

Комментарии 4

То что в вашем методе называется протоколом, у нас называется стенограмма, и приходит к нам уже в готовом виде. Далее мы составляем протокол a.k.a краткое содержание стенограммы.
Имея чистую транскрибацию ваш метод вполне хорош, однако решает отличную от нашей задачи проблему.

А есть какой-то репозиторий с примерами кода для дообучения или хоть что-то воспроизводимое? Иначе практической пользы от статьи 0. Рассказ о том, что крупный банк умеет дообучать модели через LoRA - это не какое-то сверхдостижение, достойное статьи.

Код это внутренние разработки банка, поэтому, к сожалению, не можем его выкладывать.
Суть статьи не в том, что мы можем обучать адаптеры, а в том что при дистилляции адаптеры квантизованной модели показывают себя хуже адаптеров неквантизованных, на примере конкретной задачи протоколирования.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Информация

Сайт
www.vtb.ru
Дата регистрации
Дата основания
Численность
свыше 10 000 человек
Местоположение
Россия