Код это внутренние разработки банка, поэтому, к сожалению, не можем его выкладывать. Суть статьи не в том, что мы можем обучать адаптеры, а в том что при дистилляции адаптеры квантизованной модели показывают себя хуже адаптеров неквантизованных, на примере конкретной задачи протоколирования.
То что в вашем методе называется протоколом, у нас называется стенограмма, и приходит к нам уже в готовом виде. Далее мы составляем протокол a.k.a краткое содержание стенограммы. Имея чистую транскрибацию ваш метод вполне хорош, однако решает отличную от нашей задачи проблему.
Код это внутренние разработки банка, поэтому, к сожалению, не можем его выкладывать.
Суть статьи не в том, что мы можем обучать адаптеры, а в том что при дистилляции адаптеры квантизованной модели показывают себя хуже адаптеров неквантизованных, на примере конкретной задачи протоколирования.
То что в вашем методе называется протоколом, у нас называется стенограмма, и приходит к нам уже в готовом виде. Далее мы составляем протокол a.k.a краткое содержание стенограммы.
Имея чистую транскрибацию ваш метод вполне хорош, однако решает отличную от нашей задачи проблему.