Комментарии 9
Немного контекста для специалистов https://habr.com/ru/companies/yandex/articles/830410/
Что удивительно -- это не "убрать 2 слоя менеджеров". Впрочем, это способ сократить еще в 40 раз
Хотите сказать что Gemma 9b будет нормально работать не на 10гб памяти а меньше чем на 2? Звучит абсолютно нереалистично.
Верной дорогой идете, товарищи
Отличная новость. Вот бы удалось досжимать языковые модели до размеров бытового накопителя при сохранении качества работы, чтобы можно было запускать условную Алису и прочее в оффлайне.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Специалисты «Яндекса» разработали решение, позволяющее бизнесу сократить расходы на внедрение нейросетей до восьми раз