Как стать автором
Обновить

Специалисты «Яндекса» разработали решение, позволяющее бизнесу сократить расходы на внедрение нейросетей до восьми раз

Время на прочтение2 мин
Количество просмотров4.4K
Всего голосов 13: ↑11 и ↓2+15
Комментарии9

Комментарии 9

Спасибо, добавил в материал!

Что удивительно -- это не "убрать 2 слоя менеджеров". Впрочем, это способ сократить еще в 40 раз

Хотите сказать что Gemma 9b будет нормально работать не на 10гб памяти а меньше чем на 2? Звучит абсолютно нереалистично.

imatrix делает что-то похоже, но конечно не за бесплатно, экономия в памяти выливается в очень сильных требованиях в ЦПУ и ГПУ.

Верной дорогой идете, товарищи

Отличная новость. Вот бы удалось досжимать языковые модели до размеров бытового накопителя при сохранении качества работы, чтобы можно было запускать условную Алису и прочее в оффлайне.

Запустить локально модель уровня Алисы не проблема уже довольно давно, запускают даже на макбуках.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Другие новости

Истории