daniilshat 21 фев 2024 в 15:22

Google представила открытые языковые модели Gemma

1 мин

Open source * Машинное обучение * Искусственный интеллект

Комментарии 3

BigDaddy09 21 фев 2024 в 20:36

Миллион контекста в несчастные 7B параметров запихнули. Сейчас ведь не первое апреля. Yi 30B с контекстом в 200к не справляется, а они сделали уродца, который встанет в один ряд со странными решениями для туалетных юнтузиастов. Пока что самый жизнеспособный вариант на длинный контекст это 8x7 и тому подобные Mixtral MoE.

ValeriyPushkarev 22 фев 2024 в 05:03

У гениев ИИ там везде декартов квадрат - вместо чтения - гигантский маппинг. Вместо описания используя тот же ResNet - опять 3 Гб. Вместо хранилища информации как Wolfram - Еще 4 Гб ). Спасает только квантизация. Вот такая мода, зато модели делать не надо ).

ValeriyPushkarev 22 фев 2024 в 05:44

*декартово произведение

Зарегистрируйтесь на Хабре, чтобы оставить комментарий