atomlib Mar 18 at 06:09

xAI открыл веса и архитектуру языковой модели Grok-1

3 min

13K

Open source*Machine learning*Popular scienceIT-companiesNatural Language Processing*

+23

Comments 18

nemajo Mar 18 at 06:39

На деле это значит, что отныне для создания конкурента OpenAI и Anthropic может сгодиться дообучение модели Grok-1. Отсутствие необходимости создавать собственный претрейн потенциально сэкономит миллионы долларов.

И у какого же процента сообщества есть средства и мощности чтобы адекватно работать с такой моделью?

logran Mar 18 at 08:00

У любой занимающейся какими-либо расчетами на GPU компании?
Не все модели должны быть для простых смертных, более того - по имеющимся 70b-120b моделям очевидно, что нормальные умные модели в потребительское железо на текущем этапе точно не влезут.

Я потому и не понимаю, почему ClosedAi и прочие мистрали трясуться над своими моделями аки Кощей над златом и не выкатывают в OpenSource. Сообщество их запустить всё равно не сможет, а потенциально могущие составить конкуренцию демпингом цен компании отсекаются лицензией.

BlackMokona Mar 18 at 08:02

Китайцы, они и запустят и на лицензию положат болт

logran Mar 18 at 08:12

Возможно. Но, к сожалению, только для себя (ибо дешевых API c утекшей Miqu так и не появилось, а оно GPT-3.5 уделывает).

Lexicon Mar 18 at 08:58

Все потому, что люди думают, будто мегакорпы используют 500-1000b+ модели, а на самом деле они выкручиваются за счет датасетов и надстроек, тюнов и тп, наверняка также используя кванты моделей гораздо меньшего размера, чем кажется.

Пока нет способа консистентно ускорить работу с большими моделями, а исследователи openAI такие же люди, как вы, с тем же гуглом, теми же публичными моделями и подходами, на которых они учатся.

Ценность, которую скрывают компании находится на грани доступности обывателю

nemajo Mar 18 at 14:31

Хвала небесам, у компаний всё в порядке. Как гора с плеч.

-1

Kergan88 Mar 18 at 16:42

>по имеющимся 70b-120b моделям очевидно, что нормальные умные модели в потребительское железо на текущем этапе точно не влезут.

Вроде же наоборот? Даже 70б сейчас значительный оверхед, выглядит так что 10-20б параметров вполне достаточно. Осталось только решить проблему с тем, чтобы модель перестала заучивать факты - и у каждого в телефоне будет своя полноценная универсальная сетка.

Grogcm20 Mar 18 at 13:15

У государств разных, есть.

DmitryOgn Mar 19 at 01:55

У сообщества для подобных задач есть petals.dev

Araki_Satoshi Mar 18 at 08:11

Ждём поддержку в llamacpp и Axolotl, будем файнтюнить и запускать в облаке или даже дома в ~3bpw. Аренда такого большого видеокарт будет недешева, но вполне посильна для энтузиастов.

DGN Mar 18 at 09:39

И какой же минимальный конфиг?

Yapokhozhnakota Mar 19 at 00:23

Более 300Гб GPU памяти. По слухам 8шт h100(80Gb ОЗУ каждая)

Alex20129 Mar 19 at 11:34

Если у вас 300+ Гб системной RAM, то можно запустить на CPU. Старенький Threadripper добыть легче, чем топовый ускоритель класса H100. Другое дело, что работать это будет крайне медленно.

DGN Mar 20 at 01:43

Да, вот как раз о таком конфиге думал. Благо серверная память дешёвая. А крайне медленно, это сколько примерно токенов в секунду?

Alex20129 Mar 20 at 23:45

Не рискну ванговать, я не трогал ничего даже близко похожего на сабж. Ради смеха запускал, через GGML, StarCoder 2 на 15 млрд. параметров. Квантизированная версия q8_0 на моём Ryzen 3700x выдаёт в среднем 1 токен в секунду.

Полагаю, это сильно зависит от скорости доступа к памяти, и какой-нибудь девайс с памятью HBM, типа MacPro, вероятно, справился бы лучше. Однако, там всего 192Гб ? и ценник конский... ну это так, мысли вслух.

MessirB Mar 18 at 10:11

Ну что, ждем квантованную версию в gguf формате на обниморде.

Alex20129 Mar 19 at 11:41

Судя по размеру, выложена как раз таки квантизированная модель. 314 млрд параметров в формате float32_t это ~1256 Гб. Хотя, мы не знаем, какой формат был исходным, но я лично сомневаюсь, что они тренировали 8-битную модель.

MessirB Mar 19 at 16:06

Ну вот, а я уже размечтался.