high_fly12 дек 2023 в 19:47

Mixtral 8x7B – Sparse Mixture of Experts от Mistral AI

Средний

4 мин

3.6K

Open source * Машинное обучение * Искусственный интеллектNatural Language Processing *

Комментарии 11

Aniro 12 дек 2023 в 23:58

Перед запуском нужно иметь в виду, что, например, в 16ГБ такая модель, вероятно, не влезет. И в 32, думаю, тоже.

Квантизованная модель отлично влезет в 32ГБ, в 24 придется скинуть пару слоев на процессор чтобы влезло хоть немного контекста или использовать что-то типа 3Q GGUF. Зато в 24ГБ отлично влезет 4x7b GPTQ, (вдвое меньше экспертов, но зато комфортно влезает в потребительские ускорители)
Другой вопрос что сейчас все это довольно сложно запустить, но библиотеки/фреймворки скоро подтянутся.

GruBBy_kz 16 дек 2023 в 16:31

LMstudio 029 уже предварительно умеет. Я даже скачал q4_k_m но попробовать не успел - новая версия не видит ни одной из десятка скачаных моделей. (все аботали раньше) хотя и позволяет загрузить ту, что в сохраненных чатах запомнила.

Inkor 18 дек 2023 в 06:12

GPTQ и GGUF от TheBloke уже есть, но они конечно работают пока не в основных ветках библиотек.

psemilanceata 25 дек 2023 в 05:35

Вы о чем? На 1080ti 11Gb замечательно работает

janvarev 13 дек 2023 в 09:09

Коллеги, если вдруг кому-то хочется погонять вживую, то я уже выложил её на VseGPT.ru (можно через чат или API, кому как нравится). Впечатления в целом от модели приятные.

vagon333 13 дек 2023 в 12:16

... я уже выложил её на VseGPT.ru

Если не секрет, на каком железе вы подняли?
Примеряемся поднять у себя.

janvarev 13 дек 2023 в 12:54

Западный API проксируем, если честно - там стоимость за генерации в целом. Что интересно, предлагают по цене 7B моделей, что приятно удивляет - хотя, возможно, это временная акция.

Вообще есть вот в GGUF-формате - (V)RAM требуется в меру много, но можно глянуть предполагаемые требования: https://huggingface.co/TheBloke/Mixtral-8x7B-Instruct-v0.1-GGUF