high_fly Dec 12 2023 at 19:47

Mixtral 8x7B – Sparse Mixture of Experts от Mistral AI

Medium

4 min

15K

Open source * Machine learning * Artificial IntelligenceNatural Language Processing *

+10

Comments 11

Aniro Dec 12 2023 at 23:58

Перед запуском нужно иметь в виду, что, например, в 16ГБ такая модель, вероятно, не влезет. И в 32, думаю, тоже.

Квантизованная модель отлично влезет в 32ГБ, в 24 придется скинуть пару слоев на процессор чтобы влезло хоть немного контекста или использовать что-то типа 3Q GGUF. Зато в 24ГБ отлично влезет 4x7b GPTQ, (вдвое меньше экспертов, но зато комфортно влезает в потребительские ускорители)
Другой вопрос что сейчас все это довольно сложно запустить, но библиотеки/фреймворки скоро подтянутся.

GruBBy_kz Dec 16 2023 at 16:31

LMstudio 029 уже предварительно умеет. Я даже скачал q4_k_m но попробовать не успел - новая версия не видит ни одной из десятка скачаных моделей. (все аботали раньше) хотя и позволяет загрузить ту, что в сохраненных чатах запомнила.

Inkor Dec 18 2023 at 06:12

GPTQ и GGUF от TheBloke уже есть, но они конечно работают пока не в основных ветках библиотек.

psemilanceata Dec 25 2023 at 05:35

Вы о чем? На 1080ti 11Gb замечательно работает

janvarev Dec 13 2023 at 09:09

Коллеги, если вдруг кому-то хочется погонять вживую, то я уже выложил её на VseGPT.ru (можно через чат или API, кому как нравится). Впечатления в целом от модели приятные.

vagon333 Dec 13 2023 at 12:16

... я уже выложил её на VseGPT.ru

Если не секрет, на каком железе вы подняли?
Примеряемся поднять у себя.

janvarev Dec 13 2023 at 12:54

Западный API проксируем, если честно - там стоимость за генерации в целом. Что интересно, предлагают по цене 7B моделей, что приятно удивляет - хотя, возможно, это временная акция.

Вообще есть вот в GGUF-формате - (V)RAM требуется в меру много, но можно глянуть предполагаемые требования: https://huggingface.co/TheBloke/Mixtral-8x7B-Instruct-v0.1-GGUF