runaway_llm9 дек 2025 в 16:50

Mistral выпустила две модели для кодинга: одна соперничает с Claude Sonnet, вторая работает на домашнем GPU

1 мин

10K

Искусственный интеллектМашинное обучение *

Комментарии 9

Timmek 9 дек 2025 в 16:53

Ох уж эти 24B модели в домашних ПК....

weirded 9 дек 2025 в 17:42

А что с ними не так? Вполне неплохо влезают в квантованном в Q4 виде в 16гб VRAM.

Politura 9 дек 2025 в 18:03

Это dense модель, так что 256k токенов контекста (да даже и 16к) не влезут туда вместе с моделью. kv кэш даже у квантованных моделей по дефолту 16-и битный и меньше 8 бит делать не рекомендуется, ибо глючить начинает.

jarkevithwlad 9 дек 2025 в 20:20

ну есть относительно не дорогая rtx3090 на рынке, я себе планирую вообще взять мини пк на ai max+ 395 с 128gb ram/vram (за 2200$ можно найти)

grixis 9 дек 2025 в 20:51

Аххах .. 128гб ddr5, да? Доорогую игрушку смотришь

jarkevithwlad 9 дек 2025 в 21:24

там не ddr5, там распаяна LPDDR5X 8000MHz и да, пока ценник там не повышали

Politura 9 дек 2025 в 17:46

Ну, 8-й квант даже с каким-то контекстом влезет в память топовой видюхи. А сейчас популярны вариации 4-го кванта, есть шанс, что эта модель будет не сильно тупеть на каком-нибудь из них.

Fardeadok 9 дек 2025 в 23:35

А что сейчас лучше для локального кодинга есть в пределах 12гб видяхи и 128гб оперативы?

puchuu 10 дек 2025 в 20:53

Qwen3 next

Зарегистрируйтесь на Хабре, чтобы оставить комментарий