Pull to refresh

Comments 8

А если несколько rx580 они недорогие . и платка на ксеон. И принципиально ли ддр4 или ддр3 подойдет

Выжимать что-то из Олламы это как стрелять себе в ногу. Автор хотя бы изучил бы современный стек, прежде чем строчить полотно. Оллама уже давно смешной полукомерческий анахронизм в числе вечно догоняющих. Вы на выжали, а ноборот себя загнали в рамки этого тормознутого поделия, на которой генерация почти в 2 раза медленнее чем на llama.cpp например. Когда вижу как автор очередного гайда что-то там вымучивает из Олламы - сразу ясно, в вопросах ии генерации явно дилетант.

Не совсем так. На стадии исследования ollama вполне себе норм. Если на нем завелось, то и на llama будет работать с приростом процентов 20

А llama.cpp уже научилась динамически выгружать и загружать в память модели в зависимости от потребности? Я может плохо искал, но не нашёл нормальной реализации этого с простым пробросом в Open WebUI.

Искать не нужно, всё есть в доках на гитхаб. Научилась - спокойно подключаете к OpenWebUi и меняете модели переключением в главном окне чата. Тоже раньше приходилось юзать llama-swap для этих целей, но в каком-то очередном обновлении llama.cpp сам подтянул возможность менять модели на лету. Причём там можно выбрать либо только одна модель будет постоянно в памяти (текущую выгружаем, новую зашружаем), либо несколько - количество моделей можно указать.

Тут больше вопрос: а что делать то с такими маленькими моделями? Где они могут приносить пользу?

Достаточно интересная статья, а насколько хорошее качество моделей и есть ли горизонот для масштабирования? (Например несколько поставить видеокарт?)

Всем спасибо за обсуждение и критику! Согласен, что llama.cpp быстрее, но целью был именно простой “бандл” для n8n. Про несколько карт — идея интересная, но пока для меня не реализуемая. Я показываю, как запустить современные ИИ-технологии на железе, которое уже есть на руках у многих людей или легко приобретается на вторичном рынке за разумные деньги. Это решение с минимальным порогом входа для тех, кто хочет иметь свой локальный ИИ здесь и сейчас.

Sign up to leave a comment.

Articles