Aleks_Koh16 часов назад

Локальный ИИ на «древнем» железе: выжимаем максимум из AMD RX 580 через Vulkan в Fedora (Llama 3.1, DeepSeek, Qwen 3.5)

Средний

6 мин

6.7K

Искусственный интеллектLinux * Системное администрирование * Старое железоOpen source *

Кейс

Из песочницы

Комментарии 5

Agne 16 часов назад

А если несколько rx580 они недорогие . и платка на ксеон. И принципиально ли ддр4 или ддр3 подойдет

Incognito4pda 15 часов назад

Выжимать что-то из Олламы это как стрелять себе в ногу. Автор хотя бы изучил бы современный стек, прежде чем строчить полотно. Оллама уже давно смешной полукомерческий анахронизм в числе вечно догоняющих. Вы на выжали, а ноборот себя загнали в рамки этого тормознутого поделия, на которой генерация почти в 2 раза медленнее чем на llama.cpp например. Когда вижу как автор очередного гайда что-то там вымучивает из Олламы - сразу ясно, в вопросах ии генерации явно дилетант.

JajaComp 11 часов назад

Не совсем так. На стадии исследования ollama вполне себе норм. Если на нем завелось, то и на llama будет работать с приростом процентов 20

VGusev2007 11 часов назад

Тут больше вопрос: а что делать то с такими маленькими моделями? Где они могут приносить пользу?

DSoap 4 часа назад

Достаточно интересная статья, а насколько хорошее качество моделей и есть ли горизонот для масштабирования? (Например несколько поставить видеокарт?)

Зарегистрируйтесь на Хабре, чтобы оставить комментарий