alex0x08 Mar 8 at 11:52

Праздник продолжается: LLM на FreeBSD

Hard

5 min

4.6K

Abnormal programming * Machine learning *

Tutorial

+14

Comments 15

holodoz Mar 8 at 13:01

Однобитное квантование - это скорее какое-то упражнение, чем реальное решение какой-то задачи. Показать, что и так можно и даже немного работает. Качество работы по ответам хорошо видно: чуть лучше, чем случайный набор слов, но не сильно лучше.

alex0x08 Mar 8 at 13:09

Грешу больше на модель, плюс я не очень хорошо умею писать промпты.

Будут еще тесты на новых китайских моделях.

punzik Mar 8 at 13:36

А почему не использовать ollama? Там из коробки много интересных моделей, и руками можно поставить. Я пробовал запускать Deepseek-R1 671B Q1.58 на 128ГБ оперативы. Оно, конечно, работает, но оооочень медленно. Для CPU инферинга отлично подошла deepseek-coder-v2-16b. За счёт MoE работает офигенно быстро, и при этом достаточно качественно.

alex0x08 Mar 8 at 15:16

А почему не использовать ollama?

Докер, да и оно судя по репозиторию каких-то космических размеров.

Врядли заработает в BSD-системе.

You should have at least 8 GB of RAM available to run the 7B models, 16 GB to run the 13B models, and 32 GB to run the 33B models.

Еще не увидел каких-либо требований по GPU, скорее всего для самого интересного все же необходим ускоритель.

при этом достаточно качественно.

С критериями качества тоже не очень понял - как вообще тестируются LLM?

punzik Mar 8 at 15:51

Докер, да и оно судя по репозиторию каких-то космических размеров.

Там Go и C++. Она на базе той же llama-cpp, думаю собрать её на BSD трудов не составит. А ещё её в качестве бэкэнда поддерживают многие интересные тулы, типа веб-интерфейсов, телеграм ботов, консольных тулов и редакторов кода (emacs, например)

Еще не увидел каких-либо требований по GPU

Такие же, как у llama-cpp. Если модель влазит в память GPU, то будет большое ускорение. Если не влазит - то ускорения практически не будет, хоть и будет часть модели считаться на GPU. Ускоритель желателен, но не необходим, все модели работают на CPU.

С критериями качества тоже не очень понял

Критерии простые - устраивает ответ на вопрос или нет.

nuclight Mar 15 at 16:29

По такому критерию большинство платных и рекламируемых нейронок будут некачественные =)

irnis Mar 9 at 03:10

так и напрашивается подзаголовок - "Как пропатчить LLM под FreeBSD" :)

unreal_undead2 Mar 10 at 10:55

Как то не вяжется

Петон нужен третий и самой последней версии

conda create -n bitnet-cpp python=3.9

alex0x08 Mar 10 at 11:01

Видимо инструкция старая, поскольку там же в README:

python>=3.9

Я использовал последнюю версию на тот момент, вроде 3.12.

unreal_undead2 Mar 10 at 11:05

вроде 3.12

Старьё, там даже JIT нет )

alex0x08 Mar 10 at 12:19

Речь про это? Ну такими темпами они еще лет 10 его доводить будут.

bugigugi Mar 12 at 10:37

Убрать версию Pytorch - это храбро и уважаемо :)

alex0x08 Mar 12 at 10:59

"Слабоумие и отвага" as-is ;)

nuclight Mar 15 at 16:30

А зачем csh и почему /opt ?

И еще из тележного @freebsd_ru передают:
Евгений Гросбейн, [15 Mar 2025 09:42:58]
Совершенно ничего интересного.

Евгений Гросбейн, [15 Mar 2025 09:43:21]
Каменты ниачом.

Евгений Гросбейн, [15 Mar 2025 09:44:27]
Статья - ну да, грабельки расписаны, мог бы и скриптик нарисовать для автоматизации установки, я уж не говорю про полноценный порт.

Евгений Гросбейн, [15 Mar 2025 09:45:21]
Сфига ли он там что-то цензурил, неясно, какие-то локальные хабро-заморочки, наверное.

alex0x08 Mar 15 at 16:35

держите в курсе )