Комментарии / Профиль titulusdesiderio / Хабр

А я в то время искал русскоязычные источники с актуальной интересной информацией про нейросети для разработчиков. А то всё на английском да на английском

А тут вы со своим списком на 10 крутые каналов! Как тогда подписался, до сих пор читаю и участвую в дискуссиях. Спасибо за подгон 👍

Feature Flags на фронтенде: как управлять фичами без боли и рисков

titulusdesiderio 15 дек 2025 в 09:52

Спасибо за статью.

Помимо бд есть ещё вариант хранения JSON файла в S3. Его и обновлять проще и кеширование там из коробки.

Большой куш Сбера – громкие заголовки на чужом коде

titulusdesiderio 12 дек 2025 в 07:21

Вы правы. Я так понял из статьи, но видимо ошибся.

шаблоны CI/CD, в том числе и интеграционный, мы распространяли свободно для всех

Получается автор соврал в тексте статьи

Большой куш Сбера – громкие заголовки на чужом коде

titulusdesiderio 12 дек 2025 в 07:07

"Хорошие художники копируют, великие — воруют"

Ваш код распространялся по свободной лицензии. Opensource для того и существует, чтобы другие могли взять код, переделать его и создать на базе этого свой проект.

Я сам тысячи раз воровал код из гитхаб и sof. Все мои коллеги, кто старше интерна - так же. Так работает наша индустрия. За счёт этого мы так быстро движемся вперёд

+39

Мне 17, завтра отчисление. Пытаюсь понять, не совершаю ли я ошибку, копаясь в AI

titulusdesiderio 11 ноя 2025 в 16:51

Практически все.. Некоторые ещё студенты

Мне 17, завтра отчисление. Пытаюсь понять, не совершаю ли я ошибку, копаясь в AI

titulusdesiderio 11 ноя 2025 в 04:29

Не способность закончить проект "универ" - ред флаг для работы.

Запускаем GPT-OSS-120B на 6 Гб GPU и ускоряем до 30 t/s. Вам нужна RAM, а не VRAM. Параметр -cmoe для ускорения MoE LLM

titulusdesiderio 4 ноя 2025 в 07:18

У меня сервер на linux и я устанавливал llama.cpp через brew - это неправильный способ? о_О

Покопался в логах. Действительно дело в GPU. Буду копать в эту сторону. Спасибо!

~$ llama-server -hf lmstudio-community/gpt-oss-120b-GGUF --host 0.0.0.0 --port 8080 -c 32000 -ngl 99 -ub 4092 -b 4092 -ncmoe 25 warning: no usable GPU found, --gpu-layers option will be ignored warning: one possible reason is that llama.cpp was compiled without GPU support warning: consult docs/build.md for compilation instructions

Запускаем GPT-OSS-120B на 6 Гб GPU и ускоряем до 30 t/s. Вам нужна RAM, а не VRAM. Параметр -cmoe для ускорения MoE LLM

titulusdesiderio 4 ноя 2025 в 07:06

чуда не произошло ):

3.6 t/s при любых раскладах

GPU 1x RTX 3060

CPU 26 Cores

Memory 51.2 GB

Можете дать ссылку на cuda версию? не понимаю как отличить её от cpu на huggingface

Запускал как рекомендует сам huggingface

Запускаем GPT-OSS-120B на 6 Гб GPU и ускоряем до 30 t/s. Вам нужна RAM, а не VRAM. Параметр -cmoe для ускорения MoE LLM

titulusdesiderio 4 ноя 2025 в 06:27

🤦 сорян, не ту модель скопировал в сообщение. Вот:
unsloth/gpt-oss-120b-GGUF - её использовал. Gemma 3 12b показывает гораздо выше t/s на такой карте.

Сейчас проверяю ту же OSS-120B на 3060. Надеюсь будет заметна разница в скорости. через полчаса-час скину результаты

Запускаем GPT-OSS-120B на 6 Гб GPU и ускоряем до 30 t/s. Вам нужна RAM, а не VRAM. Параметр -cmoe для ускорения MoE LLM

titulusdesiderio 4 ноя 2025 в 05:16

Попробовал unsloth/gemma-3-12b-it-GGUF на:
GPU: 1x RTX 5090
CPU: 48 Cores
Memory: 128 GB
Disk: 200 GB

Что без флагов 11t/s что с -c 32000 -ngl 99 -ub 4092 -b 4092 -ncmoe 25 11t/s, что с -c 32000 -ngl 99 -ub 4092 -b 4092 -cmoe 11t/s. вообще никакого влияния на производительность 🤷

Запускаем GPT-OSS-120B на 6 Гб GPU и ускоряем до 30 t/s. Вам нужна RAM, а не VRAM. Параметр -cmoe для ускорения MoE LLM

titulusdesiderio 1 ноя 2025 в 21:01

А можно такое повернуть с ollama?

2 3 ...

36 37