Comments / Profile of titulusdesiderio / Habr

Кунцевич Андрей@titulusdesiderio

JS-dev | IT-specialist

ProfileArticles10Posts6NewsComments736

Цифровая муха сделала первый шаг: как Eon Systems загрузил биологический мозг в симуляцию и почему на очереди — человек

titulusdesiderio 22 hours ago

Квантовые компьютеры могут тут помочь

Лучшие виртуальные карты для оплаты зарубежных сервисов и расчётов за границей

titulusdesiderio yesterday at 04:09

Только предварительно загуглить актуальную информацию, какие карты РБ сейчас привязываются к PayPal

Никакие? Хотя погулять конечно не плохо

OpenAI выпустила ChatGPT 5.3 — чем же она отличается от предыдущей модели?

titulusdesiderio Mar 7 at 12:31

У вас новости просроченные. Зачем Выпускать новостную статью о позапрошлой версии?

Какие LLM потянет ваше железо?

titulusdesiderio Feb 24 at 10:15

Спасибо! Крутой инструмент. Только не обязательно его устанавливать. Можно просто:

npx llm-checker hw-detect

Хабр, работай давай. Код не отображался, пока я эту фразу после него не вставил

Будь Uniqlo: сложность и простота в работах Сато Касива

titulusdesiderio Feb 21 at 07:17

Проходная завода - максимально стандартная и не сложная. Как по мне, ничем не отличается от работы любого студента

Посимвольная нейросетевая модель для автоматической акцентуации русского языка

titulusdesiderio Feb 5 at 06:11

Справится ли оно с билингвальным текстом?

"Залей этот commit в ветку."

Не болтайте ерундой

titulusdesiderio Jan 5 at 20:08

Не понятно чем оно лучше spec-kit. Одна строчка в таблице совершенно голословна и кажется даже не притянута за уши, а вовсе выдумана

Как несколько технарей сделали топ-1 конфу на русском по ИИ в разработке

titulusdesiderio Dec 20 2025 at 22:09

А я в то время искал русскоязычные источники с актуальной интересной информацией про нейросети для разработчиков. А то всё на английском да на английском

А тут вы со своим списком на 10 крутые каналов! Как тогда подписался, до сих пор читаю и участвую в дискуссиях. Спасибо за подгон 👍

Feature Flags на фронтенде: как управлять фичами без боли и рисков

titulusdesiderio Dec 15 2025 at 09:52

Спасибо за статью.

Помимо бд есть ещё вариант хранения JSON файла в S3. Его и обновлять проще и кеширование там из коробки.

Большой куш Сбера – громкие заголовки на чужом коде

titulusdesiderio Dec 12 2025 at 07:21

Вы правы. Я так понял из статьи, но видимо ошибся.

шаблоны CI/CD, в том числе и интеграционный, мы распространяли свободно для всех

Получается автор соврал в тексте статьи

Большой куш Сбера – громкие заголовки на чужом коде

titulusdesiderio Dec 12 2025 at 07:07

"Хорошие художники копируют, великие — воруют"

Ваш код распространялся по свободной лицензии. Opensource для того и существует, чтобы другие могли взять код, переделать его и создать на базе этого свой проект.

Я сам тысячи раз воровал код из гитхаб и sof. Все мои коллеги, кто старше интерна - так же. Так работает наша индустрия. За счёт этого мы так быстро движемся вперёд

+39

Мне 17, завтра отчисление. Пытаюсь понять, не совершаю ли я ошибку, копаясь в AI

titulusdesiderio Nov 11 2025 at 16:51

Практически все.. Некоторые ещё студенты

Мне 17, завтра отчисление. Пытаюсь понять, не совершаю ли я ошибку, копаясь в AI

titulusdesiderio Nov 11 2025 at 04:29

Не способность закончить проект "универ" - ред флаг для работы.

Запускаем GPT-OSS-120B на 6 Гб GPU и ускоряем до 30 t/s. Вам нужна RAM, а не VRAM. Параметр -cmoe для ускорения MoE LLM

titulusdesiderio Nov 4 2025 at 07:18

У меня сервер на linux и я устанавливал llama.cpp через brew - это неправильный способ? о_О

Покопался в логах. Действительно дело в GPU. Буду копать в эту сторону. Спасибо!

~$ llama-server -hf lmstudio-community/gpt-oss-120b-GGUF --host 0.0.0.0 --port 8080 -c 32000 -ngl 99 -ub 4092 -b 4092 -ncmoe 25 warning: no usable GPU found, --gpu-layers option will be ignored warning: one possible reason is that llama.cpp was compiled without GPU support warning: consult docs/build.md for compilation instructions

Запускаем GPT-OSS-120B на 6 Гб GPU и ускоряем до 30 t/s. Вам нужна RAM, а не VRAM. Параметр -cmoe для ускорения MoE LLM

titulusdesiderio Nov 4 2025 at 07:06

чуда не произошло ):

3.6 t/s при любых раскладах

GPU 1x RTX 3060

CPU 26 Cores

Memory 51.2 GB

Можете дать ссылку на cuda версию? не понимаю как отличить её от cpu на huggingface

Запускал как рекомендует сам huggingface

Запускаем GPT-OSS-120B на 6 Гб GPU и ускоряем до 30 t/s. Вам нужна RAM, а не VRAM. Параметр -cmoe для ускорения MoE LLM

titulusdesiderio Nov 4 2025 at 06:27

🤦 сорян, не ту модель скопировал в сообщение. Вот:
unsloth/gpt-oss-120b-GGUF - её использовал. Gemma 3 12b показывает гораздо выше t/s на такой карте.

Сейчас проверяю ту же OSS-120B на 3060. Надеюсь будет заметна разница в скорости. через полчаса-час скину результаты

Запускаем GPT-OSS-120B на 6 Гб GPU и ускоряем до 30 t/s. Вам нужна RAM, а не VRAM. Параметр -cmoe для ускорения MoE LLM

titulusdesiderio Nov 4 2025 at 05:16

Попробовал unsloth/gemma-3-12b-it-GGUF на:
GPU: 1x RTX 5090
CPU: 48 Cores
Memory: 128 GB
Disk: 200 GB

Что без флагов 11t/s что с -c 32000 -ngl 99 -ub 4092 -b 4092 -ncmoe 25 11t/s, что с -c 32000 -ngl 99 -ub 4092 -b 4092 -cmoe 11t/s. вообще никакого влияния на производительность 🤷

Запускаем GPT-OSS-120B на 6 Гб GPU и ускоряем до 30 t/s. Вам нужна RAM, а не VRAM. Параметр -cmoe для ускорения MoE LLM

titulusdesiderio Nov 1 2025 at 21:01

А можно такое повернуть с ollama?

Буква «ў» в домене — бесплатная маркетинговая идея для белорусского бизнеса

titulusdesiderio Oct 28 2025 at 21:16

Думаю стоит сразу два домена регистрировать - с обычной у и нескладовай

Учёные выращивают миниатюрные человеческие мозги и делают из них компьютеры

titulusdesiderio Oct 25 2025 at 18:01

Недавно проскакивала статья, в которой как раз освещался успешный пример механизма снабжения органоидов питательными веществами. Вместо кровеносных сосудов использовалась матрица желобков на поверхности, на которой выращен органоид. Благодаря этому их получалось в большие (относительно) горизонтальные кластеры выращивать.

2 3 ...

36 37