Comments / Profile of triller599 / Habr

Инженер-программист

Subscribers

Локальные LLM в реальной работе: Gemma 4, Qwen 3.6 и Qwen Coder

Или обновили, или ещё что.. Сегодня скачал - как написано 16.5, так и на диске занимает 16.5
Впрочем не важно, 15.5 слишком много для реальной работы на GPU, необходимо выносить часть слоёв. Плохо!
Делали бы они все модели 20B, как OpenAI - вот это комфортный размер для 16ГБ. А тут прям как насмешка..

А про паплайн.. спасибо за совет! Я лишь имел в виду, что если уж включать "думание", то его не следует ограничивать, иначе ерунда получается.

Локальные LLM в реальной работе: Gemma 4, Qwen 3.6 и Qwen Coder

triller599 May 12 at 19:17

Да, уже разобрался про Nvidia.
Жаль. Тому же Unsloth возможно имеет смысл "подкрутить" бенчмарки, а вот Nvidia вроде особого смысла нет, могут просто качественно стараться сделать.

Локальные LLM в реальной работе: Gemma 4, Qwen 3.6 и Qwen Coder

triller599 May 12 at 16:15

Спасибо за результаты, пойдёт как ориентир. Однако Вы сами не нейросеть? :)
1) у Вас "Gemma 4 - 15,5 ГБ" а в другом абзаце "помещается в VRAM". И потом приводите порог в 15.3.. Если сама сеть 15ГБ+, то в 16ГБ она никак не лезет, Ваши же пороги это подверждают.

Хотя ладно:
2) Не могли бы сказать, кто сжимает Гемму MXFP4 в 15.5 ? Я вижу только 16+ варианты
3) Так понимаю, что llama.cpp ещё не поддерживает NVFP4? Иначе можно было бы взять квант напрямую от Nvidia.
4) И по моим наблюдениям, часто QWEN3.6 –reasoning off работает лучше, чем с размышлениями. Однако уже не раз натыкался, что для qwen надо именно что НЕ ограничивать бюджет на размышления, типа это у них в архитектуре заложено. Однако на железках уровня 5060/5070 выглядит малореально..

Запуск модели gpt-oss на 20 и 120 миллиардов параметров, на процессоре Core I9 для решения непростой задачи без GPU

triller599 Mar 7 at 18:32

Благодарю за ссылки и совет.

Запуск модели gpt-oss на 20 и 120 миллиардов параметров, на процессоре Core I9 для решения непростой задачи без GPU

triller599 Feb 20 at 17:37

И эта модель ( gpt‑oss‑20b ) реально работает на 5060 Ti 16ГБ ?
Опыта мало, выбираю себе для такой же карты модель в качестве baseline-а для агентской системы.

Собираем ANPR-систему на Python: от YOLOv8 и кастомного OCR до INT8-квантизации

triller599 Oct 25 2025 at 07:51

YOLO внутри сразу, скорей всего, "пожмёт" Ваши данные к 640х640 и ничего не поменяется. Причём и снизу(480p) и сверху (1080p). Так что в детекции только небольшие накладные расходы..
Извините что опять встреваю)

Собираем ANPR-систему на Python: от YOLOv8 и кастомного OCR до INT8-квантизации

triller599 Oct 25 2025 at 07:34

У Вас на видео в простейшем случае вылезла ошибка, а Вы забыли это упомянуть.
Потому следующие замечания:
1) 100 эпох на yolo8n для детекции номеров на 25к изображений? У меня не то чтобы много опыта, но тот что есть, говорит - скорей всего переобучение. Для подобной задачи это всё ещё большая модель.
2) Вот на видео очевидная пробелма в простейшей ситуации. И подозреваю, что Вы не знаете, как это фиксить. Проблема "коробочного" решения в 2 клика.. Но может я и ошибаюсь - распознаватель-то у Вас свой )

Было бы приятнее прочитать про Ваш опыт, если бы в статье было поменьше восторженных эпитетов, если результат отнюдь не выдающийся.
Однако какой-то результат получили, что уже неплохо!

От GPT-2 к gpt-oss: анализ достижений архитектуры

triller599 Oct 5 2025 at 19:53

"Афтар пишы исчо!"(С)
А если серьёзно, то очень полезно, благодарю!
Для интересующихся, такие обзоры очень полезны - позволяют чётко увидеть тренд.

Как генерировать Jupyter Notebooks из Python-скриптов с удобством

triller599 Sep 22 2025 at 19:07

Попробуем, попробуем. Благодарю!

Absolute Zero Reasoner: ИИ научился программированию без входных данных — и это может поменять всё

triller599 Jun 6 2025 at 21:22

Разве что в самом начале, как и в обычном обучении.
Потом формируются закономерности, ~~как и в обыном обучении~~, причём формируются и у обучаемого и у обучающего. И зайти он, очевидно, может гораздо дальше, нежели зашли мы с собственными архитектурами и подходами.
Действительно интересно..

Absolute Zero Reasoner: ИИ научился программированию без входных данных — и это может поменять всё

triller599 Jun 6 2025 at 17:10

Немного оффтоп и я не спец, но часто повторяемая идея "данные закончились" кажется весьма абсурдной.
Сколько знаний большие модели могут извлечь из задачи "вот перыдущие 5 кадров видео с едущей по дороге машиной, нарисуй 6-й?" Или дальше, "вот кадры начала падения капли жидкости, добавь следующие". "Предскажи положинеи листа на дереве", "сгиб куска пластика"?
Бесконечное море данных! Причём очень точных, без дилетансткого "шума" в интернете..

От задачи до решения: LLM с RAG-конфигурацией и ROC-AUC. Эксперимент на 121 прогоне за 40 часов с помощью ИИ

triller599 Jun 5 2025 at 07:20

Весьма обстоятельно!

Мной, как не профессионалом в области, использование чанков воспринимается жутким костылём. Даже Ваши статистические выкладки не убедили: похоже, результат больше зависит от того, попала ли связанная информация в один чанк или нет.
Неужели нет распростронённых подходов в виде каких-нибудь "семантических деревьев поиска"(фразу я придумал) или что-то подобного? Понимаю, что в индустрии "все" так делают, но это очевидный недостаток алгоритма, на мой взгляд.

Семантический поиск по статьям Хабра в PostgreSQL + индексация текстов LLM в Ollama

triller599 Jun 4 2025 at 07:54

Весьма наглядный пример и есть возможности для развития, благодарю!

Вопрос: не будет ли преимуществом объединить(перенести в единую модель) извлечение ключевых слов и формирование эбеддингов? Ведь когда Вы одной сеткой извлекаете ключевые слова и темы, то вы разрушаете между ними связь. Т.е. для второй сетки, которая фомирует эмбеддинги, это просто отдельные слова и фразы.

Упрощение прототипирования и верификации RTL с помощью Python

triller599 May 22 2025 at 21:13

А есть ли преимущества по сравнению с тем же CocoTB? Было бы неплохо сравнить)

Периодическая таблица машинного обучения

triller599 May 22 2025 at 21:11

Очень интересно. Спасибо за статью, так бы пропустил..
Мне кажется это отличный маркер готовности к серьёзной работе в ML - если можешь сходу осознать каждую формулу и замечание из этой работы!

One-shot промптинг. Как я начал вайбкодить в 10? раз быстрее

triller599 May 13 2025 at 20:01

Если решите поразбираться, то, как предлагали в другой статье про Курсор, можете подсунуть собственный ключ от openAI/Google и т.д. и посмотреть реальный промт на другой стороне. На всякий случай, вдруг не в курсе..

Глубокое Q-обучение (DQN)

triller599 May 4 2025 at 11:10

Предположу, что стиль изложения больше подходит специалистам-теоретикам, чем тем, кто решает практические задачи. Остальным, чтобы разобратсья в этих формулах, необходимо прилагать усилия, пусть и не большие. А смысла в этом сокрей всего не будет, раз не применяется широко..

Автору: если Вы заинтересованы в обсуждении данной темы, Вы бы подготовили наглядный пример, допустим что-нибудь на ViT для картинок и показали разницу, между классическим подходом и вашим.

Представлен проект отдельного процессора под названием PyXL для выполнения байткода Python

triller599 Apr 29 2025 at 10:10

.. на C составляет ..

А на Python? :)

Представлен проект отдельного процессора под названием PyXL для выполнения байткода Python

triller599 Apr 29 2025 at 10:06

Выглядит очень интересно! Прям достойно полноценной статьи.
Глядишь и ПЛИС перестанут быть экзотикой..

Gemini 2.5 Pro еще ближе к человеку, но реально рассуждать умеют только модели OpenAI

triller599 Apr 1 2025 at 16:30

Подскажите, для задач кодинга Курсор используете или что-то другое? Или может сами соорудили себе инструмент?

Information

Specialization