Comments / Profile of virex / Habr

"Обучение LLM с нуля" - это непрактично, заучивает только "немногочисленные диалоги".
ImageBrowserAI - зачем, ведь есть Immich.
VoiceReader - прививает "неправильные паттерны ребёнку".
"Алиса, подвинься" - "Столько трудов и не получилось ничего".

Я не делаю готовый продукт, мне никто за это не платит. Каждая статья - попытка самому разобраться как это работает.

Как на самом деле работают LLM

virex Jul 8 at 06:41

Можно, создание модели с нуля: Обучение LLM с нуля на c# и экспорт в GGUF. OpenCL против CUDA / Хабр

Microsoft позволила отключить Bing в поиске Windows 11

virex Jun 9 at 08:20

На Ryzen AI 9 HX 370 служба Windows Search активно использует NPU. Пришлось отключить.

Как я обучил GPT с нуля на русском языке — и что из этого получилось

virex May 22 at 15:49

0.7B — это мало. Для нормальных связных диалогов нужно минимум 3-7B, и это при условии хорошего файн-тюнинга поверх.

А 0,000103744B хватит что бы модель зазубрила пару диалоговых строк https://habr.com/ru/articles/1017484/ :)

Kwayk: как я сделал Quake на Qt Quick3D и прикрутил физику из Death Stranding 2

virex May 21 at 07:16

Плюсанул везде где можно. Получилось очень хорошо!

Вот как сегодня устроено российское производство

virex Apr 29 at 13:44

Вдогонку, интересные видео на тему полимеров:
Полимеры, 1974
Тефлон: как одна компания втайне отравила весь мир [Veritasium]
Катастрофа, которая нас (возможно) ждёт [Veritasium]

Обучение LLM с нуля на c# и экспорт в GGUF. OpenCL против CUDA

virex Apr 21 at 15:19

Исходный код: https://github.com/virex-84/LLMGPT2

Добавил выбор всех доступных "ускорителей" на выбор при запуске программы: CPU, OpenCL, CUDA.

Скрытый текст

Анализ корпуса - показывает какую модель можно сделать на основе данного корпуса.

Скрытый текст

Так же добавил авто-конфигуратор модели: конфигурация модели создается исходя из текущего корпуса.

Ну и собственно все классы были оптимизированы для ускорения обучения.

Обучение LLM с нуля на c# и экспорт в GGUF. OpenCL против CUDA

virex Apr 20 at 12:41

Это реализация gpt-2 архитектуры использующая для обучения OpenCL (CUDA, CPU), с возможностью экспорта в gguf. Для наглядности была выбрана минимально возможная конфигурация, что бы любой мог повторить обучение с нуля на своем железе. Вне этих диалогов будет мусор.

Но никто не мешает вам увеличить конфигурацию и корпус, и получить более осмысленную модель.

З.Ы. на github кто-то уже попробовал обучить микро модель на Nvidia RTX 3090, через CUDA.

Как я за 2,5 месяца написал строительный калькулятор на Flutter с ИИ-прорабом, 45+ калькуляторами и 8000 тестами

virex Feb 19 at 15:05

Интересное приложение. Но нужно немного доработать.

Пишу Михалычу вопрос, долго пишу, старюсь. Нажимаю "отправить". Выдает "Неполадки связи". Заново писать всё это - тяжело. Нет кнопки "повторить" у неотвеченного запроса.

Выхожу из диалога. Захожу заново, что бы еще раз попытать счастья, повторить вопрос - чат пустой.

Братство нейросети: итоги сезона «ИИ в разработке»

virex Jan 31 at 09:01

Спасибо! В моей статье не только поиск фото по текстовому описанию, но и видео. Плюс поиск по лицу среди фото и видео.

Энтузиасты нарастили производительность SSD в Windows 11 после включения NVMe-драйвера для Windows Server 2025

virex Dec 24 2025 at 14:08

Если кто решится переключиться на новый драйвер, для возможности загрузки в безопасном режиме необходимо добавить:

reg add "HKLM\SYSTEM\CurrentControlSet\Control\SafeBoot\Network\{75416E63-5912-4DFA-AE8F-3EFACCAFFB14}" /ve /d "Storage Disks" /f
reg add "HKLM\SYSTEM\CurrentControlSet\Control\SafeBoot\Minimal\{75416E63-5912-4DFA-AE8F-3EFACCAFFB14}" /ve /d "Storage Disks" /f

Обновление T-Pro 2.1: как мы улучшили Instruction Following и Tool Calling

virex Dec 24 2025 at 12:27

MoE шустро работает на Ryzen AI 300. Еще одно интересное направление - текстовые diffusion модели. На хабре уже были статьи, например: Не только трансформеры: за пределами стандартных архитектур LLM / Хабр, Китайская LLaDa: как зашумленный текст превращается в осмысленный диалог – новая эра диффузионных языковых моделей / Хабр.
Ну и новое направление Diffusion-MoE, https://github.com/yhlleo/EfficientMoE

Обновление T-Pro 2.1: как мы улучшили Instruction Following и Tool Calling

virex Dec 23 2025 at 12:41

Планируется ли использование архитектуры MoE?

Поиск в личном фото архиве по текстовому описанию

virex Dec 21 2025 at 13:01

Добавил описание видео mp4, дополнил статью. Изменения выложил на гитхаб.

Поиск в личном фото архиве по текстовому описанию

virex Dec 2 2025 at 15:46

Добавил поиск по лицу, дополнил статью. Изменения выложил на гитхаб.

Поиск в личном фото архиве по текстовому описанию

virex Dec 2 2025 at 07:07

Кроме того скорость обработки зависит и от скорости чтения с диска

Про "сильно" я не говорил, но влияние от дисковой подсистемы есть.

Для HDD: это может быть старая версия SATA, сильная фрагментация, текущая нагрузка диска другими процессами.

Для SSD: проседание скорости во время операции TRIM, тротлинг при перегреве, либо при почти полной заполненности диска.

Применение локальных LLM для OCR

virex Dec 1 2025 at 08:25

Решал схожую задачу Поиск в личном фото архиве по текстовому описанию. Но в вашем случае ollama не нужна. Это умеет llama.cpp, на которой собственно основана ollama.

Запускаете модель через llama-server

Ставите пакет Microsoft.Extensions.AI, код можно посмотреть в разделе "Мультимодальность" https://habr.com/ru/articles/914392/

2 3 4 5