Comments / Profile of dibu28 / Habr

Для теста можно попробовать эти модели в приложении LM Studio. В нём можно скачать все те-же модели и давно добавили поддержку мульти-модальных моделей и загрузку картинок в чат.

А по поводу компьютера - тут важна не столько скорость видеокарты, сколько объем видеопамяти и чем больше тем лучше.

Применение локальных LLM для OCR

dibu28 Dec 1 2025 at 19:27

Ещё пару дней назад появилась

HunyuanOCR - обещают топ по бенчмаркам и размер меньше.

Почему ChatGPT не знает ваших внутренних данных и как это исправить: простое объяснение RAG

dibu28 Nov 22 2025 at 08:06

Согласен, статья как будто написана ChatGPT. Ничего конкретного, только базовые вещи. А проблемы как раз кроются в деталях.

Начиная с того что: Чем парсить и OCRить документы и pdf. Как разбивать на чанки и как доставать семантические связи. Нужны ли графы. Чем делать эмбеддинги, как оптимизировать их размер и где хранить для быстрого поиска. Как и чем ранжировать чанки. В каком формате отдавать их ллм. Какой длинны отдавать чтобы ллм не путалась в большом количестве информации. И какой промпт написать чтобы не галюцинировала и ответы были полезными. (Тут в промпте много мелких нюансов). И какой ответ ожидает юзер короткий и быстрый или длинный и подробный, это тоже надо в промпте для ллм прописать.

Посмотрел что написал. Получился прям промпт для ChatGPT для новой статьи.)

Как вайбкодить без боли? 11 выводов, к которым я пришёл

dibu28 Nov 22 2025 at 05:02

Тоже заметил что переключение между моделями помогает. Если одна модель зацикливается или не может за несколько шагов починить ошибку, то перекдючение на другую модель с тем же промптом помогает двигаться дальше.

Современные OCR для сложных документов: сравниваем 6 open-source моделей на реальном кошмаре инженера

dibu28 Nov 16 2025 at 12:39

Пробовал несколько открытых моделей пол года назад, но у всех у них были проблемы с распознаванием таблиц в сканах печатных документом. И самая большая проблема была с определением направления таблицы - то есть горизонтальная она или вертикальная. (Ну и да ещё с вертикальным текстом в колонках.) Как сейчас с этим обстаят дела? Какие модели сейчас лучше всего распознают документы с таблицами? Qwen3 Omni ?

Моя система хранилищ в Obsidian: Как я разделяю личное и рабочее

dibu28 Nov 14 2025 at 09:05

Syncthing давно перестал использовать. Он бьёт файлы при синхронизации 3х устройств и теряет данные что не допустимо) Remotly Save использую через облако и проблем нет. 3 устройства а одну папку. Только надо сразу после правок на одном устройстве синхронизировать или настроить автосинхронизацию. Ещё использую Self-hosted LiveSync на свой сервер, с ним проблем нет. На сервере нужна только CouchDB. Ещё для посика использую плагин Omni Search, удобный и быстрый поиск.

GPT-5.1 вошла в число лидеров по качеству программирования

dibu28 Nov 14 2025 at 08:48

Или на SWE-Rebench. Если они добавили задач из SWE, то на Rebench будет видно.

Rоманда WeiboAI представила компактную модель с 1.5 миллиарда параметров

dibu28 Nov 12 2025 at 20:01

На реддите читал отзывы, говорят эта поделка сделана на Qwen3 1.5B и просто дообучена на бенчмарках чтобы красивые цифры в них показывать.

Gemini 3.0 Pro решает задачи, считавшиеся почти невозможными для ИИ

dibu28 Nov 12 2025 at 19:41

Спасибо ChatGPT )

+11

Домашняя векторная БД + RAG

dibu28 Nov 10 2025 at 10:52

ColbertV2 как раз не большого размера, но принцип работы у неё немного другой.

Домашняя векторная БД + RAG

dibu28 Nov 7 2025 at 18:45

А модель ColbertV2 не пробовали для эмбеддингов? Я получил для себя лучше результаты чем на обычных dense моделях. Её можно подключить через библиотеку fastembed.

Codex: как много в этом звуке. Агент-разработчик от openai который входит в вашу подписку на ChatGPT за 20$

dibu28 Nov 7 2025 at 06:31

Codex же можно использовать ещё из VSCode есть для этого отдельный плагин Codex от Open AI. Это намного удобней и можно править код в редакторе и запускать команды он может локально. Это тоже входит в подписку, но есть лимиты 5 часовые и недельные.

Распределенный монолит: тихий убийца мечты о микросервисах

dibu28 Nov 3 2025 at 10:28

Просто надо мечтать о Монолите и тогда не будет расхождения мечт с реальностью )

В OpenAI все чаще берут разработчиков уровня super junior

dibu28 Nov 3 2025 at 10:16

Ждём разработчиков уровня: Mega Extra Super Junior Pro Max Ultra )

Вышла Kimi-Linear-A3B: гигантский контекст при разумных требованиях к железу

dibu28 Oct 31 2025 at 00:04

Coding бы ещё выпустили такого размера на замену Qwen3-30B-A3B

2 3