Emi_Dev Mar 4 at 22:06

Как мы с ИИ сделали локальный ИИ, который учится по моим книгам и пишет за меня отчёты

Medium

6 min

12K

Machine learning * Artificial IntelligenceOpen source * Python *

Review

+11

Comments 14

Wesha Mar 4 at 22:38

Как мы с ИИ сделали локальный ИИ, который учится по моим книгам и пишет за меня отчёты

Судя по обилию эмоджи, он и статью за Вас написал.

В общем, продолжайте в том же духе — так этим сектантам и надо! Только сразу готовьтесь к тому, что он ещё будет ещё и получать Вашу зарплату.

Emi_Dev Mar 4 at 22:41

Главное чтобы мне потом отдавал ее😁

Wesha Mar 4 at 22:46

Ещё чего! Кюшать он тоже за Вас будет!

neodavinchi Mar 5 at 04:14

Есть ли причины ставить "температуру" 0.3, а не 0.0, при условии, что ваша задача: точность и снижение галлюцинаций?

dyadyaSerezha Mar 5 at 04:51

Полезная статья. Несколько вопросов.

(1) В таблице про степень поддержки русского указана RAM. Это необходимая память для модели или это память самого компа? Вообще, 32 GB на компе норм или лучше больше? Хотя, говорят, память сейчас резко дорожает...

(2) В статье неоднократно сказано, что большие облачные модели рассуждают лучше этой. Насколько лучше? Хотелось бы парочку примеров, чтобы понять, о чем речь.

(3) Почему не добавлен формат fb2.zip? Места на диске до фига?)

(4) Copilot не ревновал, когда видел, что фактически создаёт замену самому себе?)

Emi_Dev Mar 5 at 07:56

GGUF-квантизация (Q4_K_M) загружает модель целиком в RAM (или VRAM при использовании GPU). 32 GB — более чем достаточно: хватит на Qwen2.5-14B (12 GB под модель) и останется запас на ОС, ChromaDB, эмбеддинги и сам Python. Даже 32B-модель (24 GB) влезет, хотя будет впритык. Для комфортной работы с 7B-14B моделями хватает и 16 G
Рассуждения/логика: если спросить «сравни подходы к управлению памятью в Linux и Windows, выдели ключевые архитектурные отличия», GPT-4/Claude выдаст структурированный анализ с нюансами, а 7B-модель скорее перескажет основные факты без глубокого сопоставления. С RAG это компенсируется: модель хотя бы оперирует правильными фактами из учебника, а не галлюцинирует.
Генерация текста: у облачных моделей стилистически более гладкий и «академичный» русский. Локальная 7B иногда повторяет фразы или делает неловкие переходы между абзацами. 14B-32B модели уже значительно ближе к коммерческим по качеству текста.
fb2 поддержка добавлена , ноя забыл указать
Скорее всего это больше подходит на колоборацию ии моделей нежели чем ревность

holgw Mar 5 at 07:50

Qwen2.5 уже неактуален, лучше вместо него рекомендовать Qwen3.

Demanih Mar 5 at 09:42

Может тогда уж лучше сразу Qwen3.5, как раз на днях вышла 9B

Demanih Mar 5 at 09:55

Идея интересная. Захотелось даже погонять, посмотреть как она с локальными текстами работает... Но работает ли всё это на винде? И если да, то как запустить?

Emi_Dev Mar 5 at 10:38

не тестил на винде но на убунту 22 работает хорошо

Demon77 Mar 5 at 20:45

Работает

Emi_Dev Mar 5 at 20:45

Спасибо за информацию

diffnotes-tech Mar 5 at 13:03

E5-Large обрезает на 512 токенах - при чанках 1500 символов русского текста это впритык к лимиту. BGE-M3 от BAAI держит 8192, для русского работает не хуже, плюс можно чанки крупнее делать

pavlushk0 Mar 11 at 09:27

Ллм-слоп статья про ллм-слоп... рекурсия которую мы заслужили!