GGUF-квантизация (Q4_K_M) загружает модель целиком в RAM (или VRAM при использовании GPU). 32 GB — более чем достаточно: хватит на Qwen2.5-14B (12 GB под модель) и останется запас на ОС, ChromaDB, эмбеддинги и сам Python. Даже 32B-модель (24 GB) влезет, хотя будет впритык. Для комфортной работы с 7B-14B моделями хватает и 16 G
Рассуждения/логика: если спросить «сравни подходы к управлению памятью в Linux и Windows, выдели ключевые архитектурные отличия», GPT-4/Claude выдаст структурированный анализ с нюансами, а 7B-модель скорее перескажет основные факты без глубокого сопоставления. С RAG это компенсируется: модель хотя бы оперирует правильными фактами из учебника, а не галлюцинирует. Генерация текста: у облачных моделей стилистически более гладкий и «академичный» русский. Локальная 7B иногда повторяет фразы или делает неловкие переходы между абзацами. 14B-32B модели уже значительно ближе к коммерческим по качеству текста.
fb2 поддержка добавлена , ноя забыл указать
Скорее всего это больше подходит на колоборацию ии моделей нежели чем ревность
У нас в Узбекистане только плеймаркету лояльность населения, и мне будет легче продвинуть его, население нашей страны не доверяют никакому источнику за исключением плеймаркет, так как в последнее время активизировались мошенники которые скидывают АПК под предлогом разным будь то повестка в суд или же "Ты ли это на фото" после скачивания и открытия , телефон превращается в кирпич визуально но в это время с него выкачивают все данные и деньги
Продвигать иначе не получается, плей маркет требует обязательного закрытого тестирование, поэтому продвигаю как могу, спасибо за понимание:) буду рад если предложите какие нибудь плюшки и фичи что можно добавить в приложение чтобы оно было полезным
Статьи пишу сам как и код, буду открыт, запустил ранний релиз, так как у меня есть большой кредит и уже просрочка 2 месяц , да вы права делаю эти статьи чтобы продвинуть приложение, у меня нет никого близкого кто бы мог помочь финансово огромной суммой поэтому я выпустил это приложение на скорую руку максимально постарался сделать рекламу не навязчивой
Спасибо
Обновил интерфейс добавил пару фич, буду рад если протестируете и дадите обратную связь:)
Спасибо за информацию
не тестил на винде но на убунту 22 работает хорошо
GGUF-квантизация (Q4_K_M) загружает модель целиком в RAM (или VRAM при использовании GPU). 32 GB — более чем достаточно: хватит на Qwen2.5-14B (12 GB под модель) и останется запас на ОС, ChromaDB, эмбеддинги и сам Python. Даже 32B-модель (24 GB) влезет, хотя будет впритык. Для комфортной работы с 7B-14B моделями хватает и 16 G
Рассуждения/логика: если спросить «сравни подходы к управлению памятью в Linux и Windows, выдели ключевые архитектурные отличия», GPT-4/Claude выдаст структурированный анализ с нюансами, а 7B-модель скорее перескажет основные факты без глубокого сопоставления. С RAG это компенсируется: модель хотя бы оперирует правильными фактами из учебника, а не галлюцинирует.
Генерация текста: у облачных моделей стилистически более гладкий и «академичный» русский. Локальная 7B иногда повторяет фразы или делает неловкие переходы между абзацами. 14B-32B модели уже значительно ближе к коммерческим по качеству текста.
fb2 поддержка добавлена , ноя забыл указать
Скорее всего это больше подходит на колоборацию ии моделей нежели чем ревность
Главное чтобы мне потом отдавал ее😁
Нет, только недавно запустил
У нас в Узбекистане только плеймаркету лояльность населения, и мне будет легче продвинуть его, население нашей страны не доверяют никакому источнику за исключением плеймаркет, так как в последнее время активизировались мошенники которые скидывают АПК под предлогом разным будь то повестка в суд или же "Ты ли это на фото" после скачивания и открытия , телефон превращается в кирпич визуально но в это время с него выкачивают все данные и деньги
А что посоветуете сделать?
Продвигать иначе не получается, плей маркет требует обязательного закрытого тестирование, поэтому продвигаю как могу, спасибо за понимание:) буду рад если предложите какие нибудь плюшки и фичи что можно добавить в приложение чтобы оно было полезным
Статьи пишу сам как и код, буду открыт, запустил ранний релиз, так как у меня есть большой кредит и уже просрочка 2 месяц , да вы права делаю эти статьи чтобы продвинуть приложение, у меня нет никого близкого кто бы мог помочь финансово огромной суммой поэтому я выпустил это приложение на скорую руку максимально постарался сделать рекламу не навязчивой
Приму во внимание, спасибо за обратную связь
Дизайн на скрине отличается от дизайна приложения)
Спасибо за ценный ответ, обязательно приму во внимание
спасибо за совет, приму во внимание, изучу
Принял во внимание ваш совет и внес правки, буду благодерен за тест
Спасибо за обратную связь, это мое первое приложение, в новой статье я пофиксил и сделал некоторые правки буду благодарен за обратную связь вновь