Комментарии / Профиль TrauNN / Хабр

Пользователь

Газоразрядное табло для машины времени, или как я оказался в титрах к японской дораме

TrauNN 9 июн 2025 в 07:30

"Туттурукнет - мало не покажется!" - это отсылка на Врата Штейна? Если да - то, получается, отсылка стала пророчеством о дальнейшем применении :D

Спасибо за статью! Сам мало в этом понимаю, но почитать всегда интересно

RAG: борьба с низким качеством ответов в условиях экономии памяти на GPU

TrauNN 11 апр 2025 в 17:54

Рассматривали ли вы OpenWebUI в качестве инструмента для данной задачи? Сам делаю нечто похожее с его помощью, но пока не добился достаточного качества результатов на 12Гб GPU

Как я сделал RAG для своей компании

TrauNN 10 мар 2025 в 11:23

Если уместиться в видеопамять (не уверен на счёт возможностей М3, но на 16 ОЗУ в теории будет грустно), то даже не самая мощная видеокарта способна выдать адекватную скорость. Но облако имеет слишком огромное преимущество по размеру окна контекста и кол-ву параметров самой модели (671B у DeepSeek R1 против 32B/70B моделей на 3090 и 7/14B на 3060-12) при чаще всего меньшей стоимости

Как я сделал RAG для своей компании

TrauNN 6 мар 2025 в 07:49

Очень полезная статья!

Сам сейчас занимаюсь похожей задачей, используя OpenWebUI + Ollama. В роли генератора использую deepseek-R1 7B Q4 с сайта Ollama, Embed-модель bge-m3. Запускаю всё это на RTX 3060 12Гб. Надо будет попробовать повторить ваш алгоритм действий