Обновить
3
8
Дмитрий@odblckcore

Пользователь

Отправить сообщение

Корпоративная память как инфраструктура: как мы построили RAG-систему внутри ИТ-компании с промышленной экспертизой

Уровень сложностиСредний
Время на прочтение14 мин
Охват и читатели8.8K

Привет, Хабр! Меня зовут Дмитрий Омаров, я ведущий инженер учебного центра по продуктам в компании «Цифра». Вместе с моим коллегой, Фёдором Арефьевым, мы решили поделиться своим опытом создания корпоративного агента, который в разы ускоряет поиск по базам знаний компании.

Внутри статьи: мы подробно разбираем архитектуру RAG-пайплайна — от локального векторного поиска и реранкинга до сборки контекста для облачной LLM. Вы узнаете, почему мы отказались от дообучения моделей в пользу динамической базы знаний, как реализовали локальную очистку данных от чувствительной информации для соблюдения требований информационной безопасности и каким образом системный промпт помогает победить «галлюцинации», гарантируя опору только на факты и ссылки на первоисточники.

Статья будет полезна тем, кто решает задачу эффективного доступа к знаниям внутри компании и ищет баланс между качеством генерации, стоимостью инфраструктуры и требованиями ИБ.

Читать далее

Информация

В рейтинге
767-й
Зарегистрирован
Активность

Специализация

Создатель контента
Ведущий
PostgreSQL
Docker
Python
Git
SQL
Linux
Bash
Kubernetes
MongoDB
REST