Как стать автором
Обновить

Почему граф в RAG работает лучше, чем вы думаете… но не так, как вам рассказали

Уровень сложностиСредний
Время на прочтение9 мин
Количество просмотров4.2K
Всего голосов 9: ↑7 и ↓2+7
Комментарии3

Комментарии 3

Для построения реальной системы кто-то должен описать сотни узлов и связей между ними... А потом как-то подавать эту структуру в llm при чтении каждого документа, чтобы она нашла и распознала нужные сущности?

Как это реально происходит? С какими промптами - как подаётся структура узлов и связей?

Спасибо за отличный вопрос! В системе граф узлов и связей не описывается вручную - его создание автоматизировано с помощью LLM-модели (использовалась модель Cotype_Pro_2. https://habr.com/ru/companies/mts_ai/news/896364/).

Пайплайн выглядит следующим образом:

1. Автоматическое построение графа:

• Документы разбиваются на небольшие фрагменты (чанки).

• Каждый чанк подаётся в модель, которая автоматически извлекает из текста триплеты в виде:

(субъект → отношение → объект)

• Модель возвращает результат в структурированном виде (JSON). После обработки всех документов из полученных триплетов формируется полноценный граф, где узлы - это извлечённые сущности, а связи - отношения между ними.

2. Анализ новых документов:

• Входящий документ также разбивается на чанки, из которых извлекаются ключевые сущности.

• Извлечённые сущности преобразуются в векторное пространство (получаются эмбеддинги) и сравниваются с уже существующими узлами графа.

• Благодаря векторному сравнению определяется наиболее близкий узел графа для каждой извлечённой сущности.

3. Использование графа для поиска релевантного отдела:

• Найдя ближайший узел, система исследует связи в графе, чтобы определить, какой именно отдел или подразделение должен отвечать за запрос.

• Здесь учитывается специфика сущностей: является ли сущность субъектом или объектом в графе, и какие связи у неё существуют.

Таким образом, вся структура узлов и связей формируется автоматически. Это позволяет масштабировать систему без ручного труда по описанию и поддержке графа, значительно упрощая дальнейшую работу и повышая точность маршрутизации документов.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий