Comments 15
Интересная статья, выходящая за рамки стандартных RAG - решений. Рекомендую продолжить развивать тему графов, они позволяют существенно поднять качество поиска, и чем сложнее запрос, тем больше графы добавляют. Если интересно, моя статья по теме: https://habr.com/ru/articles/1018860/
можно сделать действительно удобного помощника, который работает по фильтрам и слушает тебя, куда ходить, куда не ходить, как глубоко копать, когда присылать, когда напоминать. И который ищет нужную инфо не только на сайтах, но и площадках типа ютуб, каналах телеграм и т.п. Можно существенно сократить временные издержки и сделать помощника очень похожего на тебя. Остается работать над качеством отбора и упаковки инфо.
RAG справляется хорошо, когда […]
Это все равно, что заявить «Продукты вкусные, когда они красные». RAG — это не инструмент per se, это подход к созданию инструментов. Мой собственноручно написанный RAG справляется лучше RAGa Клода, например.
В целом поиск в отрыве от агентов так и реализован. Только я извлекаю не entity а т.н. якорь. Якорь = entity + обстоятельства (глагол, время, дополнения). В моем проекте схожесть запроса и якоря это формула немного пальцем в небо: 0.4 cosine dist + 0.2 time delta + 0.2 verb match + более мелкие факторы. Но по ощущениям эта формула неплохо работает, во всяком случае лучше чем 1.0 cosine dist. Индекса как такого нет по сущностям, но то что каждую надо индексировать я уверен. Как минимум, это очень помогает при дедупликации
Везде слоп уже...
А кодом на репозиторий сможете поделиться?
Когда дошел до "папы", закралось предубеждение. А оказалось довольно любопытно. Исследуй дальше.
И тут пришли теории заговора...
Интересно, а где папа работает?
Статья интересная, но дипсек связь "Израиль - нефть - рубль" находит без проблем.
Наглядный пример, зачем нужны агенты