All streams
Search
Write a publication
Pull to refresh
3
0
Михаил @rakerunner

project manager

Send message

Какое-то однобокое сравнение. А как бы ваш продукт выглядел бы на фоне RAGFlow, Dify, R2R, Morphik, SurfSense?

есть еще Automatish (https://github.com/automatisch/automatisch)
open-source, >13k звезд на GitHub

Немного оффтоп: Чтобы вы порекомендовали для создания домашнего RAG-а?
AnythingLLM, Open WebUI, RAGFlow, R2R, Morphik, UltraRAG, Onyx, Verba, LightRAG, Kotaemon, Quivr, Dify, FastGPT, AutoRAG, Msty, etc...

Советую посмотреть следующие ресурсы:
1) https://github.com/DEEP-PolyU/Awesome-GraphRAG - содержит материалы посвященные GraphRAG
2) https://github.com/infiniflow/ragflow - мой любимец! трудится на домашнем сервере )))
3) https://github.com/HKUDS/LightRAG
4) https://github.com/circlemind-ai/fast-graphrag
5) https://github.com/OpenSPG/KAG
6) https://github.com/pingcap/autoflow
7) https://github.com/JayLZhou/GraphRAG
8) https://github.com/severian42/GraphRAG-Local-UI - UI к макрософтовскому GraphRAG с поддержкой локальных LLM
9) https://github.com/TheAiSingularity/graphrag-local-ollama - макрософтовский GraphRAG с поддержкой локальных LLM (без UI)
10) https://github.com/getzep/graphiti
11) https://github.com/apecloud/ApeRAG
12) https://github.com/OSU-NLP-Group/HippoRAG

Автор планирует написать вторую часть?

КЕМ и с помощью ЧЕГО создаюеться Граф Знаний? Людьми или ИИ?
"...Выполняются запросы к графу для поиска связанных узлов, что позволяет формировать граф знаний..." (с)
Так все-таки для чего нужны эти запросы? Чтобы формировать граф или чтобы извлекать из графа уже имеющююся там информацию?
В каком фрмате храниться информация в графах знаний? В каком формате передается запрос и полутаеся ответ? Как и кем графы знаний формируються и обновляються(!)?
Статья очень поверхностная.

В каком-то смысле GraphRAG — это своего рода "воссоединение" вычислительного ИИ (LLM) и зафиксированных знаний (графы знаний) 

Почему "зафиксированных"? Разве Граф Знаний не должен обновляться при получении новых фактов, которые не укладываються в его онтологию?

И чем этот KAG отличаеться от майкрософтовского GraphRAG? (Welcome - GraphRAG)

LightRAG позволяет создавать тематические коллекции документов? (как это делает, например, RAGFlow)
Насколько гибко можно настраивать чанкинг? Есть, например, семантик чанкинг?
Какие интеграции есть "из коробки"? Можно интегрировать с облачными хранилищами?

LBS и CESP умеют выстраивать причинно-следственные связи?

А как LBS и CESP коррелируют с JEPA-архитектурой, котою разрабатывт Ян Лекун в Meta? Идеи очень похожи.

Можете привести ссылку на "около 2-х млн" артефактов TOGAF? Откуда взялась эта цифра?
"...Мы могли бы использовать TOGAF, который понятен и привычен, но отказались от этого варианта — он тоже нам не подходит..." (с) - а чем именно вам не подошел TOGAF?

Подскажите, пожалуйста, хороший туториал по созданию self-hosted RAG.
На каком фреймворке луче его делать - n8n, LlamaIndex, LangChain, etc.?
Какие инструменты\модели лучше использовать для разбиения на чанки, векториизации, поиска?

Хммм. А я всегда думал что "résumé" это прекрасное французское слово )))

Поздравляю, вы изобрели трассировку. Только это уже давным давно описано в сотнях статей и книг. Зачем изобретать велосипед и наступать на грабли самостоятельно?
APM vs Tracing vs Observability

Интересно почитать этот комментарий в 2025 году

Какие из перечисленных CAT-инструментов позволяют подключать LLM?

Вопрос OlegZH просто немного саркастичен, ИМХО )) Но я с ним полностью согласен. Вы действительно считаете что каждый читатель Хабра должен знать что такое ARPU, CAC, LTV, ICE, RICE, PIES, PFM, NPS, CSAT, CES?

А как вы решаете проблему скрытых конфаундеров или скрытых медиаторов?
Допустим в реальности есть конфаундер С который влияет и на А и на Б. А в данных на которых строится DAG переменной С нет. Как вы тогда вы установите связь между А и Б?

Information

Rating
Does not participate
Location
Тбилиси, Грузия, Грузия
Date of birth
Registered
Activity