it-calm27 мая в 08:43

Почему RAG — фундамент любой AI-трансформации

5 мин

8.6K

Big Data * Natural Language Processing * Базы данных * Искусственный интеллектПроектирование API *

Комментарии 7

Soltkreig 27 мая в 08:46

Фундамент любой ИИ трансформации это сначала цифровизация всего и вся.

amaksr 27 мая в 15:41

RAG не очень надёжен для поиска артикулов, SKU, кодов или точных названий блюд — там, где нужно точное совпадение, обычный поиск по ключевым словам или гибридный поиск часто работают лучше и предсказуемее. И если всё равно нужны классический поиск, фильтрация по метаданным и детерминированная логика, то RAG уже не может быть центром всей системы. Это лишь один из слоёв архитектуры, которые статья почти не затрагивает: гибридный поиск, переранжирование результатов, пайплайн оценки качества, orchestration/tooling-слой поверх самого RAG. Но в любом случае интересный опыт.

Ahest 28 мая в 05:23

Вообще-то RAG это не только векторный поиск, а поиск основанный на инструментах вообще. При этом инструменты могут быть какие угодно - хоть поиск по векторной базе, хоть по реляционной. Можно хранить артикулы в Postgre и иметь тул, который ищет SQL запросами и это всё будет RAG.

dimonier 27 мая в 20:17

Фундамент - это электричество

PAL_habr 28 мая в 01:57

Интересно, конечно, но непонятно. Непонятно, как же для каждой новой роли делается "изолированная база данных"(!).

Т.е. данные дублируются? (условное меню, наверное, нужно и повару и официанту и гостю)

А как же тогда постулат о "единой базе"? Так это единая база или всё же набор изолированных баз? Или терминология и картинки немного несогласованно используются?

dibu28 31 мая в 12:08

Сильно зависит от задачи. Например для некоторых данных проще использовать реляционную базу данных, скил и хелпер скрипты для получения данных и обновления и в таком варианте ллм может работать лучше с структурированными и с точными данными.

grixis 1 июн в 16:33

У меня скорее вопрос масштабирования. Я работаю в компании где документов сотни тысяч и обновляются ежегодно более 10 тысяч. Как сделать быстрым создание RAG и не потеряется ли он в таком количестве данных. Как быть с версионностью и не потерять доступ к старым данным и не захоебнется ли сама модель от такого количества данных. Это из того о чем я подумал сразу. И если с этим ок, то какую модель стоит использовать для работы с таким массивом, например qwen 3.6.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий