Обновить

Выбираем векторную БД для AI-агентов и RAG: большой обзор баз данных и поиск смысла

Время на прочтение18 мин
Количество просмотров11K
Всего голосов 20: ↑20 и ↓0+25
Комментарии6

Комментарии 6

Сценарий “SQLite + vec” (например, через расширение sqlite-vec или veqlite) для памяти ReAct-агента крайне популярен для встроенных и десктопных проектов, так как сочетает простоту, универсальность и низкие требования к инфраструктуре. Такой подход позволяет интегрировать долговременную память (таблицы SQLite для текста/метаданных) с возможностями семантического поиска (векторные embedding с помощью virtual table, например, vec или veqlite).

Производительность для больших коллекций: Векторные расширения SQLite (на момент 2025 года) реализуют только brute-force поиск (точный KNN по векторному расстоянию, без HNSW, IVF и других индексов), что ограничивает оптимальную работу размером до 100-200 тысяч embedding. Производительность будет ниже, чем у специализированных LanceDB, Qdrant, Milvus.

Отсутствие продвинутых index/ANN-структур: Если нужна мега-быстрая реакция на больших коллекциях (миллионы embedding), лучше использовать специализированные базы, заточенные под ANN (LanceDB, Qdrant). Для небольших/средних коллекций SQLite + vec идеален.

Классный обзор! Большое спасибо!

Спасибо!

Подскажите пожалуйста, а квантилизацию можно сделать в клон базы, в дополнение к чистым векторам чтобы получить скорость от квантилизации, но по необходимости иметь возможность в точность? Если так можно выразиться, как отдельный индекс?

В смысле я понимаю, что базу можно клонировать, и один клон квантилизировать, на другой нет. Мой вопрос скорее про такую возможность из коробки?

Из базы FAISS я именно так и делал, но там один файл и пара сотен тысяч векторов...

У Qdrant тоже есть GPU ускорение

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации