Выбираем векторную БД для AI-агентов и RAG: большой обзор баз данных и поиск смысла / Comments / Habr

Kwentin3 Oct 29 2025 at 11:35

Sqllite + vec

Sannyasin Oct 30 2025 at 12:17

Сценарий “SQLite + vec” (например, через расширение sqlite-vec или veqlite) для памяти ReAct-агента крайне популярен для встроенных и десктопных проектов, так как сочетает простоту, универсальность и низкие требования к инфраструктуре. Такой подход позволяет интегрировать долговременную память (таблицы SQLite для текста/метаданных) с возможностями семантического поиска (векторные embedding с помощью virtual table, например, vec или veqlite).

Производительность для больших коллекций: Векторные расширения SQLite (на момент 2025 года) реализуют только brute-force поиск (точный KNN по векторному расстоянию, без HNSW, IVF и других индексов), что ограничивает оптимальную работу размером до 100-200 тысяч embedding. Производительность будет ниже, чем у специализированных LanceDB, Qdrant, Milvus.

Отсутствие продвинутых index/ANN-структур: Если нужна мега-быстрая реакция на больших коллекциях (миллионы embedding), лучше использовать специализированные базы, заточенные под ANN (LanceDB, Qdrant). Для небольших/средних коллекций SQLite + vec идеален.

ypastushenko Oct 30 2025 at 08:50

Классный обзор! Большое спасибо!

antipov_dmitry Oct 30 2025 at 14:39

Спасибо!

LittleMeN Oct 31 2025 at 16:34

Подскажите пожалуйста, а квантилизацию можно сделать в клон базы, в дополнение к чистым векторам чтобы получить скорость от квантилизации, но по необходимости иметь возможность в точность? Если так можно выразиться, как отдельный индекс?

В смысле я понимаю, что базу можно клонировать, и один клон квантилизировать, на другой нет. Мой вопрос скорее про такую возможность из коробки?

Из базы FAISS я именно так и делал, но там один файл и пара сотен тысяч векторов...

ndrewpj Nov 3 2025 at 08:23

У Qdrant тоже есть GPU ускорение

Выбираем векторную БД для AI-агентов и RAG: большой обзор баз данных и поиск смысла

Comments 6

Articles