Не читал, но автора презираю?)) Про параметры - приведён код миграций в которых собственно видно, что параметры тупо дефолтные. Простой тест из коробки. Про recall - тут весь тест это baseline : дефолтные индексы без тонкой настройки, оценка QPS на левом датасете. Тут метрики — это как линейкой до микрона мерить
Ожидается, что статья про векторный поиск в PostgreSQL, а про него вообще ничего нет, только create extension.
Наверное не совсем корректно составил название. План был именно предложить минимально жизнеспособное решение для хранение векторов в PostgreSQL и API для работы с ним, а не теоретическое описание векторного поиска обзор вариантов для PostgreSQL.
Почему вы против принципа KISS, может есть какие-то причины?
Вот тут честно, не понимаю вопроса. Вроде бы и так не сложно)
Если jsonb лучше оптимизирован под поиск и индексацию
Согласен, надо учится правильно излагать мысли. Имел ввиду, что JSONB лучше для хранения метаданных, чем просто текстовое поле или обычный JSON. Ну и естественно он не заменяет эмбеддинги для поиска смыслового сходства.
Может немного не в тему, но сейчас ещё актуально алгосы на бумажке? Во время, когда IDE тебе, как минимум, предлагает справку по классам, решать задачки в блокноте? Я уже молчу про нейронки
Для меня весь смысл был в том, чтобы на существующей инфраструктуре сделать векторный поиск. Поэтому именно Postgres
Не читал, но автора презираю?)) Про параметры - приведён код миграций в которых собственно видно, что параметры тупо дефолтные. Простой тест из коробки. Про recall - тут весь тест это baseline : дефолтные индексы без тонкой настройки, оценка QPS на левом датасете. Тут метрики — это как линейкой до микрона мерить
Наверное не совсем корректно составил название. План был именно предложить минимально жизнеспособное решение для хранение векторов в PostgreSQL и API для работы с ним, а не теоретическое описание векторного поиска обзор вариантов для PostgreSQL.
Вот тут честно, не понимаю вопроса. Вроде бы и так не сложно)
Согласен, надо учится правильно излагать мысли. Имел ввиду, что JSONB лучше для хранения метаданных, чем просто текстовое поле или обычный JSON. Ну и естественно он не заменяет эмбеддинги для поиска смыслового сходства.
Ну как-бы в теме ещё и API значится, а я считаю, что API без CRUD получилось бы неполноценным.
Может немного не в тему, но сейчас ещё актуально алгосы на бумажке? Во время, когда IDE тебе, как минимум, предлагает справку по классам, решать задачки в блокноте? Я уже молчу про нейронки