Комментарии 7
Спасибо. Как раз месяц назад задавался вопросом, как хранить ембеддинги лиц для кластеризации
Спасибо, однако все примеры на английском языке, такое впечатление, что используются западные проекты для образца. И кстати, самый важный вопрос - сам процесс векторизации и загрузки векторов текстовых или аудио/видео совсем не раскрыт, формирование вектора на основе документов и датасетов, хотя бы размером несколько сот тысяч вопросов и ответов. Вы не указали, что PGVector не дружит нативно с open-source векторизаторами из huggingface, например популярным E5 Intfloat. Каким образом будет строиться серьезный проект на основе PGVector, ведь основная задача это быстро получить вектор и интегрировать его в Postgresql ? Мы вынуждены были отказаться от этого решения в пользу другого только из-за данных проблем.
Но ведь у PgVector есть поддержка HNSW, на гитхабе в ридми даже написано
https://github.com/pgvector/pgvector
Векторный поиск внутри PostgreSQL: что умеет и где может пригодиться pgvector