Алгоритмы векторного поиска: IVF и HNSW
Сложный
17 мин
Обзор

В данной статье я хочу пройтись по двум самым популярным алгоритмам векторного поиска, используемым на практике. Попробуем понять, почему точный поиск не работает в высоких размерностях и почему мы в итоге приходим к приближенному поиску.
Заодно мы затронем тему метрик, чтобы понять, как вообще сравнивают эмбеддинги. Рассмотрим вспомогательный и очень простой алгоритм k-means из классического ML’а, лежащий в основе IVF.
И наконец, подробно разберем два самых главных алгоритма IVF и HNSW с примерами их реализации на Python’е.