Pull to refresh

Comments 4

"Цель статьи заключалась в демонстрации минималистичного подхода к использованию моделей эмбеддинга, векторных хранилищ и LLM для обработки пользовательских запросов " - это называется RAG. Логичнее соответственно озаглавить представленную статью и теги начать с RAG

Про векторное хранилище по подробнее. Как в нём организовано хранение информации и поиск. В конце концов - разве не скоростью поиска определяется быстродействие всей системы?

Деталей реализации не знаю - не вникал, но в работе используем elasticsearch для хранения векторов лиц. Так вот поиск по 20 млн записей происходит меньше чем за 200мс. Жрет оперативы и диска как не в себя, но это очевидно.

Спасибо за статью, я давно искал РАБОЧИЕ способы реализации внедрения ИИ в мои проекты. Желаю вам успехов на Хабре и не только!

Sign up to leave a comment.

Articles