codementor Nov 4 2024 at 06:00

Разрабатываем первое AI приложение

Medium

13 min

19K

Python *

Tutorial

+11

Comments 4

ENick Nov 4 2024 at 10:58

"Цель статьи заключалась в демонстрации минималистичного подхода к использованию моделей эмбеддинга, векторных хранилищ и LLM для обработки пользовательских запросов " - это называется RAG. Логичнее соответственно озаглавить представленную статью и теги начать с RAG

seyko2 Nov 4 2024 at 12:42

Про векторное хранилище по подробнее. Как в нём организовано хранение информации и поиск. В конце концов - разве не скоростью поиска определяется быстродействие всей системы?

iosuslov Nov 7 2024 at 15:49

Деталей реализации не знаю - не вникал, но в работе используем elasticsearch для хранения векторов лиц. Так вот поиск по 20 млн записей происходит меньше чем за 200мс. Жрет оперативы и диска как не в себя, но это очевидно.

TheScienceVictor200 Nov 10 2024 at 19:50

Спасибо за статью, я давно искал РАБОЧИЕ способы реализации внедрения ИИ в мои проекты. Желаю вам успехов на Хабре и не только!