Я студент и пока только учусь, но занимаюсь реализацией схожей системы для своего ВУЗа, соответственно у меня возникло несколько вопросов:
Почему была выбрана данная коллекция эмбеддеров? Как часто и точно ретривер находит подходящий результат?
Почему использовалась именно БД Milvus? Чем не подошёл Postgres с векторным хранилищем или же популярные ChromaDB и Faiss?
Рассматривалась ли LLM поменьше? Было ли в планах заняться дообучением модели и при этом нарастить уже существую реализацию для более точной работы сервиса? Или же это лишнее/не эффективно?
Как вы пытались бороться с галлюцинациями помимо систменого промпта?
Я студент и пока только учусь, но занимаюсь реализацией схожей системы для своего ВУЗа, соответственно у меня возникло несколько вопросов:
Почему была выбрана данная коллекция эмбеддеров? Как часто и точно ретривер находит подходящий результат?
Почему использовалась именно БД Milvus? Чем не подошёл Postgres с векторным хранилищем или же популярные ChromaDB и Faiss?
Рассматривалась ли LLM поменьше? Было ли в планах заняться дообучением модели и при этом нарастить уже существую реализацию для более точной работы сервиса? Или же это лишнее/не эффективно?
Как вы пытались бороться с галлюцинациями помимо систменого промпта?