Comments 11
Используются ли мощности компьютера при обучении на своей документации? или все на себя берут сервера openai?
можете объяснить? не до конца понимаю. зачем нам ретривер, если index и так возвращает самый релевантный ответ? еще вопрос по прошлой части статьи: ноды по сути это то же самое, что документ? то есть сколько документов, столько и должно быть нод?
и последний вопрос: как в вашем случае получить ответ на вопрос "с какими компаниями были заключены договора в 2023 году?".
Обучал на своих документах, там была однотипная информация, но только по разным объектам, но на подобный вопрос он мне отвечал: "с теми, с кем компания начала сотрудничество в 2023 году"
PS. При добавлении своего векторайзера все равно требуется ключ api openai
index - это просто способ хранить ваши документы, а ретривер уже возвращает релевантные документы согласно запросу
Ноды - это кусочки документа фиксированной длины (на один документ может быть десятки и сотни нод)
Проверить, возвращает ли ваш ретривер адекватные ноды, если да, то можно переформулировать запрос - например, "выведи все компании, с которыми были заключены договора в 2023 году"
в статье вы говорили, что не надо платить деньги с собственным векторайзером, но все равно требует ключ api, то есть выводит сообщение:
ValueError: No API key found for OpenAI.
почему так?
В том и дело, что query_engine = index.as_query_engine(similarity_top_k=5) при вызове response возвращает теже 5 наиболее релевантных документов что и ретривер
Как можно сохранить получившийся индекс со своим векторайзером на диск и потом загрузить его?
index.storage_context.persist - работает в обычном случае, но в случае сохранения со своим векторайзером выдает ошибку
LlamaIndex: создаем чат-бота без боли и страданий. Часть 3