Pull to refresh

Comments 11

Используются ли мощности компьютера при обучении на своей документации? или все на себя берут сервера openai?

Можно использовать оба подхода, в статье показано, как подгрузить свою модель для эмбеддингов

можете объяснить? не до конца понимаю. зачем нам ретривер, если index и так возвращает самый релевантный ответ? еще вопрос по прошлой части статьи: ноды по сути это то же самое, что документ? то есть сколько документов, столько и должно быть нод?

и последний вопрос: как в вашем случае получить ответ на вопрос "с какими компаниями были заключены договора в 2023 году?".
Обучал на своих документах, там была однотипная информация, но только по разным объектам, но на подобный вопрос он мне отвечал: "с теми, с кем компания начала сотрудничество в 2023 году"

PS. При добавлении своего векторайзера все равно требуется ключ api openai

  1. index - это просто способ хранить ваши документы, а ретривер уже возвращает релевантные документы согласно запросу

  2. Ноды - это кусочки документа фиксированной длины (на один документ может быть десятки и сотни нод)

  3. Проверить, возвращает ли ваш ретривер адекватные ноды, если да, то можно переформулировать запрос - например, "выведи все компании, с которыми были заключены договора в 2023 году"

в статье вы говорили, что не надо платить деньги с собственным векторайзером, но все равно требует ключ api, то есть выводит сообщение:

ValueError: No API key found for OpenAI.

почему так?

да, за собственный векторайзер платить не нужно, но для инициализации класса все равно нужна будет эта переменная, попробуйте просто указать os.environ['OPENAI_API_KEY'] = 0

попробовал, так не работает, видимо нужен рабочий и все равно в итоге платишь, но за заданные вопросы. так что ок

Логично, если ты потом используешь ллм, то надо будет платить, если только в режиме ретривера, то нет

В том и дело, что query_engine = index.as_query_engine(similarity_top_k=5) при вызове response возвращает теже 5 наиболее релевантных документов что и ретривер

Там уже ретривер встроен. может обновили просто библиотеку

Как можно сохранить получившийся индекс со своим векторайзером на диск и потом загрузить его?
index.storage_context.persist - работает в обычном случае, но в случае сохранения со своим векторайзером выдает ошибку

Sign up to leave a comment.

Articles