Mark_K Sep 14 2023 at 06:50

LlamaIndex: создаем чат-бота без боли и страданий. Часть 3

7 min

7.4K

Machine learning * Artificial Intelligence

Tutorial

Comments 11

Maxskam Sep 21 2023 at 05:22

Используются ли мощности компьютера при обучении на своей документации? или все на себя берут сервера openai?

Mark_K Sep 22 2023 at 03:50

Можно использовать оба подхода, в статье показано, как подгрузить свою модель для эмбеддингов

Maxskam Sep 22 2023 at 08:09

можете объяснить? не до конца понимаю. зачем нам ретривер, если index и так возвращает самый релевантный ответ? еще вопрос по прошлой части статьи: ноды по сути это то же самое, что документ? то есть сколько документов, столько и должно быть нод?

и последний вопрос: как в вашем случае получить ответ на вопрос "с какими компаниями были заключены договора в 2023 году?".
Обучал на своих документах, там была однотипная информация, но только по разным объектам, но на подобный вопрос он мне отвечал: "с теми, с кем компания начала сотрудничество в 2023 году"

PS. При добавлении своего векторайзера все равно требуется ключ api openai

Mark_K Sep 22 2023 at 08:38

index - это просто способ хранить ваши документы, а ретривер уже возвращает релевантные документы согласно запросу
Ноды - это кусочки документа фиксированной длины (на один документ может быть десятки и сотни нод)
Проверить, возвращает ли ваш ретривер адекватные ноды, если да, то можно переформулировать запрос - например, "выведи все компании, с которыми были заключены договора в 2023 году"

Maxskam Sep 22 2023 at 09:05

в статье вы говорили, что не надо платить деньги с собственным векторайзером, но все равно требует ключ api, то есть выводит сообщение:

ValueError: No API key found for OpenAI.

почему так?

Mark_K Sep 22 2023 at 10:40

да, за собственный векторайзер платить не нужно, но для инициализации класса все равно нужна будет эта переменная, попробуйте просто указать os.environ['OPENAI_API_KEY'] = 0

Maxskam Sep 22 2023 at 11:39

попробовал, так не работает, видимо нужен рабочий и все равно в итоге платишь, но за заданные вопросы. так что ок

Mark_K Sep 22 2023 at 12:18

Логично, если ты потом используешь ллм, то надо будет платить, если только в режиме ретривера, то нет

SlavkaLev Apr 16 2024 at 12:10

В том и дело, что query_engine = index.as_query_engine(similarity_top_k=5) при вызове response возвращает теже 5 наиболее релевантных документов что и ретривер

SlavkaLev Apr 16 2024 at 13:38

Там уже ретривер встроен. может обновили просто библиотеку

Maxskam Sep 22 2023 at 10:18

Как можно сохранить получившийся индекс со своим векторайзером на диск и потом загрузить его?
index.storage_context.persist - работает в обычном случае, но в случае сохранения со своим векторайзером выдает ошибку