Mark_K17 авг 2023 в 08:06

LlamaIndex: создаем чат-бота без боли и страданий. Часть 2

Простой

5 мин

1.4K

Машинное обучение * Искусственный интеллект

Туториал

Комментарии 9

ximik666 17 авг 2023 в 08:48

Как можно это запустить не используя api OpenAi? Пусть он будет работать хуже, но запустить полностью на своей машине.

Mark_K 17 авг 2023 в 09:08

В теории можно. Надо настроить свою модель для эмбеддингов и LLM. В продолжении как-нибудь распишу

ximik666 17 авг 2023 в 12:20

Буду признателен, если подробно распишите.

BaxLi 18 авг 2023 в 06:03

дачеча нашел как LLAMA2 прикрутить ... Прикрутил - однако обучение модели вроде 94% на английском приводит к чудесатым ответам в случае использования других языков.
а так в принципе легко - вот так у меня работает (переопределил модель и го ....)

model_id = "TheBloke/Llama-2-7B-Chat-GGML"

model_basename = "llama-2-7b-chat.ggmlv3.q4_0.bin"

llm = load_model(device_type, model_id=model_id,

model_basename=model_basename)

sneg2015 19 авг 2023 в 11:22

Подскажите на ноутбуке без мощной видеокарты, например макбук с м2 реально llama2 запустить и чтобы она ответ не пол дня писала?

Mark_K 19 авг 2023 в 13:54

Смотря какую версию использовать(веса же в диапазоне от 7 до 70 млрд параметров). Но без видеокарты все равно инференс медленный будет

BaxLi 20 авг 2023 в 10:17

На маке не знаю как поведет себя, но я запускал как в варианте на GPU так и в варианте на просто CPU. Основное что оперативки надо свободной иметь минимум 14Гб. У меня на винде операционка +модель на питон скрипте заняли 17.6 гиг озу... Ну и плюс торч если на процессоре хотите, соответственный не забудьте подгрузить\установить.... Я кондой среду свитчу ... Удобно ...

mepos 18 авг 2023 в 06:03

А можно в векторную базу загружать вакансии и автоматически тегировать. А при необходимости искать и фильтровать по тегам? Код примера для этого подойдет или его нужно как то изменить?

Mark_K 19 авг 2023 в 13:55

Можно в keywords добавить свои теги, а не генерировать их с помощью llm. Код надо будет изменить

Зарегистрируйтесь на Хабре, чтобы оставить комментарий