Комментарии 8
Спасибо, классный проект!) А какого агента используете? На своём сервере или внешний API?
Спасибо за позитивный отклик!
Разрабатывал используя LM Studio:
CHAT_COMPLETIONS_MODEL=gemma-3-12b-it
EMBEDDINGS_MODEL=lm-kit/text-embedding-bge-m3
Что бы ИИ отвечал лучше переключился на gemma-3-27b-it, но он медленнее на моей видюхе.
Потом использовал OpenAI
CHAT_COMPLETIONS_MODEL=gpt-4o-mini
EMBEDDINGS_MODEL=text-embedding-3-small
Хотел проверить стало ли лучше работать на коммерческих моделях. В итоге чуть лучше чем квантованная gemma-3-27b-it, но не сильно, даже от OpenAI иногда фигню выдает )
Для самовыражения растомана норм. Но всё же, думаю, lang-chain + python больше подойдёт для проф разработки подобных систем. Да и для читателей, наверное, было бы интересно увидеть примеры разумного реального использования нетривиальных концепций лангчейна, прежде чем отвергать его из-за кажущейся неимоверной сложности и крутой кривой обучения.
Всегда хотел блокнот который для показа диалога "сохранить изменения?" будет требовать мощную видеокарту
Как создать ИИ Телеграм-бот с векторной памятью на Qdrant