Как стать автором
Обновить

Комментарии 8

Агенты: С помощью агентов модель может получить доступ к различным источникам информации, таким как Google, Wikipedia итд.

Правильно ли я понял, что данный фреймворке имеет рантайм доступ к внешнему миру при обучении?

В LangChain вы используете уже обученные модели. Агенты нужны, чтобы обращаться к разным источникам в зависимости от пользовательского ввода.

Пользовательский ввод во время выполнения или во время обучения?

Во время выполнения

А насколько большим может быть объем обучаемых данных?
Например, я хочу:


  • обучить корпоративной схеме данных (700+ таблиц и 6000+ колонок) в формате: "имя" + "описание назначения"
  • дать пользователям возможность задавать вопросы по структуре данных и в ответах давать ссылки на имена колонок и таблиц.

Возможно ли работать с таким объемом частных (корпоративных) данных с описанным вами подходом?

Тут лучше говорить не про обучаемые данные, а про входные данные. Т.е вы на вход даете описания ваших данных, а на выходе ждете, что ИИ поймет их структуру и связи. В принципе это реально, вопрос в методологии - как сохранять промежуточные состояния, чтобы использовать их как долговременную память

Не получится скормить а запросе сотни мб данных.


В моем случае ИИ нужен для:


  • анализа вопроса в терминах индустрии (законы);
  • трансляция вопроса в формулу на основе структуры данных.

Пример запроса: In a manual underwrite where there is a short sale within the last 3 years, evidence an exception granted and supporting documentation was not in the file.
— HUD Handbook 4000.1: II.A.5.a.iii(J)


Т.е. без схемы ответить на вопрос нельзя.

ИМХО LangChain задает хороший фреймворк подхода к работе с LLM, но реализация часто сложнее и менее прозрачна чем если напрямую с тем же API OpenAI.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории