Комментарии 8
Агенты: С помощью агентов модель может получить доступ к различным источникам информации, таким как Google, Wikipedia итд.
Правильно ли я понял, что данный фреймворке имеет рантайм доступ к внешнему миру при обучении?
В LangChain вы используете уже обученные модели. Агенты нужны, чтобы обращаться к разным источникам в зависимости от пользовательского ввода.
А насколько большим может быть объем обучаемых данных?
Например, я хочу:
- обучить корпоративной схеме данных (700+ таблиц и 6000+ колонок) в формате: "имя" + "описание назначения"
- дать пользователям возможность задавать вопросы по структуре данных и в ответах давать ссылки на имена колонок и таблиц.
Возможно ли работать с таким объемом частных (корпоративных) данных с описанным вами подходом?
Тут лучше говорить не про обучаемые данные, а про входные данные. Т.е вы на вход даете описания ваших данных, а на выходе ждете, что ИИ поймет их структуру и связи. В принципе это реально, вопрос в методологии - как сохранять промежуточные состояния, чтобы использовать их как долговременную память
Не получится скормить а запросе сотни мб данных.
В моем случае ИИ нужен для:
- анализа вопроса в терминах индустрии (законы);
- трансляция вопроса в формулу на основе структуры данных.
Пример запроса: In a manual underwrite where there is a short sale within the last 3 years, evidence an exception granted and supporting documentation was not in the file.
— HUD Handbook 4000.1: II.A.5.a.iii(J)
Т.е. без схемы ответить на вопрос нельзя.
ИМХО LangChain задает хороший фреймворк подхода к работе с LLM, но реализация часто сложнее и менее прозрачна чем если напрямую с тем же API OpenAI.
LangСhain: создаем свой AI в несколько строк