Comments 7
Надеюсь этот агент не убьёт вашего отца. Как-то переживательно даже.
Хоть бы отредачили полный копи паст от чата без надстройки, даже можно не читать
Такое Claude напишет минут за 10 при правильной постановке задачи.
Такое впечатление что продукта не существует. Не рассказано о целях и роли RAG - для чего он нужен в вашей системе. По стеку(ChromaDB + SentenceTransformer) видно, что вы используете семантический поиск. Про него нет ни слова. Отсутствует описание логики извлечения информации для медицинской системы. Если ваша система по запросу ищет ближний вектор, то есть шанс вернуть не ту информацию, которая нужна в данном запросе, что может навредить человеку.
Чем обусловлен выбор тессеракта, который не может справиться с хорошо структурированными медицинскими файлами, в которых есть таблицы, разметки и т д? Ничего не сказано про неправильное распознавание символов им. Если тессеракт неправильно распознает символ, LLM придется работать с неверными данными(что в свою очередь угроза жизни вашему отцу).
Присоединяюсь к комментариям выше.
Это моя первая статья поэтому не стал расписывать подробно всё. Но если будет интересно читателям то в следующей статье распишу подробнее.
Главное, чтобы медицинский ассистент не начал галлюцинировать.
Отцу здоровья.
Подобная система крайне ненадежна для использования в медицинских целях из-за галлюцинаций или тех же ошибок при распознавании текста/речи. К тому же, у вас есть функция для поиска в интернете, что может дополнительно сбить модель с толку.
Конечно, можно предполагать, что у вас зашит функционал защиты внутри методов, но в статье это совершенно не раскрыто. В общем и целом, можно сказать, что это поверхностный обзор на построение пайплайна с RAG.
По моему мнению, статья - филлер
Отцу крепкого здоровья!
Как я собрал AI-ассистента для отца с больным сердцем: Tool-Calling RAG Pipeline на GPT-4o-mini без LangChain