TAU1528 мар в 05:43

RAG или умный поиск по документам: как это работает

Средний

10 мин

7.1K

Искусственный интеллект

Кейс

Комментарии 4

Aquahawk 28 мар в 06:07

у меня достаточно много документов в pdf в виде сканов, насколько оно дружит с таким?

danilovmy 28 мар в 06:47

Не знаю как у автора статьи - у меня распознание документа через doctr, дальше работаем как с текстом. Графики распознаются криво. Сейчас вышел мультимодальный embedding, качество его работы я не проверял, по идее он убирает кодовый бойлерплейт по документам разных типов. Описание, например, тут https://habr.com/ru/articles/1010030/

TAU15 28 мар в 08:51

В эту функцию даются файлы с текстом, а для перевода файлов со сканами в ProTalk есть отдельные функции

ENick 28 мар в 08:02

Результаты тестов интересно посмотреть. Также интересно продолжение: графы и кластеры графов

Зарегистрируйтесь на Хабре, чтобы оставить комментарий