Комментарии 5
Совсем недавно на работе как раз размышлял над тем, что в сейчас с развитием QR кодов, то на всех печатных формах документов можно делать QR код содержащий всю информацию из документа.
Это позволит там, куда этот документ понесут наладит ввод информации не вручную, а сканированием.
Я сделал свой аналогичный проект на связке CV+ NLP, тоже автоматизация документооборота. Все эти этапы куда и что отнести это легко, самая большая сложность именно качественно распознать и спарсить нужные поля в базу данных, а уже с имеющимися в базе данными работать легко. Верно сказано, что готовых решений нет.
применением набора правил, построенных на регулярных выражениях;
На одних регулярных выражениях ничего не сделать, скан может быть кривой, с помарками, либо формат документа может внезапно чуть измениться и тогда все придется делать заного руками, а в это время работу придется делать руками.
с помощью библиотек обработки естественного языка и предварительно обученных моделей;
А вот это в связке с регулярными выражениями дает хороший эффект.
А никто не пробовал решение для распознавания текста от Microsoft Power Automate? Можно было бы попробовать настроить сканирование с отправкой на почту и дальнейшее распознавание и отправка сканов адресатам.
Как систематизировать работу с входящими документами в компании с помощью OCR-инструментов. Часть 1