Как стать автором
Обновить

Комментарии 11

Опять Двадцать Пять. Плохой скан и кирдык.
Всё равно нужен человек, чтобы ошибки исправлять.

Плохой скан не приговор. В статье рассказываю только про функционал ML. Но сама система намного больше! Для первичной обработки изображения есть более 10 профилей очистки.

Для своих нужд писали распознование паспортов, столько наелись, что жуть просто.
Шрифты, не пропечатки, ориентация как шрифта так и шаблоны самих документов, печать стоит бывает на буквах, что не есть хорошо.
И ещё самое противное - вручную написано всё в паспорте.

А про шаблоны документов вообще отдельная тема, т.к. шаблоны могут менять, добавлять колонки и строки, растояния между колонками.
И со словами "у нас это всё есть" пытаются менеждеры "втюхать".
Про кросплатформенность вообще молчу, одни неделю пытались, но когда узнали что у нас Linux, сразу всё прекратилось.

Всё верно. Качественный OCR также важен) Для этого у нас используются разные модели OCR в движке, в том числе и для рукописного текста. Кстати наша система работает и на ОС семейства Linux.

Всё верно. Качественный OCR также важен) Для этого у нас используются разные модели OCR в движке, в том числе и для рукописного текста.

Ваш подход похож на решение ABBYY с гибкими шаблонами.
Каковы отличия в вашем продукте?
Сильные стороны, ... и слабые, если не слабо ответить. :)

Ответить не слабо )

В нашем решении при создании шаблонов любой сложности не нужно использовать код, для всего есть готовый инструментарий в удобном интерфейсе. Из слабых сторон можно отметить не столь широкую известность на рынке

тут же на хабре уже не раз рекламировался какой-то smart-engine кажется. и хвастали, что их движок уже используют ведущие корпорации.

Я правильно понял, что Вы стали применять ML из-за того, что на настройку множества локаторов уходило много времени? Сколько времени уходит на качественную настройку ML моделей?

У опытных инженеров с набитой рукой на настройку множества локаторов уходит не так уж много времени. Тем более что есть множество уже проработанных цепочек (заготовок), которые можно копировать.

ML локатор позволяет новым не опытным инженерам меньше погружаться в тонкости настройки и выдать не плохое решение в течении дня.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий