Как стать автором
Обновить

Эволюция паспортного сканера: от фанерной поделки к реальному бизнесу

Время на прочтение5 мин
Количество просмотров4.7K
Всего голосов 17: ↑15 и ↓2+13
Комментарии28

Комментарии 28

Почему в тегах указано «Программирование микроконтроллеров»?
Одна из моделей описанного паспортного сканера содержит внутри микрокомпьютер, выполняющий распознавание документа. Помимо одноплатного компьютера внутри контроллер, который управляет периферией (подсветкой рабочей области, светозвуковой индикацией, обеспечивает обработку клавиш и т.п.), а также реализует возврат результата распознавания.
Но в этой статье-то микроконтроллеры в принципе не упоминаются.

только в статье про именно программирование микроконтроллеров 0. Тут даже самих упоминания МК нет.

Блин. И почему в этом fips.ru картинки в в tif, а не png ;) Не удобно :(

Статья напомнила вопрос, который давно хотел вам задать. Я знаю, что у вас есть SDK для мобильных платформ. Есть ли у вас планы на разработку плагина для такого популярного сейчас flutter? Чтобы, как говорится, «на горячую» подключать распознавание документов.
В ближайших планах разобраться с подключением в flutter.
Вы не думали каким образом можно уменьшить габариты? К сожалению нет финансовой возможности провести эксперимент самостоятельно с криволинейными зеркалами. Мне кажется три зеркальных стержня позволят получить три проекции, восстановив которые можно получить хорошее бесшовное изображение для OCR. Проблему сильно прямоугольных проекций можно решить анаморфными линзами, которые сжимают пропорции изображения для площади сенсора. Но может быть этого и не потребуется.

что должна "показывать" данная анимация? Отличия между кадрами вижу только в линии и шарике, который почти в конце появляется.

просто пространственное понимание конструкции, расположение зеркальных валов немного со смещением. Можно было уменьшить кадры до 5 штук.

Для этого лучше было бы воспользоваться двухкартинным чертежом (в любых выбранных проекциях).
У анимации есть фатальный недостаток: она предписывает зрителю сколько времени смотреть на каждую проекцию. Человек же, который хочет понять пространственную геометрию конструкции — должен смотреть на каждую проекцию столько времени, сколько ЕМУ удобно.

я думал о этом. Анимация здесь не самая удачная. Но я склоняюсь к тому, что анимация лучше, потому что не просит ваш мозг собирать 3D модель в голове, если вы не инженер.

Я с Вами категорически несогласен. Группу изображений можно изучить, а анимация вызывает те же чувства, как текст на картинке: увидеть можно, а использовать нельзя.
Чтобы "сборка 3D модели в голове" не вызывала затруднений — нужно выбрать удобную проекцию. Кстати, вашу анимацию можно было бы показать одной единственной аксонометрической проекцией — объём чувствовался бы так же.


Простой пример: я остановил Вашу анимацию, и наконец-то смог разглядеть, что цилиндры установлены на разной высоте. Когда всё движется, это заметить крайне трудно.

согласен.
Спасибо за очень интересный вопрос. Мы постоянно работаем над совершенствованием сканеров и процессом их производства. При этом, каждое улучшение мы оцениваем не только с технической, но и производственной составляющей. Добавление нетипичных комплектующих — совсем не простой момент.
самособой. Нестандартные линзы могут и не понадобиться. Может быть зеркало наклонить можно сильнее. Может быть попробовать зеркальную полусферу или другую криволинейную поверхность. Мне кажется с зеркальными поверхностями нет совершенно никаких проблем. Просто иначе пару сканеров таких за границу не отправишь. Огромный недостаток это размер.
В такой конструкции надо серьезно просчитать свет, часть паспорта ламинирована и очень сильно бликует. Идея интересная, но надо считать и физику и экономику.

Избавиться от бликов можно попеременно включать диаметрально расположенные массивы светодиодов. А соединить изображения можно по поровогому значению яркости аналог режима darken в смешении слоев. Только это конечно приведет к увеличению времени на обработку. Камера работает наверняка в режиме 10 fps при 100 iso чтобы не сильно шуметь.

Вопрос на сколько это удорожает производство и повысит брак. Кроме того, тут уже придется писать драйвер управления под множество платформ — вот это уже дорого. Как вариант зашивать все в железо, но в РФ это будет не просто. Кроме того, есть еще вопросы к искажениям которые мы получим в такой схеме, матрица то дискретная, а пиксели прямоугольные. Надо проверять и просчитывать, а идея оригинальная.
аа… у вас же просто видеовыход UVC? понял. Сделал тестовый рендер. К сожалению ооочень много потерь при расжатии с ролика диаметром 4см. Да взять рабочий отрезок с цилиндра можно только с его небольшой части.



зато на сплюснутом шаре половинку можно всю разглядеть. Но половинки мало.
image

А нельзя обойтись без зеркал вообще? Взять обьектив с широким углом fisheye?..
aliexpress.ru/item/32689892116.html и поставить по центру? Если он не будет давать больших искажений из-за своей дешивизны по краям, вполне можно и зеркало выкинуть.

Искажения можно исправлять на уровне интеграции софта, предфильтром. У вас же сканер привязан к вашему софту? Точнее пока проекция у него без искажений пойдет любой ocr софт, а если интеграция то какая разница что там в предфильтре.

И мне кажется что бликов не будет в инфракрасном свете. Ламинация для IR будет прозрачной.
Искажения можно частично можно исправить. Рыбий глаз брали и пробовали, на краях все очень плохо и блики или орлы (голограммы). Дешево и тонко пока не получается. Сейчас делают интересную технологию сканеров под ЖК экранами, вот там интересно получается, но пока это космическая цена.
Аберрации и мыло целиком заслуга объектива. То что идет на камерах как правло жуткое г. Если посмотреть обзоры на накладные фишаи на смартфоны — явно видна разница в качестве. Но не знаю как на макро. наверное все равно будет мыло youtu.be/adbX0QlqXsw?t=587
А почему он такой здоровый по вертикали можно поинтересоваться? Вроде плоские сканеры сто лет существуют

Плоские сканеры, в свою очередь, не видят целиком весь лист, что нужно для быстрого считывания документа.

Плоские сканеры с линейной матрицей и механической частью.

Работали в этом направлении. Сам сканер представляет собой тупо фотоаппарат с хорошей линзой.
Скажу сразу, что так себе идея, т.к. много но:
— шрифт в паспортах разный, включая есть и рукописный.
— много попадается со смещениями самих данных в документе
— распознавание не всегда точные, очень большая должна быть база соответствий имен, фамилий, городов, «кем выдан» УФМС и ОВД и т.д., включая сокращения коих много.
— встречаются такие экспонаты «Али Алиевич Аглы Алиев» или двойные фамилии «Петр Петрович Петров — Иванов».
— нет конкретного шаблона.
— не во всех машиночитаемая запись есть.
— если говорить о паспортах других стран, то столкнетесь с тем, что вам не дадут шаблон.
— не все паспорта с чипами.
— ЦЕНА, не все готовы брать аппараты.
— софт, нужна кроссплатформенность. (видел в основном под Wind'у).
— драйвера под платформы.
— API соответственно нужно нормальное, чтобы другие программы могли брать данные.
Добрый день! Большое спасибо за такой интересный комментарий, который содержит так много тем для обсуждения. Постараемся развернуто ответить по пунктам:

  1. Начнем с «тупо фотоаппарат с хорошей линзой» — действительно, одна из составляющих сканера — фотокамера. Качество светочувствительной матрицы и линзы должно быть ровно таким, чтобы обеспечивать высокий уровень распознавания (которое делается с помощью программы, в нашем случае — Smart IDReader). Здесь еще хотели сообщить, что просчитанная оптическая система сканера включает не только выбор модели камеры, но и подбор других элементов (подсветка, светоотражатели, рабочую поверхность), а также взаиморасположение всех перечисленных элементов. Если пропустить этот важный этап создания сканирующего устройства, а просто тупо засунуть камеру в ящик, то результат будет очень посредственный, даже при использовании хорошей камеры и линзы. Кроме того, для бизнеса не последнюю роль играет цена компонентов и цена производства, так вот хорошая оптика стоит дорого, иногда очень. Как мы пришли к такой конструкции описано в наших статьях на Хабре – вот они: раз и два)
  2. Как вы правильно замечаете центральное место этого прибора это софт – система распознавания, которая и определяет выбор конструктивных и инженерных решений. Если софт не может распознавать с достаточной точностью, то никакая сверх оптика или супер матрица уже не поможет. Для распознавания мы используем собственный софт который точно распознает омнифонтовое заполнение и рукопись, делая это без всяких баз, умеет находить и классифицировать документы в условиях разного освещения, ракурсов съемки и много еще чего умеет, и даже работает на такой экзотике как Эльбрус и Комдив, как он это делает мы пишем в нашем блоге. Если хотите точные ТХ — ссылка есть в тексте статьи, продублируем, вот она.
  3. Насчет шаблонов для других стран — конечно никто не дает изображения содержащие персональные данные – это просто нарушает закон. Но существуют базы данных, в которых есть образцы (изображения) паспортов всех стран. И тут опять вопрос к софту – достаточно ли будет такого общедоступного изображения для качественного решения задачи – нам хватает.

Спасибо.

Ага. Не все готовые брать аппараты 3М AT9000 за сто тысяч.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий