Эволюция паспортного сканера: от фанерной поделки к реальному бизнесу

    Привет, Хабр! Сейчас, когда каждый из нас послушно сидит на самоизоляции, мы искренне скучаем по офису, разработке и изобретательству. Помимо софта мы в Smart Engines изобретаем сканирующие программно-аппаратные комплексы (кстати, мы ранее про это писали тут и тут). Наши ранние статьи были скорее похожи на статью из журнала «Очумелые ручки», где рассказывалось как из подручных материалов сделать что-то полезное и высокотехнологичное. Сегодня речь пойдет о другом. Мы решили поделиться с вами историей о том, как фанерную коробочку со сканером мы довели до полноценного продукта, который успешно продается на рынке.



    Перед тем как начать рассказ о том, как мы превращали наш прототип в серийный продукт, мы хотим сказать пару слов о том, зачем вообще мы занимаемся изобретением программно-аппаратных комплексов (ПАК). Разве не эффективнее сосредоточить все силы чисто на написании софта? Тут есть несколько соображений.

    Во-первых, распознающие программы часто используются в паре с устройством оцифровки документов. Конечно, в последнее время появляется все больше «цифровых» компаний, которые забыли (а в некоторых случаях даже и не знали) про бумагу. Тем не менее, даже если вы разработаете универсальную программу, которая будет совсем неприхотлива и совместима со всеми компьютерами, камерами, сканерами, МФУ, телефонами, планшетами, документными сканерами (прям как наша Smart IDReader), все равно будьте готовы на презентациях назвать рекомендовать устройства, необходимые для решения задачи ввода паспортных данных.

    Во-вторых, по нашему опыту, специальный ПАК зачастую решает задачу намного лучше, а программные и аппаратные части взаимодействуют друг с другом стабильнее, чем если бы это была «сборная солянка». Это легко объяснить на пальцах: за счет ограничения в моделях отладка и тестирование софта и оборудования оказываются проще, что, естественно, повышает общее качество решения. Кстати, именно по этой причине софт для iPhone (для которых в каждый момент времени актуальны не более 5-6 моделей) работает стабильнее, чем софт для Android-телефонов. Но это совсем другая история, не будем в нее углубляться.

    И, наконец, в-третьих, ПАК – это что-то физически осязаемое. У ПАК есть физические размеры, масса, цвет и даже запах (кто из нас не любит запах новой техники?). А еще у ПАК, в отличие от того же софта, есть НДС 20%, но про эту неприятную часть бизнеса чуть позже. Давайте переходить к основному содержанию сегодняшней статьи.

    Как мы организовали производство сканеров


    Как только мы живьем увидели эффективность прототипа паспортного сканера, как только остыли эмоции и «охладел» мозг (вернувшись в свое стабильное состояние), мы начали задумываться о потенциальной аудитории паспортного сканера и способах дистрибьюции. На это у нас ушло полтора месяца. И мы сразу же поделились с тобой, наш читатель Хабра, своими мечтами в заключении к очередной статье:

    Проведенные эксперименты плавно подвели нас к важной научно-социальной цели: создать промышленный образец, позволяющий полностью решить проблему ввода паспортных данных на проходных, в банках, билетных кассах, а также подумать об импортозамещении.

    Итак, первый шаг, который мы сделали, обеспечили себя правовой защитой, подав заявки на регистрацию изобретений и полезных моделей. Без какого-либо сарказма заявляем, что наличие честных зарегистрированных результатов интеллектуальной деятельности (РИД) – очень важный элемент бизнеса, который выстреливает несколько раз: обеспечивает правовую защиту продуктов, поднимает стоимость компании, повышает доверие со стороны партнеров и контрагентов. С патентами тянуть не стоит, зачастую достаточно рабочего прототипа, а иногда даже четко описанной идеи. Мы зарегистрировали как патент на полезную модель, так и патент на изобретение:

    • Патент на полезную модель № 166038 Автоматизированное рабочее место контроля паспортных документов
    • Патент на изобретение № 2643130 Автоматизированное рабочее место контроля паспортных документов

    Вторым шагом был выбор организационной формы нашего нового направления. Понимая, что серьезное развитие нового бизнес-направления потребует полного задействования наших административных ресурсов и может нанести серьезный урон нашему основному направлению – разработке распознающего софта, мы приняли решение о создании спин-оффа. Точнее, сразу двух: первый должен развивать «простую и дешевую» модификацию паспортного сканера для масс-маркета, а второй – наладить производство «продвинутых и дорогих» устройств, содержащих внутри автономные вычислители для решения задачи распознавания. За собой мы оставили важную роль супервайзера.

    Идея разбить бизнес паспортных сканеров на два независимых направления была совсем не случайна. Хотя на тот момент у нас практически не было опыта производства конечного изделия, мы четко видели разницу между двумя классами устройств (и это разница была не только в функциональных характеристиках, но и конструкторских особенностях, организации производственного процесса, рынках сбыта).

    Для развития первого класса устройств («дешевых» сканеров для масс-сегмента) мы искали команду, способную быстро организовать малый бизнес и поставить на конвейер первые серийные образцы, выполняя развитие и модернизацию сканера в процессе жизненного цикла. К счастью, нам удалось найти ребят, которые взяли на себя всю рутинную работу по разработке нормального корпуса (напомню, в первых образцах он был ил ЛДСП), сертификации, производства и логистики. Знали бы вы сколько термопластика было израсходовано прежде, чем удалось изготовить пригодные для конвейерной сборки и последующей эксплуатации корпуса! В результате вышло надежное устройство, крайне востребованное особенно при организации СКУД и гостиничном бизнесе.


    Настало время сделать маленький отступ к бухгалтерской составляющей и способу реализации товара. Несмотря на то, что ПАК является целостным устройством, выполняющим понятную бизнес-функцию (распознавание документов), для конечных клиентов с точки зрения налогов оказывается более выгодна продажа его «по частям»: отдельно сканер паспортов (облагается НДС 20%), отдельно софт (не облагается НДС). При такой схеме не происходит «лишней» накрутки налога на распознающий софт (который по факту немало стоит). Несмотря на финансовое преимущество, у этой схемы есть недостаток: в случае возврата ПАК (при поломке или какой-либо другой причине) вернуть удастся только стоимость непосредственно сканера.

    Устройства второго класса («дорогие» автономные модели) по нашему замыслу должны были производиться на серьезном российском (лучше — оборонном) предприятии и быть работоспособными в самых непредсказуемых условиях. А еще выглядеть солидно.


    Серьезность наших намерений закономерно потребовала от нас большего вложения сил. Выбранный нами оборонный завод не хотел запускать производство по простым «чертежам на клетчатой бумаге». Нам пришлось разработать полный комплект конструкторской документации, чтобы хоть как-то приблизиться к заветной цели. Потом мы столкнулись с проблемами поставки комплектующих из-за границы (про это, если вдруг вам интересно, мы напишем отдельный пост с перечислением рабочих лайфхаков). Организация линии сборки, обеспечение процедуры тестирования готового изделия, проработка схемы обновления встроенного программного обеспечения – все это новые дисциплины, с которыми нам, разработчикам софта, пришлось в оперативном режиме ознакомиться. Хотя, с другой стороны, это было время частых командировок! Но главное – достойный результат, которым мы гордимся!



    А что после наладки производства?


    Прошло уже где-то два года с того момента, как мы закончили организацию производства обоих классов устройств. Наблюдая, как растут объемы продаж, мы понимаем, что наши сканеры нашли свою целевую аудиторию. Приятно осознавать, что твое изобретение (в прошлом – фанерный ящик, скрученный на даче шуруповертом) сегодня помогает людям быстрее справляться с рутиной ввода персональных данных. И пусть пока не все проходные, офисы финансовых организаций и билетные кассы оборудованы нашими сканерами, мы твердо видим вектор в светлое будущее и четко следуем выбранному направлению. Спасибо.
    Smart Engines
    Обработка изображений, распознавание в видеопотоке

    Комментарии 28

      +3
      Почему в тегах указано «Программирование микроконтроллеров»?
        –6
        Одна из моделей описанного паспортного сканера содержит внутри микрокомпьютер, выполняющий распознавание документа. Помимо одноплатного компьютера внутри контроллер, который управляет периферией (подсветкой рабочей области, светозвуковой индикацией, обеспечивает обработку клавиш и т.п.), а также реализует возврат результата распознавания.
          +9
          Но в этой статье-то микроконтроллеры в принципе не упоминаются.
            +4

            только в статье про именно программирование микроконтроллеров 0. Тут даже самих упоминания МК нет.

          0

          Блин. И почему в этом fips.ru картинки в в tif, а не png ;) Не удобно :(

            0
            Статья напомнила вопрос, который давно хотел вам задать. Я знаю, что у вас есть SDK для мобильных платформ. Есть ли у вас планы на разработку плагина для такого популярного сейчас flutter? Чтобы, как говорится, «на горячую» подключать распознавание документов.
              +1
              В ближайших планах разобраться с подключением в flutter.
              0
              Вы не думали каким образом можно уменьшить габариты? К сожалению нет финансовой возможности провести эксперимент самостоятельно с криволинейными зеркалами. Мне кажется три зеркальных стержня позволят получить три проекции, восстановив которые можно получить хорошее бесшовное изображение для OCR. Проблему сильно прямоугольных проекций можно решить анаморфными линзами, которые сжимают пропорции изображения для площади сенсора. Но может быть этого и не потребуется.

                0

                что должна "показывать" данная анимация? Отличия между кадрами вижу только в линии и шарике, который почти в конце появляется.

                  0
                  просто пространственное понимание конструкции, расположение зеркальных валов немного со смещением. Можно было уменьшить кадры до 5 штук.
                    0

                    Для этого лучше было бы воспользоваться двухкартинным чертежом (в любых выбранных проекциях).
                    У анимации есть фатальный недостаток: она предписывает зрителю сколько времени смотреть на каждую проекцию. Человек же, который хочет понять пространственную геометрию конструкции — должен смотреть на каждую проекцию столько времени, сколько ЕМУ удобно.

                      0
                      я думал о этом. Анимация здесь не самая удачная. Но я склоняюсь к тому, что анимация лучше, потому что не просит ваш мозг собирать 3D модель в голове, если вы не инженер.
                        0

                        Я с Вами категорически несогласен. Группу изображений можно изучить, а анимация вызывает те же чувства, как текст на картинке: увидеть можно, а использовать нельзя.
                        Чтобы "сборка 3D модели в голове" не вызывала затруднений — нужно выбрать удобную проекцию. Кстати, вашу анимацию можно было бы показать одной единственной аксонометрической проекцией — объём чувствовался бы так же.


                        Простой пример: я остановил Вашу анимацию, и наконец-то смог разглядеть, что цилиндры установлены на разной высоте. Когда всё движется, это заметить крайне трудно.

                          0
                          согласен.
                  0
                  Спасибо за очень интересный вопрос. Мы постоянно работаем над совершенствованием сканеров и процессом их производства. При этом, каждое улучшение мы оцениваем не только с технической, но и производственной составляющей. Добавление нетипичных комплектующих — совсем не простой момент.
                    0
                    самособой. Нестандартные линзы могут и не понадобиться. Может быть зеркало наклонить можно сильнее. Может быть попробовать зеркальную полусферу или другую криволинейную поверхность. Мне кажется с зеркальными поверхностями нет совершенно никаких проблем. Просто иначе пару сканеров таких за границу не отправишь. Огромный недостаток это размер.
                      0
                      В такой конструкции надо серьезно просчитать свет, часть паспорта ламинирована и очень сильно бликует. Идея интересная, но надо считать и физику и экономику.
                        0

                        Избавиться от бликов можно попеременно включать диаметрально расположенные массивы светодиодов. А соединить изображения можно по поровогому значению яркости аналог режима darken в смешении слоев. Только это конечно приведет к увеличению времени на обработку. Камера работает наверняка в режиме 10 fps при 100 iso чтобы не сильно шуметь.

                          0
                          Вопрос на сколько это удорожает производство и повысит брак. Кроме того, тут уже придется писать драйвер управления под множество платформ — вот это уже дорого. Как вариант зашивать все в железо, но в РФ это будет не просто. Кроме того, есть еще вопросы к искажениям которые мы получим в такой схеме, матрица то дискретная, а пиксели прямоугольные. Надо проверять и просчитывать, а идея оригинальная.
                            0
                            аа… у вас же просто видеовыход UVC? понял. Сделал тестовый рендер. К сожалению ооочень много потерь при расжатии с ролика диаметром 4см. Да взять рабочий отрезок с цилиндра можно только с его небольшой части.



                            зато на сплюснутом шаре половинку можно всю разглядеть. Но половинки мало.
                            image

                            А нельзя обойтись без зеркал вообще? Взять обьектив с широким углом fisheye?..
                            aliexpress.ru/item/32689892116.html и поставить по центру? Если он не будет давать больших искажений из-за своей дешивизны по краям, вполне можно и зеркало выкинуть.

                            Искажения можно исправлять на уровне интеграции софта, предфильтром. У вас же сканер привязан к вашему софту? Точнее пока проекция у него без искажений пойдет любой ocr софт, а если интеграция то какая разница что там в предфильтре.

                            И мне кажется что бликов не будет в инфракрасном свете. Ламинация для IR будет прозрачной.
                              0
                              Искажения можно частично можно исправить. Рыбий глаз брали и пробовали, на краях все очень плохо и блики или орлы (голограммы). Дешево и тонко пока не получается. Сейчас делают интересную технологию сканеров под ЖК экранами, вот там интересно получается, но пока это космическая цена.
                                0
                                Аберрации и мыло целиком заслуга объектива. То что идет на камерах как правло жуткое г. Если посмотреть обзоры на накладные фишаи на смартфоны — явно видна разница в качестве. Но не знаю как на макро. наверное все равно будет мыло youtu.be/adbX0QlqXsw?t=587
                  0
                  А почему он такой здоровый по вертикали можно поинтересоваться? Вроде плоские сканеры сто лет существуют
                    0

                    Плоские сканеры, в свою очередь, не видят целиком весь лист, что нужно для быстрого считывания документа.

                      0

                      Плоские сканеры с линейной матрицей и механической частью.

                      0
                      Работали в этом направлении. Сам сканер представляет собой тупо фотоаппарат с хорошей линзой.
                      Скажу сразу, что так себе идея, т.к. много но:
                      — шрифт в паспортах разный, включая есть и рукописный.
                      — много попадается со смещениями самих данных в документе
                      — распознавание не всегда точные, очень большая должна быть база соответствий имен, фамилий, городов, «кем выдан» УФМС и ОВД и т.д., включая сокращения коих много.
                      — встречаются такие экспонаты «Али Алиевич Аглы Алиев» или двойные фамилии «Петр Петрович Петров — Иванов».
                      — нет конкретного шаблона.
                      — не во всех машиночитаемая запись есть.
                      — если говорить о паспортах других стран, то столкнетесь с тем, что вам не дадут шаблон.
                      — не все паспорта с чипами.
                      — ЦЕНА, не все готовы брать аппараты.
                      — софт, нужна кроссплатформенность. (видел в основном под Wind'у).
                      — драйвера под платформы.
                      — API соответственно нужно нормальное, чтобы другие программы могли брать данные.
                        0
                        Добрый день! Большое спасибо за такой интересный комментарий, который содержит так много тем для обсуждения. Постараемся развернуто ответить по пунктам:

                        1. Начнем с «тупо фотоаппарат с хорошей линзой» — действительно, одна из составляющих сканера — фотокамера. Качество светочувствительной матрицы и линзы должно быть ровно таким, чтобы обеспечивать высокий уровень распознавания (которое делается с помощью программы, в нашем случае — Smart IDReader). Здесь еще хотели сообщить, что просчитанная оптическая система сканера включает не только выбор модели камеры, но и подбор других элементов (подсветка, светоотражатели, рабочую поверхность), а также взаиморасположение всех перечисленных элементов. Если пропустить этот важный этап создания сканирующего устройства, а просто тупо засунуть камеру в ящик, то результат будет очень посредственный, даже при использовании хорошей камеры и линзы. Кроме того, для бизнеса не последнюю роль играет цена компонентов и цена производства, так вот хорошая оптика стоит дорого, иногда очень. Как мы пришли к такой конструкции описано в наших статьях на Хабре – вот они: раз и два)
                        2. Как вы правильно замечаете центральное место этого прибора это софт – система распознавания, которая и определяет выбор конструктивных и инженерных решений. Если софт не может распознавать с достаточной точностью, то никакая сверх оптика или супер матрица уже не поможет. Для распознавания мы используем собственный софт который точно распознает омнифонтовое заполнение и рукопись, делая это без всяких баз, умеет находить и классифицировать документы в условиях разного освещения, ракурсов съемки и много еще чего умеет, и даже работает на такой экзотике как Эльбрус и Комдив, как он это делает мы пишем в нашем блоге. Если хотите точные ТХ — ссылка есть в тексте статьи, продублируем, вот она.
                        3. Насчет шаблонов для других стран — конечно никто не дает изображения содержащие персональные данные – это просто нарушает закон. Но существуют базы данных, в которых есть образцы (изображения) паспортов всех стран. И тут опять вопрос к софту – достаточно ли будет такого общедоступного изображения для качественного решения задачи – нам хватает.

                        Спасибо.
                          0

                          Ага. Не все готовые брать аппараты 3М AT9000 за сто тысяч.

                        Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                        Самое читаемое