Pull to refresh
178.02

Как мы делали книжный сканер для судов

Reading time3 min
Views21K


Началось всё с того, что однажды мы увидели гигантскую хреновину (иначе не скажешь), которая выглядела один в один, как гидравлический пресс какого-нибудь завода. Она скрипела, шипела и давила книгу. Вокруг бегали специально обученные операторы и шарахались от каждого её движения.

Выяснилось, что разные архивы, библиотеки, суды и другие структуры закупают сканеры, или, скажем так, классические решения, которые по уровню начинки очень напоминают 90-е годы. Потому что тогда были разработаны первые сканеры для библиотек, и их с тех пор не особо модифицировали.

Задачей сканера было механически выровнять сканируемый материал на плоскости, а потом отсканировать.

С тех пор поменялись две вещи:
— Подходы к конструированию электроники.
— Подходы к машинному зрению.

Первый опыт: датчики давления


Гипотеза: надо прижать книгу к стеклу не со всей дури, сколько есть, а до безопасного давления для руки. Поставить датчики и просто снимать с них показания для подъёмного стола. Это снизит страхи операторов и травматизм.

Второй опыт: выравнивание изображения


С этим результатом мы пришли к одному из заказчиков из судебной сферы. Сшитые документы в судах (чаще всего судебные дела) очень толстые. Такие же кипы документов бывают у инженеров-строителей и в разных архивах.

Гипотеза: можно выравнивать очень многое не вручную, а с помощью машинного зрения. В конце концов, даже с обычного планшета можно сегодня сфотографировать документ и сразу получить его в виде почти что ксерокопии. Чем сканер хуже?

Мы дописали софт, и там появились всякие повороты и наклоны автоматом и с подсказки оператора.

Вот что вышло:


Потом ещё игрались с настройкой предельного значения силы прижима:

Третий опыт: не надо прижимать


У нас на входе в офис стоит 3D-сканер лица, который умеет строить 3D-модель лица по одной фотографии. Делает он это с помощью проектора сетки: сравнивая наложение сетки на лицо, он вычисляет геометрию этого лица. Следующая гипотеза была логична: а зачем прижимать документ, если достаточно спроецировать на него лазерные метки?



Оказалось, достаточно лазерных полосок — вот таких:



Сверху стоит камера, которая снимает.

По ТЗ: сканеры чёрно-белые, поэтому можно просто отсечь длину волны лазера и получить отдельно канал с геометрией и канал с информацией из сканируемого документа.

Затем можно выполнить «восстановление» геометрии до того уровня, когда лазерные линии в результате снова будут прямыми. Вот что получается:



Вот, собственно, конец истории.

Задача, кстати, оказалась очень актуальной для случаев, когда приходится сканировать очень ветхие и разноформатные сшитые документы, чертежи, книги. Когда страница сыплется в труху от неаккуратного прикосновения пальцами, прижать её к плоской поверхности — это всё равно что сразу уничтожить.

Результат


У нас получилось сделать нужное решение и пустить его в серию просто потому, что, видимо, прочим игрокам рынка было неинтересно или не очень выгодно, чтобы сканеры были дешёвыми и работали быстро. Наши сканеры по сочетанию цена–эффект и цена–качество вышли очень и очень хороши.

Откуда растут ноги? Опыт работы с похожими изображениями мы получили, когда распознавали по стране данные сельскохозяйственной переписи. Тогда надо было разбирать рукописный шрифт: планшеты обходчикам дали только на следующей переписи. Плюс у нас есть лаборатория робототехники, где можно быстро собрать прототип любого устройства, которое только возникнет в наших воспалённых мозгах. Собственно, так и произошло. Мы загубили некоторое количество материалов, пока не подобрали правильную модель подъёма стола, долго ковырялись с лазерами, но нашли то что нужно.

Ну и мы — интегратор большого размера, поэтому, когда пришли к одному из заказчиков и показали наш результат, к нам прислушались. И сэкономили.

Вот три поколения наших сканеров и принципы работы:

Сканер с верхним прижимом:

Сканер с прижимом снизу:

Сканер без прижима:


Ссылки


Tags:
Hubs:
+50
Comments42

Articles

Information

Website
croc.ru
Registered
Founded
Employees
1,001–5,000 employees
Location
Россия