Как мы делали книжный сканер для судов



    Началось всё с того, что однажды мы увидели гигантскую хреновину (иначе не скажешь), которая выглядела один в один, как гидравлический пресс какого-нибудь завода. Она скрипела, шипела и давила книгу. Вокруг бегали специально обученные операторы и шарахались от каждого её движения.

    Выяснилось, что разные архивы, библиотеки, суды и другие структуры закупают сканеры, или, скажем так, классические решения, которые по уровню начинки очень напоминают 90-е годы. Потому что тогда были разработаны первые сканеры для библиотек, и их с тех пор не особо модифицировали.

    Задачей сканера было механически выровнять сканируемый материал на плоскости, а потом отсканировать.

    С тех пор поменялись две вещи:
    — Подходы к конструированию электроники.
    — Подходы к машинному зрению.

    Первый опыт: датчики давления


    Гипотеза: надо прижать книгу к стеклу не со всей дури, сколько есть, а до безопасного давления для руки. Поставить датчики и просто снимать с них показания для подъёмного стола. Это снизит страхи операторов и травматизм.

    Второй опыт: выравнивание изображения


    С этим результатом мы пришли к одному из заказчиков из судебной сферы. Сшитые документы в судах (чаще всего судебные дела) очень толстые. Такие же кипы документов бывают у инженеров-строителей и в разных архивах.

    Гипотеза: можно выравнивать очень многое не вручную, а с помощью машинного зрения. В конце концов, даже с обычного планшета можно сегодня сфотографировать документ и сразу получить его в виде почти что ксерокопии. Чем сканер хуже?

    Мы дописали софт, и там появились всякие повороты и наклоны автоматом и с подсказки оператора.

    Вот что вышло:


    Потом ещё игрались с настройкой предельного значения силы прижима:

    Третий опыт: не надо прижимать


    У нас на входе в офис стоит 3D-сканер лица, который умеет строить 3D-модель лица по одной фотографии. Делает он это с помощью проектора сетки: сравнивая наложение сетки на лицо, он вычисляет геометрию этого лица. Следующая гипотеза была логична: а зачем прижимать документ, если достаточно спроецировать на него лазерные метки?



    Оказалось, достаточно лазерных полосок — вот таких:



    Сверху стоит камера, которая снимает.

    По ТЗ: сканеры чёрно-белые, поэтому можно просто отсечь длину волны лазера и получить отдельно канал с геометрией и канал с информацией из сканируемого документа.

    Затем можно выполнить «восстановление» геометрии до того уровня, когда лазерные линии в результате снова будут прямыми. Вот что получается:



    Вот, собственно, конец истории.

    Задача, кстати, оказалась очень актуальной для случаев, когда приходится сканировать очень ветхие и разноформатные сшитые документы, чертежи, книги. Когда страница сыплется в труху от неаккуратного прикосновения пальцами, прижать её к плоской поверхности — это всё равно что сразу уничтожить.

    Результат


    У нас получилось сделать нужное решение и пустить его в серию просто потому, что, видимо, прочим игрокам рынка было неинтересно или не очень выгодно, чтобы сканеры были дешёвыми и работали быстро. Наши сканеры по сочетанию цена–эффект и цена–качество вышли очень и очень хороши.

    Откуда растут ноги? Опыт работы с похожими изображениями мы получили, когда распознавали по стране данные сельскохозяйственной переписи. Тогда надо было разбирать рукописный шрифт: планшеты обходчикам дали только на следующей переписи. Плюс у нас есть лаборатория робототехники, где можно быстро собрать прототип любого устройства, которое только возникнет в наших воспалённых мозгах. Собственно, так и произошло. Мы загубили некоторое количество материалов, пока не подобрали правильную модель подъёма стола, долго ковырялись с лазерами, но нашли то что нужно.

    Ну и мы — интегратор большого размера, поэтому, когда пришли к одному из заказчиков и показали наш результат, к нам прислушались. И сэкономили.

    Вот три поколения наших сканеров и принципы работы:

    Сканер с верхним прижимом:

    Сканер с прижимом снизу:

    Сканер без прижима:


    Ссылки


    КРОК
    115,00
    №1 по ИТ-услугам в России
    Поделиться публикацией

    Комментарии 42

      +1
      Наши сканеры по сочетанию цена–эффект и цена–качество вышли очень и очень хороши.

      Ориентировочные цены?

      А сканеры, которые работают по принципу фотоаппарата, и умеют исправлять искажения, даже без лазерных меток, были уже 10 лет назад. И цена измерялась в десятках тысяч. Для больших объемов, это обычно проценты от общего бюджета.
        +2
        Подход к выравниванию без лазеров мы тоже рассматривали. Но он хорошо работает, когда необходимо сканировать небольшие книги с четкими контурами: использование лазеров/дальномеров улучшает качество выравнивания и переводит наше решение в статус промышленного устройства. Мы не говорим, что наши сканеры какие-то уникальные и ничего подобного раньше не было, просто мы создали свое, качественное и сбалансированное. Цены выгодно отличаются от конкурентов – это факт. Но на каждый случай требуется свой расчет стоимости, в зависимости от задач, которые сканер должен решать.
          +1
          Цены выгодно отличаются от конкурентов – это факт. Но на каждый случай требуется свой расчет стоимости, в зависимости от задач, которые сканер должен решать.
          Ну порядок-то можно озвучить? А то беглое гугление изобилует весьма бюджетными предложениями 1, 2, 3, которые умеют A3 и которые можно купить прям щас.

          Кроме того, в конечном варианте сканирование такое же медленное, как на видео? Там секунд 5 проходит, прежде чем можно переворачивать страницу. Я пользовал сканер в университетской библиотеке (понятия не имею, откуда он и сколько стоит) года 4 назад и он работал со скоростью фотоаппарата.
            0
            Уточняю: сканер из библиотеки, о котором я упомянул, стоит 10к EUR в рознице. Сканер автора, если верить комментарию стоил заказчикам не меньше 5k EUR.
            +2
            Но на каждый случай требуется свой расчет стоимости, в зависимости от задач, которые сканер должен решать.


            Вся суть бизнеса в России. Расчет варьируется от толщины кошелька заказчика.
              0
              Это вы видимо инженерное программное ПО не покупали, узнайте например стоимость Ansys или Siemens nx
            0
            Такая функция сейчас есть практически во всех фотоаппаратах среднего уровня. И она неплохо справляется с текстом. Но рисунки, графики и чертежи — глюкавит со страшной силой.
            Собственно в этом сама суть алгоритма — для распознавания ему необходимы символы одинаковых пропорций по всей площади документа.

            Чертёж может быть от сканирован фотиком с такой функцией, но прямых линий на нём не останется.
            /// ветхая документация — наше всё.
            +1
            А почему не класть книгу страницами вниз на два стёкла, стоящие под углом 45 градусов к горизонту и 90 градусов друг к другу (как два ската крыши деревенского дома)? А снизу фотографировать двумя камерами. Таким образом удастся получить максимум текста в районе переплёта.
              +5
              Книгу придётся каждый раз поднимать, чтобы перевернуть очередную страницу.
                0
                При таком подходе неудобно переворачивать страницы, для этого необходимо поднимать книгу, будет теряться драгоценное время и книга трепется куда больше от постоянного вращения. А заказчик борется за доли секунды на сканирование разворота. Существуют похожие варианты, когда есть колыбель, расположенная так, как Вы описали, а сверху на нее ложится книга страницами вверх, и уже затем сверху опускается прижимное стекло. Эта конструкция предназначена, прежде всего, для оцифровывания плохо раскрывающихся книг. По желанию заказчика можем реализовать и такой вариант.
                  0
                  Да, соглашусь, такой вариант намного лучше.
                  Я так понимаю борьба за доли секунды идёт из-за присутствия человека-листальщика, нельзя ли сделать листание тоже автоматическим?
                    0
                    Возможно сделать, есть такие решения. Книга кладется открытой под 90 градусов, страницами вверх. Не помню, прижимаются ли страницы. Потом фотографируются. Потом манипулятор переворачивает страницу, захвачивая ее присосками. Поищите www.google.com/search?q=book%20scanneer%20page%20turning — некоторые результаты довольно любопитны. Хотя для некоторых показаных решениях в наших реалиях дешевле и быстрее будет поставить человека переворачивать страниц.
                      0
                      Стоимость решений с автоматическим переворачиванием страниц сразу уходит в горные выси. При этом, как правило, они малоприменимы к ситуации с ветхими книгами, которым требуется бережное отношение
                      0
                      del
                        +1
                        А зачем вообще страницы переворачивать? Даёшь томографию и сканирование всей книги за раз в закрытом состоянии!
                        0
                        Было что то такое
                        habr.com/post/158457
                          0
                          Возможно потому что бОльше операций пользователю такой конструкции провести придётся.
                          –7

                          Но… зачем сканировать отдельные страницы? Сейчас же уже применяют сканеры, сканирующие книгу в закрытом состоянии, явно быстрее и проще

                            +11

                            Да и наличие книги таким сакнерам не обязательно.

                              0

                              Университетские прототипы сохраняющие разборчивость символов до 20стр

                                0
                                Вы наверное про эту статью? Но такой сканер, насколько я понял, неспособен, по крайней мере пока, отсканировать закрытую книгу в надлежащем качестве. Или эта технология шагнула вперед?
                                0
                                Очень не плохо. Особенно последний вариант. Но требует оператора для переворачивания страниц. Не пробовали переворачивать страницы манипулятором? Или вакуумной присоской?
                                  0
                                  Ответил на это чуть выше
                                  0
                                  Вы наверное про эту статью? Но такой сканер, насколько я понял, неспособен, по крайней мере пока, отсканировать закрытую книгу в надлежащем качестве. Или эта технология шагнула вперед?
                                    0
                                    Видел как-то в сети сканер, который и листал сам (
                                    Не этот, но похожий, и принцип действия тот же:
                                    www.youtube.com/watch?v=gjm6dBNlPug

                                    Годится только для книг в хорошем качестве, но таких большинство, а экономия времени — существенная.

                                    По ТЗ: сканеры чёрно-белые, поэтому можно просто отсечь длину волны лазера и получить отдельно канал с геометрией и канал с информацией из сканируемого документа.

                                    Цветные тоже можно сканировать, но придется делать два снимка — один страниц, один — сетки

                                      0
                                      Зазывалка в заголовке была про суды.
                                      Как пару раз отснявший арбитраж (томов по 12-15) скажу, что технических подходов как книге тем не действуют. Реально — места в комнате нет, идеально — 2 руки держат-листают-выпрямляют папки, две руки фоткают. с удовольствием еще бы две руки задействовали — пот стирать :).
                                      ИМХО то, что не учли авторы — это освещение. такие тени-контрасты бывают, что вообще нечитаемо.
                                        0
                                        Начал читать, не смотрел кто автор. Но как дошло до «мы предложили сами сделать сканер с блекджеком и лазером» — сразу понял, что пишет Крок)
                                          0
                                          Насколько я помню, в 2016г в суды были поставлены сканеры Optima-V. Насколько цена Оптимы отличается от вашей?
                                            0
                                            Наше решение стоит примерно на процентов 20-30 дешевле. Опять же все зависит от объема закупки, от необходимости доработок под какие-то специфичные запросы и других нюансов. Допускаю, что при каких-то раскладах стоимость может выровняться, только функционал у аппаратов будет разный. К примеру, ключевым отличием нашего сканера от Оптимы является не столько цена, сколько удобство использования (нет больших движущихся механизмов, интеллектуальное выравнивание и т.д.). Мы сразу понимаем, что и как можно доработать под проект, и обычно сразу обговариваем с заказчиком в том числе и нужные доработки. То есть как таковую просто коробку спрашивают крайне редко. Потому сравнивать цены за аппараты как на прилавке магазина немного неверно. Если есть интерес к конкретному расчету, под проект, пишите на почту (в конце поста есть), посчитаем.
                                            –2
                                            Я не хочу портить вам настроение…

                                            … Нет, я хочу.



                                            64 евро, весь Али завален. Версии как для A4, так и больше.
                                              0
                                              Нее, такое вы в «архивы, библиотеки, суды и другие структуры» не продадите.
                                                0
                                                Года два назад у меня в Росреестре сканили доки примерно таким сканером. Паспорт, выписки, договор… Быстро и нормально по качеству. Они загоняли в свою базу, мне на руки сканы не выдавали и не печатали. Но на экране вроде было норм.
                                                0
                                                Попал мне такой в руки пару лет назад, когда только появились. Вернул, сказав что даже самый дешевый сканер (стоит столько же, примерно) функциональнее. Лист проще центрируется, не врет по цветам (а у меня все лампочки «теплые»), не дает искажений перспективы, занимает меньше места. И ПО было так себе. По цене выигрывает только в формате А3 и более.

                                                P.S: Как же разочаровался, когда понял что сканер для корабликов, как мне сначала подумалось :)
                                                  0

                                                  Никогда, никогда не покупайте это. Поверьте, потраитившему 64 бакса. Начиная от уникального драйвера который идёт только на CD, заканчивая отвратительным софтом и дико убогим шумодавом при любом освещении.

                                                    –1
                                                    Спасибо.
                                                  0
                                                  Сканеры BookEye с вашим не пробовали сравнить? У нас на работе стоит, очень доволен и качеством и скоростью. Еще и пальцы удаляет, без которых «серединку» в толстой книге не распознать. Кстати говорят об этой пресловутой серединке, почему несколько камер под разными угламы не сделать? Тогда поидее будет еще проще выравнивание делать, так как сразу 3Д модель строится и мертвых зон нет.

                                                  П.С. Мне всетаки кажется, что дешевле и быстрее расшить книгу и прогнать обычным проточным сканером при таких огромных размерах тома. Да и сшить по новой тоже по-идее несложно и недорого.
                                                    0
                                                    Надо чтобы рука-робот переворачивала страницы. пока что уровень автоматизации меньше 50%
                                                      +1
                                                      Хм, я сейчас наверно глупый вопрос задам, но есть ли деструктивные сканеры? я имею ввиду что в процессе сканирования экземпляр книги просто разрушается (не до конца). Например, разбираем книгу на страницы и дальше уже в автоматическом режиме сканируем страницы залпом. можно даже организовать конвейер, человек разбирает переплет, а робот потом сканирует, по аналогии со счетными машинками в банкоматах. Мне кажется что у такого сканера скорость будет сильно выше.

                                                      P.S. на редких/ветких экземплярах явно не прокатит, но есть же и не редкие экземпляры.
                                                        0

                                                        так почти во всех больших офисных МФУ есть автоподача на сканер из пачки листов

                                                        +3
                                                        Прочитал «Сканер для судов», сначала не понял зачем на судне книжный сканер :)
                                                          0
                                                          какие преймущества это сканера над сканером от ATIZ? Я вижу, что ATIZ бережней работает с разворотами книг, и имеет приличную скорость со встроенной автоматической фокусировкой.
                                                            +1
                                                            Linear Book Scanner
                                                            Потомок Гугловского проекта по сканированию книг.
                                                            Делается из куска пластика, бытового пылесоса и простого планшетного сканера. Сам листает и сканирует книгу. Их есть довольно много версий, последние довольно быстрые и надежные

                                                            Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                                                            Самое читаемое