Я в своей жизни несколько десятков книг сканировал — я могу сказать, что вот эта штука, которой надо вручную листать — это пол-дела в сканировании. Потому что одно дело листать, а другое дело поднимать книгу, листать, и класть назад на сканер в растопырку кверху обложкой.
Технология не нова. Лет 10 назад читал, как в Гугле решили оцифровать книги. Именно с построением подобного устройства. Так у них еще использовалось перелистывание страниц с помощью пылесоса.
Для постобработки снимков порекомендую бесплатную программку Scan Tailor. Режет двойные страницы пополам, выравнивает ориентацию и наклоны, делает кроп полезных областей и все автоматом.
Умеет даже поплывшие строки ровнять.
Я в свое время ScanKromsator'ом обрабатывал… программа навороченная, но запутанная (т.к. делалась по сути «на коленке» и фичи добавлялись бессистемно), и автор так и не выложил исходники в паблик. Как я понимаю, по этой причине и был создан проект ScanTailor.
Пару лет во время подачи документов на конкурс распробовал CamScaner под Android на своем LenovoP770. По пути, в машине, на месте пассажира «отфотосканировал» все 10 листов заявки и послал pdf по почте, заявку приняли. А в бумаге не успел привезти — была пробка. Был приятно удивлен и теперь частенько пользуюсь, лень ходить к дуплексному сканеру.
Периодически приходится оцифровывать книги советского периода. В последнее время для книг, не содержащих иллюстраций, отказался от сканеров. просто снимаю разворот мобильным. Прихватываю грузиками поля книг, страницы, чтоб не раскрывать книгу на 180 градусов, получаются изрядной кривизны. После окончания процесса перегоняю фото на ноут, где скармливаю их батчем ФайнРидеру и иду пить кофе.
Моя статистика:
Среднее время на съемку одного разворота: 6 секунд(10 страниц в минуту)
Процент брака:
— подправить поля — 1-5%(в зависимости от кривизны страниц)
— переснять страницу — 0.5%(иногда бывает нефокус или дергаю камеру раньше времени)
— пробежать в Ворде по ошибкам орфографии — 30-60 минут на книгу.
Книжный сканер своими руками