Я думаю, если ошибки такого рода будут единичными, то быстрее и проще сначала прогнать книгу через такой сканер, а потом исправить ошибки, чем сканировать всю книгу вручную.
Теоретически, его можно научить распознавать номера страниц, и после сканирования книги, он сможет выдать отчет о проделанной работе и о недостающих страницах в том числе. Конечно, если качество позволяет.
А при чем здесь гитхаб если проект опубликован на Google Code? Или я что-то не понял? Вот только ссылка должна вроде бы быть все же code.google.com/p/linear-book-scanner/
Совершенно безумный девайс — елозит книгой по направляющим, в одну из которых вмонтирован протяжный сканер.
А для перелистывания используется сепаратор, работающий как рубанок. Только снимает он не стружку, а «отделяет» страницу от блока. Если же «подсасывающий» поток не сможет полностью отделить страницу, то рубанок её вырвет, скорее всего…
Цена — это конечно важный критерия, но в данном случае — малоприменимый.
Во-первых, принцип «традиционного» книжного сканера позволяет реализовать его за те же 1,5к кустарным способом. На том же LegoMindstorms (совершенно угарный агрегат, взгляните — не пожалеете) и хорошем фотоаппарате.
А во-вторых, сканирование новых книг (которых «не жалко») всё равно неоправдано — копирайт или доступность электронной версии исходника. Значит в первую очередь буксканер должен рассчитываться на редкие книги, а здесь бережное отношение к поверхности листов — самое главное.
И, наконец, кто сказал, что девайс в продакшине будет стоить 1500 долларов? Любое полиграфическое оборудование дешёвым не бывает. Надёжность узлов, точность приводов, специальные роликовые покрытия, сканер, который сможет работать 24/7 лет 10 без выключения — вот Вам и 150 тысяч «набежит» легко.
Цену ЭЛАРобота указывают порядка 7.3млн рублей = 230тис. $. Устройство на порядок дороже, это не 1.5 тис$. Ведь суть данной презинтации не новизна, а именно дешевизна сканера.
Инженер Google разработал сверхбыстрый сканер — 1000 страниц за 90 минут