Да и сейчас выпускается значительное количество печатных изданий, которое вряд ли кто способен сканировать полностью, хотя бы на выполнение десятитысячной части этой задачи кто подрядился.
А на кой хрен сканировать то, что изначально в издательстве в электронном виде есть?
Сканирование (профессиональное) не нарушает законов т.к. делается по лиц.договору с правообладателем. Или обрабатываются книги на которые А.П. не распространяются
А вы уверены, что все официально?.. Я не спорю, что возможно оформить официальное сканирование (в таком случае легче даже оформить договор на получение электронной копии, чем покупать аппарат для сканирования и тратить кучу человеко-часов). Но… в нашей стране часто спрашивают разрешение?..
Относительно оборудования представленного выше — Эларовский сканер и это японское существо, да я уверен что там все официально. Такое оборудование проф.ориентировано именно на обработку большого объема книг. А большие объемы в черную и без договора никто не возьмется делать.
Покупать сканер за 16-17 тыс у.е. чтобы оцифровать книжки для саттелитов / выкладывания на шару, да даже и за деньги в инете / раздаче друзьям совершенно экономически невыгодно.
Пиратской оцифровкой занимаются в основном любители. И оборудование у них совершенно другое.
В этом мире много что ориентировано изначально на профессиональную сферу, а используется в пиратстве…
Смотря какой доход потом получат эти пираты. 16 тыс. у.е. не такие уж и большие деньги для нормального проекта. Зато не надо будет в ручную фотографировать или сканировать на обычном сканере (человеко-часы тоже стоят денег).
Не думаю, что такой аппарат нуждается в частом, многочасовом, квалифицированном обслуживании. Лампу поменять, линзу настроить — может любой человек с головой на плечах. Конечно если какие-то важные запчасти менять — то да.
Человеко-часы на обработку я не учитываю, т.к. она и там и тут будет примерно равной. Зато именно на этап съемки уйдет в разы, в десятки раз меньше человеко-часов. Плюс, если брать аппарат из топика, то там программа сама расправляет страницы, т.к. обработки вообще никакой не нужно.
Ну да, наверно. Учитывая какой объектив там стоит… Он один обойдется недешево. Плюс ПО, на сколько я понимаю, идет в связке с аппаратом и отделять его было бы не разумно.
а распознавалке совсем не обязательно идти в ногу со сканом.
Обычно при больших объемах оцифровки книг операторы работают раздельно:
1. первичная массовая оцифровка (одна группа)
2. обработка материалов и рескан брака (вторая группа, включается в работу во вторую смену, когда первая уже наработала материал).
Большинство книг кстати очень сложно быстро распознать ввиду того что в тексте встречаются сложные формулы, изображения.
я сейчас читаю «конец радуг», там как раз был эпизод, когда герой зашел в подвал библиотечный, а там в большой шредер (типа который ветки измельчать может) книжки бросают
оказалось — цифруют: шредер измельчает книжку на кусочки, которые, пролетая в трубе, фотографируются кучей камер, цифруются, а потом быстрые компьютеры (которые настолько быстрые, что им делать нечего уже) складывают пазл из кусочков в картинку исходной страницы, которая распознается в текст
В промышленных масштабах не проще-ли срезать переплет у книги и сканировать как стопку бумаги уже существующими сканерами и потом прогонять через уже существующие OCR?
Японцы представили прототип самого быстрого сканера книг