Pull to refresh

Comments 35

UFO just landed and posted this here
занимательно. Но так можно много страниц пропустить.
UFO just landed and posted this here
Ну можно добавить алгоритм пропущенных страниц (по номерам в углу или где-то еще), который будет в конце сканирования просить показать их еще.

Хотя, мне кажется, технология, основанная на человеческом факторе, выглядит немного странной.
Ну вообще можно использовать и такую личталку, которая деньги считает…
да и ветхие документы не полистаешь
работал вот с такими несколько лет назад — около 2000 сканов/день
А вот такой аппарат умеет работать с ветхими экземплярами? elarobot.ru/
Да и сейчас выпускается значительное количество печатных изданий, которое вряд ли кто способен сканировать полностью, хотя бы на выполнение десятитысячной части этой задачи кто подрядился.

А на кой хрен сканировать то, что изначально в издательстве в электронном виде есть?
Ну надо же что-то изобретать и распиливать бюджет…

А если серьезно, то вроде как все книги защищены авторскими правами и правами издательств, так что такое сканирование — нарушение закона.
С чего вдруг сканирование — нарушение закона?
А глазами сканировать книжки-то ещё можно?
Провожу аналогию с вашими пунктами:
— копирование кассет/дисков;
— просмотр видео, прослушивание аудио.

Так понятнее?
Мне понятно, что вы путаетесь.

Я сколько угодно могу снимать видеокамерой изображение с телевизора у себя дома.
Может, это фетиш такой — снимать на камеру телевизор.

А вот если я решу этот камрип распространить — тогда это будет незаконно.
Законч читайте, больше нечего сказать. А уж как вы поступаете — это ваши тараканы.
Процитируйте закон, если не сложно.
Возможно, у вас он какой-то другой, и тогда я ошибаюсь.
Сканирование (профессиональное) не нарушает законов т.к. делается по лиц.договору с правообладателем. Или обрабатываются книги на которые А.П. не распространяются
А вы уверены, что все официально?.. Я не спорю, что возможно оформить официальное сканирование (в таком случае легче даже оформить договор на получение электронной копии, чем покупать аппарат для сканирования и тратить кучу человеко-часов). Но… в нашей стране часто спрашивают разрешение?..
Относительно оборудования представленного выше — Эларовский сканер и это японское существо, да я уверен что там все официально. Такое оборудование проф.ориентировано именно на обработку большого объема книг. А большие объемы в черную и без договора никто не возьмется делать.

Покупать сканер за 16-17 тыс у.е. чтобы оцифровать книжки для саттелитов / выкладывания на шару, да даже и за деньги в инете / раздаче друзьям совершенно экономически невыгодно.

Пиратской оцифровкой занимаются в основном любители. И оборудование у них совершенно другое.
В этом мире много что ориентировано изначально на профессиональную сферу, а используется в пиратстве…

Смотря какой доход потом получат эти пираты. 16 тыс. у.е. не такие уж и большие деньги для нормального проекта. Зато не надо будет в ручную фотографировать или сканировать на обычном сканере (человеко-часы тоже стоят денег).

Про все остальное спорить не буду.
Ну молотком тоже можно и гвоздь забить и по голове кому нибудь настучать. В зависимости от «проекта» ;)

16k$ — разово, не считая обслуживания.
человеко-часов в любом случае много уйдет: пост обработка образа / индексация / распознавание / верстка и тп.
Не думаю, что такой аппарат нуждается в частом, многочасовом, квалифицированном обслуживании. Лампу поменять, линзу настроить — может любой человек с головой на плечах. Конечно если какие-то важные запчасти менять — то да.

Человеко-часы на обработку я не учитываю, т.к. она и там и тут будет примерно равной. Зато именно на этап съемки уйдет в разы, в десятки раз меньше человеко-часов. Плюс, если брать аппарат из топика, то там программа сама расправляет страницы, т.к. обработки вообще никакой не нужно.
аппарат из топика я думаю _много_ больше 16k стоит…
+ пока как я понимаю это лишь прототип и появится на рынке еще не скоро.
Ну да, наверно. Учитывая какой объектив там стоит… Он один обойдется недешево. Плюс ПО, на сколько я понимаю, идет в связке с аппаратом и отделять его было бы не разумно.
Я в своё время, когда школьником был и читать не очень любил, хотел научиться таким пролистыванием книги читать, чтобы бежать гулять :)
А мне очень не хватало поиска по бумажной книге. Я хотел по ней научиться гуглить, хотя в те годы и слова такого не было, равно как и интернета :)
Значит сверхбыструю и создающую 3д снимок камеру изобрели, а переворачивают все равно руками? =)
Вспомнилось как №5 из «Короткого замыкания» инструкцию читал
Не инструкцию, а все книги в доме.
UFO just landed and posted this here
UFO just landed and posted this here
а распознавалке совсем не обязательно идти в ногу со сканом.
Обычно при больших объемах оцифровки книг операторы работают раздельно:
1. первичная массовая оцифровка (одна группа)
2. обработка материалов и рескан брака (вторая группа, включается в работу во вторую смену, когда первая уже наработала материал).

Большинство книг кстати очень сложно быстро распознать ввиду того что в тексте встречаются сложные формулы, изображения.
я сейчас читаю «конец радуг», там как раз был эпизод, когда герой зашел в подвал библиотечный, а там в большой шредер (типа который ветки измельчать может) книжки бросают

оказалось — цифруют: шредер измельчает книжку на кусочки, которые, пролетая в трубе, фотографируются кучей камер, цифруются, а потом быстрые компьютеры (которые настолько быстрые, что им делать нечего уже) складывают пазл из кусочков в картинку исходной страницы, которая распознается в текст

а чего, красивая идея :)
да, у японцев прототипы не то что наши телефоны с наклейками:)
В промышленных масштабах не проще-ли срезать переплет у книги и сканировать как стопку бумаги уже существующими сканерами и потом прогонять через уже существующие OCR?
Sign up to leave a comment.

Articles