Comments 35
занимательно. Но так можно много страниц пропустить.
Ну можно добавить алгоритм пропущенных страниц (по номерам в углу или где-то еще), который будет в конце сканирования просить показать их еще.
Хотя, мне кажется, технология, основанная на человеческом факторе, выглядит немного странной.
Хотя, мне кажется, технология, основанная на человеческом факторе, выглядит немного странной.
да и ветхие документы не полистаешь
работал вот с такими несколько лет назад — около 2000 сканов/день

работал вот с такими несколько лет назад — около 2000 сканов/день

А вот такой аппарат умеет работать с ветхими экземплярами? elarobot.ru/
Да и сейчас выпускается значительное количество печатных изданий, которое вряд ли кто способен сканировать полностью, хотя бы на выполнение десятитысячной части этой задачи кто подрядился.
А на кой хрен сканировать то, что изначально в издательстве в электронном виде есть?
А на кой хрен сканировать то, что изначально в издательстве в электронном виде есть?
Ну надо же что-то изобретать и распиливать бюджет…
А если серьезно, то вроде как все книги защищены авторскими правами и правами издательств, так что такое сканирование — нарушение закона.
А если серьезно, то вроде как все книги защищены авторскими правами и правами издательств, так что такое сканирование — нарушение закона.
С чего вдруг сканирование — нарушение закона?
А глазами сканировать книжки-то ещё можно?
А глазами сканировать книжки-то ещё можно?
Провожу аналогию с вашими пунктами:
— копирование кассет/дисков;
— просмотр видео, прослушивание аудио.
Так понятнее?
— копирование кассет/дисков;
— просмотр видео, прослушивание аудио.
Так понятнее?
Сканирование (профессиональное) не нарушает законов т.к. делается по лиц.договору с правообладателем. Или обрабатываются книги на которые А.П. не распространяются
А вы уверены, что все официально?.. Я не спорю, что возможно оформить официальное сканирование (в таком случае легче даже оформить договор на получение электронной копии, чем покупать аппарат для сканирования и тратить кучу человеко-часов). Но… в нашей стране часто спрашивают разрешение?..
Относительно оборудования представленного выше — Эларовский сканер и это японское существо, да я уверен что там все официально. Такое оборудование проф.ориентировано именно на обработку большого объема книг. А большие объемы в черную и без договора никто не возьмется делать.
Покупать сканер за 16-17 тыс у.е. чтобы оцифровать книжки для саттелитов / выкладывания на шару, да даже и за деньги в инете / раздаче друзьям совершенно экономически невыгодно.
Пиратской оцифровкой занимаются в основном любители. И оборудование у них совершенно другое.
Покупать сканер за 16-17 тыс у.е. чтобы оцифровать книжки для саттелитов / выкладывания на шару, да даже и за деньги в инете / раздаче друзьям совершенно экономически невыгодно.
Пиратской оцифровкой занимаются в основном любители. И оборудование у них совершенно другое.
В этом мире много что ориентировано изначально на профессиональную сферу, а используется в пиратстве…
Смотря какой доход потом получат эти пираты. 16 тыс. у.е. не такие уж и большие деньги для нормального проекта. Зато не надо будет в ручную фотографировать или сканировать на обычном сканере (человеко-часы тоже стоят денег).
Про все остальное спорить не буду.
Смотря какой доход потом получат эти пираты. 16 тыс. у.е. не такие уж и большие деньги для нормального проекта. Зато не надо будет в ручную фотографировать или сканировать на обычном сканере (человеко-часы тоже стоят денег).
Про все остальное спорить не буду.
Ну молотком тоже можно и гвоздь забить и по голове кому нибудь настучать. В зависимости от «проекта» ;)
16k$ — разово, не считая обслуживания.
человеко-часов в любом случае много уйдет: пост обработка образа / индексация / распознавание / верстка и тп.
16k$ — разово, не считая обслуживания.
человеко-часов в любом случае много уйдет: пост обработка образа / индексация / распознавание / верстка и тп.
Не думаю, что такой аппарат нуждается в частом, многочасовом, квалифицированном обслуживании. Лампу поменять, линзу настроить — может любой человек с головой на плечах. Конечно если какие-то важные запчасти менять — то да.
Человеко-часы на обработку я не учитываю, т.к. она и там и тут будет примерно равной. Зато именно на этап съемки уйдет в разы, в десятки раз меньше человеко-часов. Плюс, если брать аппарат из топика, то там программа сама расправляет страницы, т.к. обработки вообще никакой не нужно.
Человеко-часы на обработку я не учитываю, т.к. она и там и тут будет примерно равной. Зато именно на этап съемки уйдет в разы, в десятки раз меньше человеко-часов. Плюс, если брать аппарат из топика, то там программа сама расправляет страницы, т.к. обработки вообще никакой не нужно.
если не ошибаюсь, новость не нова.
Я в своё время, когда школьником был и читать не очень любил, хотел научиться таким пролистыванием книги читать, чтобы бежать гулять :)
Значит сверхбыструю и создающую 3д снимок камеру изобрели, а переворачивают все равно руками? =)
Вспомнилось как №5 из «Короткого замыкания» инструкцию читал
а распознавалке совсем не обязательно идти в ногу со сканом.
Обычно при больших объемах оцифровки книг операторы работают раздельно:
1. первичная массовая оцифровка (одна группа)
2. обработка материалов и рескан брака (вторая группа, включается в работу во вторую смену, когда первая уже наработала материал).
Большинство книг кстати очень сложно быстро распознать ввиду того что в тексте встречаются сложные формулы, изображения.
Обычно при больших объемах оцифровки книг операторы работают раздельно:
1. первичная массовая оцифровка (одна группа)
2. обработка материалов и рескан брака (вторая группа, включается в работу во вторую смену, когда первая уже наработала материал).
Большинство книг кстати очень сложно быстро распознать ввиду того что в тексте встречаются сложные формулы, изображения.
я сейчас читаю «конец радуг», там как раз был эпизод, когда герой зашел в подвал библиотечный, а там в большой шредер (типа который ветки измельчать может) книжки бросают
оказалось — цифруют: шредер измельчает книжку на кусочки, которые, пролетая в трубе, фотографируются кучей камер, цифруются, а потом быстрые компьютеры (которые настолько быстрые, что им делать нечего уже) складывают пазл из кусочков в картинку исходной страницы, которая распознается в текст
а чего, красивая идея :)
оказалось — цифруют: шредер измельчает книжку на кусочки, которые, пролетая в трубе, фотографируются кучей камер, цифруются, а потом быстрые компьютеры (которые настолько быстрые, что им делать нечего уже) складывают пазл из кусочков в картинку исходной страницы, которая распознается в текст
а чего, красивая идея :)
да, у японцев прототипы не то что наши телефоны с наклейками:)
В промышленных масштабах не проще-ли срезать переплет у книги и сканировать как стопку бумаги уже существующими сканерами и потом прогонять через уже существующие OCR?
Sign up to leave a comment.
Японцы представили прототип самого быстрого сканера книг