marks Sep 15 2010 at 14:33

Японцы представили прототип самого быстрого сканера книг

2 min

1.6K

High performance *

+24

Comments 35

UFO landed and left these words here

bondbig Sep 15 2010 at 15:23

занимательно. Но так можно много страниц пропустить.

UFO landed and left these words here

SmartBye Sep 15 2010 at 16:19

Ну можно добавить алгоритм пропущенных страниц (по номерам в углу или где-то еще), который будет в конце сканирования просить показать их еще.

Хотя, мне кажется, технология, основанная на человеческом факторе, выглядит немного странной.

AlexFadeev Sep 15 2010 at 17:06

Ну вообще можно использовать и такую личталку, которая деньги считает…

dioneo Sep 15 2010 at 21:29

Ну или МРТ, КТ, ПЭТ :)

pavelpromin Sep 15 2010 at 16:24

да и ветхие документы не полистаешь
работал вот с такими несколько лет назад — около 2000 сканов/день

alexxz Sep 16 2010 at 09:22

А вот такой аппарат умеет работать с ветхими экземплярами? elarobot.ru/

kawabunga Sep 15 2010 at 20:34

Да и сейчас выпускается значительное количество печатных изданий, которое вряд ли кто способен сканировать полностью, хотя бы на выполнение десятитысячной части этой задачи кто подрядился.

А на кой хрен сканировать то, что изначально в издательстве в электронном виде есть?

Svobodniy Sep 16 2010 at 05:30

Ну надо же что-то изобретать и распиливать бюджет…

А если серьезно, то вроде как все книги защищены авторскими правами и правами издательств, так что такое сканирование — нарушение закона.

Yareactor Sep 16 2010 at 05:51

С чего вдруг сканирование — нарушение закона?
А глазами сканировать книжки-то ещё можно?

Svobodniy Sep 16 2010 at 06:05

Провожу аналогию с вашими пунктами:
— копирование кассет/дисков;
— просмотр видео, прослушивание аудио.

Так понятнее?

Yareactor Sep 16 2010 at 07:23

Мне понятно, что вы путаетесь.

Я сколько угодно могу снимать видеокамерой изображение с телевизора у себя дома.
Может, это фетиш такой — снимать на камеру телевизор.

А вот если я решу этот камрип распространить — тогда это будет незаконно.

Svobodniy Sep 16 2010 at 08:43

Законч читайте, больше нечего сказать. А уж как вы поступаете — это ваши тараканы.

Yareactor Sep 16 2010 at 10:17

Процитируйте закон, если не сложно.
Возможно, у вас он какой-то другой, и тогда я ошибаюсь.

atrian Sep 16 2010 at 06:05

Сканирование (профессиональное) не нарушает законов т.к. делается по лиц.договору с правообладателем. Или обрабатываются книги на которые А.П. не распространяются

Svobodniy Sep 16 2010 at 06:17

А вы уверены, что все официально?.. Я не спорю, что возможно оформить официальное сканирование (в таком случае легче даже оформить договор на получение электронной копии, чем покупать аппарат для сканирования и тратить кучу человеко-часов). Но… в нашей стране часто спрашивают разрешение?..

atrian Sep 16 2010 at 06:24

Относительно оборудования представленного выше — Эларовский сканер и это японское существо, да я уверен что там все официально. Такое оборудование проф.ориентировано именно на обработку большого объема книг. А большие объемы в черную и без договора никто не возьмется делать.

Покупать сканер за 16-17 тыс у.е. чтобы оцифровать книжки для саттелитов / выкладывания на шару, да даже и за деньги в инете / раздаче друзьям совершенно экономически невыгодно.

Пиратской оцифровкой занимаются в основном любители. И оборудование у них совершенно другое.

Svobodniy Sep 16 2010 at 06:29

В этом мире много что ориентировано изначально на профессиональную сферу, а используется в пиратстве…

Смотря какой доход потом получат эти пираты. 16 тыс. у.е. не такие уж и большие деньги для нормального проекта. Зато не надо будет в ручную фотографировать или сканировать на обычном сканере (человеко-часы тоже стоят денег).

Про все остальное спорить не буду.

atrian Sep 16 2010 at 06:34

Ну молотком тоже можно и гвоздь забить и по голове кому нибудь настучать. В зависимости от «проекта» ;)

16k$ — разово, не считая обслуживания.
человеко-часов в любом случае много уйдет: пост обработка образа / индексация / распознавание / верстка и тп.

Svobodniy Sep 16 2010 at 06:45

Не думаю, что такой аппарат нуждается в частом, многочасовом, квалифицированном обслуживании. Лампу поменять, линзу настроить — может любой человек с головой на плечах. Конечно если какие-то важные запчасти менять — то да.

Человеко-часы на обработку я не учитываю, т.к. она и там и тут будет примерно равной. Зато именно на этап съемки уйдет в разы, в десятки раз меньше человеко-часов. Плюс, если брать аппарат из топика, то там программа сама расправляет страницы, т.к. обработки вообще никакой не нужно.

atrian Sep 16 2010 at 06:47

аппарат из топика я думаю _много_ больше 16k стоит…
+ пока как я понимаю это лишь прототип и появится на рынке еще не скоро.

Svobodniy Sep 16 2010 at 07:00

Ну да, наверно. Учитывая какой объектив там стоит… Он один обойдется недешево. Плюс ПО, на сколько я понимаю, идет в связке с аппаратом и отделять его было бы не разумно.

man_without_face Sep 15 2010 at 20:45

если не ошибаюсь, новость не нова.

amlet Sep 15 2010 at 22:04

Я в своё время, когда школьником был и читать не очень любил, хотел научиться таким пролистыванием книги читать, чтобы бежать гулять :)

litos Sep 16 2010 at 01:00

А мне очень не хватало поиска по бумажной книге. Я хотел по ней научиться гуглить, хотя в те годы и слова такого не было, равно как и интернета :)

kinitko Sep 16 2010 at 02:31

Значит сверхбыструю и создающую 3д снимок камеру изобрели, а переворачивают все равно руками? =)

ssve Sep 16 2010 at 04:41

Вспомнилось как №5 из «Короткого замыкания» инструкцию читал

kost Sep 16 2010 at 07:59

Не инструкцию, а все книги в доме.

UFO landed and left these words here

atrian Sep 16 2010 at 05:33

а распознавалке совсем не обязательно идти в ногу со сканом.
Обычно при больших объемах оцифровки книг операторы работают раздельно:
1. первичная массовая оцифровка (одна группа)
2. обработка материалов и рескан брака (вторая группа, включается в работу во вторую смену, когда первая уже наработала материал).

Большинство книг кстати очень сложно быстро распознать ввиду того что в тексте встречаются сложные формулы, изображения.

fat_hamster Sep 16 2010 at 07:12

я сейчас читаю «конец радуг», там как раз был эпизод, когда герой зашел в подвал библиотечный, а там в большой шредер (типа который ветки измельчать может) книжки бросают

оказалось — цифруют: шредер измельчает книжку на кусочки, которые, пролетая в трубе, фотографируются кучей камер, цифруются, а потом быстрые компьютеры (которые настолько быстрые, что им делать нечего уже) складывают пазл из кусочков в картинку исходной страницы, которая распознается в текст

а чего, красивая идея :)

EiZeRR Sep 16 2010 at 07:13

да, у японцев прототипы не то что наши телефоны с наклейками:)

Leonov Sep 16 2010 at 12:43

В промышленных масштабах не проще-ли срезать переплет у книги и сканировать как стопку бумаги уже существующими сканерами и потом прогонять через уже существующие OCR?