Pull to refresh
  • by relevance
  • by date
  • by rating

Microsoft прекращает сканирование книг

Lumber room
Компания Microsoft заявила, что после полутора лет работы сворачивает проекты по сканированию книг и журналов. В то же время аналогичный проект от Google продолжает идти полным ходом, так что вывод здесь можно сделать только один: Microsoft просто не выдержала конкуренции.

Новость о заморозке сервисов Live Search Books и Live Search Academic пришла спустя несколько дней после того, как Microsoft официально заявила, что сфокусируется на некоторых конкретных областях интернет-поиска, в которых она может конкурировать с Google. Очевидно, что полнотекстовый поиск по книгам не относиться к таким областям. Вряд ли такой сервис можно легко монетизировать, тем более затраты на сканирование очень высоки. В принципе, это довольно специфическая область поиска, число пользователей которой ограничивается библиотекарями, исследователями, наиболее пытливыми студентами и проч. Однако эксперты подчёркивают, что именно такие люди относятся к числу “early adopters” и оказывают большое влияние на общую массу юзеров.

И Google, и Microsoft занимались сканированием старых книг и журналов, которые уже стали всенародным достоянием в силу давности. Кроме того, Google без разрешения сканирует защищённые копирайтом работы и выдаёт по поисковым запросам небольшие цитаты из этих книг, что не противоречит закону об авторском и смежных правах, хотя и вызывает ярость книгоиздателей.
Читать дальше →
Total votes 32: ↑26 and ↓6 +20
Views 237
Comments 19

Инфракрасная подсветка для OCR

IT-companies
Как известно, Google поставила перед собой отсканировать, распознать и проиндексировать все бумажные книги в мире, то есть всё знание человечества. Однако в реальности этот процесс продвигается не так быстро, как хотелось бы. Самый трудный этап — нормальное распознавание текста. Для программы OCR нужно чёткое изображение страницы без искажений. Все строчки на странице должны быть идеально ровными. На практике же книгу невозможно прижать к сканеру (во многих случаях страницы книги вообще нельзя трогать). Как бы то ни было, возникают характерные искривления по краям страниц. С ними борются программными методами, с разной степенью успешности.

Однако, компания Google придумала, как можно аппаратным способом помочь в решении этой проблемы. На прошлой неделе они получили патент на применение инфракрасных сенсоров при сканировании книг (патент США № 7508978). Суть идеи в том, что инфракрасная сетка позволяет составить трёхмерную модель искривления страницы, так что программа для выравнивания изображения получает чёткие координаты, как нужно преобразовать картинку.



New Scientist
Total votes 36: ↑34 and ↓2 +32
Views 763
Comments 34

Оцифровка библиотечных фондов окупается за 50 лет

Gadgets
Британские университеты Лидса, Шеффилда и Йорка объединили усилия для масштабного проекта LIFE-SHARE по исследованию различных вариантов долговременного хранения документов. Очевидно, что самым выгодным является сканирование книг и хранение их в цифровом виде. Но важно иметь цифры в доказательство этого предположения.

Исследование показало, что стоимость оцифровки высока, но эти затраты окупаются сравнительно быстро: уже через 50 лет. При этом самым выгодным вариантом является деструктивное сканирование книг своими силами. На отрезке в 250 лет деструктивное сканирование оказывается примерно в 4,5 раза выгоднее, чем хранение бумажных оригиналов.
Читать дальше →
Total votes 10: ↑5 and ↓5 0
Views 889
Comments 8

Аналитика по российскому рынку книжных сканеров

ALEE Software corporate blog
Sandbox
Вот уже пол года как я работаю стажером-маркетологом в ИТ-компании, занимающейся промышленным сканированием. Одна из поставленных передо мной глобальных задач заключалась в изучении российского рынка оборудования, предназначенного для сканирования сшитых документов. Погружаясь в проблему, я не смог найти в рунете каких-либо сводных и аналитических статей по этой теме, соответственно все пришлось собирать по крупицам. В итоге я бы хотел с вами поделиться тем материалом, который у меня накопился в процессе работы. Надеюсь, что собранный материал будет полезен читателям хабра.
Читать дальше →
Total votes 21: ↑21 and ↓0 +21
Views 29K
Comments 5

Гильдия авторов отказалась от иска к библиотекам за сканирование книг

Copyright
Вот уже несколько лет Гильдия авторов США (Authors Guild) пытается добиться от университетских библиотек выплаты лицензионных отчислений за то, что они сканируют книги и предоставляют доступ к контенту в цифровом виде. Судебный иск подан против организации Hathitrust, которая возглавляет проект сканирования книг в интересах ряда библиотек, пишет Techdirt.

Ещё в 2012 году окружной суд вынес вердикт, что действия Hathitrust являются очевидным примером добросовестного использования (fair use), а в июне 2014 года апелляционный суд подтвердил это решение.

Теперь Гильдия авторов, наконец, фактически признала своё поражение. В суд подано мировое соглашение, в котором сообщается об отказе от претензий.
Читать дальше →
Total votes 17: ↑16 and ↓1 +15
Views 6.8K
Comments 1

Руководство по выбору сканера для дома и офиса

Epson corporate blog Computer hardware Periphery
Мы решили учесть все комментарии, полученные после публикации предыдущего поста, и опубликовать версию 2.0, улучшенную и дополненную. Благодарим всех, кто помог сделать пост лучше! (Предыдущий пост удалять не будем для тех, кто уже добавил его себе в избранное, но добавим ссылку на новую версию)


К нашей службе техподдержки довольно часто обращаются за помощью в выборе сканера. На рынке можно найти самые разные типы сканеров: сканер изображений, штрих-кода, кинопленки, биометрический сканер сетчатки глаза или отпечатков пальцев и т.д… Мы решили пролить свет на этот вопрос и в первом посте по этой теме вкратце расскажем, чем вообще отличаются сканеры документов, которые, в частности компания Epson предлагает для дома и офиса, и какие технологии в них используются.

Принтер со сканером или отдельный сканер?



Перевести документ в электронную форму можно, воспользовавшись сканером, установленным в МФУ (многофункциональном принтере со встроенным сканером и копиром) или отдельным устройством – планшетным или потоковым.

При ограниченном бюджете удобнее рассмотреть вариант покупки МФУ. Сканеры в таких устройствах немного проигрывают по скорости сканирования и качеству получаемого изображения отдельным сканерам.

Если же вы планируете переводить в архив большие объемы документов (например, в офисе или отделе бухгалтерии) или вам крайне важно высокое качество отсканированных материалов (для перевода аналоговых фото и пленки в электронный формат), рекомендуем обратить внимание на отдельное сканирующее устройство. Рассмотрим, почему это так.
Читать дальше →
Total votes 9: ↑9 and ↓0 +9
Views 42K
Comments 19