Pull to refresh

Comments 59

А казалось бы, что не так уж много денег нужно на оцифровку.
Такие пожары просто так не случаются.
Поставили минус в карму и за комментарий. У поджигателя припекло что ли?
Это нормально, тут периодически кто-то устраивает набеги беспричинные :)
Хорошее место в хорошем районе Москвы. Так что — все может быть. Но правду мы вряд ли узнаем.
Самое забавное, что правка в википедии по поводу пожара появилась чуть ли не раньше, чем поступил вызов в пожарную.
Ну, учитывая какой электротехнической кунст-камерой являются гораздо более финансируемые государственные учреждения это могла быть и проводка.
451 градус по Фаренгейту?
Да, под шумок можно списать все, что угодно.Поди потом разберись, что сгорело, что пропало!
Краткое содержание поста по ссылке:

Описывается опыт посещения библиотеки год назад.
Они замуровали главный вход. Они приходят на работу в 11 и уходят раньше 16 часов. Они работают на компе одним пальцем. Заявку нужно писать по копирку, повторно указывать сведения о себе. В зале всего 4 читателя. мало где включён свет — экономят. Не реагируют на телефонные обращения. Нет туалетной бумаги. Внутри института нет единой базы данных, каждый библиотекарь записывает читателей в свою тетрадку. Сервер выключается когда из комнаты уходит последний сотрудник. Протестуют против реформы РАН.

Резюме: хуже быть уже не может, нужно всё рушить и строить заново
Подтверждаю, лет 10 назад там было примерно тоже, только посетителей побольше.
Собственно, в 90% институтов РАН сейчас можно наблюдать весьма похожую картину.
Рушить у нас умеют, а кто строить будет?
Разве так дорого было нанять студента-фотолюбителя с зеркалкой или даже мыльницей, штативом и листом оргстекла и посадить просто фотографировать страницы книг? И найти программку для группового сжатия фотографий или перепаковки в определённый стандарт (простейший случай — пережимать Paint'ом в jpeg). Быстро, просто, эффективно и достаточно качественно, чтобы читать текст. Работая месяц за месяцем, можно было оцифровать немало. Есть вроде и автоматы для оцифровки, которые сами переворачивают страницы, но это может быть уже дорого.
Это не оцифровка, а фотокопия. Которую надо где-то хранить. Желательно, не в jpg, а в чём-то более качественном. Нужно иметь доступ к отснятым материалам как работникам, так и посетителям. Целая система, как мне кажется. И оно стоит больших денег, чем просто оплата свободного времени студента.
Ну понятно, что если делать как положено — оно выйдет дорого. Лучше всё же делать на таком самопальном уровне, чем не делать вообще. Хотя бы фотик с JPEG, пэйнт для сжатия и расшаренный как FTP RAID на пару винтов в качестве хранилища… Дешевле некуда, но пользоваться этим уже можно.
Как пишут в статье выше, они там на электричестве экономят. Сомневаюсь, что есть хотя бы доступ к интернету, не говоря уже о FTP или RAID.
Вы недооцениваете масштаб необходимых работ. Вам кажется чего тут — щелкнул, сконвертировал и выложил… сотня страниц — это конечно легко.
Но счет идет на многие миллионы страниц. это десятки лет безостановочной работы целого коллектива фотографов. И парой винтов уже не обойдешься.
UFO just landed and posted this here
Чтобы начать нужна ясная конечная цель, а не «вы тут начинайте а дальше видно будет».
Не могу сказать подробности, но у нас в Иркутской библиотеке Гос.Университета что-то такое одно время было. Сидел студент и фортал нужные книги. Сейчас, вроде, сканируют потихоньку. На счет того, распознают текст или нет не знаю, но все же даже наличие картинки — это уже огромный плюс — распознать всегда успеют, а вот сделать цифровую копию можно и не успеть.
UFO just landed and posted this here
Понимаю, объём большой… Но с другой стороны а) наверняка многие книги есть в других библиотеках или вовсе уже оцифрованы, можно цифровать только уникальные. б) можно начать с наиболее редких и старинных, тогда при пожаре ущерб был бы не таким грустным.

Был бы я библиотекарем — возможно, даже на энтузиазме бы потихоньку этим занимался.
Может быть и дорого, но при наличии в России такой компании, как ABBYY, можно было бы и договориться. А сканеров, которые в автоматическом режиме развивают скорость до 250стр/мин уже есть не мало. Вопрос в другом — а вообще какие-то работы велись в этом направлении? Видимо, нет.
В оцифровке книг есть 2 варианта ведения работ:
1) Расшить книгу и прогнать через поточный сканер, тогда да, можно и 250 страниц в минуту сделать. Но все равно для этого потребуется хороший поточник с ценой от 100 000 руб. Естественно для книг старых, ветхих или редких такой способ не работает.
2) Книжные сканеры. Они сканируют книги либо с помощью фотокамер, либо с помощью матриц. Скорость обычно около 600-800 страниц в час. Причем даже эта цифра не всегда достижима и не вклчюает в себя обработку изображений\сборку в PDF и так далее. Книжные сканеры бывают ручными и автоматическими. Стоимость ручных начинается от 500 000 руб. Автоматических — от 3 000 000. Цены примерные, но представление о ситуации дают.

Сканеры, делающие 250 страниц в минуту в автоматическом режиме, если я не ошибаюсь, не очень бережно относятся к страницам книг. Плюс стоят достаточно много. Библиотекари, при всем заверении продавцов, не дают автоматическим книжным сканерам ветхие книги, ведь если такую книгу 17 века сканер испортит, то отвечать будет библиотекарь, а не производитель.

На саму оцифровку так-же накладывается много ограничений, связанных с авторским правом. Таким образом «просто договориться» не получается.
если мы говорим о портативных книжных сканерах до А3, то их цена начинается от 17000. Качество такого сканирования может вызывать сомнения, но вот начальная цена вполне определенна.
UFO just landed and posted this here
Мы же говорим о недорогих портативных сканерах, они непосредственно к бумаге не прикасаются, информация снимается через фотографирование с распознавание. Тут скорее вопрос в качестве сканирования, распознавания, и аккуратности сканирующего. Ну и вопрос с объемом работ — очень актуален будет при таком подходе.
Не соприкасаются не значит что не портят книгу. Необходимый для фотографирования свет, и тот уже вред книге наносит… а страницы переворачивать, тоже бесконтактно?
и аккуратности сканирующего

В целом разговор идет о том, что если нет денег на большое и масштабное промышленное решение — можно организовать студентов-энтузиастов. И хоть какая-то оцифровка будет лучше, чем никакой+пожар.
Бюрократия-с. Не сотрудник — нет доступа.
UFO just landed and posted this here
>По поводу книг. В первую очередь ценна информация из них. А уже потом их уникальность и историческая ценность.
Если информация не ценна — что они делают в библиотеке?

Не скажите. А как же первая отпечатанная книга в стране? Или первая книга по определенной технологии? Как правило печаталась же Библия, в ней особо новой информации не будет. Потому книга может быть не менее важна, как и сама информация.
Я полностью за оцифровку, но технология должна быть щадящей.
Любой известный image viewer умеет массовый ресайз/изменение формата. Можно в Lightroom быстро и удобно откадрировать изображение.
Очень дорого выйдет. Зеркалка ценой под килобакс и ресурсом около 30 тысяч снимков — это только расходы на одну зеркалку. А студенту еще какой-то профит с этого нужен.
ресурсы там уже давно от 100к начинаются, а по факту ходит оно сколько влезет (либо врожденный брак и сдохнет в первые тысячи, либо уже при многократном перебеге за официальный ресурс).
но не нужна тут зеркалка, БЗК или вообще приличное мыло — самое то. главное чтоб света было много и нормального.

главное — найти кого-то, кому будет не лень этим заниматься за обозначеный прайс.
От 100К начинаются ресурсы у профессиональных «тушек». У любительских затворы столько могут ходить, но это если повезет, либо если в данную модель ставили затвор от профессионального или полупро аппарата. Понятно, что цифра статистическая и как повезет. Но преувеличивать ресурс на основании того, что пишут «у меня была D40, отстрелявшая полмиллиона кадров, я ее продал, так как мегапукселей не хватало».
у профессиональных сейчас 300-400, а сотка — это вполне себе любительские камеры уровня Nikon D7x00
А еще надо объяснить руководству, что сервера с данными лучше ставить не в том же здании библиотеки, что тоже стоит денег. Чтобы не читать потом заголовки: Пожар повредил 15% фондов научной библиотеки ИНИОН в Москве. Так же сгорели все резервные цифровые копии, которые находились в том же здании.

Но в целом согласен: печально что денег на это не выделяется и лучше иметь хоть какую-то систему резервного копирования чем вообще никакой.
>>простейший случай — пережимать Paint'ом в jpeg

Тексты только в PNG.
Это если идеально белая бумага и чёткий чёрный шрифт. А если, как это часто бывает с древними книгами, страницы жёлтые, неоднородного цвета, краплёные, с вековой грязью, заломами? Тогда png будет весить много, лучше уж jpeg. И всё-таки древняя книга ценна не только своим текстом, но и шрифтом, рисунками, всякими пометками на полях. Так что ИМХО в идеале надо сохранять и хорошую фотокопию, и распознанный текст.
Мне кажется стоимость физического хранилища в любом случае малая доля от общих затрат такого проекта.
Да и paint не подходит для этой задачи. Разве в нем есть пакетная обработка? Нужен какой-нибудь XnView хотя бы.
Речь о том, чтобы хоть что-то сделать. Лучше копия, полученная через Пейнт, чем вообще никакой.

Осторожнее надо с факелами в библиотеке ходить.
UFO just landed and posted this here
Может быть тупо потому что в Европе откликнулись на предложение, а то и сами обратились? Судя по описанию, наши вполне могли сказать что у них обед и им некогда.
«Мы так не делаем».

С партнером хотели сделать некоммерческий сервис продажи билетов в театры Петербурга (не топовые театры — у них уже все есть, а для небольших). Я программист, он актер — человек близкий к театрам + связи по этой тематике. Даже финансирование нашли, но общение с театрами заканчивалось фразой руководителя «мы так не делаем».
На оцифровку, полноценный ремонт проводки, да и остальные хознужды денег не хватает.А во сколько обойдется восстановление поврежденного фонда? Надеюсь, что надежды ученых оправдаются и :-"… большую часть повреждённых экземпляров удастся спасти."
Денег не хватает… сдали бы или продали здание в дорогом районе, купили бы на окраине. Разницы бы хватило и на оцифровку и на хлеб с икрой руководству.
они не могут продать здание, оно им не принадлежит.
Есть вариант, что кто-то приторговывал ценным культурным наследием. Сначала понемногу, потом вошел во вкус, потом уже не мог остановится. Некоторые раритетные книги и миллион могут стоить.
А тут проверка. Паника… Пожар все спишет.

Цифровые копии вещь хорошая. Но мало оцифровать, нужно организовать защищенный территориально разнесенный архив. Проводить регулярные тестирующие мероприятия цифровых копий на целостность и неизменность. Проводить обслуживание мощностей. Это люди и ресурсы.

Хорошим бы выходом было обратиться к облачным технологиям, заключить договора с отечественными гигантами в этой сфере (да хоть бы яндекс, и майлру). И польза человечеству и реклама гигантам.

Если прочесать поисковики по зарубежной практике, то можно увидеть, что например к гуглу, с их огромными защенными дата центрами, часто и обращаются с такими просьбами.
На оцифровку научного наследия не хватило значит. Но вот на «духовность» и «скрепы» выделяют полным ходом. Абсурд!
Ну часть оцифровали, и что, думаете это помогло? Ха!
Однако в результате тушения пожара серверная была залита водой, и сохранность оцифрованных данных остается под вопросом.


Потому что дело не в финансировании, а в халатности и непрофессионализме тех, кто там работал.
Проблема оцифровки стоит остро. Но если государство не может ее решить само — то пусть создаст условия для общественных организаций. Если бы существовало волонтерское движение по оцифровке, с прозрачными правилами и принципами — я бы с удовольствием бы и денежку бы перевел, и раз в неделю бы гонял помочь руками (странички перелистывать, сканировать, файлы обрабатывать). Сформировалось бы разделение — часть активистов сканирует, другая — сканы обрабатывает для OCR и потом проверяет качество. Система рейтинга, соревнования в том кто сделал больше работы. Ведь нелегально оцифровывается куча литературы. Но все упирается в две большие проблемы.

Первая — организационного характера. Как обеспечить доступ волонтеров к фондам? а вдруг они чего испортят, потом начальство накажет. За такую инициативу скорее поругают чем похвалят. Многие управленцы больны бюрократизмом головного мозга и желанием максимально прикрыть задницу.

И вторая проблема — копирастическая. Если книга лежит 20 лет на пыльной полке, ее никто не читает и она не приносит денег — то всем плевать, но стоит только ее опубликовать — все, побегут в суд отсуживать 100500 миллионов денег ущерба, высосанного не из пальца. В итоге наука в упадке, библиотеки живут в какой то параллельной реальности. Вполне очевидно что доступность качественной информации в первоисточниках, а не пересказов в желтой прессе способствует более высокому уровню понимания.
Only those users with full accounts are able to leave comments. Log in, please.

Articles