Как стать автором
Обновить

Комментарии 59

А казалось бы, что не так уж много денег нужно на оцифровку.
Такие пожары просто так не случаются.
Что вы имеете ввиду?
Поставили минус в карму и за комментарий. У поджигателя припекло что ли?
Это нормально, тут периодически кто-то устраивает набеги беспричинные :)
Хорошее место в хорошем районе Москвы. Так что — все может быть. Но правду мы вряд ли узнаем.
Самое забавное, что правка в википедии по поводу пожара появилась чуть ли не раньше, чем поступил вызов в пожарную.
Ну, учитывая какой электротехнической кунст-камерой являются гораздо более финансируемые государственные учреждения это могла быть и проводка.
451 градус по Фаренгейту?
Да, под шумок можно списать все, что угодно.Поди потом разберись, что сгорело, что пропало!
Краткое содержание поста по ссылке:

Описывается опыт посещения библиотеки год назад.
Они замуровали главный вход. Они приходят на работу в 11 и уходят раньше 16 часов. Они работают на компе одним пальцем. Заявку нужно писать по копирку, повторно указывать сведения о себе. В зале всего 4 читателя. мало где включён свет — экономят. Не реагируют на телефонные обращения. Нет туалетной бумаги. Внутри института нет единой базы данных, каждый библиотекарь записывает читателей в свою тетрадку. Сервер выключается когда из комнаты уходит последний сотрудник. Протестуют против реформы РАН.

Резюме: хуже быть уже не может, нужно всё рушить и строить заново
Подтверждаю, лет 10 назад там было примерно тоже, только посетителей побольше.
Собственно, в 90% институтов РАН сейчас можно наблюдать весьма похожую картину.
Рушить у нас умеют, а кто строить будет?
Разве так дорого было нанять студента-фотолюбителя с зеркалкой или даже мыльницей, штативом и листом оргстекла и посадить просто фотографировать страницы книг? И найти программку для группового сжатия фотографий или перепаковки в определённый стандарт (простейший случай — пережимать Paint'ом в jpeg). Быстро, просто, эффективно и достаточно качественно, чтобы читать текст. Работая месяц за месяцем, можно было оцифровать немало. Есть вроде и автоматы для оцифровки, которые сами переворачивают страницы, но это может быть уже дорого.
Это не оцифровка, а фотокопия. Которую надо где-то хранить. Желательно, не в jpg, а в чём-то более качественном. Нужно иметь доступ к отснятым материалам как работникам, так и посетителям. Целая система, как мне кажется. И оно стоит больших денег, чем просто оплата свободного времени студента.
Ну понятно, что если делать как положено — оно выйдет дорого. Лучше всё же делать на таком самопальном уровне, чем не делать вообще. Хотя бы фотик с JPEG, пэйнт для сжатия и расшаренный как FTP RAID на пару винтов в качестве хранилища… Дешевле некуда, но пользоваться этим уже можно.
Как пишут в статье выше, они там на электричестве экономят. Сомневаюсь, что есть хотя бы доступ к интернету, не говоря уже о FTP или RAID.
Вы недооцениваете масштаб необходимых работ. Вам кажется чего тут — щелкнул, сконвертировал и выложил… сотня страниц — это конечно легко.
Но счет идет на многие миллионы страниц. это десятки лет безостановочной работы целого коллектива фотографов. И парой винтов уже не обойдешься.
НЛО прилетело и опубликовало эту надпись здесь
Чтобы начать нужна ясная конечная цель, а не «вы тут начинайте а дальше видно будет».
Не могу сказать подробности, но у нас в Иркутской библиотеке Гос.Университета что-то такое одно время было. Сидел студент и фортал нужные книги. Сейчас, вроде, сканируют потихоньку. На счет того, распознают текст или нет не знаю, но все же даже наличие картинки — это уже огромный плюс — распознать всегда успеют, а вот сделать цифровую копию можно и не успеть.
НЛО прилетело и опубликовало эту надпись здесь
Понимаю, объём большой… Но с другой стороны а) наверняка многие книги есть в других библиотеках или вовсе уже оцифрованы, можно цифровать только уникальные. б) можно начать с наиболее редких и старинных, тогда при пожаре ущерб был бы не таким грустным.

Был бы я библиотекарем — возможно, даже на энтузиазме бы потихоньку этим занимался.
Может быть и дорого, но при наличии в России такой компании, как ABBYY, можно было бы и договориться. А сканеров, которые в автоматическом режиме развивают скорость до 250стр/мин уже есть не мало. Вопрос в другом — а вообще какие-то работы велись в этом направлении? Видимо, нет.
В оцифровке книг есть 2 варианта ведения работ:
1) Расшить книгу и прогнать через поточный сканер, тогда да, можно и 250 страниц в минуту сделать. Но все равно для этого потребуется хороший поточник с ценой от 100 000 руб. Естественно для книг старых, ветхих или редких такой способ не работает.
2) Книжные сканеры. Они сканируют книги либо с помощью фотокамер, либо с помощью матриц. Скорость обычно около 600-800 страниц в час. Причем даже эта цифра не всегда достижима и не вклчюает в себя обработку изображений\сборку в PDF и так далее. Книжные сканеры бывают ручными и автоматическими. Стоимость ручных начинается от 500 000 руб. Автоматических — от 3 000 000. Цены примерные, но представление о ситуации дают.

Сканеры, делающие 250 страниц в минуту в автоматическом режиме, если я не ошибаюсь, не очень бережно относятся к страницам книг. Плюс стоят достаточно много. Библиотекари, при всем заверении продавцов, не дают автоматическим книжным сканерам ветхие книги, ведь если такую книгу 17 века сканер испортит, то отвечать будет библиотекарь, а не производитель.

На саму оцифровку так-же накладывается много ограничений, связанных с авторским правом. Таким образом «просто договориться» не получается.
если мы говорим о портативных книжных сканерах до А3, то их цена начинается от 17000. Качество такого сканирования может вызывать сомнения, но вот начальная цена вполне определенна.
НЛО прилетело и опубликовало эту надпись здесь
Мы же говорим о недорогих портативных сканерах, они непосредственно к бумаге не прикасаются, информация снимается через фотографирование с распознавание. Тут скорее вопрос в качестве сканирования, распознавания, и аккуратности сканирующего. Ну и вопрос с объемом работ — очень актуален будет при таком подходе.
Не соприкасаются не значит что не портят книгу. Необходимый для фотографирования свет, и тот уже вред книге наносит… а страницы переворачивать, тоже бесконтактно?
и аккуратности сканирующего

В целом разговор идет о том, что если нет денег на большое и масштабное промышленное решение — можно организовать студентов-энтузиастов. И хоть какая-то оцифровка будет лучше, чем никакой+пожар.
Бюрократия-с. Не сотрудник — нет доступа.
НЛО прилетело и опубликовало эту надпись здесь
>По поводу книг. В первую очередь ценна информация из них. А уже потом их уникальность и историческая ценность.
Если информация не ценна — что они делают в библиотеке?

Не скажите. А как же первая отпечатанная книга в стране? Или первая книга по определенной технологии? Как правило печаталась же Библия, в ней особо новой информации не будет. Потому книга может быть не менее важна, как и сама информация.
Я полностью за оцифровку, но технология должна быть щадящей.
Любой известный image viewer умеет массовый ресайз/изменение формата. Можно в Lightroom быстро и удобно откадрировать изображение.
Очень дорого выйдет. Зеркалка ценой под килобакс и ресурсом около 30 тысяч снимков — это только расходы на одну зеркалку. А студенту еще какой-то профит с этого нужен.
ресурсы там уже давно от 100к начинаются, а по факту ходит оно сколько влезет (либо врожденный брак и сдохнет в первые тысячи, либо уже при многократном перебеге за официальный ресурс).
но не нужна тут зеркалка, БЗК или вообще приличное мыло — самое то. главное чтоб света было много и нормального.

главное — найти кого-то, кому будет не лень этим заниматься за обозначеный прайс.
От 100К начинаются ресурсы у профессиональных «тушек». У любительских затворы столько могут ходить, но это если повезет, либо если в данную модель ставили затвор от профессионального или полупро аппарата. Понятно, что цифра статистическая и как повезет. Но преувеличивать ресурс на основании того, что пишут «у меня была D40, отстрелявшая полмиллиона кадров, я ее продал, так как мегапукселей не хватало».
у профессиональных сейчас 300-400, а сотка — это вполне себе любительские камеры уровня Nikon D7x00
А еще надо объяснить руководству, что сервера с данными лучше ставить не в том же здании библиотеки, что тоже стоит денег. Чтобы не читать потом заголовки: Пожар повредил 15% фондов научной библиотеки ИНИОН в Москве. Так же сгорели все резервные цифровые копии, которые находились в том же здании.

Но в целом согласен: печально что денег на это не выделяется и лучше иметь хоть какую-то систему резервного копирования чем вообще никакой.
>>простейший случай — пережимать Paint'ом в jpeg

Тексты только в PNG.
Это если идеально белая бумага и чёткий чёрный шрифт. А если, как это часто бывает с древними книгами, страницы жёлтые, неоднородного цвета, краплёные, с вековой грязью, заломами? Тогда png будет весить много, лучше уж jpeg. И всё-таки древняя книга ценна не только своим текстом, но и шрифтом, рисунками, всякими пометками на полях. Так что ИМХО в идеале надо сохранять и хорошую фотокопию, и распознанный текст.
Мне кажется стоимость физического хранилища в любом случае малая доля от общих затрат такого проекта.
Да и paint не подходит для этой задачи. Разве в нем есть пакетная обработка? Нужен какой-нибудь XnView хотя бы.
Речь о том, чтобы хоть что-то сделать. Лучше копия, полученная через Пейнт, чем вообще никакой.

Осторожнее надо с факелами в библиотеке ходить.
НЛО прилетело и опубликовало эту надпись здесь
Может быть тупо потому что в Европе откликнулись на предложение, а то и сами обратились? Судя по описанию, наши вполне могли сказать что у них обед и им некогда.
«Мы так не делаем».

С партнером хотели сделать некоммерческий сервис продажи билетов в театры Петербурга (не топовые театры — у них уже все есть, а для небольших). Я программист, он актер — человек близкий к театрам + связи по этой тематике. Даже финансирование нашли, но общение с театрами заканчивалось фразой руководителя «мы так не делаем».
На оцифровку, полноценный ремонт проводки, да и остальные хознужды денег не хватает.А во сколько обойдется восстановление поврежденного фонда? Надеюсь, что надежды ученых оправдаются и :-"… большую часть повреждённых экземпляров удастся спасти."
Денег не хватает… сдали бы или продали здание в дорогом районе, купили бы на окраине. Разницы бы хватило и на оцифровку и на хлеб с икрой руководству.
они не могут продать здание, оно им не принадлежит.
Есть вариант, что кто-то приторговывал ценным культурным наследием. Сначала понемногу, потом вошел во вкус, потом уже не мог остановится. Некоторые раритетные книги и миллион могут стоить.
А тут проверка. Паника… Пожар все спишет.

Цифровые копии вещь хорошая. Но мало оцифровать, нужно организовать защищенный территориально разнесенный архив. Проводить регулярные тестирующие мероприятия цифровых копий на целостность и неизменность. Проводить обслуживание мощностей. Это люди и ресурсы.

Хорошим бы выходом было обратиться к облачным технологиям, заключить договора с отечественными гигантами в этой сфере (да хоть бы яндекс, и майлру). И польза человечеству и реклама гигантам.

Если прочесать поисковики по зарубежной практике, то можно увидеть, что например к гуглу, с их огромными защенными дата центрами, часто и обращаются с такими просьбами.
На оцифровку научного наследия не хватило значит. Но вот на «духовность» и «скрепы» выделяют полным ходом. Абсурд!
Ну часть оцифровали, и что, думаете это помогло? Ха!
Однако в результате тушения пожара серверная была залита водой, и сохранность оцифрованных данных остается под вопросом.


Потому что дело не в финансировании, а в халатности и непрофессионализме тех, кто там работал.
Проблема оцифровки стоит остро. Но если государство не может ее решить само — то пусть создаст условия для общественных организаций. Если бы существовало волонтерское движение по оцифровке, с прозрачными правилами и принципами — я бы с удовольствием бы и денежку бы перевел, и раз в неделю бы гонял помочь руками (странички перелистывать, сканировать, файлы обрабатывать). Сформировалось бы разделение — часть активистов сканирует, другая — сканы обрабатывает для OCR и потом проверяет качество. Система рейтинга, соревнования в том кто сделал больше работы. Ведь нелегально оцифровывается куча литературы. Но все упирается в две большие проблемы.

Первая — организационного характера. Как обеспечить доступ волонтеров к фондам? а вдруг они чего испортят, потом начальство накажет. За такую инициативу скорее поругают чем похвалят. Многие управленцы больны бюрократизмом головного мозга и желанием максимально прикрыть задницу.

И вторая проблема — копирастическая. Если книга лежит 20 лет на пыльной полке, ее никто не читает и она не приносит денег — то всем плевать, но стоит только ее опубликовать — все, побегут в суд отсуживать 100500 миллионов денег ущерба, высосанного не из пальца. В итоге наука в упадке, библиотеки живут в какой то параллельной реальности. Вполне очевидно что доступность качественной информации в первоисточниках, а не пересказов в желтой прессе способствует более высокому уровню понимания.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории