Сегодня мы расскажем вам, как помогали оцифровывать Сахалинскую областную универсальную научную библиотеку. Переводить библиотеки в электронный вид мы начали довольно давно. Постоянные читатели блога наверняка помнят обзорный пост по нашим библиотечным проектам, а также топики, посвященные оцифровке библиотеки Хартли и созданию каталога Королевского ботанического сада Эдинбурга. Итак, поехали.
Сахалинская областная универсальная научная библиотека существует уже 67 лет и остается одним из основных информационных, культурных и научно-исследовательских центров Дальнего Востока. Сегодня в библиотеке хранится около 617 тысяч различных изданий.
Одна из самых ценных коллекций – редкие краеведческие издания о Сахалине и Курилах, в том числе местная периодика. Редкие издания на дом не выдают – они могут испортиться или потеряться – поэтому посмотреть их можно только в читальном зале. Если вы с какими-то своими целями изучаете Сахалин, а живете, например, в Москве, до последнего времени библиотека ничем не могла вас порадовать. Книги из депозитарного фонда не выдаются — часть из них вот в таком состоянии (фото ниже) и давать их на руки просто нельзя:
Нужно сказать, в Сахалинской областной универсальной научной библиотеке уже давно стараются сделать различные издания доступнее, например, с 1994 года формируется электронный каталог. Фонд краеведческой литературы представлен в электронном каталоге – 98 187 библиографических записей. Сейчас сотрудники библиотеки участвуют в программе создания полнотекстовой базы краеведческих информационных ресурсов – предоставляют периодические издания и документы из фонда для создания электронных копий. Уже отсканировано более 7 тысяч книг и более 30 тысяч периодических изданий. Библиотекари также анализируют содержимое фонда: раскрывают содержание изданий, аналитически расписывают сборники, дополняют записи электронного каталога предметными рубриками, ключевыми словами и аннотируют их.
Процесс оцифровки издания состоит из сканирования на сетевых сканерах и обработки полученного изображения с помощью программ Scan Tailor (обрезка страниц, выравнивание текста) и Photoshop (обработка засветов, теней, настройка яркости, контрастности изображения). Сначала библиотекари пробовали работать на сканере с перелистыванием страниц, но он испортил несколько книг, и эту функцию перестали использовать.
После обработки изображения прогоняют через ABBYY Recognition Server, решение для распознавания текста и преобразования документов в электронные редактируемые форматы. Решение создает PDF файлы газет и книжных изданий с распознанным текстом, затем файлы поступают в систему хранения. На готовые документы создаются записи с описанием ресурса и поисковыми атрибутами. С помощью Recognition Server ежегодно обрабатывается 2000 изданий, или около 200 тысяч страниц.
Электронная библиотека состоит из трёх частей: «Сахалин и Курилы: острова утренней зари», «Публичная электронная библиотека» и «Национальная электронная библиотека». Для пользователей разработан навигатор на всех сайтах электронных библиотек. Можно сузить поиск нужной информации по теме статьи, автору, а также рубрике, коллекции и тексту документа.
Эта электронная библиотека формируется с 2009 года, с 2012 года для удаленных пользователей открылся сайт «Сахалин и Курилы – острова утренней зари»). Специалисты сектора оцифровки отбирают образы газет и помещают их в систему «КАИСА-Краеведение», предназначенную для формирования полнотекстовой электронной библиотеки. Сегодня в электронном виде доступны более 9 тысяч номеров региональных изданий и более 10 тысяч статей из газет, среди них известные газеты «Советский Сахалин» (выходит с 1933 года) и «Губернские ведомости».
В настоящее время оцифровано 7221 книжных изданий из редкого краеведческого фонда, например, особо ценные книги: «Десятиверстная карта Русского Сахалина, составленная по съемкам экспедиций геологического комитета 1907-1910 гг. и другим источникам» 1914 г., «Первая всеобщая перепись населения Российской империи» 1897 г. под редакцией Н.А. Тройницкого, «Остров Сахалин и экспедиция 1853-54 гг.» 1872 г. Н.В. Буссе. Оцифрованные книжные издания частично размещаются на страничке библиотеки на портале Национальной Электронной Библиотеки (НЭБ) и в Публичной электронной библиотеке в книжных тематических коллекциях.
Периодические издания и особо ценные книги после сканирования не возвращаются в отдел краеведения, а передаются в специальный фонд для консервации и постоянного хранения.
Работы по оцифровке фонда продолжаются. Если вы для каких-то своих целей исследуете Сахалин или просто собираетесь в гости, интернет-версия Сахалинской библиотеки — вам в помощь.
Сахалинская областная универсальная научная библиотека существует уже 67 лет и остается одним из основных информационных, культурных и научно-исследовательских центров Дальнего Востока. Сегодня в библиотеке хранится около 617 тысяч различных изданий.
Одна из самых ценных коллекций – редкие краеведческие издания о Сахалине и Курилах, в том числе местная периодика. Редкие издания на дом не выдают – они могут испортиться или потеряться – поэтому посмотреть их можно только в читальном зале. Если вы с какими-то своими целями изучаете Сахалин, а живете, например, в Москве, до последнего времени библиотека ничем не могла вас порадовать. Книги из депозитарного фонда не выдаются — часть из них вот в таком состоянии (фото ниже) и давать их на руки просто нельзя:
Нужно сказать, в Сахалинской областной универсальной научной библиотеке уже давно стараются сделать различные издания доступнее, например, с 1994 года формируется электронный каталог. Фонд краеведческой литературы представлен в электронном каталоге – 98 187 библиографических записей. Сейчас сотрудники библиотеки участвуют в программе создания полнотекстовой базы краеведческих информационных ресурсов – предоставляют периодические издания и документы из фонда для создания электронных копий. Уже отсканировано более 7 тысяч книг и более 30 тысяч периодических изданий. Библиотекари также анализируют содержимое фонда: раскрывают содержание изданий, аналитически расписывают сборники, дополняют записи электронного каталога предметными рубриками, ключевыми словами и аннотируют их.
Процесс оцифровки издания состоит из сканирования на сетевых сканерах и обработки полученного изображения с помощью программ Scan Tailor (обрезка страниц, выравнивание текста) и Photoshop (обработка засветов, теней, настройка яркости, контрастности изображения). Сначала библиотекари пробовали работать на сканере с перелистыванием страниц, но он испортил несколько книг, и эту функцию перестали использовать.
После обработки изображения прогоняют через ABBYY Recognition Server, решение для распознавания текста и преобразования документов в электронные редактируемые форматы. Решение создает PDF файлы газет и книжных изданий с распознанным текстом, затем файлы поступают в систему хранения. На готовые документы создаются записи с описанием ресурса и поисковыми атрибутами. С помощью Recognition Server ежегодно обрабатывается 2000 изданий, или около 200 тысяч страниц.
Электронная библиотека состоит из трёх частей: «Сахалин и Курилы: острова утренней зари», «Публичная электронная библиотека» и «Национальная электронная библиотека». Для пользователей разработан навигатор на всех сайтах электронных библиотек. Можно сузить поиск нужной информации по теме статьи, автору, а также рубрике, коллекции и тексту документа.
Библиотека периодики
Эта электронная библиотека формируется с 2009 года, с 2012 года для удаленных пользователей открылся сайт «Сахалин и Курилы – острова утренней зари»). Специалисты сектора оцифровки отбирают образы газет и помещают их в систему «КАИСА-Краеведение», предназначенную для формирования полнотекстовой электронной библиотеки. Сегодня в электронном виде доступны более 9 тысяч номеров региональных изданий и более 10 тысяч статей из газет, среди них известные газеты «Советский Сахалин» (выходит с 1933 года) и «Губернские ведомости».
Книжный фонд
В настоящее время оцифровано 7221 книжных изданий из редкого краеведческого фонда, например, особо ценные книги: «Десятиверстная карта Русского Сахалина, составленная по съемкам экспедиций геологического комитета 1907-1910 гг. и другим источникам» 1914 г., «Первая всеобщая перепись населения Российской империи» 1897 г. под редакцией Н.А. Тройницкого, «Остров Сахалин и экспедиция 1853-54 гг.» 1872 г. Н.В. Буссе. Оцифрованные книжные издания частично размещаются на страничке библиотеки на портале Национальной Электронной Библиотеки (НЭБ) и в Публичной электронной библиотеке в книжных тематических коллекциях.
Периодические издания и особо ценные книги после сканирования не возвращаются в отдел краеведения, а передаются в специальный фонд для консервации и постоянного хранения.
Работы по оцифровке фонда продолжаются. Если вы для каких-то своих целей исследуете Сахалин или просто собираетесь в гости, интернет-версия Сахалинской библиотеки — вам в помощь.