ABBYY помогает в оцифровке редких изданий Сахалинской библиотеки

    Сегодня мы расскажем вам, как помогали оцифровывать Сахалинскую областную универсальную научную библиотеку. Переводить библиотеки в электронный вид мы начали довольно давно. Постоянные читатели блога наверняка помнят обзорный пост по нашим библиотечным проектам, а также топики, посвященные оцифровке библиотеки Хартли и созданию каталога Королевского ботанического сада Эдинбурга. Итак, поехали.

    Сахалинская областная универсальная научная библиотека существует уже 67 лет и остается одним из основных информационных, культурных и научно-исследовательских центров Дальнего Востока. Сегодня в библиотеке хранится около 617 тысяч различных изданий.

    Одна из самых ценных коллекций – редкие краеведческие издания о Сахалине и Курилах, в том числе местная периодика. Редкие издания на дом не выдают – они могут испортиться или потеряться – поэтому посмотреть их можно только в читальном зале. Если вы с какими-то своими целями изучаете Сахалин, а живете, например, в Москве, до последнего времени библиотека ничем не могла вас порадовать. Книги из депозитарного фонда не выдаются — часть из них вот в таком состоянии (фото ниже) и давать их на руки просто нельзя:





    Нужно сказать, в Сахалинской областной универсальной научной библиотеке уже давно стараются сделать различные издания доступнее, например, с 1994 года формируется электронный каталог. Фонд краеведческой литературы представлен в электронном каталоге – 98 187 библиографических записей. Сейчас сотрудники библиотеки участвуют в программе создания полнотекстовой базы краеведческих информационных ресурсов – предоставляют периодические издания и документы из фонда для создания электронных копий. Уже отсканировано более 7 тысяч книг и более 30 тысяч периодических изданий. Библиотекари также анализируют содержимое фонда: раскрывают содержание изданий, аналитически расписывают сборники, дополняют записи электронного каталога предметными рубриками, ключевыми словами и аннотируют их.

    Процесс оцифровки издания состоит из сканирования на сетевых сканерах и обработки полученного изображения с помощью программ Scan Tailor (обрезка страниц, выравнивание текста) и Photoshop (обработка засветов, теней, настройка яркости, контрастности изображения). Сначала библиотекари пробовали работать на сканере с перелистыванием страниц, но он испортил несколько книг, и эту функцию перестали использовать.

    После обработки изображения прогоняют через ABBYY Recognition Server, решение для распознавания текста и преобразования документов в электронные редактируемые форматы. Решение создает PDF файлы газет и книжных изданий с распознанным текстом, затем файлы поступают в систему хранения. На готовые документы создаются записи с описанием ресурса и поисковыми атрибутами. С помощью Recognition Server ежегодно обрабатывается 2000 изданий, или около 200 тысяч страниц.

    Электронная библиотека состоит из трёх частей: «Сахалин и Курилы: острова утренней зари», «Публичная электронная библиотека» и «Национальная электронная библиотека». Для пользователей разработан навигатор на всех сайтах электронных библиотек. Можно сузить поиск нужной информации по теме статьи, автору, а также рубрике, коллекции и тексту документа.

    Библиотека периодики


    Эта электронная библиотека формируется с 2009 года, с 2012 года для удаленных пользователей открылся сайт «Сахалин и Курилы – острова утренней зари»). Специалисты сектора оцифровки отбирают образы газет и помещают их в систему «КАИСА-Краеведение», предназначенную для формирования полнотекстовой электронной библиотеки. Сегодня в электронном виде доступны более 9 тысяч номеров региональных изданий и более 10 тысяч статей из газет, среди них известные газеты «Советский Сахалин» (выходит с 1933 года) и «Губернские ведомости».







    Книжный фонд


    В настоящее время оцифровано 7221 книжных изданий из редкого краеведческого фонда, например, особо ценные книги: «Десятиверстная карта Русского Сахалина, составленная по съемкам экспедиций геологического комитета 1907-1910 гг. и другим источникам» 1914 г., «Первая всеобщая перепись населения Российской империи» 1897 г. под редакцией Н.А. Тройницкого, «Остров Сахалин и экспедиция 1853-54 гг.» 1872 г. Н.В. Буссе. Оцифрованные книжные издания частично размещаются на страничке библиотеки на портале Национальной Электронной Библиотеки (НЭБ) и в Публичной электронной библиотеке в книжных тематических коллекциях.

    Периодические издания и особо ценные книги после сканирования не возвращаются в отдел краеведения, а передаются в специальный фонд для консервации и постоянного хранения.



    Работы по оцифровке фонда продолжаются. Если вы для каких-то своих целей исследуете Сахалин или просто собираетесь в гости, интернет-версия Сахалинской библиотеки — вам в помощь.
    ABBYY
    Решения для интеллектуальной обработки информации

    Похожие публикации

    Комментарии 12

      +9
      Вот когда вижу книги, как на первых фотографий, нагло испорченные простыми печатями, которые ставились без всяких сомнений — как-то не по себе.
        +3
        Да, бросьте, потом оно все равно случайно сгорит.
          –4
          Видимо без этих печатей никак, учёт и всё такое.
          Наверняка библиотекарям не в радость «портить» эти книги.
            0
            Такие книги все равно не выдаются на руки просто так, потому для учета достаточно было все печати поставить на коробку, в которой эта книга хранится. Так что это простое пренебрежение.
            И что за вечная манера его оправдывать?
              –3
              И что за вечная манера его оправдывать?
              Мы знакомы? Или как понять ваш комментарий?
                +1
                Недавно был минискандальчик с эрмитажем что ли. Когда букинистические издания из фондов хранения не были никак промаркированы и совершенно внезапно (и почти случайно) обнаружились в антикварном магазине. Тоже в коробке на полке стояли, видимо.
                  0
                  Вы хотите сказать, что печать — защита от кражи, учитывая, что сводится она минут за двадцать работы? Не смешите.
                    0
                    Я хочу сказать ровно то, что сказал. Про 20 минут — ну может вам виднее.
              0
              В чём же заключается порча печатями? Какой критерий такой порчи?
                +6
                Всё это, конечно, субъективно, но вот моя логика:
                • Очень старая, пусть и не рукописная книга, сохранившаяся в единичных экземплярах — это не просто печатное издание, не набор листов бумаги с буквами, а ценный артефакт, произведение искусства.
                • Зачем вносить в такой объект необратимые изменения? Единственная причина — «так положено по инструкции, у нас тут государственное учреждение».
                • Представьте себе выгравированный инвентарный номер на античной скульптуре.
                  +2
                  Не всё, что старое — произведение искусства. На большинстве архивных книг есть куча пометок, оставленных в разные времена. Такова жизнь.

                  Ребята минусующие, чувствуется, вы никогда в жизни не работали в архивными документами.
                    0
                    Все равно как собаки метят дерево.

              Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

              Самое читаемое