Генеалогия существует давно независимо от того, знаем мы о ней или нет.

Впервые генеалогия как наука появилась в Древней Греции. В России термин «генеалогия» в значении «учение о роде» появился в XI веке.

В современной России часть архивов оцифрована, но еще многое предстоит оцифровать. В оцифровке есть свои преимущества и недостатки, с которыми мне лично пришлось столкнуться.

Попытка разобраться в госархивах, картинка из Интернета
Попытка разобраться в госархивах, картинка из Интернета

Достоинства

В удобной домашней обстановке за чашкой чая можно безмятежно анализировать оцифрованные дела, выискивать в рукописном тексте знакомые имена, звания, награды, даты рождения, смерти, женитьбы...

Обмениваться ссылками на дела с родственниками в 5+ колене и такими же участниками этого увлекательного мира познания истории через познание быта своих предков.

Недостатки

Здесь можно сказать только об одном большом недостатке - органы управления архивным делом в субъектах России подчиняются администрациям своих субъектов федерации. И у каждой администрации свой вкус и мнение.

Разберем по порядку

Если запланируете поездку �� Рязанский архив, вас ждет увлекательный аттракцион. Запись на следующий месяц открывается каждый 15 день месяца ровно в 9:00. Тут же сайт падает, страница записи может не отвечать до 20 минут и места достаются самым настойчивым или счастливым (здесь есть свой механизм быть в первых рядах). Как повезет.

Но и здесь приключения не заканчиваются. Попав в сам архив, вас мило встречают охранники, все расскажут и объяснят, что нельзя сказать про работников самого читального зала. Наберитесь терпения, наденьте шоры и идите к своей цели, не обращая внимания на эту извращённую "клиентоориентированность". Там не будет жалости к вам. Второй раз приезжать не хочется, но второй и последующие разы не будет такого внимания, будет легче.

После таких увеселительных аттракционов с нетерпением ждешь, когда же Рязанский архив перейдет на ИС и выложит дела в оцифрованном виде.

Каждый архив самостоятельно выбирает ИС, на базе которой будет предоставлять доступ к оцифрованным делам. Это последствия того самого единственного, на мой взгляд, недостатка.

Можно также отметить и следующие последствия:

  • не все архивы спешат переходить на цифру

  • цену доступа к оцифрованным документам регламентирует администрация субъекта

Есть архивы, где час стоит как час парковки в Москве. Удивительно, во Владимирском архиве час стоит 33 рубля (номер региона). Вот такие патриоты трудятся во Владимирской администрации.

Самый дорогой час, по моим сведениям, в РГАДА. На ноябрь 2025 года составляет 90 рублей.

Кто-то скажет, что это несоизмеримо дешевле, чем стоимость поездки в архив и заказ фотографий выбранных листов или целого дела. Соглашусь, но в любом случае это ощутимо для искателей своих корней, кто не зарабатывает на генеалогии, а таковых большинство.

Да, генеалогия всегда была делом, требующим вложений.

Вступление закончилось, приступаем к делу

Если на оцифровку дел и переход архивов на ИС мы повлиять не можем, то с оцифрованными делами надо что-то делать. Невозможно работать с делом, когда страница открывается до 3 минут.

Здесь тоже есть свои исключения, например, Ивановский архив. По моим личным наблюдениям это самый быстрый архив на сегодняшний день. Но он и самый пустой. Есть несколько дел, оцифрованных более 50%. Цена доступа равна 55 рублей/час. Почему не 37?

Рейтинг архивов, с которыми мне пришлось поработать, по убыванию скорости:

  1. Ивановский архив (летает, но мало дел)

  2. Владимирский и Тамбовский архивы (KAISA)

  3. Воронежский и Курский архивы (ARSVO)

  4. Костромской архив (NIOSOFT). Самый медленный (на то есть причина, ниже).

Владимирский и Тамбовский архивы базируются на KAISA. Скорость передачи сносная, если не сказать шустрая. Но цена доступа почасовая. За час в лучшем случае можно успеть просмотреть 3-4 дела. Оплата производится поэтапно, сначала вносятся средства на абонемент, а потом можно эти средства активировать. С момента оплаты до момента, когда можно будет активировать, может пройти до 4 суток, так как сотрудники перепроверяют "вручную". Нужно учесть эту особенность.

Воронежский и Курский архивы базируются на другом движке ARSVO. Раз в сутки (примерно в 23:45) происходит обрыв связи со стороны сервера, днем в рабочие дни с 9:00 до 18:00 скорость отдачи самая низкая, такая же скорость в рабочие дни с 20:00 до 23:00. Ориентируйтесь на менее загруженное время. К слову, сервер здесь не виноват, по прямым ссылкам дела качаются куда быстрее, чем при использовании JS, которым окутан весь движок сайта. Самое удобное время для работы с этими архивами - выходные и праздничные дни, а также с 18:00 до 20:00 и ночью до 9:00 утра в рабочие дни.

Костромской архив базируется на каком-то отдельном движке от ИП Герасимов Олег Николаевич, о чем можно найти запись в разделе "О программе"

Костромской архив
Костромской архив
Костромской архив. Картинка представляется частями в base64
Костромской архив. Картинка представляется частями в base64

Самый медленный. Порой скорость показа падает до одной картинки в 20 секунд, но есть приятный сюрприз по оплате. На данный момент Костромской архив заслуживает звание "Самый нежадный архив года". Оплата активируется только в момент открытия листов в режиме просмотра. Если открывать дело в режиме миниатюрок, то деньги не списываются. Плюс, бывают бесплатные доступы в праздничные и выходные дни. Ближайшая дата бесплатного доступа - 04.11.25.

Бесплатный доступ в Костромской архив выглядит так
Бесплатный доступ в Костромской архив выглядит так

Статья выйдет в эфир после этой даты, но посчитал, что информацию стоит отметить.

И что теперь?

Работая с медленно отдающим архивом, невольно возникает желание найти способ обойти этот медленный JS скрипт и получить прямые ссылки к листам дела. Возникает желание автоматизировать процесс загрузки.

А еще загрузка может просто зависнуть
А еще загрузка может просто зависнуть

Здесь стоит отметить важность прочтения публичного соглашения на сайтах архивов.

Пользовательское соглашение

Пользователь обязан использовать электронные копии архивных документов, право доступа к которым ему предоставлено, исключительно в личных целях, для просмотра, прослушивания и иного изучения.

Пользователь не имеет права:

переделывать, изменять или прочим образом электронные копии архивных документов; передавать либо рассылать электронные копии архивных документов третьим лицам как полностью, так и частично;

изготавливать другие копии архивных документов, на основе электронных копий архивных документов, право доступа к которым он получил, то есть изготавливать экземпляры документов или их частей в любой материальной форме, если этот экземпляр имеет цель дальнейшего распространения.

В одном из архивов написано, что нельзя скачивать картинки. Но когда в браузере открывается картинка, будьте уверены, что она уже на компьютере, компьютер уже загрузил еe. Загрузка происходит независимо от вашей воли или воли работников архива.

С запретами определились. Соблюдаем правила работы с архивами, уважаем столь важный труд.
А что хотели авторы сказать фразой: «или прочим образом электронные копии архивных документов», мне не известно. Обязуюсь прочим образом ни‑ни.

На других сайтах информация немного другая, но суть остается такой же — запрещается копировать и передавать третьим лицам.

Clickermann + архив

В 2006 году Джонни Челленджер представил миру помогающий решать множество задач Clickermann, программу, эмулирующую манипуляторы (клавиатура и мышь), будто их нажимает пользователь. Кто-то с помощью кликера даже маджонги решает.

Мне не удалось победить JS и написать обработчик на python, который смог бы авторизовываться в браузере, а в случае Курского архива через Госуслуги, и работать с JS скриптами, которые у каждого движка свои.

Но с помощью Clickermann написал задания, эмулирующие работу пользователя, использование которых сэкономили в общей сложности не менее 3 недель за несколько месяцев.

Делюсь наработками со всеми, кто уже столкнулся с трудностями р��боты с цифровыми архивами, когда важно сосредоточиться на главном, а не смотреть на крутящийся прогресс бар (троббер) минутами.

Главный плюс от такой работы - к обработанным кликером делам появляется локальный доступ, ведь за доступ уже заплатили.

Здесь помним про передачу третьим лицам и используем только в личных целях.

Снова приведу сравнение, но уже по возрастанию сложности:

  1. Ивановский архив. Самый простой скрипт и логика. Все настолько просто, что скрипт получился на 144 строки с комментариями.

  2. Воронежский и Курский архивы. Логика сложнее, но можно скачивать дела, размером до 2000 листов (мне и такие попадались), в течение оплаченных суток, скрипт более сложный. Скорость загрузки примерно 200 листов в час.

  3. Владимирский и Тамбовский архивы. Вынужденной мерой стал отдельный скрипт для сбора ссылок листов, логика менее сложная, чем у ARSVO. Здесь потребовались более сильные навыки программирования.

  4. Костромской архив. На данный момент имеет самую стойкую логику и метод сокрытия картинок. За счет этого, работать с делами данного архива без магния очень трудно. Наберитесь терпения, скрипт загрузит и оповестит по окончанию.

Если более распространенные движки архивов стараются спрятать прямую ссылки картинки, то движок Костромского архива разбивает картинку на тоненькие полоски и представляет их в виде base64. Логика такой схемы требует более продуманного алгоритма. Сбор таких отрезков тоже осуществим, но после сбора эти отрезки потребуется раскодировать и представить в виде jpeg.

Для декодирования приложен файл base64_p.py

# Декодируем base64 
image_data = base64.b64decode(strip)
image = Image.open(io.BytesIO(image_data))
images.append(image)

Не забываем открыть режим Разработчика SHIFT + CTRL + i.
В режиме разработчика переходим в раздел Network (Сеть), включаем фильтр и в строке фильтра добавляем :image

Браузер нужно настроить примерно так:

Костромской архив
Костромской архив

Особенности

Отмечу важную особенность - все скрипты привязаны к одной и той же настройке браузера и зкрана компьютера. Планируется уйти от этого хардкода, отвязаться от жестких координат, но для этого придется переделать скрипты и добавить функционал поиска координат кнопок или точек, что достаточно сложно при изменяющемся масштабе кнопок.

Хардкод - наше всё
Хардкод - наше всё
  • Разрешение экрана 1920x1080

  • Яндекс браузер с масштабом в 80%

Еще момент. При обновлении приложения Яндекс Браузера обновляется дизайн кнопок. В скриптах добавлен поиск необходимых кнопок. Если кнопка отображается на экране, а скрипт ее не определяет, просто пересохраните bmp файл кнопки. Более подробная информация записывается в лог приложения.

Кнопка Сохранить
Кнопка Сохранить

В Тамбовском и Владимирском архивах потребуется открыть меню Разработчика SHIFT + CTRL + i до запуска скрипта, если планируется сбор ссылок. В режиме разработчика переходим в раздел Network (Сеть), включаем фильтр и в строке фильтра добавляем image?

Открываем режим Разработчика
Открываем режим Разработчика

Попроще с ARSVO - ссылки показывает Яндекс Браузе��. Скрипт услужливо сохраняет их в файл link.txt. Вы не только собираете дело, но и получаете ссылки на листы. Настолько все просто, что 2 файла подпрограмм, формирующих ссылку, пришлось исключить из репозитория, чтобы не провоцировать авторов ИС на доработки. Скажу сразу, никаких sql инъекций не используется.

#include "change_link.cms"
#include "white_list.cms"

Синтаксис Clickermann своеобразный:

  1. # - означает вызов подпрограммы, а не комментарий.

  2. Комментарий начинается с //

  3. $S_CORR = 0 - анахронизм из предыдущих версий, но решил оставить.

  4. Если будете дорабатывать задания Clickermann, обязательно ознакомьтесь с синтаксисом.

  5. WHILE закрывается не END_WHILE, а END_CYC,

  6. Пауза - не PAUSE, а WAIT или WAITMS

Продолжение будет?

После публикации статьи ожидаю реакцию создателей движков, либо смену движков архивами, что обязательно даст дополнительную возможность сильнее развить навыки по работе с архивами. Будем развиваться вместе.

Что могу посоветовать архивам?

Не плодить сущности. Разные движки - разные ошибки, разные бюджеты, разные скорости перехода к цифре. Все это негативно влияет на развитие российских государственных услуг.

Понизить стоимость, привести все архивы к посуточному абонементу или посекундной оплате.

Периодически предоставлять бесплатный доступ, как это делает Костромской архив.

Понизить сложность сокрытия ссылок на картинки, а лучше вообще убрать, оставить только платный доступ к этому контенту (KAISA).

Дать возможность быстро получать необходимую информацию, ведь именно медленная работа архивов заставляет искать пути экономии времени.