Как стать автором
Обновить

Как жили наши предки 400 лет назад? Создание базы данных населения XVII века по южным уездам России

Время на прочтение6 мин
Количество просмотров8.4K
Всего голосов 39: ↑38 и ↓1+56
Комментарии13

Комментарии 13

Реляциями можно описать любую структуру, но не всегда удобно. Поэтому если нет понимания какую систему хранения выбрать, реляционная база будет оптимальным выбором. Тем более что postgres для этой задачи имеет хорошее преимущество, документы можно хранить в JSON, как в документоориентированной БД.

Часто бывает что для разных задач используют несколько баз данных. И хотя postgres имеет свой движок полнотекстового поиска. Более слабый, но часть задач покрывает. Когда ожидается серьёзный полнотекстовый поиск то чаще берут ElasticSearch в связку.

Это же применимо и к графовым базам. Циклические графовые связи (связи между людьми) можно хранить в графовой базе, а ациклические в реляционной.

Можно попробовать натянуть AGE на Postgres

Видимо астрологи объявили месяц метрических книг. Вчера вечер провел в поиске по архиву этих книг от Яндекса https://habr.com/ru/company/yandex/blog/712510/

Удивлялся написанию имен и фамилий в 18 веке. Например у невесты имя было Клеопатра Петровна.

Это ещё что. Вот у меня пращур был Неустрой Данилович. А ещё брат одного предка Калина Иванович. Но это уже в 17 веке.

Калина Иванович звали дядю моего тестя :)

Ну вот вы оба в базу и "попались"!

Можно также для каждой персоне БД присвоить цифровой код , по подобию СНИЛС, добавив в него символы века. Это нужно, чтобы потом легко по этому номеру находить однозначно нужных предков, так как поиск по Ф.И.О и дате рождения не всегда дает нужный результат, тем более, что они могут уточняться.

Я думал сделать так. Создать для персон отдельную таблицу-справочник, в котором уникальное ID персоны (пусть будет ИНН) будет связано со всеми фактами упоминаний этой персоны в основной таблице. НО! У меня есть ещё три справочника - по фамилиям, именам и отчествам (учитывают все возможные варианты написания соответственно фамилий, имен и отчеств по всем персонам), чтобы по запросу по унифицированным ФИО подгружались все возможные варианты написаний. Но не будет ли это конфликтовать с единым справочником?...

В недрах ГИЦ МВД ищите контакты с теми кто помнит о наличии диссертаций времен бумажных учётов на тему правильного формирования запросов по ФИО и методикам интерпретации результатов поиска.

Я своих предков смог проследить до 1848 года. И только благодаря тому что в станице Воровсколесской нашелся человек похожий на автора статьи. Который создал сайт http://vorovskolesskaja.narod.ru и выложил на него исповедные росписи (раздел Генеалогия). А до этого мои предки предположительно прибыли из Воронежской губернии. Только вряд ли были служивыми людьми. И они точно не были из Хоперских казаков которые первыми сюда прибыли и попали в роспись 1827 года.

Очень интересно! Живу в Липецкой области, sql и postgres знаю, готов помочь, чем смогу!

Отлично, давайте спишемся. В Липецкой области находились несколько древних городов: Елец, Чернавск, да и Сокольск, который теперь в состава Липецка. Приходилось заниматься населением этих уездов XVII века - тоже сплошь служилые люди были.

praksitel в телеге.

Всё показанное Вами очень хорошо укладывается в понятие "аналитическая база данных". Именно там можно легко строить выборки типа "соседи соседей, которые могли видеть". Из наиболее универсальных можно взять ClickHouse - она и масштабируется, и раскидывает вычислительные мощности по разным серверам. При желании то же самое можно реализовать и в других распределённых базах, типа GreenPlum, Hadoop.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории