Как стать автором
Обновить

Нейросети «Яндекса» расшифровали рукописные архивы Московской области

Время на прочтение1 мин
Количество просмотров3.2K

Компания «Яндекс» заявила о расшифровке рукописных архивов Московской области (МО) с помощью нейросетей. Нейросети «Яндекса» расшифровали 300 тысяч страниц метрических книг из Центрального государственного архива Московской области, рассказали информационной службе Хабра в пресс‑службе IT‑компании.

Документы 18 — начала 20 веков обработали с помощью алгоритма, построенного на базе системы оптического распознавания символов. В оцифрованных файлах содержится множество записей о людях, живших в окрестностях Рязани, Тулы и Владимира. Эти люди представлены в сервисе «Поиск по архивам».

В базе сервиса появились документы с упоминанием фамилии, населенного пункта и других слов. Сервис поможет историкам, генеалогам и обычным людям искать информацию о предках, родственниках или исторических личностях.

Кроме 300 тысяч страниц метрических книг из центрального архива МО в базе сервиса есть 700 тысяч страниц документов из Главархива Москвы, опубликованы описи из центрального архива Республики Мордовия, доступны документы из Новгородской и Оренбургской областей.

Сервис «Поиск по архивам» запущен в январе 2023 года. За два месяца количество расшифрованных нейросетями компании составляет 5 миллионов.

Теги:
Хабы:
Всего голосов 11: ↑11 и ↓0+11
Комментарии1

Другие новости

Истории

Ближайшие события

7 – 8 ноября
Конференция byteoilgas_conf 2024
МоскваОнлайн
7 – 8 ноября
Конференция «Матемаркетинг»
МоскваОнлайн
15 – 16 ноября
IT-конференция Merge Skolkovo
Москва
22 – 24 ноября
Хакатон «AgroCode Hack Genetics'24»
Онлайн
28 ноября
Конференция «TechRec: ITHR CAMPUS»
МоскваОнлайн
25 – 26 апреля
IT-конференция Merge Tatarstan 2025
Казань