Pull to refresh

Comments 8

Очень полезный ресурс. Но уж больно долго документы оцифровывают.

действительно, очень полезный ресурс.

жаль, что (как всегда) объективность под вопросом. поясню: даже независимый ресурс (назовём его Wayback Machine), цель которого была хранить историю Интернета в любые события, была вынуждена удалять очень многое, чтобы не исчезнуть.

прискорбно, но факт, что очень много кому не нравится то, что происходило и с ними и не с ними в прошлом, и они очень хотят, чтобы все думали иначе. а у некоторых имеется достаточно денег и власти, чтобы желаемое стало реальностью...

даже независимый ресурс (назовём его Wayback Machine), цель которого была хранить историю Интернета в любые события, была вынуждена удалять очень многое, чтобы не исчезнуть.

А зачем Вы называете его "независмым ресурсом", если сам же это опровергаете?

потому что абсолютно независимых нет. если вам нужен независимый ресурс, то езжайте в Арктику, основывайте там своё государство и стройте датацентр. иначе к вам придут хорошо одетые люди и сначала вежливо, но настойчиво попросят, с красочным описанием альтернативы. и это в любой стране. и первичная вежливость людей также зависит от страны - возможно, вас сначала бросят в помойную яму, а уж потом объяснят, почему.

вы, если не alien, (не ксеноморф из фантастического фильма, а человек без всякого гражданства) по конституции являетесь "собственностью государства" и обязаны выполнять законы этого государства. плюс, законы государства, где вы и/или ваше имущество находится, если это не одно и то же. а законы, сами знаете, зачем пишутся размыто. плюс люди, которые считают себя вправе делать то, что им хочется, а защиту закона они себе уже обеспечили.

так что, да, нет абсолютно независимых. это просто красивые слова для народа. а иногда эти люди продаются. (и тогда ещё громче начинают кричать о своей независимости, примите это как свидетельство канарейки)

Прекрасно - будет кому заняться оцифровыванием документов сталинских времен после вынужденного ухода Мемориала

Вам не кажется, что Мемориал вынужденно ушел как раз для того, чтобы некому было заниматься оцифровкой документов сталинских времен?

В принципе, учитывая, что Yandex сотрудничает с чекистами, может и так оказаться, только результат будет противоположным оному у "Мемориала".

Технология расшифровки в «Поиске по архивам» основана на оптическом распознавании символов. Нейросеть узнаёт утратившие актуальность знаки (например, исчезнувшие из алфавита буквы), учитывает особенности почерка и за несколько секунд преобразует трудночитаемые записи в печатный текст. Для работы с вёрсткой газетных страниц нейросеть специально адаптировали: она научилась распознавать текст на огромных полосах, набранный мелким шрифтом на низкоплотной бумаге. 

А как это по потребным вычислительным ресурсам и точности распознавания, по сравнению с остальным OCR?

Sign up to leave a comment.

Other news