Как стать автором
Обновить

Специальный шрифт для нахождения ошибок после OCR

Время на прочтение1 мин
Количество просмотров15K
Сообщество Distributed Proofreaders («Распределённые корректоры») больше десяти лет занимается сканированием книг для проекта «Гутенберг». Сотни добровольцев помогают вычитывать тексты и исправлять ошибки.

После автоматического распознавания чаще всего ошибки встречаются в символах, которые похожи друг на друга, как I, l и 1, O и 0, и так далее. Если пользоваться обычным шрифтом вроде Times, то такие ошибки можно и не заметить. Поэтому для проекта Distributed Proofreaders был создан специальный шрифт, в котором «похожие» символы как можно сильнее отличаются друг от друга.



Все символы шрифта разработаны с учётом многочисленных советов и пожеланий участников проекта, добровольных корректоров. Цель — максимально удобно и эффективно идентифицировать типичные ошибки OCR.

К сожалению, сайт Distributed Proofreaders по историческим причинам не поддерживает юникод, и сообщество работает с весьма ограниченным списком языков, среди которых нет кириллических. Поэтому и сам шрифт DPCustomMono2 спроектирован только для латиницы. Но идеи, которые применили дизайнеры шрифта, можно использовать и в создании кириллического набора символов.

На этой странице можно сравнить DPCustomMono2 с различными популярными шрифтами.

Теги:
Хабы:
+29
Комментарии62

Публикации