Pull to refresh

Comments 18

Извините, но содержание статьи можно представить одним предложением: «мы пробовали распознавать с помощью Fine Reader, печатный текст неплохо, а вот распознавание почерков разных людей — плохо».
Пост про автоматизацию, думаю, будет интересен. В случае если он будет более конкретным.
Спасибо. Учту. Буду выкладывать конкретику.
Софт тестировался разный, но есть смысл писать про Fine Reader, так как он самый популярный и дает результат на порядок лучше других программ.
Переделал пост. Удали 2/3 воды. Добавил раздел.
Но ведь к примеру Samsung Galaxy Note с софтинкой S Note очень неплохо распознает.
Lingvo с встроенной функцией распознавание для iOS тоже дает хороший результат на напечатанной странице текста. Стоит сделать текст как на первом скриншоте и он начинает сильно ошибаться. При переводе архивов в цифру приходится работать с очень плохим качеством документов.
Глупость все это. Хорошая машинистка «бьёт» 400-600 знаков в минуту текста, который способна прочитать. И даже «со слуха».
Итого, 3-4 карточки в минуту точно успеют вдвоём. Нужно только договориться о структуре текста, чтобы потом его распарсить:
Например, можно диктовать так:
новая карточка
О25
автор
Юлов Н Н
код
А13
титул
классификация книг, ее история…
При правильное разбивке на блоке и хорошем ПО результат будет лучше при методе, описанном выше. Ключевое слово в названии удаленный . Люди работают из дому и у компании уменьшаются затраты на сотрудников. Дома человек работает сам. Парная работа возможна только в офисе. КПД получится выше от двух людей, которые печатаю слепым методом.
Я и не предлагаю Вам заставить людей работать в паре. Это просто один из вариантов использования наборщиков.
Просто мой опыт подсказывает, что ПО для OCR в данной задаче вообще лишнее, что я и пытался донести.

И насчет безопасности тоже бы поспорил. Если спросить машинистку о содержании текста, с которым она работала час назад — она ответит, что не запоминает его. И это — правда. Все рефлексы «на автомате» делаю своё, а мозг занят совершенно другим. Поэтому достаточно просто перемешать карточки.
А вот все лишние операции связанные с отрывом рук от клавиатуры — зло. Самый лучший интерфейс — его отсутствие, текстовая консоль. Enter — перевод строки, Ctrl-Enter — следующее поле. Лучше, чтобы поля выглядели как один документ, то есть можно было бы перемещаться по всей карточке курсорными стрелками.

Вот тогда вы удивитесь, насколько быстро можно ввести 10 тысяч карточек.
Не важно, запомнит ли машинистка или нет. Любая работа регламентируется должностной инструкцией, которая формируется на основе действующего законодательства и условий подписания договора с заказчиком. Таким образом подача конфиденциальной информации оператору со стороны исполнителя запрещена.
Отвечаю на часть комментария про интерфейс. Переход между полями — Tab, новая карточка — Enter. Прежде чем система даст пользователю отправить карточку, каждое поле проверится на валидность и соответствие правилам прописанным в инструкции.
Достоверность конечного массива должна иметь достоверность не ниже 97%. Жесткие проверки, разделение труда и последующая ручная проверка позволяют добиться такого показателя.
Вот такой вопрос возник.

У вас на скриншотах карточек изображения получаются довольно низкого качества. Серый фон, слабая контрастность, размытые края букв.

А что если сначала попытаться программно улучшить качество оцифрованных изображений (перед тем, как скармливать их Файнридеру)? Ведь это всё хорошо чистится графическими фильтрами.
Тем более что для этого есть отличные библиотеки, например, imagemagic, который легко прицепить к PHP.
Мы сканируем в качестве 300 DPI. Практика показывает, что в данном случае результат будет идентичным. Часть скриншотов была сделана в 300 DPI, часть в более низком качестве. Все примеры были выложены по ссылке в блоге. Пожалуйста, вот результат распознавания карточки с качеством в 300 DPI.

Дело не в разрешении, а в том, что на картинке изображено. Повторюсь, серый грязный фон, размытые буквы, нечёткие границы. Всё это можно улучшить пост-обработкой, графическими фильтрами. По крайней мере, я уверен, фон можно убрать (останутся буквы на белом фоне), а контрастность значительно повысить.

Оценивать работу Файнридера без такой обработки я бы вообще не стал. Начните не с него, а с Imagemagic или фотошопа.
Все карточки разные. Есть с серым, белым, зеленым фонами. В некоторых случаях текст сливается с фоном. Для потоковой работы ставится экшн в фотошопе, который будет на части карточек стирать информацию. По этой причине я разместил скриншоты с фоном, максимально приближенный вид к производству.

Даже если удалить фон и повысить контрастность вручную, FineReader не сможет распознать рукописный текст.
Обычно содержание книги служит рекламой книги. Содержание курса рекламой курса. Содержание семинара — рекламой семинара.

Вы тщательно скрываете содержание, как будто в нем вся суть курса. Т.е. либо вы боитесь зная содержание заранее человек либо не пойдет к вам на курс т.к. там будет фигня. Либо зная содержание изучит все самостоятельно (тогда в чем польза от вашего обучения?).

В общем как-то вы очень неуверенно выглядите под этой завесой секретности и доверия это вызывает весьма мало.
Sign up to leave a comment.

Articles