ondister3 июн 2013 в 15:41

Распознавание бланков психологического тестирования с нуля

6 мин

27K

C# * Алгоритмы * Обработка изображений *

Из песочницы

+26

Комментарии 11

maksbotan 3 июн 2013 в 16:26

Если когда-нибудь еще придется работать с изображениями, посмотрите на OpenCV — говорят, очень хорошо для этого подходит :)

ondister 3 июн 2013 в 16:59

Безусловно, но aforge написан на C# и мне были интересны приемы написания кода. Я ведь шарп не очень знал.

dimitrimus 3 июн 2013 в 16:30

почему-то напомнило бланки тестирования в военкомате, когда в первый раз на учет становишься :)

ondister 3 июн 2013 в 17:00

Вы не поверите где я работаю…

AraneusAdoro 3 июн 2013 в 18:40

Тьфу. Я аж в чудеса поверил, пока в профиль не заглянул.

Надеюсь, и у нас такое будет автоматикой проверяться когда-нибудь. (Могу и ошибаться, но на моей анкете маркеров не было).

kefirr 3 июн 2013 в 17:14

Классно, что всё получилось. Недавно была похожая задача — тоже бланки опросов распознать. Взялся за C#+OpenCV (EmguCV), тоже бинаризация (threshold), определение поворота, разбивка на регионы. Но, к сожалению, затея провалилась, т. к. бланки оказались разные (несколько вариантов с разным расположением граф), и нужно было отличать + от -. Задача была разовая, и ручная обработка заняла меньше времени, чем написание кода.

iwi 3 июн 2013 в 20:48

У меня немного вопросов:

Как собираетесь бороться с нестандартностью и разнообразием бланков? Не во всех бланках ячейки идут такими удобными ровными столбиками без текста. Не станет ли это проблемой?
Если поиск ячеек базируется по яркости, будет ли работать алгоритм на цветном бланке?
Вы хотите выдать продукт людям. Будет ли это открытый исходный код или как-то иначе? Что делать тем, кто не умеет компилить, но хочет пощупать?

Меня очень заинтересовал ваш продукт. Желаю вам успехов и сил довести всё до конца.

ondister 4 июн 2013 в 03:11

В базе данных хранятся координаты ячеек, поэтому разнообразия бланков не страшно.
Любое цветное изображение бинаризируется, то есть преобразуется в черно-белое, а уж потом распознается.
Это будет библиотека для распознавания бланков тестирования с открытым исходным кодом и тестовым приложением.

SKolotienko 4 июн 2013 в 14:13

[реклама]
ocrsdk.com/plans-and-pricing/
Помимо обычного распознавания текста возможно сделать также рукопечатное (например, когда от руки пишут по одной букве в клеточку) распознавание или распознавание меток, как в вашем случае.
Ну а если нужно распознавать гибкие формы — то тут уже надо смотреть в сторону FlexiCapture
[/реклама]

Piskov 5 июн 2013 в 12:24

Нафиг это облако (если только не разовая акция) — проще какой-нибудь «Омнипейдж» купить, настроить распознавание с экспортом в csv и не париться (особенно, если бланки разные и могут менятся).

Ezgard 7 июл 2015 в 08:47

Очень заинтересовал ваш продукт.
Он еще живой? Можно с вами как-то связаться?

Зарегистрируйтесь на Хабре, чтобы оставить комментарий