LRpro Aug 29 2016 at 08:06

Распознавание цифр на микроконтроллере

4 min

20K

IOTDIY

+14

Comments 36

mmMike Aug 29 2016 at 09:28

У мышиного сенсора есть очень существенный недостаток (ADNS2610).

На первый взгляд, интерфейс вытаскивания изображения по весьма приличной тактовой частоте должен был дать весьма хорошее количество кадров в сек. Но… дьявол крылся в деталях.
Фраза в документации на ADNS2610 по поводу 6-го бита данных
"Data_Valid There is valid data in the frame grabber" была не с проста!

Пытаясь задействовать в своем проекте (то же распознование, но попроще, фиксированных пиксельных кодов), с удивлением и разочарованием наткнулся на то, что фактическая частота кадров ВСЕГДА около 4.67 кадра в сек.
Выше SCK — больше байт идет с 6-м битом "не валидные данные".

А 4.67 кадра — вообще ни о чем. Быстрое сканирование не получится.

У меня даже результаты с разным SCK зафиксированы в исходниках.
// 18x18 image scan:
// 0.214s 1008..1012 lostCnt(ADNS2610_delay = 110us, CLK_halfDelay = 8)
// 0.214s 691..701 lostCnt (ADNS2610_delay = 100us, CLK_halfDelay = 20)
// 0.214s 517..520 lostCnt (ADNS2610_delay = 100us, CLK_halfDelay = 30)
// 0.214s 377..380 lostCnt (ADNS2610_delay = 150us, CLK_halfDelay = 30)
// 0.214s 52..54 lostCnt (ADNS2610_delay = 100us, CLK_halfDelay = 100)
// 0.214s 39..41 lostCnt (ADNS2610_delay = 120us, CLK_halfDelay = 100)
// 0.218s 0..1 lostCnt (ADNS2610_delay = 200us, CLK_halfDelay = 100)

SopaXT Aug 29 2016 at 09:37

ESP8266 вполне может работать самостоятельно, без дуины, а здесь даже пинов хватает.

LRpro Aug 29 2016 at 10:00

Ага, об этом мы упоминали.

KonstantinSoloviov Aug 29 2016 at 12:53

Они оба... могут! )

Celtis Sep 1 2016 at 12:14

При этом 8266 обладает существенно большей производительностью.

LRpro Sep 2 2016 at 06:02

Именно это нас и привлекло в ESP8266. Поэтому переносим проект на эту платформу.

Andy_Big Aug 29 2016 at 09:37

Сразу хочу оговориться, что в данной статье не будет приведен исходный код, рассматриваться технология или алгоритм распознавания

То есть рекламная статья?

С радостью ответим на вопросы.

Да вы первым же абзацем урезали по самое небалуй возможность задавать вопросы :)
Теперь вот только один интересующий вопрос остался из всех — а зачем вам этот девайс? Ну, кроме как для того чтобы убедиться, что на ардуине это возможно.
А, и еще один — а распознается цифра, повернутая на 45 градусов? На 90? На 180?

LRpro Aug 29 2016 at 09:59

Конкретно этот девайс для тестирования, а так например можно разработать устройство считывания показаний со счетчиков, например.

Касательно вопроса про поворот: не проводили таких исследований, так как изначально задача стояла распознавание на микроконтроллере хоть при каком нибудь угле.

Andy_Big Aug 29 2016 at 10:10

Просто предложение "Это было нужно для того, что бы увеличить расстояние от объекта съемки до камеры иначе цифры нашего размера не помещались и была видна лишь небольшая часть." наводит на мысль, что у вас была конкретная цель.
А по алгоритмы вы разве не можете сказать распознаются ли повернутые на произвольный угол цифры? Сам алгоритм это предусматривает?

ncix Aug 30 2016 at 07:00

>> а так например можно разработать устройство считывания показаний со счетчиков, например
У счетчиков, например, обычно есть импульсный выход.

LRpro Aug 30 2016 at 07:29

Скажем так не у всех видов счетчиков есть импульсный выход.

ncix Aug 30 2016 at 07:49

Верно. Но не будет ли дешевле заменить счетчик чем ставить распознаватель? Тем более описаное решение из-за механики вглядит сложным и дорогим в серийном производстве.
Может я неверно интерпретировал подтекст, но у меня сложилось впечатление, что вы таки подумываете о серийном применении.Нет?

Но в целом проект концептуально интересный. Вы показали что на дешевом МК можно распознавать символы. Это здорово.

LRpro Aug 30 2016 at 08:11

Хм, а в чем собственно дороговизна, на Ваш взгляд?

ncix Aug 30 2016 at 08:31

Приводы, механика, десятки деталей. Это навскидку будет вам стоит не одну и не две тысячи рублей в производстве при средних партиях. Да и конструкцию придется долго отлаживать, пока она станет достачной надежной. Т.е. это целесообразно если мы говорим не о бытовых счетчиках а о каких-то дорогих высокоточных приборах (которые давным-давно все оснащаются цифровыми выходами).
Несмотря на привлекательность распознавания образов на дешевом контроллере, тут видится более рациональным применение камеры и дешевого одноплатника типа RPi и без подвижных частей.

И еще один момент есть — если ваши счетчики работают в сфере госрегулирования (например бытовые счетчики воды), то и ваш прибор (он будет считаться устройством сбора и передачи данных) окажется в сфере госрегулирования, а значит скорее всего подлежит внесению в госреестр как средство измерений, и должен проходить первичную и регулярную поверку. А это всё недешево.

LRpro Aug 30 2016 at 08:42

Хм, а с чего вообще Вы взяли, что должна быть какая-то механика? Достаточно микроконтроллера и камеры. Сенсор мыши мы применять не собираемся, ибо это нецелесообразно. И перемещать камеру или сенсор над каждой цифрой нет никакого смыла. В статье это всего лишь установка для удобства.

ncix Aug 30 2016 at 08:57

бОльшая часть статьи именно про механику и сенсор мыши, а это оказываетс описание тупикового этапа разработки.
Хотелось бы тогда прочитать про сопряжение реальной камеры с ардуиной

LRpro Aug 30 2016 at 09:16

Можно и так сказать. Надо же было на чем то отлаживать. Думаю эта статья не последняя на тему распознавания.

geisha Aug 29 2016 at 12:35

Полагаю, цифры 6, 8, 9 и 0 распознаются повернутыми на 180. Ваш кэп.

LRpro Aug 29 2016 at 13:21

Нет никакого поворота на 180.

masai Aug 29 2016 at 14:18

То была шутка, полагаю. :)

geisha Aug 29 2016 at 14:52

Магия.

Andy_Big Aug 29 2016 at 15:48

Из них распознаются только 8 и 0, а перевернутые 6 и 9 будут выдавать 100% неверное распознавание :))

Shpakov Aug 29 2016 at 09:49

Напомнило: в начале двухтысячных делали для военных полигонов модернизацию теодолитов для угломерных измерений (использовались для построения траекторий объектов, исходные теодолиты снимали на пленку). В связи с ограниченным бюджетом и требованием военных о сохранении возможности обратной переделки решение было принято такое — внутрь теодолитов устанавливались камеры, основная для съемки объекта (использовала оптику теодолита) и две вспомогательные, снимающие изображение напрямую с лимбов. Изображение с лимбов обрабатывалось на ПЛИС EP2C5 (второй циклон) и полученные данные скидывались в одном потоке в накопитель. Для распознавания использовалось наложение эталонных масок на изображение цифры и решение принималось по количеству пересечений с маской.
В теории все выходило хорошо, а на деле столкнулись с трудностями — цифры на лимбах различались по написанию, лимбы загрязнялись, из-за убитой механики изображение выходило из фокуса и т. д., пришлось уже на полигоне для каждого теодолита вводить свои поправочные коэффициенты в работу с эталонными масками. Система работала (большей частью удовлетворительно), была утверждена и поставлена на поток. Разработчик предлагал доработать для лучших результатов (хотя бы заменить ПЛИС на более мощную), но для этого нужны были средства и нам сказали что-то типа «и так сойдет».
Через несколько лет стали доступны хорошие абсолютные датчики угловых положений и после долгих «боданий» убедили-таки руководство перейти на них.

masai Aug 29 2016 at 09:50

Раз уж статья называется «Распознавание цифр на микроконтроллере», то хотя бы название метода распознавания скажите. А то немного не то ожидаешь увидеть открывая такою статью.

LRpro Aug 29 2016 at 10:06

Метод претендующий на оригинальность, можно отнести к омнифонтовому морфологическому методу.

APaMazur Aug 29 2016 at 09:55

В текущем виде статья не предоставляет никакой информации о техническом решении. Вся суть сводится к одному предложению: "мы пытаемся распознавать на ардуинке и иногда это получается".

Особые вопросы вызывает вот эта фраза:

Приложение на планшете отправляет запрос, «ардуинка», получая запрос, «снимает» изображение с сенсора мыши, затем бинаризует его. После бинаризации происходит распознавание, а после его завершения формируется ответ.

Собственно, неясно, где таки проходит само распознавание и, если бинаризация на планшете, то к чему распознавание на микроконтроллере? Возможно будь в статье краткая информация о сути проекта — это было бы очевиднее.

LRpro Aug 29 2016 at 10:07

Все происходит в микроконтроллере, планшет только визуализирует результат.

defecator Aug 29 2016 at 10:28

Статья, имхо, ни о чём от слова совсем.
Куча фоток железа, ни слова хотя бы о методах распознавания, скорости распознавания и его качестве.

Подозреваю, что это — написать софт — вообще только в планах, но застолбить статью хочется.

LRpro Aug 29 2016 at 10:29

По видео демонстрации можно составить примерное представление о скорости распознавания.

sav13 Aug 29 2016 at 10:57

Зачем там городить ESP-шку? И Андроид?
Единственное полезно применение такого устройства — увидеть в дальнем углу цифры счетчика (например воды) и красиво подсветить цифры.
Если работать с картинкой, гораздо проще передавать с Дуины изображение и распознавать на Андройде. Благо, там вычислительных возможностей на два порядка больше

А вообще, статья без алгоритмов и исходников очень похожа на хвастовство. Или рекламу.

BubaVV Aug 29 2016 at 16:14

В давние времена на Palm OS работало распознавание рукописного ввода с процессором 16 МГц и 128 Кб памяти. Лагов на глаз заметно не было. Алгоритм работы лично для меня не очень понятен, информации по потрохам системы почти нет

tnt23 Aug 29 2016 at 17:38

Там было не распознавание рукописного ввода, а распознавание определённых закорючек (глифов), по начертанию с некоторой фантазией напоминающих буквы.

Настоящее распознавание рукописного ввода было на Newton.

MinamotoSoft Aug 30 2016 at 06:42

пытаетесь создать конкуренцию
http://www.slovary.ru/itemdet.php?item_id=118
???

Sylvan Aug 30 2016 at 08:03

спасибо за статью
Должен отметить что распознавание (OCR) на микроконтроллерах вещь хоть и не самая популярная, но совершенно реальная. Я в своих проектах делаю это именно на микроконтроллерах в реальном времени, с жесткими ограничениями по ресурсам. Распознавание символа за 10...100мкс на микроконтроллере за USD10 — реальность.
Жаль что заказчиков на подобные разработки найти сложно… наверное это действительно, мало кому нужно.
Отмечу что в реальных условиях как правило больше ресурсов уходит на подготовку образа к распознаванию чем само распознавание. Например, борьба с линейными и нелинейными искажениями, поворот и пр. Иногда соотношение времязатрат на подготовку к времязатратам на распознавание может быть 10:1.

Error1024 Aug 31 2016 at 20:21

Hamster во всем!

— Действительно — захомячить суть самой статьи.

Psychosynthesis Sep 2 2016 at 02:05

Ну, вы молодцы, но спасибо не скажу, ибо никакой инфы из статьи вынести невозможно.