Vasyutka 11 июн 2014 в 06:09

Распознавание автомобильных номеров в деталях

9 мин

149K

Блог компании RecognitorАлгоритмы*Обработка изображений*

+69

Комментарии 40

subver 11 июн 2014 в 07:21

А есть ли способ упростить распознавание 2х значного номера, например, наклеенного на борт или стекло машины? Например напечатать его каким либо особым образом или еще что то, чтобы при проезде мимо камеры, номер считывался? )

Ocelot 11 июн 2014 в 10:19

Номера печатаете вы сами? Так рисуйте рядом штрих- или QR-код.

datacompboy 11 июн 2014 в 11:05

qr/штрих коды на скорости ваще не читаются

Vasyutka 11 июн 2014 в 11:07

да, одномерный штрихкод с линиями вдоль движения должен стабильнее читаться )

Ocelot 11 июн 2014 в 12:04

Тогда цветовой код. 4 разноцветных квадрата плюс метка для привязки — будет отлично распознаваться при любом смазывании картинки. Можно сами цифры делать цветными.

Vasyutka 11 июн 2014 в 13:28

Цвет очень плохо запечатляется камерами, особенно в разных условиях освещения. Задача баланса белого тоже не тривиальная, там еще накладываются проблемы чувствительности элементов матрицы к ИК и много других. Да что говорить, даже для человека ночью все кошки серые. А у человека есть умная система баланса белого (здорово опирается на контекст), шикарный динамический диапазон чувствительности,

Только если какой-то мощный известный нам источник света есть, который освещает все. Такие условия на производстве при контроле качества можно обеспечить. Улица — значительно сложнее.

Vasyutka 11 июн 2014 в 11:06

QR код человек не на лету схватывает. Ну мне кажется номер из цифр, как на почтовом конверте, читались бы отлично. Кто-то на хабре писал, что и их можно улучшить. Но да, там какой-то компромис будет между читаемым человеком и читаемым машиной. Штрих коды же действительно мощная штука, в том числе и одномерные.

Еще стоит обвести в какую-то рамку или поставить рядом крестик / какую-то метку дать для быстрого поиска области с цифрами в кадре

Mrrl 11 июн 2014 в 08:42

А почему речь всё время идёт про 5 символов? Ведь три буквы плюс три цифры это шесть? Или здесь какая-то хитрость, оставленная читателю?

Vasyutka 11 июн 2014 в 11:08

АААА! Это мозг в 4 утра перестал считать до 6 ))) спасибо, правлю

Vasyutka 11 июн 2014 в 11:12

Пойду, кстати, код поинспектирую на предмет магического числа 5…

Magi 11 июн 2014 в 08:44

Объединитесь с авторами программы RoadAR. Видеорегистратор с распознаванием знаков, номеров и отсылкой жалоб на нарушения был бы отличной штукой.

KEKSOV 11 июн 2014 в 13:40

Давно у меня была идея по созданию сервиса по сбору статистики о дорожном движении — ставим такой девайс в машину и он регулярно отправляет на сервер увиденные номера (в виде криптохеша, чтобы не подвергать риску личную жизнь автолюбителей). Такой ресурс мог бы предоставить бесценную инфу о городских транспортных потоках — откуда и куда люди регулярно перемещаются, что позволило бы оптимизировать дорожную сеть.

Второй вариант использования такого сервиса — ставить лайки и минусы другим водителям прямо в реальном времени. А система бы тебе потом подсказывала — впереди урод, держись от него подальше.

BelBES 11 июн 2014 в 17:02

А такой сервис не попадет под незаконный сбор и обработку персональных данных? Ведь фактически можно будет в автоматическом режиме массово фиксировать типичные маршруты для всех автомобилистов.

KEKSOV 11 июн 2014 в 17:08

Я там в скобочках написал, что на сервер будут отправляться только крипто-хэши номеров, а не сами номера. То есть владельцы сервиса никогда не смогут идентифицировать конкретного водителя, всё будет обезличено.

Mrrl 11 июн 2014 в 17:20

А в чём проблема просчитать хэши для двухсот миллионов реально возможных номеров, и тем самым получить базу для их идентификации? Или у каждого пользователя персональный ключ шифрования, и следовательно, своя база? Но тогда и сервер не нужен.

KEKSOV 11 июн 2014 в 18:45

Да, логично. Про вариант просчета хешей я позабыл. Но, можно предложить следующий вариант (детали будут отличаться, но смысл, думаю, ясен) Берем таблицу всех возможных номеров, и каждому из номеров присваиваем id, который вычисляется как, скажем, floor( порядковый номер записи / 1000 ), таким образом мы разбиваем все номера на группы по 1000 знаков в каждом. Для статистических целей по анализу трафика этого может быть достаточно, а вот с вероятностью 100% сказать, что конкретный номер был там-то и там-то, уже не получится — 1000 номеров имеют одинаковый id.

Функция генерации не уникального id по номеру может быть какой-то иной, главное, что бы номера равномерно распределялись по группам. Как-то так…

KEKSOV 24 июн 2014 в 07:00

В Нью-Йоркской городской думе не читали Хабр и наступили на эти самые грабли :)

ZlodeiBaal 12 июн 2014 в 02:31

По закону РФ номер не является собственностью автовладельца, а является собственностью РФ: автовладельцу его представляют в пользование. Он не имеет права его скрывать. Думаю, что противозаконной было бы привязывать номер к фамилии. А сам по себе сбор номеров не должен являться противозаконным.

ZlodeiBaal 11 июн 2014 в 15:41

У нас открытый сервер. Если они заинтересованны будут — им можно воспользоваться, если что, мощность попробуем нарастить. Навязываться с нашим открытым проектом в закрытый коммерческий проект как-то неприлично.
Мы сами, кстати, в восхищении от их системы. Сами такое давно обсуждали, но решимости браться за что-то настолько глобальное не было.

NFM 11 июн 2014 в 08:45

Очень познавательно, но читаю уже несколько статей и все задаюсь вопросом, можно ли обхитрить алгоритм? =)

Vasyutka 11 июн 2014 в 11:16

Ну я так понимаю интеллектуально обхитрить? Чтобы не пришлось подтачивать завитушку у буквы В до Р?

Не знаю. вот конкретно второй алгоритм — как-то схитрить с границами. Границы слева-справо, например. Скосы подрисовать черной краской на номере или белой под 30 градусов. Получится как будто перспектива такая. Какие-то другие алгоритмы за другие характерные части номера цепляются (хотя за рамку довольно часто).

sp2k6 11 июн 2014 в 10:00

Спасибо за весь цикл статей, очень познавательно и интересно.

У меня вопрос по обучению каскада Хаара: каким образом вы выбирали лучшие характеристики для тренировки (пропорции сэмплов, размеры сэмплов, количество стадий, maxFalseAlarm и тд)?

Vasyutka 11 июн 2014 в 11:10

решили не изобретать велосипед и воспользоваться утилитой из OpenCV. Она как-то сама. Хотя здесь как раз неприятное место — действительно оно как-то обучилось… а хорошо или плохо — ктож знает. Как раз сижу разбираюсь уже пару дней, что можно/нельзя сделать с этим Хааром.

sp2k6 11 июн 2014 в 11:20

Если не трудно, держите нас в курсе дела по этому вопросу :)

ZlodeiBaal 11 июн 2014 в 11:39

Примерно так же как я писал в этой статье — habrahabr.ru/post/208092/
А настроечные параметры очень зависят от базы. Там изменится база на 100 объектов — всё уже значительно уйдёт.

jonic 11 июн 2014 в 14:20

а я бы попробовал сервис распознавания капч для распознавания номеров… Уж больно любопытно, заработает ли эта связка(вырезанный номер вместо капчи)

ZlodeiBaal 11 июн 2014 в 15:52

Капчу можно считать сломанной, если её распознавание работает с вероятностью выше процентов 5-10. У нас номера куда лучшей вероятностью распознаются:)

kmike 11 июн 2014 в 15:57

А данные (картинки) выложите в открытый доступ?

НЛО прилетело и опубликовало эту надпись здесь

ZoomEx 11 июн 2014 в 17:29

Два вопроса:
1) Предполагает ли ваш алгоритм калибровку камеры для устранения дисторсий, чтобы лини на изображении были прямыми?
2) Почему вы не используете ректификацию (гомографию в плоскость сенсора) изображения? По крайней мере в статье она не упоминается.

Просто я недавно экспериментировал с ректификацией изображения (гомографией) и мне казалось, что это должен быть неотъемлемый этап в процессе распознавания плоского номера.
Недавно получил “письмо счастья” (комплекс Стрелка СТ). Судя по фото они этого не делают. Понятно, что камеры длиннофокусные и расположены четко по методике, но мне все же кажется, что смысл есть.

ZlodeiBaal 12 июн 2014 в 02:42

1) Дисторсию нельзя устранить без знания геометрии линзы, или без набора тестовых фотографий шаблона с известным изображением. Ни то ни другое невозможно сделать для десятков разных моделей телефонов. С другой стороны, дисторсию на 90% сегодняшних устройств делают программно и вшито. 100% веб-камер с которыми мы имели дело при попытки откалиброваться OpenCV-алгоритмом подавления дисторсии давали нулевые её коэффициенты: преобразование делается внутри камер.

2) Для того чтобы сделать гомографию номера сначала нужно точно найти его границы. После точного нахождения границ определить буквы уже не представляет никакой сложности. Но зачастую проблема в том, что границы нечёткие, много теней, граница загораживается рамками автомобиля. При её нахождении будет крупная погрешность. В нашем алгоритме используется перебор гипотез по масштабу (это описано в статье). По сути это является неявной гомографией.

mejedi 11 июн 2014 в 23:34

кстати это кто-то нам отправил желтый номер такси, насколько я понял — формат не штатный

Вобще, есть очень много форматов номерных знаков.

НЛО прилетело и опубликовало эту надпись здесь

ZlodeiBaal 12 июн 2014 в 02:33

В каждой статье её кто-нибудь выкладывает… ;)

BigObfuscator 12 июн 2014 в 10:59

У меня несколько вопросов:
1) Удается ли распознавать смазанные номера, когда камера тряслась при съемке, типа такого:

Скрытый текст

2)Удается ли распознать расфокусированные номера:

Скрытый текст

3) Аналогичный вопрос — для непрямых, изогнутых номеров:

Скрытый текст

4) Что вы делаете с афинными искажениями (skew):

Скрытый текст

5) Ну и наконец номера типа таких удается распознать?

Скрытый текст

Спасибо.

ZlodeiBaal 12 июн 2014 в 17:32

Васи нет, отвечу я. Может чуть позже он добавит мой ответ изображениями, что распознаётся, что нет.

Так, начну в принципе с этого:
193.138.232.71:10000/uploadimage — сюда можно загрузить полноразмерную картинку и проверить как выделяется + распознаётся
193.138.232.71:10000/result — сюда можно загрузить обрезанный кусок и посмотреть на то, как распознаётся номер у него

1-2) С настолько жесткими примерами, думаю, не справится. Но за счёт того, что буквы мы анализируем без бинаризации со многими размазанными и смазанными оно всё же работает.

3) Не всегда, но часто работает. Так как достаточно много гипотез по размеру и сдвигу буквы, то если поворот осуществлён более-менее правильно, то схватится.

4) Нет, с такими сильными искажениями мы пока не занималсь.

5) 1 и 3 — нет, считается, что буква должна быть темнее номера. 2 — как повезёт конкретно этот нет, но зачастую бывают примеры где алгоритм справляется.

В целом, хотел бы повторится, что у нас очень простой алгоритм, не заточенный под редкие ситуации. Потихоньку мы его допиливаем, в свободное время, но от какой-бы то ни было универсальности он далёк:)

xandr0s 1 июл 2014 в 22:55

C757PP 949 54% B444HP 77 53%

netmaxed 8 сен 2014 в 12:51

Добрый день!
а можно как-нибудь получить Вашу базу изображений, а то хочется поиграться с настройками Хаара, а самому собирать такую базу очень муторно?

nswbit 1 авг 2016 в 15:08

+1 можно получить? Очень пригодилась бы в обучающей выборке.

buriy 19 дек 2016 в 19:36

Авторы выложили базу в соседнем посте:
https://habrahabr.ru/company/recognitor/blog/243919/

Зарегистрируйтесь на Хабре, чтобы оставить комментарий