Pull to refresh
0

TAPe-технология — новое слово в распознавании изображений

Reading time 4 min
Views 11K
Приветствую, уважаемые Хабражители!

Позвольте представить вашему вниманию блог компании Comexp, а также технологию TAPe, которая позволяет очень быстро распознавать изображения даже в условиях сильных помех.

Интересно? Прошу под кат

Зачем это нужно?


Как известно, существуют некие стандартные методы обработки изображений, позволяющие справиться с достаточно узким классом технических задач. Средства, используемые для анализа изображений, могут работать только в условиях минимальных помех. Если помехи становятся значительными, то надежность распознавания картинки резко снижается. При этом существенно возрастает время ее обработки, что сводит на нет все задачи по обнаружению объекта или слежения за ним. Еще бы, объект давно уже исчез, а система только через полчаса сообщила, что она его опознала!

Классическая технология обработки изображения предполагает три основных этапа:
  1. Первичная обработка
  2. Выделение классификационных признаков
  3. Классификация изображения.


До разработки TAPe-технологии первые два этапа не имели теоретического решения при условии наличия организованных помех. Именно этим объясняется отсутствие в настоящее время алгоритмов надежного распознавания человека по его фотографии, или телевизионных изображений в системах контроля различных правоохранительных органов.

Может, это фикция, и создать подобный механизм невозможно? Однако здесь, как всегда, нам бросает вызов сама природа, в очередной раз демонстрируя свое совершенство. Зрительный анализатор человека столь совершенен, что мы можем распознавать какой-то предмет не только в сложных погодных условиях, но и тогда, когда большая часть этого предмета от нас скрыта. Если для нас опознать, например, стакан по одной его кромке не представляется сложным, то для машины — это непосильная задача! В то время как машина работает с огромным числом несвязных чисел, человек обладает целостным восприятием, распознавая объект большими фрагментами по малому числу признаков.

Однако решение данной проблемы все же было найдено. Компания Comexp изобрела и запатентовала такую технологию, которая позволяет распознать объект даже при условии загораживания значительной его части. Эта технология получила название TAPe (англ. Theory of Active Perception — теория активного восприятия).

Этапы технологии состоят в следующем:


  1. Составление исходного описания. Одномоментная обработка всего изображения в целом. Отсутствие на этом этапе процедуры свертки позволяет избежать зависимости от возможных помех (шума). Возникающие помехи становятся частью изображения, что может быть использовано в пользу рассматриваемого объекта: в некоторых случаях это помогает получить его информативные элементы; все существующие картинки тождественно отображаются на определенное множество картинок, которые затем могут быть обработаны в реальном времени при помощи стандартных вычислительных машин. Например, если речь идет об обработке изображения на поле размером 1024х1024 с уровнями градаций яркости 256, то мощность многообразия изображений (все множество изображений) — это космическое число, составляющее 2561048576. При обработке мощность множества полутоновых изображений существенно уменьшается и может быть представлена небольшим количеством признаков, несущих информацию о наиболее значимых структурных элементах изображения.
  2. Анализ изображения. Обработка результатов первого этапа, пространственное дифференцирование, которое позволяет выявить композитные и структурные связи между всеми структурными частями изображения.
  3. Создание образа изображения. Подготавливаются специальные изобразительные описания, отражающие остовы и интегральные кривые структурных связей элементов изображения.
  4. Принятие решений. Составленное изобразительное описание сравнивается с эталоном, имеющимся в базе. Если эталон отсутствует, то происходит формирование нового эталона.


Отсутствие свертки позволило распознавать рассматриваемый объект значительно эффективнее, чем это происходило у пирамидальных зрительных машин, основанных на свертке. Для примера, пирамидальные зрительные машины эффективнее матричных машин в 106 раз!

Посмотреть в действии



Посмотреть на технологию в действии можно на нашем сайте в разделе «Протестируй», там представлены различные видеофрагменты, которые в реальном времени ищутся по записям недельных эфиров нескольких телеканалов по разным регионам. Список телеканалов и регионов для тестирования мы изменяем каждую неделю, актуальный список всегда отображается в разделе «Протестируй». Хочу отметить, что для уменьшения нагрузки на базу данных мы включили на сайте кэширование, поэтому отчет для каждого фрагмента формируется в первый раз после его добавления.

Также вы можете загрузить свой видеофрагмент (потребуется регистрация в два шага) и увидеть насколько быстро будет произведен поиск по базе. Если у вас под рукой нет никаких видеороликов из эфира, то мы подготовили список актуальных рекламных роликов и заставок для тестирования.

Рекламные ролики:


Заставки телепередач и сериалов:


Хотелось бы узнать мнение хабражителей по поводу нашей технологии. Сейчас мы развиваем направление мониторинга телеэфира, как приоритетное в использовании технологии TAPe, но параллельно разрабатываем API для сторонних разработчиков. Есть ли какие-то идеи на этот счет, пожелания, предложения? Буду рад узнать ваше мнение по данному вопросу.
Спасибо за внимание.
Tags:
Hubs:
+6
Comments 14
Comments Comments 14

Articles

Information

Website
www.comexp.ru
Registered
Founded
2006
Employees
11–30 employees
Location
Россия