ZlodeiBaal Nov 2 2013 at 21:30

Использование каскада Хаара для сравнения изображений

4 min

74K

Algorithms*Image processing*

+67

Comments 19

Mrrl Nov 3 2013 at 03:40

Для наклонных прямоугольников надо будет сосчитать ещё одно интегральное изображение?

ZlodeiBaal Nov 3 2013 at 07:41

Всё зависит от желаемой точности. Именно для задачки сравнения изображений я не считал ни разу, хватает 6 самых первых в обычной ориентации.
Для распознавания лиц они точность неплохо повышают.

EugeneEgorov Nov 3 2013 at 09:49

Да, нужно другое интегральное преобразование(впрочем, довольно очевидное), а формула SumOfRect с ним останется такой же.

Browning Nov 3 2013 at 07:45

Коротко и ясно, спасибо.
Сначала прочитал заголовок «использование каскада Хабра». :)

UFO landed and left these words here

ZlodeiBaal Nov 3 2013 at 09:58

Он, безусловно, значительно хуже точность и изменение геометрии чем SURF и SIFT держит. Но существенный плюс, что он быстрее и значительно проще. Если разработка идёт с нуле и точность SURF не нужна — Haar самое то будет.

UFO landed and left these words here

ZlodeiBaal Nov 3 2013 at 10:26

Мы когда-то опробовали SURF & SIFT (правда это было давно, года 4 назад), у нас не очень быстро он работал. В принципе, не исключаю, что там можно сильно оптимизировать, у нас тогда не было цели посмотреть, была цель поиграться:)
Но Хаар хорошо оптимизируется. Можно строить дерево, начиная сравнение с крупных модулей (два примитива на картинку), а когда накапливается расхождение, то переходить к следующей точке. Тогда оно в десятки раз ускориться по сравнению с полным перебором.

UFO landed and left these words here

BelBES Nov 3 2013 at 18:11

Это дескрипторы SIFT/SURF считаются только в локальных экстремумах градиента, а при поиске этих экстремумов бегаем по всему изображению. Плюс к накладным расходам прибавляйте необходимость матчинга фич между изображениями, а эта операция со сложностью O(n*m) (если считать не приближенные матчи, а перебирать все расстояния между фичами).
Ну и еще надо учитывать, что SIFT/SURF запатентованные алгоритмы — поэтому с их использованием в коммерческих продуктах могут быть сложности.

UFO landed and left these words here

ZlodeiBaal Nov 3 2013 at 10:44

Наглядно! Интегральное представление всё же на редкость полезная штука.

volocuga Nov 3 2013 at 14:01

Я ничерта не понял, но вам, парни, респект!

Chamie Nov 3 2013 at 18:21

например для центра лица человека будет всегда отрицательна следующая свёртка:
…
Глаза будут темнее, чем область между ними, так же как область рта будет темнее чем лоб.

Разве всегда?

Осторожно, большие картинки!

ZlodeiBaal Nov 3 2013 at 18:43

Ох тыж чорт. Второе, я думаю, OpenCV-шный поиск лиц не осилит.

Chamie Nov 3 2013 at 20:52

Вот такие лица вылезают в Гугле по запросу «face»:) Видимо, никто не пишет «face» к лицу, если это нормальное лицо.
Можно ещё на blackface полюбоваться.

Иллюстрация

…и в догонку

vovo4K Nov 3 2013 at 18:52

В большинстве случаев, когда нужно простое сравнение двух достаточно похожих фрагментов изображения его реализуют через их ковариацию (или что-нибудь аналогичное).

Вроде бы это раньше называлось «свёрткой» (convolution). А на ковариацию это не похоже как по формуле, так и по смыслу. Дальше в примере Вы правильно употребляете «свёртка».

ZlodeiBaal Nov 3 2013 at 19:10

В принципе и то и то конечно можно обзывать свёрткой (хотя оно не соответствует математическому определению), но мне хотелось как-то различить эти два процесса, разделив, что «свёртка» — с известной функцией, а корреляция/ковариация — с неким набором точек. Но, походу, получилось не очень.

sainquake May 4 2014 at 10:12

Спасибо автору. Сделал веб камеру следящую за выделенным объектом.

http://www.youtube.com/watch?v=2PHCFtm9b8I