NMellon Dec 14 2011 at 20:40

Алгоритм определения движения через сравнение двух кадров

4 min

22K

Algorithms *

From sandbox

+79

Comments 31

UFO landed and left these words here

NMellon Dec 14 2011 at 21:58

да, «дельта» другими словами — пороговое значение. Для каждой маски подбирается свое.

guyfawkes Dec 15 2011 at 06:09

Можете тогда этот «подбор» пояснить? Почему написано, что отнимается 2, но при этом просто убраны двойки из маски, и почему именно 2?

NMellon Dec 15 2011 at 08:50

Я убираю «на глаз». Смотрю все значения по изображению и определяю, при какой «дельте» (каком пороге) маска будет иметь необходимый вид (чтобы различные шумы на нее почти не влияли). А в шагах 6 и 7 — смотрим, чтобы и блики убирались нормально, и реальный объект не сильно «съедало».
Может есть и математический метод какой. Но я такой не искал. На глаз настроил и работает.
На второй вопрос — 2 это и есть порог. То что равно или меньше обнуляем, все что больше — оставляем.

CENTUR10N Dec 14 2011 at 22:46

Спасибо! Очень познавательно, как для меня.

pnd_ku Dec 14 2011 at 23:19

Есть ощущение, что в реальном видео с камеры будет работать лучше, ибо 2 соседних кадра не могут очень сильно отличаться. Итого — порогом будут порезаны незначительные движения деревьев и смена освещённости (далеко они за 1/20 секунды на простой веб-камере не переедут), а если ещё и подключить предыдущий кадр, и вычитать его движения, то всё вообще должно быть чистенько. Кажется мне…

GregoryF1 Dec 15 2011 at 05:59

зачастую такие алгоритмы требуется использовать с камерами наблюдения, которые сильно шумят, дают мало fps и т.д.

NMellon Dec 15 2011 at 08:53

На практике, в режиме слежения не обязательно «колбасить» со скоростью 1/20 сек. У меня работает сейчас слежение с паузой 0.3 сек. При записи — 0.1 сек.
Так вот за 0.3 секунды освещение может сильно меняться, пришлось улучшать алгоритм.
А так вы правы. В статье я привел экстремальный пример.

iXCray Dec 15 2011 at 00:00

Как насчет воспользоваться Гаусс-размытием?
Сила размытия будет определять границу между подавлением шумов и чувствительностью определения движения. Определить силу размытия можно на этапе калибрации: включить камеру на неподвижную сцену и снять первые десяток-два кадров для проведения сравнения и выделения шумов.

После того, как с шумами разобрались, остается проблема автоподстройки камеры под изменение светового заполнения сцены. Эту проблему можно как игнорировать (в случае, если камера профессиональная и подобная автоподстройка может быть выключена), так и обработать далее:
— выбросить «мигающий» кадр
— определить, не произошло ли полное перестроение источников света (включили/выключили свет в помещении)

Слишком большое количество дельт можно убрать, разбив алгоритм на три стадии: грубый анализ, уточнение, определение границ движущегося объекта.

Грубый анализ можно реализовать через вычитание двух соседних (а может и не соседних) размытых гауссом кадров — Вы получите перемещение контрастных точек. После этого проведение уточнения следует делать в окрестностях этих точек, не тратя процессорное время на неизменную часть кадра. Определение границ объекта может проходить как с помощью готовых алгоритмов (заливка, повышение контрастности), так и прикидочным образом с помощью попиксельного/поблочного вычитания.

mmatros Dec 15 2011 at 05:49

Я как-то занимался похожей задачей. Поэтому вопрос: почему нельзя просто оценить арифметическую разность двух кадров, и не заморачиваться вообще ни с чем?

bolk Dec 15 2011 at 06:27

Например, шумы испортят вам всю малину.

Eddy_Em Dec 15 2011 at 07:11

Представляем изображение в HSV, используем только H, шумы фильтруем элементарным гауссом (медианный фильтр, конечно, лучше, но он слишком медлителен для realtime). В итоге разность двух изображений даст нам надежную оценку, чего там новенького появилось.

ErmIg Dec 15 2011 at 10:09

Медианный фильтр, если его грамотно написать, вполне подходит для обработки реального видео (у меня, например, медианный фильтр 3х3 занимает менее 1 мс для 1 мегапиксельного серого изображения на одном ядре).

bolk Dec 15 2011 at 10:54

Вы сейчас на какой вопрос ответили?

Eddy_Em Dec 15 2011 at 11:05

На этот:

Например, шумы испортят вам всю малину.

bolk Dec 15 2011 at 12:48

А вы прочитали на что это был ответ? Там был вопрос, почему бы, не заморачиваясь ни с чем, просто не подсчитать арифметическую разность кадров. Я ответил почему нельзя. На что вы отвечаете мне непонятно.

mmatros Dec 15 2011 at 19:59

я думаю, количество шума на двух фотографиях, снятых с разностью 5 секунд, будет одинаковым. Этот уровень и сделать пороговым.

Зачем избавляться от шума, если он присутствует на обоих изображениях в одинаковом количестве.
В любом случае, если в кадре появляется человек, то это будет значительное изменение, точно не шум.

bolk Dec 16 2011 at 03:51

Количество будет примерно равным, расположение шумовых элементов, очевидно, будет разным. Вот это вам и помешает просто вычесть один кадр из другого.

mmatros Dec 16 2011 at 08:43

если уровень шума будет одинаковым, то можно просто не обращать на него внимания.

bolk Dec 16 2011 at 09:06

Ложные срабатывания даст.

mmatros Dec 16 2011 at 09:17

минимальный порог = кол-во шума*2

mmatros Dec 16 2011 at 09:18

т.е. порог срабатывания сделаем в два раза больше, чем количество шума.

Eddy_Em Dec 16 2011 at 09:23

Что значит «количество шума»? Все равно вам после вычитания кадров придется сделать медианную либо другую сглаживающую фильтрацию, иначе шум вида «соль-перец» будет давать множество ложных срабатываний. Ну, а после сглаживания нужно будет бинаризовать результат и выделить связанные области, которые и будут масками, позволяющими выделить новые объекты на кадре.

Dexif Dec 15 2011 at 05:57

Just For Fun и для самообучения — сойдёт и интересно… Спасибо. Хотя я в подобных случаях просто настраиваю Motion :)

NikoM Dec 15 2011 at 07:02

Жуткая картинка. Девушка без ног.

om2804 Dec 15 2011 at 07:18

наверно она их под себя подложила :)

NikoM Dec 15 2011 at 09:09

а стул у нее на ливитационной платформе )

UFO landed and left these words here

AndreyIvanoff Dec 15 2011 at 13:49

Для этих целей принято использовать алгоритм Lucasa-Kanade: Лучший мануал от Jean-Yves Bouguet.
Вот тут картинки Лекция про оптический поток.
Ваш подход мне показался наивным. Как по вашему алгоритму определить параметры проективных (или афинных в упрощении) искажений?

skyboy Dec 15 2011 at 14:13

Это конечно интересно, но почему для видео наблюдения, не использовать обычные датчики объема, на подобие этих www.gsm-alert.ru/media/catalog/product/cache/1/image/70e4f3cdda829922f4301d3770cbe283/5/5/55.jpg, точность срабатывания будет выше, да и реализовать такую систему гораздо проще, а если скомбинировать эти 2 метода, вообще хорошо будет.