feihunt 8 янв 2013 в 15:45

Простейшая кластеризация изображени методом к-средних (k-means)

5 мин

88K

C++*Обработка изображений*

Туториал

Из песочницы

+33

Комментарии 23

Brand 8 янв 2013 в 15:48

То, что должно было быть упомянуто — результат чувствителен не к шуму, а к начальному выбору центров.

feihunt 8 янв 2013 в 15:59

Да и кнему тоже.Про шум я имел ввиду то, что например при том же вычитании фона, некоторые точки из-за шума исходных изображений могут детектироваться как движущийся, а если они находиться на существенном расстоянии от кластера то граница того же кластера может сушественно исказиться.

srgkvlv 8 янв 2013 в 18:43

Вы правы, чувствительность к шуму — главная «болезнь» k-means. По схожему принципу работает алгоритм k-medoids, но он менее чувствителен к шумам поскольку как центр кластера использует один из объектов кластера, а не некоторый «центр масс».

uniqueperson 9 янв 2013 в 15:14

ну и то, что зачастую это неплохо «лечится» случайным выбором изначальных центров + запуском пакетом (batch), т.е. несколько раз подряд с последующим усреднением результата

kahi4 8 янв 2013 в 15:56

А если будет две одинаковые машины, он будет считать их одной?

feihunt 8 янв 2013 в 16:01

если они не будут загораживать друг друга, то нет.

HunterSpy 8 янв 2013 в 17:59

Фактически две машины одного цвета контуры которых пересекаются будут одной машиной я правильно понял?

feihunt 8 янв 2013 в 18:00

Да, вот такой недостаток.

ZlodeiBaal 8 янв 2013 в 19:43

Странно слышать рассказ об алгоритме кластеризации, с «примерами», нарисованными ручками. На них же ничего не видно. Интереснее смотреть когда есть картинка, которую кластеризуют. А тут сухой пересказ классического алгоритма и немного кода. Не видно ни на что алгоритм способен, ни его минусов.

P.S.
А, это первый пост автора. Тогда плюс. Но в будущем пишите более развернуто, с нормальными примерами.

feihunt 8 янв 2013 в 20:03

Да, с картинками нехрошо вышло, т.к с самой программой, которая выделяет движущиеся объекты, возникли пролемы.Пришлось ручками, хотя результат, впринципе, должен получиться приблизительно такой.

DejmosSm 8 янв 2013 в 20:14

А каким алгоритмом движущиеся объекты выделяли?

feihunt 8 янв 2013 в 20:24

пока что вычитанием с вычислением адаптивного порога

yourich 9 янв 2013 в 09:21

В случае использования только значений RGB результат будет совсем не таким. Как минимум, наравне с синей и красной машинами в отдельный кластер будут отнесены зеленая трава и серый асфальт. Приведу пример применения алгоритма K-средних для изображения, взятого из книги Bishop, «Pattern recognition and machine learning»:

Если же использовать вместе со значениями RGB еще и координаты самой точки (как предлагает автор), то возникает вопрос соотношения и нормировки этих величин: может сложиться ситуация, когда разница в расположении точек вносит намного бОльший вес в «расстояние» (которое считается как корень из суммы квадратов разницы соответствующих значений), нежели разница в цвете, либо наоборот. К примеру, для изображения 1000х1000 px максимальная разница координат точек (x и y) составляет 1000, тогда как разница в значении красного, зеленого и синего цветов не больше 255.

feihunt 9 янв 2013 в 10:28

Вы несколько все усложняете, в данном случае трава и асфальт никогда не попадут в кластер т.к они вообще не участвуют в кластеризации. В данном посте рассматривался тот случай, когда после метода вычитания фона все объекты кроме движущихся отсекаются, и в вектор кластеризируемых точек попадают только точки двух машин.

MikhailS 9 янв 2013 в 10:37

Как минимум, наравне с синей и красной машинами в отдельный кластер будут отнесены зеленая трава и серый асфальт.
Как я понял, они же «пропадают» при вычитании фона, то есть их пиксели в принципе не доходят до этапа кластеризации.

(надо обновлять комментарии, да)

А про соотношение цвета/сдвига координат — можно привести всё к значениям на [0;1] и уже там шаманить с весами, не будет хотя бы зависимости от размера картинки.

Holms 8 янв 2013 в 22:47

А как всё это собственно запустить, т.е. как вызвать метод Start?
Создать сколько надо кластеров и во все записать цвета пикселей или как-то по другому?
Спасибо

DejmosSm 9 янв 2013 в 00:42

Создать массив кластеров clusarr размером k и вызвать Start() на любом из них с k, clusarr и вектором пикселей vpt.

MIC 9 янв 2013 в 06:00

А почему этот алгоритм не реагирует на тень? Она ведь не меняется и движется с той же скоростью

DejmosSm 9 янв 2013 в 06:48

Ну по идее он должен на нее реагировать, а для отсечения теней применяются другие методы. Еще при выделении движущихся объектов можно перейти из RGB в YUV или HSV. Там теням будут соответствовать изменения в данном месте компоненты яркости практически без изменений цветовых компонент. Ну и так далее.

feihunt 9 янв 2013 в 09:03

В тиории ее надо отфильтровать перед тем как подавать в алгоритм

Nbooo 9 янв 2013 в 09:57

Координаты нового центроида можно найти описав вокруг пикселей кластера прямоугольник и тогда центроидом будет пересечение его диагоналей.

А почему не найти среднее арифметическое координат пикселей кластера для определения координат центроида?

feihunt 9 янв 2013 в 10:30

Можно конечно и так, но в посте рассматривался именно прямоугольник для большей наглядности.

MikhailS 9 янв 2013 в 10:54

Наглядность наглядностью, конечно, но центр масс-таки и нагляднее центра некого описывающего прямоугольника, да и корректнее, имхо.

Вот, например, в таком случае:

Скрытый текст

Центр прямоугольника даст точку A, тогда как реально стоило бы брать нечто ближе к точке B. Суть же в том, чтобы взять точку, «хорошо приближающую» точки текущего кластера.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий