alizar4 апр 2011 в 14:10

Отслеживание объектов на видео

1 мин

52K

Алгоритмы *

+149

Комментарии 79

netAn 4 апр 2011 в 14:12

popopo 4 апр 2011 в 14:43

Мне тоже стало страшно.

Boomburum 4 апр 2011 в 14:49

Зашел увидеть этот комментарий, но не думал, что он будет первым )

Nakilon 4 апр 2011 в 19:20

А за что плюсуют? За то, что хабр превращается в двач?

darkfrei 5 апр 2011 в 02:10

Не.

Nakilon 15 апр 2011 в 08:16

Ума на более подробный ответ не хватило? Или это тоже двачестиль?
Тупые малолетки.

qvas 4 апр 2011 в 14:43

Не будучи специалистом, правильно ли я понял, что в основе лежит идея в слабой изменяемости объекта слежения за короткий промежуток времени (судя по фреймам с объектами в правой части видео)?

Siddthartha 4 апр 2011 в 15:06

определенно, да.

НЛО прилетело и опубликовало эту надпись здесь

G0rDi 4 апр 2011 в 14:47

Определенно будет работать в Google

rPman 4 апр 2011 в 14:48

Выглядит классно, жаль нет хотя бы общего описания. А главное не показаны видео с ошибками распознавания (а то одни удачные примеры).

Теоретически, по крайней мере то чем я сам подумываю заняться, достаточно при успешном определении кадра (определенное пороговое значение) добавлять этот кадр в обучающую выборку и провести дополнительное обучение.

xSeth 4 апр 2011 в 14:57

Ошибки распознавания видны на части ролика относящейся к пальцам, там видно что трекинг прекращался но возобновлялся при возвращении пальцев в начальное положение. И из-за обучения в процессе улучшался дальнейший трекинг.

rPman 4 апр 2011 в 15:16

'не распознавание' это такая хорошая ошибка, легкая… гораздо гаже 'ошибочное распознавание'… скорость радует.

ColorPrint 4 апр 2011 в 15:18

На ютубе там у него ролики есть с процессом обучения, и там как раз прилично ложных срабатываний есть

beeruser 5 апр 2011 в 06:36

>> Выглядит классно, жаль нет хотя бы общего описания.
А на сайт его вы заходили? Там PDF-ки есть

НЛО прилетело и опубликовало эту надпись здесь

Foror 4 апр 2011 в 15:23

За что? За то что он заюзал OpenCV либу? Или SURF?

НЛО прилетело и опубликовало эту надпись здесь

savostin 4 апр 2011 в 20:18

рука дрогнула? или подсознание вмешалось? ;-)

НЛО прилетело и опубликовало эту надпись здесь

licvidator 6 апр 2011 в 01:58

Вот только засада в том, что преступникам и террористам надо предварительно хорошенько покрутиться на камерах общественных мест.
К тому же под вопросом, как подействует на алгоритм добавление например очков и накладных усов, бороды.

BigObfuscator 4 апр 2011 в 14:56

Распознавать фиксированный образ не проблема.
Но мне вот интересно как он масштабирование образа делает. Судя по всему, у него это шустро выходит.

Foror 4 апр 2011 в 15:32

Это через SURF алгоритм, скорее всего. На этом алгоритме даже такой проект есть www.tineye.com/ — будет искать вам похожие изображения в разных разрешениях и цветах. У парня просто в динамике это сделано.

BigObfuscator 4 апр 2011 в 18:06

Сомнения у меня есть в том, что это SURF. Быстродействие уж очень у него большое. Камера примерно 800*600 и 30 fps. Для описанных параметров машины, мне кажется что SURF не потянет.

НЛО прилетело и опубликовало эту надпись здесь

TheShock 5 апр 2011 в 19:55

кто сказал, что автор запустил просчёт сцены не через кадр?

TheShock 5 апр 2011 в 19:58

дык там же снизу и написано — 8-10 фпс

НЛО прилетело и опубликовало эту надпись здесь

liq 4 апр 2011 в 17:46

На его сайте есть ряд пдфок. Читая их и связанные с ними по референсам выяснилось, что он использует фичи 2bit Binary Patterns (2bitBP). Суть в том что это квантированные до 2х2 градиенты. В общем почти то же самое что LBP но вместо 3х3, используется окрестность 2х2, это дает возможность быстро считать их значения на различных масштабах через интегральную матрицу. Подробнее тут: info.ee.surrey.ac.uk/Personal/Z.Kalal/Publications/2009_olcv.pdf

BigObfuscator 4 апр 2011 в 18:04

О, это уже больше похоже на правду. Спасибо за наводку, почитаем :)

vosi 4 апр 2011 в 14:59

по сути — ничего революционного, но коммерческий успех его творение приобретет

NorthDakota 4 апр 2011 в 15:00

Там есть видео с ошибками (про чашку)

BuCeFaL 4 апр 2011 в 15:03

Очень интересный алгоритм. Применить бы его на поиск людей среди толпы, по предварительно загруженной фотографии, а еще лучше группы людей. Или поиск людей по частям тела, с высоты птичьего полета над зоной бедствия. И очень не хотелось бы такую вещь в военных целях (авто наведение).

BigObfuscator 4 апр 2011 в 15:08

Так в том, то и дело, что по фотографии он ничего не найдет. Ведь он обучается на множестенной выборке.

codemorgan 4 апр 2011 в 15:13

Новое поколение киллеров будет уничтожать целей по аватарке не выходя из дома.

EvilGen 4 апр 2011 в 19:55

Название у проекта уже подходящее, чтобы ставить систему на турели :)

AlexMorgun 4 апр 2011 в 15:06

То, что делают российские разработчики из Intel R&D в Нижнем Новгороде, это замечательно. Но то, что сделал этот парень не имея большой команды и финансирования, завораживает.

НЛО прилетело и опубликовало эту надпись здесь

Foror 4 апр 2011 в 15:25

А что он сделал? Подключил либу с реализацией SURF алгоритма? На ютубе полно таких примеров, чем этот чел круче других?

liq 4 апр 2011 в 15:50

Насколько я помню SURF в чистом виде не может адаптивно обучаться. Думаю тут немного посложнее все.
Возможно он создает словари позитив/негатив фич и потом их модифицирует за счет каких-либо эвристик(например, предметы не склонны телепортироваться). Надо будет поискать его работы. Вроде интересно, но не революционно конечно.

Mansiper 4 апр 2011 в 15:50

Сейчас у нас в УПИ в распознавании в одной работе получили результаты, превосходящие мировые. Будем ждать публикацию…

yusman 4 апр 2011 в 15:12

Чувствую, что парень заработает не хилую кучу бабла.

optemist 4 апр 2011 в 15:15

Хм, интересно. Оказывается у чехов не только пиво классное.

ColorPrint 4 апр 2011 в 15:20

Ну там вуз английский, консультант из Майкрософта — разработчик Кинекта, и много чего еще )

Grox 4 апр 2011 в 15:15

OpenCV в динамике?

kaasnake 4 апр 2011 в 15:22

Я далек от технологий распознавания образов и по-этому для меня это ВАУ. Но неужели ещё не было реализаций такой системы (коммерческая, научная, военная)? И может кто-нибудь популярно объяснит в чем фишка конкретно этого алгоритма (в прикладной реализации)?

AlexMorgun 4 апр 2011 в 15:41

Наверняка что-то подобное реализовано в военных целях, но не разглашается по определённым причинам.

equand 4 апр 2011 в 23:27

Захваты цели, никогда на видео у амеров не видели как квадратик точно на цель обращен?

noonv 5 апр 2011 в 06:25

да что тут разглашать? :)
захват, наведение и сопровождение цели :)

Trial 4 апр 2011 в 16:15

фишка в том что алгоритм не надо обучать на сотнях тестовых изображений одного ключевого предмета в разных ракурсах, он сам по мере налюдения заполняет базу этим варинатами. Собственно идея свежая и полезная в определенных случаях. Но обучение с учителем конечно надежнее, сложные задачи которые решает kinect, предложенным способом не решить

Foror 4 апр 2011 в 15:22

Смотреть ключевое слово surf algorithm на ютубе www.youtube.com/results?search_query=surf+algorithm&aq=1

fralik 4 апр 2011 в 15:31

Фамилии руководителей небезызвестные в мире распознавания образов — Mikolajczyk и Fua. Подробности реализации должны быть в публикациях, ссылки на которые есть на его странице.

pratamishus 4 апр 2011 в 15:37

В полнейшем шоке… Красавец. Это же блин надо еще и разработать систему самообучения. Панда вообще шокировала :).

vosi 4 апр 2011 в 16:01

а если 2 панды?

pratamishus 4 апр 2011 в 16:07

ну у него идет слежка и проработка алгоритма на один объект. С двумя объектами будет посложнее, но думаю не проблема. По сути можно запустить просто 2 процесса параллельно, но он будет ошибаться когда 2 панды будут пересекаться. Но думаю если понадобится, он напишет :)

forefinger 4 апр 2011 в 16:14

У него есть видео с двумя как минимум сильно похожими объектами www.youtube.com/watch?v=eNqk-eN5BV8 — все хорошо

thebestzorro 4 апр 2011 в 15:39

Парень молодец!
И видео интересное и динамичное получилось.

codemorgan 4 апр 2011 в 16:40

по видео видно — он одержимый. по хорошему естественно

Kastrulya0001 4 апр 2011 в 16:43

Интересно, а если картинка с 2-х камер или больше идет, по этим данным можно одно, но более стабильное изображение получить. То есть сращивать 2 картинки.

salyariss 4 апр 2011 в 17:53

Можно, зная расстояние между двумя камерами.

Kastrulya0001 4 апр 2011 в 16:54

Я наверно буду гореть в аду, но рано или поздно это будет стоять в ракете!

YasonBy 4 апр 2011 в 18:52

Гореть в аду будут те, кто поставит это на ракету; а Вы пройдёте по категории «пророк» :)

noonv 5 апр 2011 в 06:26

не переживайте — уже стоит :)))

darkfrei 5 апр 2011 в 02:14

Первая мысль была спарить ее с пулеметом.

simedov 4 апр 2011 в 17:29

Что значит параметр «s» на видео?

xanep 4 апр 2011 в 17:49

scale

salyariss 4 апр 2011 в 17:52

Алгоритм интересный, но был бы на много занимательнее, если бы хорошо функционировал на слабых машинах (неттопах). Например, для съемки динамических объектов двумя камерами (для 3D).

skynoname 4 апр 2011 в 20:16

Кстати, если смотрели внимательно видео, там перечислено откуда он брал инфу для разработки своего алгоритма, это ICPR и IbPRIA конференции сообществ по распознаванию образов из разных стран

ekzo 5 апр 2011 в 05:40

выглядит очень интересно, я бы сказал, что даже охеренно, но такое видеть тут не очень любят, но всё равно охеренно, стабилизация видео по определённому предмету впечатляет.

Nepofigist 5 апр 2011 в 13:31

Артемий Лебедев, ежели он был бы здесь, запросто смог бы поставить "+" Вашему комментарию :)

utya 5 апр 2011 в 06:17

Блин, теперь понятно кто моему одногрупнику диплом писал, потому что ну не могу он это написать сам

yohandson 5 апр 2011 в 10:27

Вот, посмотрите, наши ребята делают, из Владивостока http://www.rhondasoftware.com/software-solutions/computer-vision и вот блог www.computer-vision-software.com

jeck_landin 5 апр 2011 в 14:11

Очень круто. Впечатляет больше, чем видео в топике

Nordvind 5 апр 2011 в 20:37

Ну да, вы еще это с американскими военными разработками сравните. У компании из Владивостока, наверное, тоже крутой алгоритм, но они его позиционируют как именно для учета людей в зоне обзора. Студент-чех, я полагаю, работал один, и добился хороших результатов, которыми он может по праву гордиться, и придумал для алгоритма достаточно много применений.
Может иногда можно просто порадоваться за парня, а не меряться пенисами?

AlexBabin 7 апр 2011 в 13:30

Мы как раз ищем человека/людей в команду по разработке алгоритма для отслеживания объектов на видео. Пользуясь такой темой (раз уж тут собрались люди разбирающиеся в топике), хочу попросить, порекомендовать кого-нибудь, кто хотел бы работать в нашей компании. Или может кто-нибудь из присутствующих заинтересуется?