Videoanalitic May 15 2015 at 10:04

Часть 2 — Синезис. Почему демонстрация видеоаналитики в офисах так сильно отличается от реальной работы в жизни?

3 min

16K

Algorithms*Image processing*IT systems testing*

После первой публикации в обсуждении статьи появилась вопросительная ссылка, на которую я хотел бы ответить другой развернутой статьей. Ее автор – под ником «psazhin» – попал просто в точку, приведя пример классической «жесткой» видеоаналитики — как мы помним, разработанной и похороненной Интелом, реинкарнированной рекламным хайтеком. Хотя, промазать здесь сложно, потому что 90% всего рынка видеонаналитики – как капли воды повторяют интеловскую библиотеку Open CV. Ну, раз выбор пал на фирму Синезис, то проведем конкретный анализ её «интеллектуальных» алгоритмов на базе уже выработанной методики.

Мы лишь немного вдумчивей прочитаем то, что написано на рекламном сайте этой фирмы. Берем первую самую главную настройку.

Предлагается выставить размеры человека, чтобы отличать его рамку детекции от других объектов и исходя из этого классифицировать объекты. Но мы в прошлой статье уже говорили:

1. Двухмерная камера теоретически не может определять размеры объектов, т.к. у нее нет перспективы. Но тут предлагается псевдо перспектива, основанная на разнице и заведомо известном положении высот. Предполагается, что всё движение идет лишь по земле, и теоретически можно построить для «землян» такую логику. Если бы не птицы, которые летают, а также насекомые, которые ползают по камере. И их размеры не откалибруешь.

2. Контрастный детектор видит только то, что отличается от фона. Если обратить внимание на человека слева (на котором красная линия), то легко заметить, что его туловище полностью (для камеры — полностью) сливается с фоном. Т.е. компьютер будет видеть только белые брюки и отдельно ходящую черную голову.

Хотя, если выставить чувствительность на полную, то можно и попробовать находить хоть какие-то отличия, но тогда помехи забьют весь архив. Даже артефакты оцифровки будут давать сработки.

3. Размеры детекции даже на самой контрастной цели определяются совокупностью замкнутой области движения, т.е. несколько пересекающихся человек будут образовывать более крупные фигуры, нежели один человек.

4. При движении любого объекта зоной детекции является не только то место, где он находится в данный момент, но и совокупно такая же зона, где он находился один кадр назад. Процесс детектирования – это сравнение кадров: последующих с предыдущими. Соответственно, в последующем будет изменено то место, куда человек передвинулся, и то место, которое он освободил. Длина этой зоны будет зависеть от скорости движения: чем дальше объект передвинулся за время двух кадров, тем больше зона. Для автомобиля это может быть вся область кадра.

5. Как дополнение нужно сказать и про откровенный ляп рекламного хайтека, эта картинка из настроек того же Синезиса:

Как видно, зона детекции и по вертикали, и, как ни странно, по горизонтали сильно отличается от фигуры человека. Видимо, сами разработчики не сильно верят в то, что пишут.

А вот здесь, когда нужно отличить человека от машины, писатели рекламы Синезиса показывают явно вытянутые фигуры по вертикали:

По логике — да, тачки будут вытянуты по горизонтали, если конечно передвигаться они будит тоже только по горизонтали. Но вот в правом верхнем углу мы опять замечаем ляп. Там рамкой обведена фигура из двух человек. Соответственно, если пойдет вместе 3-4 человека, то это уже будет распознаваться как машина. Ну, что сделаешь, детектор объектов не обманешь!

По сути все дальнейшие настройки модулей видеоаналитики Kipod основаны на попытку вычислять размеры объектов wiki.allprojects.info/pages/viewpage.action?pageId=31785131

Т.е. почти вся технология видеоналитики строится на заведомо не рабочем в реальных условиях принципе.

От массы других компаний, связавших свой бизнес с видеоаналитикой, Синезис отличает антипрактичность. Чувствуется, кто придумывал свои хитрые алгоритмы, никогда серьезно их не испытывал. Берем очередную настройку:

Так называемым зонам интереса можно задать уровень контрастности для сработки – чувствительность. Отличная вещь – работает на все 100, если не менять освещение. Но в данном случае нам показана комната, где вечером надо выставить чувствительность побольше, а утром – поменьше. Во 2-ой (голубой) зоне вообще нужны противоположные значения: при дневном свете окно яркое, при искусственном – темное. Вот и надумаешься!

Очевидно, что во время демонстрации освещение резко не изменится, а значит, у продавца есть длительный шанс, чтобы убедить покупателя в интеллектуальных способностях.

Еще немного о 2-ой (голубой) зоне. Надо быть очень далеким от практики, чтобы выставить место детекции на окне. Солнце – объект не предсказуемый, его настроение меняется постоянно, поэтому в солнечные дни демонстрацию лучше не проводить, 2-ая зона будет реагировать постоянно.

Но у Синезиса есть возможность тестирования, грех не попробовать. Вот что насрабатывало за сутки.

При этом вырезаны множественные повторы, пауки и жуки колбасили постоянно, поэтому в ролике только пример.

Продолжение следует…

Hubs: