Pull to refresh

Comments 49

без использования OpenCV не подходит?
Если будут решаться те же задачи, то можно и без OpenCV. Просто в OpenCV реализованы основные примитивы для анализа изображений и можно сконцентрироваться на решении, а не создании собственных примитивов. На самом деле по большей части основные наработки из приведенных задач доступны в качестве примеров к самой библиотеке в том или ином виде.
C# + AForge.NET решает оооочень много задач.
Как я уже отвечал ниже в комментариях, на данный момент все основные приложения у нас написаны на C++. Один и тот же код используется не только в Windows, но и в Linux и Mac OS X. Поэтому не хочется разводить зоопарк технологий, а также думать о том, как запускать C# на Mac и Linux. Надеюсь на понимание.
Пошел штурмовать учебники по компьютерному зрению)
Поделитесь списком учебником?
Ланка шикарное место! Я бы еще добавил информации о еде. Замечательные блюда из свежей рыбы и лобстеров, которых только-только выловили! А фрукты! До Москвы они никогда не доходят в том виде, в каком они есть там!

Точно. Совсем забыл о фруктах и рыбе. Пожалуй, это одна из самых важных составляющих поездки.
И еще забыли сказать о том, что практически по всей стране есть быстрый 3G интернет и связь (звонки/смс) с Россией стоит столько же, сколько из Москвы.
Наивные :)

Шри-Ланкийского происхождения на фотке только бананы, арбузы и ананасы. Виноград — индийский, мандарины — пакистан, яблоки — китай, манго — скорее всего индия, гранаты — западная Азия. Говорю как человек, живший на Ланке, и интересовавшийся темой :)
Много про Шри-Ланку и мало про задания. Хочется чуть больше конкретики. Ответьте пожалуйста на пару вопросов.
— устойчивое слежение за несколькими объектами в кадре даже в случае их совместного пересечения или временного “пропадания” за препятствием;

какие критерии принадлежности цели к классу «объект»? насколько сильно объект может измениться в процессе слежения? (поворот, аффинное, проективное, перспективное, цвет?)

— возможность подсчета объектов, пересекающих определенную зону и учет направления пересечения;

зона указывается в начале работы программы и статична на видео? само видео статично?

Спасибо за интересный конкурс! Давно искал что-нибудь по любимой теме.
Спасибо! Ivideon это прежде всего система видеонаблюдения. Поэтому в большинстве случаев в роли объектов будут люди, автомобили, возможно животные. В процессе слежения объект может измениться достаточно сильно (с точки зрения преобразований). Но от кадра к кадру эти изменения будут такими, что можно будет идентифицировать объект. Все объекты являются частью реального мира и мы предполагаем, что они не могут внезапно исчезать или телепортироваться. Безусловно ошибки слежения будут. Главное, чтобы их было немного.

Зона указывается в начале работы программы. Например, камера может быть установлена над входом в магазин для подсчета проходящих людей. Или же прямоугольником выделяется дверь, для того, чтобы определить входит/выходит ли человек из неё или же просто проходит мимо.

Для конкурса полагаем, что камера установлена статично и не меняет своего положения во время работы.
Описанные задачки, между прочим, нифига не тривиальны. Особенно, если учитывать слово «стабильно». Первая из задач в приложении к некоторым тематикам решаются не один год группами достаточно компетентных специалистов(например слежение за объектами из космоса). Вторая задачка известны по своим алгоритмам досконально. Там нужно только повторить найденное в книжке. Третья задача есть практически решенная на Хабре(выкладывался кем-то пример одного алгоритма для немного другой цели). Там конечно немного допилить надо, но есть очень сильная математика.
И да, вы бы лучше выложили примеры видео последовательностей. А то вам каждый участник предложит свою базу где у объектов свои особенности. И не сравнить потом алгоритмы друг с другом.
Спасибо за отличное дополнение! Вы правы. Все это действительно так. Уже сейчас все задачи, которые описанные в конкурсе решаются и в приближении к той или иной предметной области решены (хотя и не тривиальны). Поэтому люди, занимающиеся этим направлением, могут уже взять отчасти готовые решения. Мы могли бы сделать это самостоятельно, но это неправильно. Так как это отвлечет нас от других задач, которых немало. Да и это только начало. Данное направление безусловно нужно развивать и развивать.

Намеренно не выкладываем видео последовательности, потому что для них можно будет разработать устойчивую работу алгоритма, который перестанет правильно работать, стоит только немного повернуть камеру. Не хотелось бы такого результата.

Насколько это можно учесть в конкурсе, но на всякий случай добавлю. У нас один из самых требовательных пользователей (массовый). Например, они могут попытаться установить наше ПО на Pentium 3 и написать отрицательный отзыв в GooglePlay, что оно у нас не работает и видео идет рывками, искренне не понимая, что для кодирования видео требуются более современные процессоры. Хотя оно и правильно. Пользователь не обязан об этом знать. Это наша недоработка, что мы ему об этом не говорим во время установки. К чему я это пишу? Просто мы сами не можем знать что же захочет считать пользователь. Вполне возможно, что завтра кто-нибудь сделает на базе Ivideon трансляцию тараканьих бегов с автоматическим определением победителя.

Даже добавлю еще. Поправьте, если я не прав. Для реализации второй и третьей задачи решение первой является обязательным. Вряд ли можно точно посчитать объекты пересекающие линию, если не понимать где один объект, а где другой.
Это же относится и к детектированию предметов. Так что фактически самое сложное это решение первой задачи. Но она позволяет достаточно легко решить все остальные.
Лично у меня выработалось мнение, что в задачах компьютерного зрения если поставлена какая-то конкретная задача, то обычно легче решать непосредственно её, чем переходить от другой задачи. То есть, конечно, если сначало поставлена первая задача, то после её решения для решения второй задачи легче использовать наработки по первой. Но при решении второй с нуля — легче пойти другим путём. Третью задачку можно решить без привлечения первой достаточно просто. Я думаю, что применением такого алгоритма (чьи исходники сейчас открыты) она решается на коленке за час.
Интересный алгоритм. Хотя в целом ничего сверх нового там, конечно, нет. Когда я его последний раз смотрел он был реализован чуть ли не на Матлабе.
Жаль, что GPL, а не LGPL. Для нас в данный момент это критично.
Ограничение на язык жёсткое? Почему именно С/С++?
Независимо от ответа — одно из самых классных описаний вакансий, что я видел)
Все наши основные приложения написаны на C++, кроме управляющих модулей в датацентрах (они на питоне) или приложений для мобильных устройств. Поэтому и такое требование. Не хочется разводить зоопарк технологий и языков там, где можно обойтись тем, что уже есть.
Встретимся в сказке ;) Я полюбил Шри Ланку за ее изящную простоту, пляжи, океан и добродушных людей.
А вы уже там?) Если да, то в каком районе?
Много читал о том, что в Новый год в Уне слишком много людей, так как место это очень разрекламировано. Но в любом случае постараемся посмотреть Гале и его Форт.
Обязательно посмотрите, Форт в отличном состоянии, обновили брусчатку, все красиво, морской музей, библиотека, собор. В Унаватуне есть смысл погулять по джунглям к двум буддистским храмам.
На Шри-Ланке только в Нувара-Элье более не менее можно работать :)
Ну, по большей части мы едем отдыхать, хотя безусловно какие-то текущие задачи будут решаться. Насколько я знаю, декабрь и январь одни из самых холодных месяцев на Шри-Ланке, поэтому и наиболее комфортных для отдыха. Температура воды около 27 градусов, а воздуха до 30.
О, ну тогда вы правильно выбрали время. По каким городам едете?
В начале мы планируем посетить Канди, затем оттуда Нувара-Элию и уже дальше по обстоятельствам. Коломбо и Негомбо исключительно проездом. После этого в качестве основного места пребывания у нас будет Бентота/Берувелла и Хиккадува. А оттуда уже будем смотреть другие возможности.
Хиккадува — самое крутецкое место из всех, самая тусовая атмосфера. Там и до апреля зависнуть можно :)
Хорошие задачи. Особенно про кружку. Искал тут недавно куда ушла моя кружка, заметил занятное — как охранник пошарился по столу и положил ценное в карман. Правда через минуту передумал и положил обратно, но не ища кружку, я бы не увидел эти кадры.
Если предполагается, что объектов в кадре может быть очень много(например толпа людей входящих/выходящих со стадиона), то первая задача сложно решаемая в плане трекинга отдельных объектов, т.к. отдельные объекты будет крайне затруднительно выделить ну и о высокой точности. Вообще первая задача больше подходит для серьезного исследования, а не для конкурса…
Какая динамика фона предполагается на тестовой выборке?
Предполагается, что фон существенно меняться не будет (освещение в течении дня). Конечно, объектов как на стадионе в виде толпы не будет. С другой стороны конкретно данная задача может уже решаться следующим образом. Определяем, что люди идут как вы описали и просто считаем по площади.
В любом случае результат конкурса это прототип, который нужно будет развивать и развивать.
+1 В карму) Классный видео отчет! Обязательно пересмотрю весь! В этом году не планируете?
Честно говоря, на Шри Ланке не так сладко что бы ехать туда второй раз на месяц и работать оттуда. Если искать приключения — то самое оно. А если работать — то не торт.
Пинг большой. Ветром иногда телефонную линию оборвет и весь поселок остается без интернета. Океан шумит. Что бы поговорить по скайпу нужно закрывать все окна и двери. Влажность большая. Одежда все время влажная. Бывало и грибы на ней росли если забывал вытащить из сумки и проветрить. Есть много таких нюансов. Еда очень острая. Но это и хорошо. Желудок оч хорошо работал. Лучше, чем дома. Но еда однообразная. Рис да морепродукты. Варенная картошечка и жаренный окорочек там чуть ли не деликатес. Про свежую рыбу прямо из моря — это какой-то миф) Ну тоесть она есть. Где-нибудь в Унаватуне ночью в кабаках на пляже. По $60 за кг. Но в остальных местах (я не говорю о дорогих ресторанах — мы там не питались) со свежей большой рыбой (т.е. не мелочью какой-то) напряженка. В лучшем случае — замороженная. В открытом океане сильные волны. Достаточно сильные что бы было не комфортно плавать (основное развлечение было — заныривание в волну с разбега и «кувыркание» потом в ней) но и не недостаточно большие что бы серфить везде. Из-за волн океан мутный. Он чистый только где есть бухты (та же Унаватуна).
Местные жители добрые. Не украдут. Под конец мы ноуты оставляли в холле гестхауса и шли купались. И они никуда не девались). Но уж очень эти местные жители хотят навязать вам свои услуги. И как правило в 2 раза дороже чем они стоят. Торгуйтесь как и везде в азии и в туристических местах.

Я лучше в следующий раз попробую Таиланд. Говорят, там лучше и поинтересней. Посмотрим :)
Спасибо за развернутый ответ. На самом деле мы понимаем куда едем. Хотя в некотором смысле у нас получилось наоборот. Так как мы были в Тайланде, но не были в Шри-Ланке.

Такой момент. А в какой период вы были?
Мы были почти ровно год назад. Кажется с 17 ноября по 12 декабря. Плюс-минус пару дней.
Там с первого декабря начинается «сезон». Цены выше, людей больше, дождей меньше. Но это мы узнали уже на месте.
Понятно. Поэтому я и спросил. С середины декабря влажность должна быть поменьше все-таки.
Скорее всего да. Вы будете вести трансляцию с мест событий?
Если связь позволит, и это будет интересно, то, конечно, будем!
Готов отдать две книги в хорошие руки по данной тематике.

1. Цифровая Обработка Изображения, Р. Гонсалес, Р. Вудс, издательство Моска Техносфера, 2005
2. Компьютерное зрение Современный подход, Д. Форсайт, Ж. Понс, издательство Вильямс, 2004

А не могли бы вы указать ещё и e-mail адрес, куда можно слать задание? Чтобы возможность поучаствовать в конкурсе получили и те, у кого нет аккаунта на хабре.
Спасибо за вопрос. Действительно, наш просчет, что сразу не учли данного факта. Отправлять вопросы можно на адрес contes(at)ivideon.ru. Кроме того часто задаваемые вопросы я выделил в отдельный топик.
Прекрасная страна, был там недавно.
Sign up to leave a comment.