Как стать автором
Обновить
102
0
Sergei Belousov @BelBES

Пользователь

Отправить сообщение
Richard Szeliski, Computer Vision: Algorithms and Applications
Вот это самое актуальное чтиво по компьютерному зрению
Если предполагается, что объектов в кадре может быть очень много(например толпа людей входящих/выходящих со стадиона), то первая задача сложно решаемая в плане трекинга отдельных объектов, т.к. отдельные объекты будет крайне затруднительно выделить ну и о высокой точности. Вообще первая задача больше подходит для серьезного исследования, а не для конкурса…
Какая динамика фона предполагается на тестовой выборке?
У них в компании работа кипит и никто из сотрудников просто не успевает играть в Xbox, а тут винду в офисе обновили до 8-ки и заметили такое наглое нарушение их патентов…
На практике для детектирования ладоней нередко используют подход flock of features. В большинстве видеороликов на youtube применяется именно этот подход.
«Из-за «сырости» дистрибутива есть несколько неприятных моментов. Так, камера не работает. Bluetooth не работает. Автоматический поворот экрана не работает. Плюс есть несколько багов, затрагивающих память, звук и прочее.» //учитывая какая «отличная» поддержка железа в десктопной версии Ubuntu, вероятно от самих Canonical ждать драйверов для планшета тем более не приходится, т.ч. если комьюнити вокруг Nexus 7 не появится пилящего Ubuntu, то затея бесполезная… Так-то всевозможные Familiar linux и тп. уже лет 6-8 назад были под КПК, только так в народ и не пошли из-за отсутствия драйверов.
«echo OFF > /sys/kernel/debug/vgaswitcheroo/switch» вполне нормально справляется с отключением лишней видеокарты.
Тачпад там стоит копейки по сравнению со всем остальным. Да и для тех-же геологов/спелеологов работая на местности, гораздо удобней будет использовать этот бук в планшетном режиме чем на весу клавиатурой пользоваться.
Если не военная тайна, то что за проект вы делаете на этот конкурс?
Можно взять фичи со всей картинки, сматчить на них, получить примерное расположение номеров, а потом матчить по маске только в эти регионы. Так вероятно получится быстрее чем скользящим окном по всей картинке бегать.
Вы обучаете классфикатор просто подсовывая ему дескрипторы особых точек? Если да, то какой процент ложных срабатываний у обученного классификатора? думается мне, что большой…
p.s. картинки нашлись в ходе 5-минутного гугления, вроде это лабораторка в каком-то из ВУЗ'ов)
Вот сейчас просто применением SURF-детектора и SIFT-дескрипторов получил такие картинки:


Как видно в качестве паттерна использовал первую попавшую под руки картинку с номером. При этом номер худо-бедно локализуется. Если подумать еще немного и применить знания о предметной области то получится лучше и точность можно повысить до приемлемой…
А какой характеристический вектор особой точки используется для подобного обучения классификатора? Дескриптор в чистом виде и используется идея о характерных для номеров перепадах градиента? Вы не могли-бы показать какой-нибудь пример локализации номера таким способом?
Насколько я знаю для того, чтобы детектировать номер при помощи SVM классификатора, необходимо получить на сцене какие-то области-кандидаты похожие на изображение знака, а потом уже для каждой такой области уточнять модель при помощи классификатора. Когда мы нашли особые точки на изображении сцены(пуская тем-же SIFT'ом), как среди всех точек выделить те, которые могут соответствовать номерам?
image как видно, в номере всегда присутствуют рамки, флаг и надпись RUS. Поэтому вполне можно использовать например такой шаблон в качестве эталона для сопоставления ОТ image. Только в качестве детектора лучше использовать какой-нибудь детектор углов типа детектора Харриса а не SIFT/SURF. И тут еще надо учитывать, что номер имеет маленький размер на изображении, а значит будет мало особых точек для сопоставления и вполне возможен вариант, когда данных не хватит для построения искомой гомографии.
Они заявляют время работы аппарата, а не экрана. В данном случае вероятно правильней было-бы сказать, что за неделю GSM модуль посадит телефон в ноль, а не постоянно светящий экран. Что в принципе похоже на правду, если вспомнить про то, что Kindle 3G как-раз недели полторы держал на одной зарядке с включенным 3G.
Хотя число обновлений было-бы хорошо увидеть в оценке времени активной работы.
А никто не в курсе, как у Ubuntu 12.10 обстоят дела с ноутбучными видео-картами nvidia? У меня на прошлой версии при включении ноутбука экран включался только если понажимать на кнопки изменения яркости, тоже самое и при открытии/закрытии крышки.
И как там обстоят дела с кликпадами от sinaptics? У меня так и не получилось его настроить на Ubuntu 12.04, саму панель сенсорную драйвер видел, а вот кнопки встроенные в эту панель игнорировал. При переключении на стандартный драйвер xinput появлялись кнопки, но пропадал мультитач.
А то красивостей добавляют а о поддержке железа из коробки как-то забывают. А это пожалуй будет поважнее чем очередная красивость в Unity…
Я создаю такой вектор для окрестности каждого соответствия, поэтому учитываются все и не по разу. Потом я объединяю кластеры относящиеся к одному визуальному образу.

Да, там пожалуй стоит уточнить, что x имеет такой вид в момент времени 1.
Окрестность для каждого соответствия (i, i') я инициализировал так:
1)для точки i на эталоне я находил все точки лежащие в радиусе Φ от неё.
2)затем для каждой точки j попавшей в этот радиус рассматривал её соответствие (j,j') и строил индикатор вектор размерности m: если вес ребра в ДГС между вершинами (i,i') и (j,j') был больше некоторого порогового значения Ε то добавлял это соответствие в кластер.

После чего строил индикатор вектор x(1) этого кластера, т.е x(1)d=1 если d-я вершина содержится в кластере, иначе x(1)d=0. И нормировал этот вектор. Вот этот нормированный вектор и брал за начальную инициализацию, соответственно вхождение всех вершин кластера в правильный визуальный образ полагается равновероятным с вероятностью x(1)i=1/k, где k-размерность кластера.

«Кстати, локальный максимум достигается не в точке x, у которой некоторые координаты равны 0, а остальные одинаковы. Таким свойством обладает вектор Ax.» //Не понял этой фразы. На вектор x в данном случае налагаются только два условия: он не выходит из окрестности инициализации и сумма компонент равна еденице, т.к. симплекс по норме l1.
Честно, не знаю про какой телефон вы говорите, но у меня телефон со 100% «в ноль» разряжается при раздаче интернета где-то порядка 5-6 часов в режиме обычного серфинга. Хотя согласен, за такие деньги 3G модуль был-бы предпочтительней.
Да, конкретно в этом случае я использую только одно соответствие для каждой ОТ с эталонного изображения. Его строго говоря мы не угадываем, а берем лучшее среди всех соответствий для каждой точки. Очевидно, что такой подход не гарантирует нахождения всех возможных правильных соответствий между изображениями, но при достаточном количестве особых точек это не так критично.
Насчет того сколько брать точек, этот алгоритм у меня за приемлемое время(не real-time) обрабатывал где-то порядка 1500-2000 соответствий, на 10000+ соответствий не хватало памяти ноутбука. Вообще все зависит от конкретной задачи, а точнее от того какую оценку сверху можно дать количеству ложных соответствий.
А смысл захламлять GitHub? исходник ничем вообщем-то не примечателен…

Информация

В рейтинге
Не участвует
Откуда
Нижний Новгород, Нижегородская обл., Россия
Дата рождения
Зарегистрирован
Активность