All streams
Search
Write a publication
Pull to refresh
469
0
Мальцев Антон @ZlodeiBaal

Computer Vision, Machine Learning

Send message
До плоской поверхности с хорошим коэффициентом отражения звука. Попробуйте немножко наклонить и всё
А я год назад такое собирал и на Хабр выкладывал — habrahabr.ru/post/142139/
И не парюсь на счёт того что кто-то ещё делает.
Не до конца понимаю, зачем на Хабре 4ая статья по фильтру Калмана. Это при учёте того, что на Википедии тоже неплохо описано.
Только, всё же, чтобы 7.9 глазом невооружённым увидеть, нужно сперва в невооружённый глаз что-то вставить. Русская википедия как лимит человеческого глаза +7,72 приводит, буржуйская +6.
А ведь да. Проще всего это свести именно к конфликту аналитического и креативного подхода. Не думал об этом с такой стороны. Спасибо!
Да, быстродействие на одном только ядре i7 для чистого алгоритма без цвета было несколько сот тысяч сравнений секунду. При использовании цвета оно значительно повышается.
www.sr-research.com/camup_remote.html

«Head distance is accurately measured at 500 Hz using a small target sticker placed on the participant's forehead».

Просто метка на лоб клеится :)
Никто не говорил, что надо такой команде платить. Просто можно собирать её на уровне интересов и ставить менее амбициозные задачи:) Те же квадрики.
Да, и всё же. Вы говорите, что представляете сложность задачи. Какими аналогичными проектами вы занимались раньше?
У нас не несколько секунд, ибо используется ряд хитрых методов (полный кадр где-то 70мс на i7). Несколько секунд, это если использовать ломовой подход с полным перебором 3х мерного пространства Хафа. В системах Eye Tracking используется ряд хитростей. Как вариант: меньшая робастность к внешним условиям, не полная сегментация, предварительное обучение. К тому же если в одном кадре глаз уже выделен, до держать его дальше — не проблема, особенно когда такая высокая частота кадров.
Скажите, а Вы сами занимались когда-нибудь программированием роботов/обработкой изображений/построением систем принятия решений? Там всё неимоверное сложно, хоть и выглядит просто. Взять к примеру тот же ROS. На нём программируют даже серьёзных роботов. Видел как-то проект на нём, где робот едет к холодильнику, берёт оттуда пиво и привозит назад. Этот проект был написан не быстро и большой командой. При этом там был достаточно сложный и многофункциональный робот.
А что самое главное, всё это было медленно глючно и неудобно. А эффект от полноценного продукта отличает 90% работы.

Сама идея хороша, но по другому. Собрать/вырастить/создать команду, которая может заниматься робототехникой в нашей стране — крутое и достойное занятие. Решать даже отдельные задачки это уже подвиг. В принципе, помещение можно под такие цели поискать у каких-нибудь инвестиционных фирм. Однажды натыкался на студенческое КБ, которая организовала одна фирма. Там было много различных квадракоптеров, самолётиков, вертолётов. И любой заинтересовавшийся студент мог придти попробовать свои силы. При этом там ему объясняли что и как устроено.
Ага. А карие глаза в близком ИК имеют на порядок более читаемую структуру, чем голубые:)
Но так как в принципе линзы в ИК видны, не понятно, что больше повлияло. То, что там печать 300dpi и между точками всё видно, то ли то, что эти точки сами по себе пропускают неплохо.
В принципе есть термин, «иридодиагностика». Там уверяют, что по цвету глаз можно болезни определять. Но ни одного серьёзного исследования, где бы доказывалось, что оно работает, или хотя бы, что цвета глаза меняются — не было. За время работы с алгоритмами по цвету (около двух лет весь проект двигался) ни у кого из связанных с проектом людей ничего не менялось до уровня, что можно было бы заметить, или чтобы алгоритм выдал отказ.
Магические константы это да. А главное — далеко не всегда от них можно избавится. Особенно в системах принятия решений.
В этой задачке, правда, с ними всё не так плохо. По сути есть только одна серьёзная константа, которая отвечает за уровень FAR. А вот когда дело начинает касаться астрономии, то там всякие константы вылетают в каждой второй строчке.
Именно об этом фильме я вспоминал, когда начинал заниматься темой распознавания по глазам:)
Тогда сканеры были простые, да. На живость не проверяли.
Вообще странно. Попробуйте сфотографировать на одинаковый фотоаппарат с одинаковой вспышкой. Думаю всё-таки что оптический обман какой-то. Глазами цвета сложно различать.
Ага, там сверху маска накладывается на все области, которые не надо сравнивать. К ним же блики относятся.
Да, там нормировка. При изменении размера зрачка можно считать, что радужка растягивается линейно. В принципе это не совсем так, но больших проблем при это не вылезало. Правда тестов на наркоманах мы не проводили:)
Веко выделяется. Без этого нельзя, статистика сильно падает. Используется примерно такая область:

Сложности есть в выделением ресниц. Их обычно не выделяют, ибо сложно, а статистику они портят.

Поворот обрабатывается. Градусов 15 туда-сюда. Корреляция проходит со сдвигом шаблона.
Если использовать два глаза, то правильную ориентацию можно вычислить. Это значительно улучшает статистику. Но проценты я все писал именно для случая, когда глаз один.
Это вопрос освещения. Скорее всего зелёные они на солнце, а голубые при лампах дневного света или в облачную погоду. У нас основная мощь сидит в предсказуемом спектре. Отклонения минимальны.
Ой, время правки истекло, а ошибку заметил. Не 0.02%, а 0.002 или 0.2%. Не то ни сё написал. Вот таблица зависимости FAR и FRR по открытой базе CASIA для чистого алгоритма:
eye-recognition.ru/table.png

Information

Rating
Does not participate
Location
Москва, Москва и Московская обл., Россия
Works in
Date of birth
Registered
Activity