Очень интересно. Еще интереснее, конечно, было бы погонгять ваш софт самому. Но пару замечаний хочу сделать.
Иллюстрация «Пейзаж с претензией на композицию» — там люди уже смещены вправо-вниз от золотого сечения. Если сместить еще, то о золотом сечении можно просто забыть. Ну и внимание, на мой взгляд, концентрируется именно там, где должно на данной картинке — чуть впереди людей, там, куда они идут.
С Моной Лизой и ее лицом — это же самая контрастная часть картины. Как она может не притягивать взгляд, даже не будучи узнаваемой? ИМХО, здесь что-то не так.
Аналогично с Ван Гогом. Может, стоит что-то подкрутить, чтобы контрастные (не только по яркости, но и по цвету) участки имели больший вес.
я сейчас доделываю программку, рисующию динамическую визуализацию. Когда доделаю — буду думать, что с нею делать дальше.
По поводу нормирования — контраст уже учитывается в модели: модель обрабатывает так называемые «ловушки внимания». К сожалению, алгоритм ищет только положительные аттракторы и не обрабатывает негативные, возможно из-за этого тепловая карта сбоит на сложных изображениях.
Я совсем не так смотрел.
Читал я очень давно про такую теорию, вот только там не было никаких математических аппаратов. Испытуемым на глаз крепили микрозеркальце и светили лучом света под определённым углом фиксируя отраженный «зайчик» на фотографии. Кстати сказать «рисунки» взгляда там были совсем другие, нежели у вас. Примерно что-то похожее на страницу Яндекса. На фотографиях же взгляд очень редко гуляет по углам фото — чаще всего концентрируется около центральных контрастных объектов.
существует понятие точки входа в обозреваемое пространство и эта точка редко находится в центре — обычно глаз динамически выделяет некую рамку и начинает двигаться от её края «зацепляясь» за цветовые перепады (не обязательно контрасты).
По поводу же визуализации — при всём желании модель не может создать такую же тепловую карту, как при eye tracking (et): максимум возможности — это выделить потенциальные векторы перемещения взгляда от одной точки к другой и сделать тепловую карту для времени концентрации внимания на какой-либо точке. Валидировать же полученую модель с помощью eye tracking можно и нужно: подтверждением модели является совпадение интенсивных участков тепловой карты et с выделеными участками на тепловой карте модели и разброс векторов треков et с углом, соответствующим направляющим на динамической визуализации. Причём во втором случае требуется ещё и совпадение направления взгляда (от светлых сегментов к тёмным).
На самом деле было бы очень интересно, как в вашу теорию укладываются естественно притягивающие взгляд вещи. Например, женские ножки, и, да, сиськи :)
Также интересно было бы посмотреть в этом ключе работу взгляда при яркоконтрастных переходах, например, белая юбочка/сапожки и тёмные колготки, ну и т.д. :)
PS: Странный каммент от себя же… Наверное, весна… :)
для этого нужно включить в алгоритмы нормирование не только лица, но и сиськи, а я — увы — ещё не научился их динамически выделять с помощью алгоритмов из картинки)
Лично мне здесь больше интересен процесс не «психологического» восприятия, а «физиологического». Очевидно, что прежде, чем мозг для себя выделит лицо, на которое он уделит больше времени для изучения, чисто с физиологической точки зрения человеческая зрительная система выделяет для себя точки наибольшего интереса или, как их еще называют, окна внимания. А здесь тоже много всего интересного. Так называемая фовеальная модель зрения позволяет фиксировать координаты и траектории между ними. И данную информацию использовать для изучения, запоминания и дальнейшего распознавания объектов. Было бы здорово, если бы вы поделились секретом, как это реализовано у вас.
Фовеальная модель зрения строится на принципах телрии восприятия, насколько я понимаю: там тоже полагается, что зрачёк постоянно движется и фокус зрения постоянно выписывает фигуры лиссажу вокруг точки внимания. Но в данном случае модель является более высокой и учитывает только предпочтительный угол склонения зрения, а в остальном ищет прямые и обратные так называемые «ловушки взгляда». Для динамической же визуализации используется другая схема: создаётся граф в виде сети, после связи графа ранжируются исходя из «сложности» перемещения взгляда из одного узла в другой и начинают сдвигаться.
Если будет время (сейчас я на больничном, потому можно было спокойно заняться развлечениями), я напишу подробнее о принципах, по которым происходит построение модели и ранжирование связей.
А в принципе-то правильно… У меня тоже глаза моментально устремляются выше, «искать лицо»… Как раз между лицом, и, собственно, «первым планом», и застревают :)
судя по результатам работы программы, у меня складывается ощущение, что алгоритм пытается бедных девушек раздеть :) Так вот, уверяю: психологический аспект тут ещё не учтён!
я вот всё думаю, насколько завистливо наш мозг ищет того, кто заглядывает Сати сзади под юбку :) И того, кто снизу-спереди пытается смотреть на «сиськи» :)
В догонку… А где можно почитать/скачать что-нить относительно этого алгоритма анализа? :) Уж больно любопытный инструмент для анализа собственных фотографий :)
Про то, как глаза воспринимают картинку