ymik Apr 16 2009 at 00:46

Про то, как глаза воспринимают картинку

3 min

14K

Lumber room

+27

Comments 28

Reey Apr 16 2009 at 01:47

Извините сразу)
Последняя картинка не Ван Гога, а пошлая фотка какая-то

olimo Apr 16 2009 at 05:28

www.photohost.ru/showpicture.php?pictureid=309707&galleryid=17024&user=0&days=&sti=

Насколько я понимаю, это подражание.

ymik Apr 16 2009 at 10:18

спасибо за картинку в хорошем качестве :)

ymik Apr 16 2009 at 10:16

ммм… Ван Гог написал много разных подсолнухов, эти — вроже бы одни из них.

Reey Apr 16 2009 at 10:27

какие из vangogh-world.ru/vangogh-sunflowers.php?

Я в курсе, что там типа закос в фотографии, только получилось мерзко по-моему, еще раз извиняюсь, ничего не могу с собой поделать.

ymik Apr 16 2009 at 11:16

понятно :)

Kalobok Apr 16 2009 at 05:39

Очень интересно. Еще интереснее, конечно, было бы погонгять ваш софт самому. Но пару замечаний хочу сделать.

Иллюстрация «Пейзаж с претензией на композицию» — там люди уже смещены вправо-вниз от золотого сечения. Если сместить еще, то о золотом сечении можно просто забыть. Ну и внимание, на мой взгляд, концентрируется именно там, где должно на данной картинке — чуть впереди людей, там, куда они идут.

С Моной Лизой и ее лицом — это же самая контрастная часть картины. Как она может не притягивать взгляд, даже не будучи узнаваемой? ИМХО, здесь что-то не так.

Аналогично с Ван Гогом. Может, стоит что-то подкрутить, чтобы контрастные (не только по яркости, но и по цвету) участки имели больший вес.

ymik Apr 16 2009 at 10:23

я сейчас доделываю программку, рисующию динамическую визуализацию. Когда доделаю — буду думать, что с нею делать дальше.

По поводу нормирования — контраст уже учитывается в модели: модель обрабатывает так называемые «ловушки внимания». К сожалению, алгоритм ищет только положительные аттракторы и не обрабатывает негативные, возможно из-за этого тепловая карта сбоит на сложных изображениях.

dshster Apr 16 2009 at 06:46

Я совсем не так смотрел.
Читал я очень давно про такую теорию, вот только там не было никаких математических аппаратов. Испытуемым на глаз крепили микрозеркальце и светили лучом света под определённым углом фиксируя отраженный «зайчик» на фотографии. Кстати сказать «рисунки» взгляда там были совсем другие, нежели у вас. Примерно что-то похожее на страницу Яндекса. На фотографиях же взгляд очень редко гуляет по углам фото — чаще всего концентрируется около центральных контрастных объектов.

ymik Apr 16 2009 at 10:35

существует понятие точки входа в обозреваемое пространство и эта точка редко находится в центре — обычно глаз динамически выделяет некую рамку и начинает двигаться от её края «зацепляясь» за цветовые перепады (не обязательно контрасты).

По поводу же визуализации — при всём желании модель не может создать такую же тепловую карту, как при eye tracking (et): максимум возможности — это выделить потенциальные векторы перемещения взгляда от одной точки к другой и сделать тепловую карту для времени концентрации внимания на какой-либо точке. Валидировать же полученую модель с помощью eye tracking можно и нужно: подтверждением модели является совпадение интенсивных участков тепловой карты et с выделеными участками на тепловой карте модели и разброс векторов треков et с углом, соответствующим направляющим на динамической визуализации. Причём во втором случае требуется ещё и совпадение направления взгляда (от светлых сегментов к тёмным).

PingWin Apr 16 2009 at 07:06

«А где же сиськи?»

На самом деле было бы очень интересно, как в вашу теорию укладываются естественно притягивающие взгляд вещи. Например, женские ножки, и, да, сиськи :)
Также интересно было бы посмотреть в этом ключе работу взгляда при яркоконтрастных переходах, например, белая юбочка/сапожки и тёмные колготки, ну и т.д. :)

PS: Странный каммент от себя же… Наверное, весна… :)

ymik Apr 16 2009 at 10:37

для этого нужно включить в алгоритмы нормирование не только лица, но и сиськи, а я — увы — ещё не научился их динамически выделять с помощью алгоритмов из картинки)

PingWin Apr 16 2009 at 10:59

Ну хотя бы на уровне физиологической оценки, интересно же, психологию пусть eye-tracking описывает :)

ymik Apr 16 2009 at 11:16

ymik.habrahabr.ru/blog/57403/#comment_1540314 ;)

andreypasyunin Apr 16 2009 at 07:25

Лично мне здесь больше интересен процесс не «психологического» восприятия, а «физиологического». Очевидно, что прежде, чем мозг для себя выделит лицо, на которое он уделит больше времени для изучения, чисто с физиологической точки зрения человеческая зрительная система выделяет для себя точки наибольшего интереса или, как их еще называют, окна внимания. А здесь тоже много всего интересного. Так называемая фовеальная модель зрения позволяет фиксировать координаты и траектории между ними. И данную информацию использовать для изучения, запоминания и дальнейшего распознавания объектов. Было бы здорово, если бы вы поделились секретом, как это реализовано у вас.

ymik Apr 16 2009 at 11:01

Фовеальная модель зрения строится на принципах телрии восприятия, насколько я понимаю: там тоже полагается, что зрачёк постоянно движется и фокус зрения постоянно выписывает фигуры лиссажу вокруг точки внимания. Но в данном случае модель является более высокой и учитывает только предпочтительный угол склонения зрения, а в остальном ищет прямые и обратные так называемые «ловушки взгляда». Для динамической же визуализации используется другая схема: создаётся граф в виде сети, после связи графа ранжируются исходя из «сложности» перемещения взгляда из одного узла в другой и начинают сдвигаться.

Если будет время (сейчас я на больничном, потому можно было спокойно заняться развлечениями), я напишу подробнее о принципах, по которым происходит построение модели и ранжирование связей.

Kastrulya Apr 16 2009 at 10:40

anub.ru/uploads/03.2007/117307678884_6.jpg ну ка ну ка!

ymik Apr 16 2009 at 11:06

static.diary.ru/userdir/1/9/4/9/19490/40503431.png :)
психологический аспект, как уже говорил, не учитывается)

PingWin Apr 16 2009 at 11:26

А в принципе-то правильно… У меня тоже глаза моментально устремляются выше, «искать лицо»… Как раз между лицом, и, собственно, «первым планом», и застревают :)

ymik Apr 16 2009 at 11:40

думаю, если добавить психологический аспект, то на соске всё же был бы мощный аттрактор)

PingWin Apr 16 2009 at 11:36

А вот такую?
img-fotki.yandex.ru/get/3212/yuly-sp.0/0_477c_5e4b19df_orig

ymik Apr 16 2009 at 11:41

static.diary.ru/userdir/1/9/4/9/19490/40504757.png

PingWin Apr 16 2009 at 11:43

и до кучи:
img-fotki.yandex.ru/get/3314/paparazzi-club.1/0_8936_31337c0_XL
img-fotki.yandex.ru/get/3312/paparazzi-club.4/0_8c89_6bd9c327_orig

ymik Apr 16 2009 at 11:50

static.diary.ru/userdir/1/9/4/9/19490/40505042.png
static.diary.ru/userdir/1/9/4/9/19490/40505168.png

ymik Apr 16 2009 at 11:51

судя по результатам работы программы, у меня складывается ощущение, что алгоритм пытается бедных девушек раздеть :) Так вот, уверяю: психологический аспект тут ещё не учтён!

PingWin Apr 16 2009 at 11:54

static.diary.ru/userdir/1/9/4/9/19490/40505168.png

я вот всё думаю, насколько завистливо наш мозг ищет того, кто заглядывает Сати сзади под юбку :) И того, кто снизу-спереди пытается смотреть на «сиськи» :)

PingWin Apr 16 2009 at 11:55

В догонку… А где можно почитать/скачать что-нить относительно этого алгоритма анализа? :) Уж больно любопытный инструмент для анализа собственных фотографий :)

ymik Apr 16 2009 at 12:55

элементы распознования изображения www.dleex.com/read/7102
ru.wikipedia.org/wiki/Зрение_человека
ru.wikipedia.org/wiki/Психология_восприятия_цвета
www.koob.ru/schiffman/sensation_and_perception — Шиффман, «Ощущение и восприятие»
www.rosmedic.ru/nevrologiya-i-neyrohirurgiya/glaz-mozg-zrenie.-hyubel-d.html Хьюбел, «Глаз, мозг, зрение»
student.km.ru/ref_show_frame.asp?id=5DD14EB8899240F28869320866061BC9 — возникновение иллюзий

в яндексе

ну и как доведу до ума программку, видимо сделаю web сервис