Про то, как глаза воспринимают картинку / Хабр

Никогда не задумывались, как глаз считывает картинку? Почему часто смотря на фотографию мы чувствуем, как какие-то части изображения притягивают глаз настолько, что невозможно оторваться, сфокусироваться на других деталях? В качестве попытки ответить на этот вопрос группой психологов и физиологов в 60х годах была создана теория зрительного восприятия. Теория получила развитие: на данный момент существуют как минимум 3 математических аппарата, позволяющих моделировать движение зрачка, считывающего картинку и связывать это движение с концентрацией внимания на определённых частях изображения.

Два-три года назад я плотно занимался моделированием внимания при просмотре изображений, и вот на днях попросили показать работу такой программки. Я полез в пыльный угол за архивами сырцов, распаковал, стал компилировать, решил поправить пару багов в алгоритмах и… увлёкся! Представляю вам плод двухдневных усилий: несколько картинок и два различных способа моделировать то, как человек воспринимает картинку.

Картинки представлены в виде триптихов. Первая часть — это картинка-оригинал. Средняя часть — тепловая карта. Чем интенсивнее зелёное свечение — тем больше вероятность, что этот регион будет притягивать ваше внимание. Последняя картинка — это динамика взгляда. Эта модель показывает, как взгляд скользит по изображению, куда он может следовать дальше. Взгляд более легко движется от светлых частей к более тёмным и наоборот — для того, чтобы переместить фокус внимания с более тёмных на более светлые части, вероятно потребуется некоторое усилие.

При просмотре картинок нужно понимать, что математический аппарат, обеспечивающий моделирование фокусировки внимания человека не учитывает психологические аспекты восприятия, например, вот такие или такие. На картинках отображено как двигается человеческий взгляд, если он не обнаруживет узнаваемые образы на картинке.

Первая картинка показывает, как воспринимается типичный фотосюжет типа «некий объект в середине кадра». Особенно интересно, как взгляд устремляется к центру, но его не достигает. Взгляд как бы гуляет, ласкает лёгкими прикосновениями центральную область, в которую вписан объект. На картинке с динамикой прекрасно видны все композиционные особенности в виде вторичных фокусов внимания и вектора устремления взгляда вверх.

А вот обычный пейзаж. Обратите внимание, что если смотреть снизу картинки, то взгляд устремляется к стволам деревьев, а если смотреть от деревьев вверх или сверху вниз, то в середине неба ясно видна «потенциальная ямка», куда непроизвольно сваливается взгляд.

Немного о вэбстраницах. Как вы думаете, какие части страницы наиболее привлекательны для внимания? Что важнее всего показать? Конечно же, рекламу!

Пейзаж с претензией на композицию. И сразу же видно, как эта композиция завалена — сместить бы этих человеков вниз-вправо как раз на 1 квадрат и золтое сечение было бы выдержано! А так внимание концентрируется между краем картинки и силуэтами людей.

А вот эту фотку я покажу только для того, чтобы показать, как автоматический анализ начинает лагать из-за психологических аспектов восприятия. При просмотре фотографии люди выделяют лица и неосознанно обращают на них больше внимания. Автомобиль, в данном случае тоже воспринимается в виде мордочки диковинного зверя. Если бы мы провели eye tracking этой картинки, то заметили бы, что максимум внимания будет «на лбу» крайслера и на лице человека. К следующей картинке это, кстати, тоже относится.

Наше «всё» Мона Лиза. Давайте забудем, что лица притягивают взгляд и посмотрим, как воспринимается картина, если рассматривать её в целом. Тепловая карта ничего нам тут не даст, а вот динамика проявляет интереснейшие вещи! Оказывается, справа от лица существует квадрат указывающий на нос со сторонами, пропорциональными золотому сечению. Мало того, если приглядеться к 4хугольным полигонам, накрывающим глаза, то окажется, что стороны их почти соответствуют гармоническому ряду (несоответствия вполне укладываются в погрешность алгоритма)! Вот и завидуй после этого познаниям Леонардо в геометрии…

Ну и перейдём к моим любимым импрессионистам. Тепловая карта сразу же показывает, что то ли алгоритм лагает, то ли картина слишком сложна для восприятия. Уж не по этому ли многие люди так тяжело воспринимают Ван Гога? Куча посторонних центров внимания, создающих сетку почти белого шума… На этом фоне так сложно уловить цветы в деталях, разве что только горшок поддаётся вдумчивому просмотру. Но всё меняет визуализация динамики! Оказывается, если отвлечься от деталей мазков и воспринимать картину издалека, то просматривается чёткая диагональная ось с точкой входа на столе и взрывным завершением в виде цветов! Картина не статична, картина живёт!