ymik Apr 19 2009 at 23:38

Моделирование зрения. Часть первая. Экскурсия в глаз

4 min

4.4K

^{1 Экскурсия в глаз — 2 Восприятие — 3 Геометрия зрения — 4 Eye tracking — 5 Как поймать взгляд — 6 Моделирование eye tracking}

Чтобы понять то, как человек воспринимает изображение, начать придётся с органа зрения – с глаза. Важным для дальнейшего понимания моментом помимо анатомического строения глаза является ограничения разрешающей способности глаза, которые я тут и опишу. Если это всё вам известно – то можно только бегло просмотреть выделенные куски текста и сразу переходить ко второй части.

Анатомия глаза

И так, как устроен глаз вы все наверняка помните из учебника по биологии, но здесь я расскажу несколько действительно удивительных вещей, которые в школе отчего-то не рассказывают. Но вначале – всё же напомню устройство глаза (иллюстрации взяты из книги Девида Хьюбелла «Глаз, мозг, зрение»):

Глаз удерживается в глазнице группой из 6 мышц, они же поворачивают его вверх-вниз вправо-влево в случае необходимости «скосить глаза».

Световой поток, попадающий на сетчатку, проходит через роговицу (она обеспечивает около 70% преломления света), потом – через зрачок, являющийся аналогом диафрагмы фотоаппарата и управляющийся группой из радиальных и кольцевых мышц, меняющих его размер, потом попадает в хрусталик, который обеспечивает окончательную фокусировку видимых предметов. Хрусталик представляет из себя студенистую подушечку, которая сжимается радиальными мышцами. При сжатии хрусталик меняет свою форму, изменяя таким образом степень преломления света и фокальное расстояние.

Собственно, всё это необходимо, чтобы создать проекцию видимого мира на сетчатке. Сетчатка – это часть мозга, отделившаяся от него на ранних стадиях развития, но крепко связанная с ним пучком зрительного нерва:

Сетчатка – это не просто аналог сенсора фотоаппарата, преобразующего световые сигналы в электрические импульсы. Сетчатка производит первичную обработку поступившего изображения, прежде, чем оно поступает в зрительную кору мозга.

Сама сетчатка состоит из трёх слоёв нервных клеток, а собственно фотосенсоры, воспринимающие свет (палочки и колбочки) составляют третий, внешний слой на её задней поверхности:

Таким образом, чтобы достигнуть сенсоров, свет вначале проходит через два слоя нервных клеток. Фоторецепторы с задней стороны покрыты меланином (чёрный пигмент), выполняющим ту же роль, что и чернение внутреннего корпуса камеры. Если бы чернения не было, то свет, проходя сквозь слой палочек и колбочек, уходил бы дальше к мозгу, отражался бы от него и возвращался обратно, всячески портя нам картину мира.

Фоторецепторы

Фоторецепторы бывают двух видов:

Палочки – рецепторы, чувствительные к очень слабому освещению (в основном в жёлто-зелёной части спектра) и воспринимающие очень тонкие перепады освещённости, поэтому при высоких уровнях освещённости они становятся бесполезны и отвечают за ночное, скотопическое зрение;
Колбочки — рецепторы, для работы которых требуется гораздо больше света, воспринимают более сильные градации в освещении и отвечают за дневное, фотопическое зрение.

Так как разговор ведётся про анализ изображений на мониторе компьютера, то про скотопическое зрение и палочки больше рассказывать не буду, сосредоточив всё внимание на зрении фотопическом и колбочках.

Так вот, колбочки делятся на три типа по виду пигмента в них, и каждый из этих типов отвечает за восприятие своей спектральной полосы. Условно типы колбочек называют «синие», «зелёные» и «красные», но на самом деле спектр их восприятия выходит за рамки указанных цветов. Поэтому многие части спектра, к примеру, жёлтый, воспринимаются сразу двумя видами колбочек и совокупное ощущение от возбуждения «красных» и «зелёных» колбочек создаёт у нас ощущение жёлтого цвета.

^{(более точные графики распределения чувствительности колбочек можно найти здесь)}

Колбочек всех трёх видов представлено примерно одинаковое количество, но так как в области жёлтого спектра количество колбочек воспринимающих его получается в два раза больше, то жёлтый кажется намного более интенсивным, чем синий. То же касается некоторых других цветов (см. приведённую диаграмму).

«Пикселы» сетчатки

Все фоторецепторы объединены ганглиозными клетками в блоки, называемые рецептивными полями – каждой ганглиозной клетке сопоставлено одно рецептивное поле. Один фоторецептор может состоять сразу в нескольких рецептивных полях, поэтому поля двух соседних ганглиозных клеток перекрываются на 70-80%. В простейшем случае, рецептивное поле похоже на аналог пикселя светочувствительной матрицы в фотоаппарате. Но не всё так просто!

Во-первых, рецептивные поля отличаются по размерам в зависимости от области сетчатки: так в области глазной ямки – зоне сетчатки, соответствующей области наибольшей остроты зрения рецептивное поле составляет 1-2мм (что соответствует 2-3 угловым минутам), а при смещении к периферии – уже до 5 мм!

Во-вторых, «пиксели» рецептивных полей отличаются от пикселей матрицы фотоаппарата тем, что среди них есть разделение – одни реагируют на «включение», другие на «выключение». Т.е. одни поля реагируют исключительно на изменение освещённости с более тёмного на более светлый, другие – наоборот.

В-третьих, поля отличаются по размеру в зависимости от их видов (условно их обозначают P поля и M поля). М поля более большие, имеют высокую скорость реакции, но из-за своей величины картина, передаваемая ими будет в куда более худшем разрешении, чем картина, переданная P полями. P поля – более мелкие, поэтому картина, передаваемая ими более точная, но скорость реакции у них не велика. Таким образом, M поля фиксируют движение и отвечают на вопрос «где находится объект (восприятие движения и глубины)», а P поля имеют дело с цветом, формой и деталями визуального отображения или отвечают на вопрос «каковы объекты (цветное зрение и острота)». С нерезким контрастом имеют дело M поля, а P — с резким контрастом. Чем дольше взгляд остаётся на месте, тем более возрастает роль P полей.

В-четвёртых, не всё так с этими «пикселями» просто: если пиксели фотоматрицы фиксируют исключительно изменение цвета, то рецептивные поля кроме того умеют реагировать на линии, полосы, различные прямоугольные сегменты с чёткими краями! Т.е. кроме информации о том, что есть изменение цвета/освещённости, эти «прокачанные пиксели» передают также информацию, что наблюдается прямая, информацию о её длине (такая длинная, что выходит за пределы зрения или виден конец отрезка) и, даже, о направлении (угле наклона) данной прямой!

^{1 Экскурсия в глаз — 2 Восприятие — 3 Геометрия зрения — 4 Eye tracking — 5 Как поймать взгляд — 6 Моделирование eye tracking}

Hubs:

Health