Не только кот: геометрия цвета по Шрёдингеру / Хабр

Черта между гениальностью и безумием ученого лежит в доказательстве его теорий. И порой от формирования теории ее автором до формирования полноценного доказательства проходят долгие годы. В XIX веке математик Бернхард Риман предположил, что перцептивные цветовые пространства не плоские и не прямые, а изогнутые. В 1920-х годах Шрёдингер развил эту идею, определив оттенок, насыщенность и яркость в рамках римановой модели восприятия цвета, используя метрику, описывающую то, как люди воспринимают различия в цвете. И вот в наши дни ученые из Лос-Аламосской национальной лаборатории (Лос-Аламос, Нью-Мексико, США) провели колоссальную работу, в результате которой им удалось формализовать модель цвета Шрёдингера. Какие аспекты входят в данную модель, какие гипотезы стали ее фундаментом, и как это модель описывает наше цветовое восприятие? Ответы на эти вопросы мы найдем в докладе ученых.

Основа исследования

Цвет — это феномен восприятия. Три параметра цвета — оттенок, насыщенность и яркость — давно известны своей важной ролью в теории цвета с точки зрения восприятия и геометрических параметров.

Ньютон утверждал, что чем дальше цвет находится от нейтральной оси (оси серых оттенков, соединяющей черный и белый) в цветовом пространстве, тем более насыщенным он является. По его мнению, цветовой оттенок определяется направлением отклонения цвета от нейтральной оси, а величина соответствует яркости цвета. Он представил воспринимаемые человеком цвета в виде евклидова цветового пространства конической формы.

Позднее была разработана риманова геометрия, которую начали применять в качестве более точного приближения перцептивно однородного цветового пространства. Она позволяла моделировать явления, наблюдаемые в экспериментах, которые не могли быть описаны евклидовыми моделями, такие как закон Вебера—Фехнера и эффект Абни.

В евклидовом пространстве кратчайшим путем между двумя точками является прямая линия. Однако в римановой геометрии понятие прямой линии не играет такой же роли, поскольку в общем случае пространство обладает ненулевой кривизной. Аналогичным понятием в римановой геометрии является геодезическая линия — путь, соединяющий две точки и являющийся локально кратчайшим. Используя эту аналогию, Гельмгольц распространил общие геометрические определения цветовых атрибутов на риманово пространство. Он предположил, что отдельные характеристики цвета можно определить геометрически, опираясь лишь на принцип наибольшего сходства в римановой метрике. Шрёдингер уточнил эту идею, предположив, что геодезическая линия между цветом и серой осью должна сохранять одинаковую яркость («Helligkeit») и цветовой оттенок («Farbton»). В соответствии с представлениями Ньютона, Шрёдингер также рассматривал цвета с одинаковым цветовым оттенком и насыщенностью («Sättigung») как лежащие на прямых линиях, проходящих через вершину цветового конуса.

Несмотря на определенную критику, геометрическая формулировка цветовых атрибутов, предложенная Шрёдингером, по своей сути сохранялась вплоть до наших дней. Однако и она противоречит ряду явлений, наблюдаемых в экспериментах, в частности эффекту Безольда—Брюкке и принципу убывающей отдачи. Было показано, что для описания принципа убывающей отдачи требуется метрическое пространство, не являющееся римановым. Этот потенциальный сдвиг парадигмы делает необходимым пересмотр классических римановых определений цветового оттенка, насыщенности и яркости, а также их анализ с позиций не-римановой геометрии. Именно этой задаче посвящена данная работа. В ней ученые рассмотрели недостатки определений Шрёдингера, предложили возможные решения и привели либо результаты уже существующих, либо собственных экспериментов по восприятию цвета человеком с целью проверки и подтверждения либо опровержения этих решений.

Римановы определения

Вдохновленный Гельмгольцем, Шрёдингер предполагает, что оттенок, насыщенность и яркость могут быть получены только из геометрического свойства наивысшего сходства:

«… quantitativ festgelegt werden können, ausschließlich aus der … Einstellung auf größte Ähnlichkeit.» («…могут быть количественно определены исключительно посредством … установления наибольшего сходства.»)

Перед тем как перейти к определениям, ученые предлагают кратко рассмотреть основы пространства, в котором они работали. В соответствии с Грассманом, базовое цветовое пространство Шрёдингера является аффинным векторным пространством, в котором цвета, различающиеся только физической интенсивностью, представляют собой векторы одного направления с разной длиной: чем выше интенсивность, тем длиннее вектор. Физическое смешение цветов подчиняется векторному сложению и образует прямые линии. Вершина полученного конуса является началом координат и соответствует абсолютному черному цвету. В соответствии с Риманом и Гельмгольцем, поверх этого аффинного пространства вводится риманова метрика, описывающая различия в восприятии цветов разными наблюдателями. Геодезические относительно этой метрики, как правило, искривлены и не совпадают с линиями цветового смешения. С точки зрения современной колориметрии, аффинный цветовой конус можно рассматривать как CIERGB, а наложенную метрику — как риманизированный ΔE₂₀₀₀.

Шрёдингер определяет яркость, исходя из экспериментальной процедуры, в которой два цвета с малым различием приводятся к одинаковой яркости: один из них регулируется вверх и вниз по физической интенсивности до тех пор, пока не достигается наиболее близкое соответствие.

«… um diejenige Lage von F’ zu finden, die dem Punkt F am nächsten liegt, haben wir um F ein Ellipsoid gleichen Abstandes in solcher Größe zu zeichnen, dass die Gerade 0 F’ es gerade berührt. Der Berührungspunkt F” … ist mit F gleich hell.» («… чтобы найти такое положение F’, которое ближе всего к точке F, мы должны провести вокруг F эллипсоид равного расстояния такого размера, чтобы прямая 0F’ лишь касалась его. Точка касания F” … имеет такую же яркость, как и F.»)

Сначала он формулирует это для близких по цвету оттенков, а затем распространяет на произвольные пары цветов, утверждая, что яркость должна обладать транзитивностью, иначе она теряет смысл. Он также утверждает, что цвета одинаковой яркости образуют поверхности, которые риманово ортогональны прямым линиям, исходящим из вершины конуса и соответствующим физическому увеличению интенсивности.

Он утверждает, что эти прямые линии, исходящие из начала координат, являются геодезическими и сохраняют качественный характер стимула:

«Beim Übergang zu einer lichtstärkeren oder lichtschwächeren Farbe gleicher Reizart (das ist also bei Änderung der absoluten Intensität ohne Änderung der Zusammensetzung des Lichtgemisches) bewegt man sich nach unserer Theorie auf einer kürzesten Farbreihe.» («При переходе к более светлому или более темному цвету одинакового типа раздражения (то есть при изменении абсолютной интенсивности без изменения состава световой смеси) мы, согласно нашей теории, движемся по кратчайшему цветовому ряду.»)

Термин «Reizart» переводится как «качество стимула», что означает, что цвета имеют одинаковые оттенок и насыщенность, то есть различаются только по яркости:

«Reizart (d.h. . . . in Farbton und Sättigung).» («Reizart (то есть … в оттенке и насыщенности).»)

Далее он отмечает, что все цвета на поверхности постоянной яркости, лежащие на кратчайшем пути к белому, имеют один и тот же оттенок:

«Als farbtongleich mit einer gegebenen Farbe hätte man dann also jene Farbe zu definieren, die auf der kürzesten Linie zum Weiß liegt.» («Цветом, равным по оттенку заданному цвету, следует тогда определить тот цвет, который лежит на кратчайшей линии к белому.»)

Насыщенность уменьшается по мере приближения к белому. Он вводит явное ограничение: рассматриваются только кратчайшие пути к нейтральной оси внутри плоскости равной яркости, а не просто общий кратчайший путь во всем цветовом пространстве. Обоснование этого неочевидно, поскольку его линейный элемент в общем случае обладает свойством, при котором кратчайшие пути между цветом и нейтральной осью остаются внутри плоскости равной яркости. Учитывая это, определение можно было бы сформулировать более кратко: яркость и оттенок постоянны вдоль геодезических, ведущих к нейтральной оси, а оттенок и насыщенность постоянны вдоль геодезических, ведущих к вершине черного конуса. Однако, как будет показано далее, это различие оказывается существенным для других метрик.

Формализация

Из неявных описаний Шрёдингера выводятся следующие формально записанные определения.

Определение 1 (стимульное качество Шрёдингера). Стимульное качество — это отношение эквивалентности, при котором цвет F эквивалентен F’, если они лежат на одной прямой, ведущей к вершине конуса, то есть

Учитывая транзитивность в данной конструкции поверхностей равной яркости, можно предложить следующее явное определение яркости.

Определение 2 (яркость Шрёдингера). Яркость — это отношение эквивалентности, при котором цвет F эквивалентен F’, если среди всех цветов с тем же стимульным качеством, что и F’, цвет F является перцептуально наиболее близким, то есть:

Используется обозначение [F]∼_l для класса эквивалентности цвета F относительно отношения эквивалентности «яркость», которое обозначается ∼_l, так что [F]∼_l — это множество всех цветов, имеющих ту же яркость, что и F. Предполагается, что цветовосприятие является непрерывным и что это множество образует непрерывную поверхность в цветовом пространстве.

Из описания Шрёдингера можно вывести, что оттенок и насыщенность также являются отношениями эквивалентности, поскольку они связаны отношением принадлежности к одной и той же прямой, проходящей через начало координат. Но как различить оттенок и насыщенность? Поскольку Шрёдингер также описывает, что оттенок остается постоянным вдоль геодезической к нейтральной оси, можно определить его следующим образом.

Ученые использовали обозначение F, F’ (∼) для кратчайшего пути между двумя точками F, F’ ∈ M в метрическом пространстве M, а обозначение F, F’ (^) — для кратчайшего пути внутри одной плоскости равной яркости. Разумеется, это имеет смысл только в случае, если F и F’ имеют одинаковую яркость, то есть F’ ∼_l F. Нейтральную ось обозначали как n.

Определение 3 (Оттенок Шрёдингера). Оттенок — это отношение эквивалентности, при котором цвет F считается эквивалентным F’, если существует цвет F’’ ∼_q F’, обладающий такой же стимульной характеристикой, как F’, и лежащий на кратчайшем пути внутри плоскости равной яркости от F к нейтральной оси, то есть:

Наконец, ученые использовали идею, уже высказанную Ньютоном и также признанную верной Шрёдингером, что насыщенность связана с расстоянием до нейтральной оси. Ученые отмечают, что мы не можем напрямую сравнивать расстояние до нейтральной оси на разных поверхностях равной яркости. Темные поверхности равной яркости, расположенные близко к вершине, обычно меньше по размеру и не содержат цветов, разделенных столь большими расстояниями, как на более светлых поверхностях, тогда как прямые линии от более светлых поверхностей к вершине определенно проходят через них. В этом смысле абсолютное расстояние более тесно связано с понятием цветности. Ученые предлагают следующее определение.

Определение 4 (Насыщенность Шрёдингера). Насыщенность — это отношение эквивалентности, при котором цвет F считается эквивалентным F’, если цвет F’’ ∈ OF’ (—) ∧ F’’ ∼_l F, лежащий на прямой, проходящей через вершину и F’, и имеющий ту же яркость, что и F, имеет такое же расстояние до нейтральной оси, как F, то есть:

Было использовано обозначение ΔE для метрики, которая определяется тем, насколько похоже люди воспринимают цвета, и которую Шрёдингер предполагал римановой.

Недостатки и возможные решения

Далее были рассмотрены три недостатка определений Шрёдингера для оттенка, насыщенности и яркости.

Эффект Безольда–Брюкке

Обобщенно говоря, неверно, что цвета, различающиеся только по интенсивности, имеют одинаковый оттенок или насыщенность. Это явление известно как эффект Безольда–Брюкке. При уменьшении интенсивности цвета, как правило, воспринимаются как более близкие по оттенку к чистому красному, синему или зеленому. Это явление создает проблему для теории Шрёдингера, согласно которой оттенок остается постоянным вдоль прямых линий, направленных к вершине.

Шрёдингер успешно учел эффект Абни в своей теории, признавая тот факт, что воспринимаемый оттенок изменяется при добавлении белого к цвету. Он также знал об эффекте Безольда–Брюкке и о том, что он противоречит его теории. Он упоминает это как одно из ограничений своей работы. Он утверждает, что это следует из ограничений закона Фехнера, на котором основана его теория.

Решением этой проблемы является рассмотрение оттенка и насыщенности как постоянных вдоль геодезических, исходящих из вершины, вместо прямых линий. Ученые использовали обозначение OF(∼) ⊂ ℝ³ для всех точек на геодезической, проходящей через вершину O и цвет F, и OF(—) ⊂ ℝ³ — для прямой линии, проходящей через них. В математически изящном линейном элементе Шрёдингера эти две кривые совпадают. Вероятно, именно поэтому это различие не входит в его определения цветовых атрибутов, которые являются независимыми от выбранной метрики.

Определение 5 (Стимульное качество). Стимульное качество — это отношение эквивалентности, при котором цвет F считается эквивалентным F’, если они лежат на одном и том же кратчайшем пути к вершине, то есть:

В схематических рисунках используется изогнутая линия с двумя стрелками для обозначения кратчайшего пути между двумя точками. Использование этого обновленного определения стимульного качества в ранее приведенных определениях яркости, оттенка и насыщенности немедленно устраняет данную проблему.

Убывающая отдача

В перцептивно равномерном цветовом пространстве воспринимаемая разница между цветами определяется расстоянием между ними. В римановой метрике это длина геодезической между двумя цветами. Однако существование эффекта убывающей отдачи показывает, что расстояние между двумя точками не совпадает с не-римановой метрикой. Геометрические определения Шрёдингера предполагают риманово пространство. Теперь ученые попытались сохранить их, учитывая не-риманову структуру.

Отображение триангулированных данных Эбнера и Фэрчайлда в пространство CIERGB. При взгляде из вершины каждая поверхность постоянного оттенка имела бы нулевую ширину, если бы оттенки следовали прямым линиям.

Существует два простых решения данной проблемы. В путево-связном метрическом пространстве все еще есть понятие расстояний, кривых и их длины. Если заменить римановы геодезические в определениях Шрёдингера на кратчайшие пути в не-римановом смысле, а ближайший серый цвет в римановой метрике — на ближайший серый цвет в не-римановой метрике, то вся теория немедленно сохраняется.

Определение 6 (Яркость на основе не-риманова расстояния). Яркость — это отношение эквивалентности, при котором цвет F считается эквивалентным F’, если из всех цветов на геодезической, проходящей через F’ и вершину, F’ является наиболее близким по восприятию относительно не-римановой перцептивной метрики, то есть:

Ученые использовали пунктирную линию с двумя стрелками для обозначения ближайшей точки в не-римановой метрике на небольших схематических рисунках. Использование этого обозначения в определениях оттенка и насыщенности вместо Шрёдингеровского автоматически обновляет их так, чтобы они работали в не-римановой постановке.

Но существует и второй весьма правдоподобный способ это сделать. Длину пути между двумя цветами можно использовать для определения индуцированной римановой метрики и использование ее при одновременном признании того что она не является истинной перцептивной метрикой в определениях Шрёдингера, тем самым сохраняя всю теорию.

Определение 7 (Яркость на основе индуцированного риманова расстояния). Яркость — это отношение эквивалентности, при котором цвет F считается эквивалентным F’, если из всех цветов на геодезической, проходящей через F’ и вершину, F’ является наиболее близким по восприятию относительно индуцированной римановой метрики, то есть:

Возможно, что эти два определения дают одинаковые результаты, однако это не гарантировано. В качестве иллюстративного примера был рассмотрен некоторый оттенок фиолетового A, показанный на рисунке, вместе с его ближайшим серым C в не-римановой перцептивной метрике. Сначала предположим, что выполняется Определение 6 и что цвет B лежит на кратчайшем пути между A и C. Возможно, что ближайший серый к B в перцептивной метрике, C’, не совпадает с C. Это выглядит весьма контринтуитивно, поскольку подразумевает, что кратчайший путь делает отклонение через другую яркость. С другой стороны, предположим, что выполняется Определение 7 и что C’’ является концом кратчайшего пути от A к нейтральной оси и, следовательно, точкой с равной яркостью. Тогда C’', наиболее похожий серый для A, не будет иметь ту же яркость, что и A.

Из этого вытекает два вопроса: различаются ли эти два определения? И если да, то какое из них более точно соответствует человеческому восприятию? Сначала ученые математически доказали, что кратчайшие пути, соединяющие две точки, совпадают в обеих метриках. Затем они показали, что это, как правило, не верно для кратчайших путей, соединяющих точку и множество точек. Иными словами, ближайшая точка в множестве к заданной точке не обязательно совпадает при измерении в перцептивной и индуцированной метриках. Это особенно важно для определения яркости, где требуется кратчайший путь от цвета к нейтральной оси. Эти результаты показывают, что доказательства не могут быть получены исключительно математическим путем. Поэтому далее ученые провели эксперименты, чтобы определить, отличается ли ближайшая точка на нейтральной оси при измерении не-риманова перцептивного расстояния и его индуцированной римановой метрикой.

Нейтральная ось

Наибольшей проблемой определений Шрёдингера является использование нейтральной оси, также называемой серой осью, белой осью или weiß в его теории, для определения оттенка и насыщенности без предоставления ее собственного определения. В более поздней работе он использует отражатель с постоянным коэффициентом отражения (равноэнергетический отражатель) для определения белого пигмента, тем самым отождествляя сам источник освещения, который, по его требованию, должен иметь положительную интенсивность на всех длинах волн, с нейтральным цветом. Однако это вводит критерий, отличный от чистого сходства, что противоречит его первоначальной цели определить цветовые атрибуты исключительно на основе геометрической близости.

Ученые предложили следующее определение, основанное на не-римановой перцептивной метрике. Как и в случае с яркостью, существует эквивалентное определение на основе индуцированной римановой метрики, однако дальнейшее обсуждение показывает, что его, возможно, не потребуется рассматривать.

Определение 8 (Нейтральная ось). В пределах плоскости постоянной яркости [F]∼_l нейтральным цветом (серым или белым) является тот, который находится ближе всего к черной вершине, то есть:

Для заданного цвета F нейтральный цвет той же яркости обозначается как n(F), то есть:

Термин «ось» может создавать впечатление, что нейтральная ось представляет собой прямую линию. Ученые использовали этот термин вследствие исторически сложившейся традиции, однако они отмечают, что в их теории нейтральная ось не обязана быть прямой линией.

Чрезвычайно важно отметить, что в теории Шрёдингера поверхности равной яркости ортогональны в римановом смысле геодезическим, исходящим из вершины, то есть прямым линиям, выходящим из вершины. В результате все точки на такой поверхности находятся на одинаковом расстоянии от начала координат, и поэтому невозможно выделить единственную ближайшую точку. То же самое остается справедливым и при использовании обновленного определения стимульного качества, основанного на геодезических. Тем не менее ученые полагают, что с точки зрения восприятия это определение может иметь смысл и может работать в не-римановом пространстве, где индуцированная риманова ортогональность не связана напрямую с расстоянием. Это означает, что римановы определения яркости и нейтральной оси не могут одновременно быть справедливыми. В свою очередь это означает, что если два определения яркости должны совпадать, то корректным может быть только не-риманово определение нейтральной оси.

Эксперименты

Из трех выявленных недостатков два по крайней мере в некоторой степени подтверждаются существующими экспериментальными данными. Единственным недостатком, происхождение которого является чисто теоретическим, но который невозможно устранить исключительно математическими средствами, остается неоднозначность, обусловленная не-римановой природой перцептивного цветового пространства. Для ее разрешения в оставшейся части работы ученые описывают два эксперимента и их результаты, предназначенные для проверки гипотезы (H): кратчайшие пути в не-римановой метрике совпадают с кратчайшими путями в индуцированной римановой метрике.

Было показано, что в общем случае не-риманова метрика и индуцированная риманова метрика совпадают для бесконечно малых шагов, но не обязательно для более крупных расстояний. Из-за этого может возникать ситуация, когда для заданной точки ближайшая точка в множестве различается в зависимости от используемой метрики. Пример такого случая возникает в определении Шрёдингера для яркости при определении кратчайшего пути от опорного цвета к серой оси (множеству в цветовом пространстве). Это указывает на то, что ближайший серый к опорному цвету может отличаться при использовании перцептивной не-римановой метрики и индуцированной римановой метрики.

Визуализация экспериментов. Задача 1: определить ближайший серый в не-римановой метрике, C, к опорному цвету A. Задача 2: определить менее насыщенный цвет B, который лежит на кратчайшем пути между A и C. Задача 3: определить ближайший серый в не-римановой метрике, C’, от менее насыщенного цвета B. Задача 4: определить ближайший цвет A’ к C’. Последняя панель показывает задачу, включенную только в эксперимент 2.

Было проведено два экспериментальных исследования, в которых ученые стремились эмпирически аппроксимировать B, C и C’ (графики выше) для различных опорных цветов A. Это позволяет впервые исследовать, совпадают ли пути в двух метриках и, следовательно, можно ли продолжать характеризовать цвета через кратчайшие пути в цветовом пространстве. Первый эксперимент просил участников определить только C, B и C’, а также сравнить C и C’. Этот эксперимент выявил смещение ответов для цветов с экстремальными значениями L. Чтобы дополнительно исследовать эффект этого смещения, во втором эксперименте участников просили указать те же цвета, что и в первом (C, B, C’), а также новый ответ A’, в котором они выбирали цвет, наиболее похожий на C, из палитры с той же хромой и насыщенностью, что и A. Если смещения ответов нет, то A и A’ должны совпадать, поскольку не-риманова перцептивная метрика не должна зависеть от того, является ли точка началом или концом геодезической.

Эксперимент 1: кратчайший путь против ближайшего серого

Участники выбирали серый цвет, наиболее похожий на каждый опорный цвет, затем промежуточный цвет, который был наиболее похож одновременно на опорный цвет и выбранный серый, и наконец серый цвет, наиболее похожий на выбранный промежуточный цвет.

Агрегированные результаты эксперимента, направленного на проверку того, заканчивается ли кратчайший путь от опорного цвета к нейтральной оси в ближайшем сером цвете. Двенадцать групп из четырех горизонтальных ячеек показывают опорный цвет (сплошной) и три цвета-ответа, которые наблюдатели воспринимали как наиболее похожие: начальный серый, промежуточный цвет и конечный серый. Пиксели в ячейках ответов упорядочены таким образом, что пиксель (i, j) в одной ячейке соответствует тому же участнику во всех ячейках с ответами.

Агрегированные ответы для каждой задачи представлены выше. Каждая группа из четырех квадратов содержит исходный опорный цвет, показанный в виде первой ячейки (сплошной цвет). Вторая ячейка (серые) — это 289 ответов для серого цвета, наиболее похожего на опорный цвет. Третья ячейка (цвета) представляет выбранный промежуточный цвет, который был определен как наиболее похожий одновременно на опорный цвет и на первоначально выбранный серый. Четвертая ячейка (серые) — это финальные серые цвета, выбранные как наиболее похожие на промежуточные цвета. Составные ячейки следуют тому же порядку, поэтому пиксель (i, j) соответствует одному и тому же участнику во всех трех наборах ответов (серых или цветных). Визуально наблюдается относительно высокая согласованность между всеми тремя задачами.

Пути, построенные на основе усредненных ответов, отображенные в пространстве CIELAB.

Визуализация путей, построенная на основе усредненных результатов, представлена выше. Для каждой пары путей точка, находящаяся на наибольшем расстоянии от центра, соответствует исходному опорному цвету. Два пути соответствуют: первому, который ведет от опорного цвета к серой оси, и второму, который проходит через промежуточную точку к другой точке на серой оси. Важно отметить, что промежуточная точка действительно лежит на обоих путях в перцептивном цветовом пространстве. Если отображается только один путь, это соответствует высокому согласованию между двумя серыми цветами.

Для оценки эквивалентности начальных и конечных серых ответов сравнивались значения L. Был проведен повторный дисперсионный анализ (ANOVA) с факторами 3 (насыщенность) × 4 (яркость) × 4 (задача) для оценки влияния насыщенности опорного цвета, яркости (в пространстве HSL) опорного цвета и задачи, включая значение L истинного опорного цвета. Был выявлен значимый главный эффект насыщенности и задачи. Также обнаружены значимые взаимодействия: насыщенности и яркости; насыщенности и задачи; яркости и задачи; а также трехфакторное взаимодействие.

Пост-хок сравнения были выполнены для каждого основного эффекта с использованием попарных t-тестов для зависимых выборок с корректировкой p-значений по Бонферрони. Все уровни яркости опорного цвета приводили к значимым различиям в значениях L ответов. Все пары уровней насыщенности опорного цвета также давали значимые различия. Все уровни фактора задачи существенно различались, включая различие между начальным и конечным серым. Однако при оценке размера эффекта основных факторов с использованием коэффициента Коэна для повторных измерений эффект различия между начальным и конечным серым оказывается пренебрежимо малым.

Гистограммы разницы L между начальным и конечным серыми для каждого опорного цвета. Вертикальная черная линия расположена в точке 0, а среднее значение показано черной точкой с полосами погрешности, соответствующими одному стандартному отклонению вправо и влево.*

Различия между значениями L начального и конечного серого показаны выше. Сплошная черная линия, обозначающая нулевую разницу, всегда попадает в пределы одного стандартного отклонения от среднего различия, которое показано в виде черной точки с полосой погрешности. Наблюдается небольшой размер эффекта при сравнении значения L опорного цвета со всеми тремя типами ответов, однако все остальные различия являются пренебрежимо малыми.

Таблица №1: простые эффекты различия между начальным и конечным серым на всех уровнях яркости опорного цвета. Все t-статистики имеют 866 степеней свободы.

Простые эффекты различия между начальным и конечным серым в зависимости от яркости опорного цвета представлены в таблице выше. В отличие от насыщенности, на трех уровнях яркости наблюдается значимый, но небольшой эффект. Наибольший эффект, почти достигающий среднего размера, наблюдается для самых светлых цветов. В этом случае конечный выбранный серый оказывается темнее, чем начальный серый. Эта закономерность достаточно симметрична: при яркости опорного цвета 0.6 наблюдается уменьшение эффекта, хотя он остается небольшим. Для самых темных цветов наблюдается противоположная картина, при которой конечный серый оказывается светлее, чем первоначально выбранный серый.

Простой эффект различия между начальным и конечным серым для всех опорных цветов.

В связи со значимостью трехфакторного взаимодействия также был рассмотрен простой эффект различия между начальным и конечным серым для каждого отдельного опорного цвета. Размеры эффектов представлены выше. Столбцы сгруппированы по яркости опорного цвета, рассматриваемой как категориальная переменная, и упорядочены таким образом, что крайний левый столбец в каждой группе соответствует минимальной насыщенности, а крайний правый — максимальной насыщенности. Все цвета, для которых коэффициент Коэна превышал порог малого эффекта, демонстрировали статистически значимые различия. Опорный цвет #E052BD показал статистически значимый t-тест, однако размер эффекта оказался пренебрежимо малым.

Эксперимент 2: контроль смещения выбора

Индивидуальные ответы на четыре задачи. Двенадцать групп опорных цветов (сплошные), за каждой из которых следуют четыре квадрата, расположенные горизонтально: выбранный начальный серый, промежуточный цвет, выбранный конечный серый и цвет, наиболее похожий на начальный серый.

Эксперимент 2 представляет собой повторение эксперимента 1 с другими исходными цветами, а также с дополнительной задачей выбора цвета A′ из палитры с той же хромой и оттенком, что и A. Подмножество из 169 ответов представлено выше. В целом наблюдается относительно хорошее согласование между квадратами индивидуальных ответов. Однако видно, что ответы для задачи 4 оказываются светлее исходного опорного цвета для темных цветов (показанных в верхнем ряду) и темнее для светлых цветов (показанных в нижнем ряду). Это указывает на наличие вероятного смещения ответов.

Был проведен повторный дисперсионный анализ (ANOVA) с факторами 3 (хрома) × 4 (яркость) × 4 (задача) для исследования влияния факторов на значение L в пространстве LCH для различных цветовых и серых ответов. Был выявлен значимый главный эффект хромы, яркости и задачи. Также обнаружены значимые взаимодействия: между хромой и яркостью; хромой и задачей; яркостью и задачей; а также трехфакторное взаимодействие.

Гистограммы, показывающие распределение различий между опорным цветом и конечным цветом (показаны более прозрачным цветом), по сравнению с различиями между начальным и конечным серыми (показаны менее прозрачным цветом). Пунктирная линия соответствует нулевому различию.

Ученых интересовало сравнение разницы между финальным цветом и опорным цветом с разницей между начальным и конечным серыми. Распределения этих двух разниц представлены выше. Различия по L между двумя цветами более вариативны и, возможно, смещены дальше от нуля. Чтобы проверить это, ученые сравнили простой эффект.

Коэффициент Коэна был рассчитан для различий между серыми и различий между цветами на каждом уровне яркости опорного цвета. Было установлено, что размер эффекта для различий между цветами всегда больше, чем размер эффекта для различий между серыми. Единственное исключение наблюдается в случаях, когда оба эффекта пренебрежимо малы.

Это указывает на то, что любые различия в серых, вероятно, обусловлены смещением ответов, поскольку участники не способны следовать своим кратчайшим путям обратно к исходному опорному цвету, когда яркость исходного цвета является предельной.

Выводы ученых

Ученые формализовали определения Шрёдингера для оттенка, насыщенности и яркости, которые он предложил, исходя из базовой идеи, восходящей к Гельмгольцу, что они могут быть выведены исключительно из перцептивной метрики. Были описаны три недостатка и предложены возможные решения.

Во-первых, для учета эффекта Безольда–Брюкке было предложено заменить определение стимульного качества как прямой линии между цветом и черным на геодезическую между ними.

Во-вторых, для учета эффекта убывающей отдачи необходимо использовать не-риманову перцептивную метрику. Было математически показано, что это вводит потенциальную неоднозначность в геометрическое определение яркости, а именно то, что ближайший серый не обязательно совпадает с концом кратчайшего пути к нейтральной оси. В первом раунде экспериментов значимого отклонения между этими двумя положениями не наблюдалось.

В-третьих, было установлено, что Шрёдингер использовал нейтральную ось без геометрического определения и предложил определять ее как цвет, наиболее близкий к черному внутри каждой поверхности равной яркости. Такое определение возможно только в не-римановом случае. Поскольку по построению пути равного стимульного качества ортогональны в римановом смысле поверхностям равной яркости, они все имеют одинаковое риманово расстояние до черного.

Это приводит к первому полному решению задачи, которую предвидел Гельмгольц: формальным геометрическим определениям оттенка, насыщенности и яркости, полностью выведенным из восприятия ближайшего сходства. В итоге рассматриваются три метрики. Во-первых, евклидова метрика, которая представляет собой естественную метрику на аффинном цветовом пространстве и описывает смешение цветов вдоль прямых линий. Она не связана с человеческим восприятием сходства цветов, но может интерпретироваться как энергия ответов колбочек человека на физический стимул. Во-вторых, метрика, которая полностью определяется тем, насколько похожими наблюдатель воспринимает цвета. В-третьих, ее индуцированная риманова метрика.

В экспериментах было обнаружено, что кратчайшие пути в не-римановой перцептивной метрике и ее индуцированной римановой метрике, по-видимому, совпадают. Если это будет подтверждено в более тщательных будущих исследованиях, это устраняет неоднозначность в расширении определения яркости Шрёдингера. Более того, это также оправдывает моделирование не-римановой метрики так, как это делалось ранее — как римановой метрики с дополнительной затухающей масштабной функцией сверху. Это имеет серьезные последствия. Во-первых, это придает структуру пространству, которое до сих пор могло быть описано лишь как путево-связное метрическое пространство. Во-вторых, это позволяет использовать более эффективные алгоритмы для базовых геометрических вычислений. Например, для вычисления кратчайшего пути между двумя точками в общем метрическом пространстве требуется использовать алгоритмы оптимизации, тогда как в римановом пространстве можно эффективно решать уравнение геодезических. В-третьих, это позволяет сформулировать гипотезу о когнитивном смысле не-римановой природы перцептивного цветового пространства. Закон Вебера–Фехнера и закон Стивенса описывают затухание (или усиление) реакции на физические стимулы при переходе к восприятию. Это обеспечивает способность человека эффективно функционировать в широком диапазоне условий — от яркого солнечного света до слабого лунного освещения. Убывающая отдача в цветовом восприятии может интерпретироваться как эффект второго порядка, позволяющий стабильно воспринимать цвета как в низкоконтрастных, так и в высококонтрастных условиях. Учитывая большое количество модальностей восприятия, для которых выполняется закон Стивенса, выдвигается гипотеза, что этот «второй порядок» закона Стивенса может относиться не только к цветовому восприятию, но и к другим модальностям, таким как слух или осязание.

Но здесь возникает ключевой момент. Если это действительно так, то это означало бы, что модель восприятия Терстоуна не может быть верной. Терстоун совершил революцию в когнитивной психологии, предложив, что одномерный стимул может быть представлен нормально распределенной случайной величиной на перцептивной шкале. Математическое ожидание соответствует «истинному» восприятию, а дисперсия — перцептивному разбросу, то есть тому, насколько легко стимул может быть принят за другой. Эта модель впервые объяснила, почему один и тот же наблюдатель может по-разному реагировать на один и тот же стимул в разные моменты времени. Далее Терстоун предположил, что сумма таких гауссиан описывает распределение сравнительных суждений; например, перекрытие разностных гауссиан в задаче выбора «лишнего» элемента соответствует вероятности ошибки наблюдателя. И именно здесь возникает проблема. Если бы убывающая отдача действительно была общей характеристикой человеческого восприятия, то гауссианы нельзя было бы просто складывать — их взаимное положение также требовало бы масштабирования. Континуумы психологических признаков у Терстоуна по своей природе линейны, поэтому их разности аддитивны. Отсутствие аддитивности обсуждалось фон Кризом, который рассматривал это как доказательство того, что психофизическая шкала не может существовать, а также Люсом, который, напротив, утверждал, что аддитивность не является необходимым условием ее существования.

Для более детального ознакомления с нюансами исследования рекомендую заглянуть в доклад ученых и дополнительные материалы к нему.

Эпилог

В рассмотренном нами сегодня труде ученые решили рассмотреть и расширить теорию Шрёдингера, касающуюся восприятия цветов.

Команда ученых использовала геометрию для построения математического определения цветового восприятия, основанного на оттенке, насыщенности и яркости. Их результаты формализуют модель Шрёдингера и показывают, что эти привычные цветовые характеристики являются не внешними конструкциями, а встроенными свойствами структуры восприятия цвета. Ученые отмечают, что эти цветовые качества не возникают из дополнительных внешних факторов, таких как культура или опыт обучения, а отражают внутренние свойства самой цветовой метрики. Эта метрика геометрически кодирует воспринимаемое цветовое расстояние — то есть то, насколько различно выглядят два цвета для наблюдателя.

Благодаря более строгому определению этих перцептивных атрибутов исследователи закрыли недостающий элемент в давней концепции Шрёдингера о замкнутой математической модели цвета. Цель состояла в том, чтобы определить оттенок, насыщенность и яркость, используя только геометрическое свойство максимального цветового сходства. Зрение человека основано на трех типах колбочек, чувствительных к красному, синему и зеленому диапазонам. Это делает цветовые пространства трехмерными, позволяя математически упорядочивать и сравнивать цвета. В XIX веке математик Бернхард Риман предложил рассматривать перцептивные цветовые пространства не как плоские и линейные, а как искривленные. В 1920-х годах Шрёдингер развил эту идею, определив оттенок, насыщенность и яркость в римановой модели цветового восприятия через метрику, описывающую воспринимаемые различия цветов.

Определения Шрёдингера около ста лет формировали цветовую науку. Однако при разработке алгоритмов визуализации ученые обнаружили важные математические недостатки в этой модели. Наиболее серьезная проблема связана с нейтральной осью — линией оттенков серого, соединяющей черный и белый. Определения оттенка, насыщенности и яркости у Шрёдингера зависят от положения цвета относительно этой оси, однако сама ось формально не была определена. Этот пробел создавал серьезную проблему: без строгого определения нейтральной оси вся конструкция оставалась математически неполной. Ключевым достижением стало определение нейтральной оси исключительно через геометрию цветовой метрики. Для этого исследователям пришлось выйти за рамки традиционной римановой модели. Этот переход представляет собой важное математическое достижение в области визуализации.

Более точная модель цветового восприятия может быть полезна в областях, где критична точность цвета — включая фотографию, видео, визуализацию и связанные технологии. Она также может улучшить методы создания и интерпретации научных данных. Научная визуализация играет важную роль в понимании сложной информации. Улучшенные цветовые модели могут повысить качество анализа в различных областях. Данная работа создает основу для будущего моделирования цвета в не-римановом пространстве.

Немного рекламы

Спасибо, что остаетесь с нами. Вам нравятся наши статьи? Хотите видеть больше интересных материалов? Поддержите нас, оформив заказ или порекомендовав знакомым, облачные VPS для разработчиков от $4.99, уникальный аналог entry-level серверов, который был придуман нами для Вас: Вся правда о VPS (KVM) E5-2697 v3 (6 Cores) 10GB DDR4 480GB SSD 1Gbps от $19 или как правильно делить сервер? (доступны варианты с RAID1 и RAID10, до 24 ядер и до 40GB DDR4).

Dell R730xd в 2 раза дешевле в дата-центре Maincubes Tier IV в Амстердаме? Только у нас 2 х Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 ТВ от $199 в Нидерландах! Dell R420 - 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB - от $99! Читайте о том Как построить инфраструктуру корп. класса c применением серверов Dell R730xd Е5-2650 v4 стоимостью 9000 евро за копейки?

Не только кот: геометрия цвета по Шрёдингеру