dom1n1k Jun 28 2016 at 11:56

Об относительной яркости, или насколько живучим бывает легаси

6 min

43K

IT Standards * Image processing *

+86

130

Comments 130

UFO landed and left these words here

petrovnn Jun 28 2016 at 17:14

Слева старая «неправильная» формула, справа новая «правильная». Справа однородность действительно заметно выше.

Объясните тогда, почему в grayscale, слева как раз более однородно?

dom1n1k Jun 28 2016 at 17:36

Мой вариант

Нужно выяснять чем и как конвертировали в grayscale, какие настройки и т.д.
Случайно не функцией Desaturate в ФШ? Она работает иначе — в модели HSB (т.е. совершенно не перцептивно).

bertmsk Jun 28 2016 at 12:55

Тогда ценность багета автора резко упадет, поскольку картинки практически идентичные

Исходная:
/>

Со старыми коэффициентами
/>

С новыми коэффициентами
/>

DistortNeo Jun 28 2016 at 13:06

Кстати, формула все равно неверная: при вычислении Y нужно учитывать гамму.

Вот статейка, где можно посмотреть результаты:
www.cgm.computergraphics.ru/files/cgm/rgb2gray_article.pdf

dom1n1k Jun 28 2016 at 18:38

Я начал было писать ответ про гамму, но он получился такой большой, что я его тоже вынес в апдейт.

dom1n1k Jun 28 2016 at 15:04

См. апдейт

UFO landed and left these words here

sasha1024 Jun 28 2016 at 16:05

Совет: я бы модифицировал Ваш пример следующим образом (но мне лень)…

У Вас (псевдокод):
var ethalonY := 0.5, count := 100;
for (var n := 0; n!=count; ++n) {
var r := random(), b := random();
var g1 := getGreenFromRedBlueY(r, b, ethalonY, [0.299, 0.587, 0.114]);
var g2 := getGreenFromRedBlueY(r, b, ethalonY, [0.2126, 0.7152, 0.0722]);
putLeft(r, g1, b); putRight(r, g2, b);
}

Надо:
var ethalonY := 0.5, count := 100;
for (var n := 0; n!=count; ++n) {
var h := n / count * 360°;
var (r, g, b) := hslToRgb(h, 100%, 50%);
var (r1, g1, b1) := normalizeToY(r, g, b, ethalonY, [0.299, 0.587, 0.114]);
var (r2, g2, b2) := normalizeToY(r, g, b, ethalonY, [0.2126, 0.7152, 0.0722]);
putLeft(r1, g1, b1); putRight(r2, g2, b2);
}

Т.е.:
1. Не подбирать зелёный по красному и синему, а подбирать все 3 канала по hue.
2. Меньше рандома, просто перебрать все значения hue подряд с каким-то шагом.

sasha1024 Jun 28 2016 at 16:12

А ещё лучше: не слева одна картинка, справа другая, а отобразить получившиеся цвета в виде 2 рядов один под другим:

□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□ (YIQ)
□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□□ (sRGB)

Какой ряд равномернее по яркости — тот и лучше.

dom1n1k Jun 28 2016 at 16:27

Такое расположение больше подходит для сравнения пар цветов между двумя группами.
Но нам ведь важнее смотреть на однородность группы, т.е. как раз лучше показать её сбитой в кучу, а не вытянутой колбасой.

sasha1024 Jun 28 2016 at 16:34

Может быть, это всё субъективно, мне кажется, так было бы лучше, но, может быть, я неправ.
Мой основной коммент был выше про «не G по (R:=rand(), B:=rand(), Y:=0.5), а L по (H:=seq(), S:=100%, Y:=0.5)».

dom1n1k Jun 28 2016 at 16:39

Эмм… не получится же: координата L в HSL и Y в XYZ — это разные параметры. По смыслу немного похожие, но разные.

sasha1024 Jun 28 2016 at 17:09

А где я говорил, что они одинаковые?

dom1n1k Jun 28 2016 at 18:50

Тогда я не совсем понял, какие преимущества сулит предложение. Лучше форкнуть и показать как надо :)

DrSmile Jun 28 2016 at 17:34

Как уже неоднократно писали, учет гаммы так же важен, как и цифры интенсивности. Так что «рядовой программист», в итоге, все равно сделает неправильно, без учета нелинейности цветового пространства, независимо от того, какие магические числа он нагуглит. Не позорьтесь, исправьте в апдейте

function stringify (r, g, b) {
	return 'rgb(' + Math.round(255 * Math.pow(r, 0.45)) + ',' +
                        Math.round(255 * Math.pow(g, 0.45)) + ',' +
                        Math.round(255 * Math.pow(b, 0.45)) + ')';
}

dom1n1k Jun 28 2016 at 18:40

См. второй апдейт

DrSmile Jun 28 2016 at 21:00

Очевидно, что написанное там не соответствует истине.

Пусть у нас есть два цвета — красный {1, 0, 0} и темно зеленый {0, 0.5, 0} в нелинейном цветовом пространстве с гаммой 2.2. Забив на гамму и применяя формулу напрямую, получим яркости 0.2126 и 0.3576. Если же корректно преобразовать цвета в линейное пространство, рассчитать яркость и вернуть в нелинейное, то получится 0.4947 и 0.4293. Налицо принципиальное изменение отношения.

Вообще, если пытаться приближать правильную формулу без степеней, то стоит хотя бы возвести в степень 1/2.2 сами коэффициенты, т. е. использовать Y = 0.4948R + 0.8587B + 0.3028G. Будет работать правильно хотя бы для чистых цветов. Для смешанных, в том числе белого, будет врать, поэтому надо заново нормировать на единицу. В общем, как я и говорил, «рядовой программист» будет врать независимо от выбранных магических чисел.

dom1n1k Jun 28 2016 at 22:49

Нашел у себя ошибку в выкладках, касающуюся этого момента. Но исследовать её буду уже завтра.

dom1n1k Jun 29 2016 at 13:41

Поэкспериментировал я с Монте-Карло — генерировал рандомные пары цветов и проверял, в каком количестве случаев отношение яркости сохранятся при разных методах. За эталон принимал соотношение CIE L*.

Метод       В лоб     С учетом гаммы
Rec.601     92.6%     94.3%
Rec.709     94.1%     100%

Результаты вполне устойчивые, разные эксперименты дают разброс <0.1%.
Выводы в общем-то капитанские: влияет и то, другое. Разница лишь в том, что гамма просаживает производительность, а коэффициенты достаются бесплатно.

VioletGiraffe Jun 28 2016 at 12:13

А в контексте YUV исходные коэффициенты валидны, или тоже нет?

dom1n1k Jun 28 2016 at 12:40

YUV — это просто преобразование системы координат над RGB-пространством (точнее семейство из нескольких родственных преобразований).
В какой пропорции смешивать — зависит от конкретного RGB-пространства, а оно в свою очередь зависит от контекста задачи.
Если вы вдруг действительно работаете с NTSC-видеосигналом — исходная формула верна. Но только для него. Для других пространств — нет.

Cthutq66a Jun 28 2016 at 12:17

А если ч/б картинка используется только для вычислений(например детектор границ) есть разница как ее считать по RGB?

UFO landed and left these words here

Cthutq66a Jun 28 2016 at 12:23

Это более — менее очевидно. Вопрос скорее — как правильно?

dom1n1k Jun 28 2016 at 12:29

Правильно — использовать те формулы, которые выведены конкретно для вашего рабочего цветового пространства.
Если это sRGB (подавляющее большинство случаев), то верна формула, которую я привёл (вторая). Если вдруг вы используете что-то иное (Adobe RGB, ProPhoto RGB и так далее) — там будут свои коэффициенты, их можно вывести из таблички Линдблума.

UFO landed and left these words here

evtomax Jun 30 2016 at 09:38

И вообще лучше вычислить границы для каждого канала, а потом сделать объединение, иначе потеряются границы между близкими по яркости цветами.

DistortNeo Jun 30 2016 at 17:11

Конкретно для вычисления границ можно использовать цветовой градиент Di Zenzo,

sasha1024 Jun 30 2016 at 12:59

По хорошему, наверное (я не специалист), следовало бы не переводить вообще в grayscale в данном случае, а делать вычисления на основе формул цветового отличия. Ну это в идеале. Не знаю, как делают на практике.

RouR Jun 28 2016 at 13:20

Выше есть ссылка на фиддл с Леной — смотрите на область вокруг носа, полутени лучше видно

darkAlert Jun 28 2016 at 14:52

Разница есть, но единственного «правильного» способа нет.
Изменения формулы rgb_to_gray аналогичны изменению контраста изображения.
Но это палка о двух концах — увеличим контраст, усилим границы, но получим больше шума. И обратно.

Проблема в том, что rgb_to_gray преобразование и последующий оператор Собеля это все линейные преобразования. Изменяя коэффициент в формуле rgb_to_gray мы лишь получаем масштабирование, т.е: Sobel(Rgb2Gray(I*A)) = Sobel(Rgb2Gray(I))*B

Более продвинутым способом можно считать нелинейные преобразования, например те же нейронные сети, обученные на выделение границ.

homm Jun 28 2016 at 12:57

если увидите в чьем-то действующем коде последовательность 299/587/114 — кидайте автору ссылку на эту заметку.

Основная проблема в том, что эта заметка на русском. Куда лучше всего всего давать ссылку англоязычным разработчикам (хочу попроваить формулу в Pillow)?

homm Jun 28 2016 at 13:44

dom1n1k так что?

dom1n1k Jun 28 2016 at 13:57

Прямой англоязычный аналог мне неизвестен, к сожалению.
Навскидку в голову приходит известный Color FAQ Чарльза Пойнтона, а конкретнее пункт 9:
http://www.poynton.com/notes/colour_and_gamma/ColorFAQ.html#RTFToC9

RolexStrider Jun 28 2016 at 13:14

коэффициенты привязаны к технологии воспроизведения цвета

Именно так и было, но наоборот: привязка изначально была к Ч/Б телевизорам и их особенностям. В целях обратной совместимости. Ну а после… Эти костыли кочуют из руководства в руководство прям аки мировые константы.

Randl Jun 28 2016 at 13:33

А разве коэффициенты не зависят от того, в каком цветовом пространстве у нас картинка? Конечно, sRGB сейчас стандарт де-факто, но ведь теоретически изображение может быть и в AdobeRGB, и в ProPhoto, и в чём то еще.

dom1n1k Jun 28 2016 at 13:42

Конечно зависят. Об этом есть комментарий выше, и это подразумевается в тексте. Но видимо, нужно уточнить более явно, сейчас сделаю поправку.

Randl Jun 28 2016 at 13:54

Просто создается впечатление, что посыл поста — "это неправильные магические числа, замените их другими". По моему лучше было бы проверять цветовое пространство и делать соответствующий перевод, такой код даже после замены стандарта не будет работать неправильно, а максимум выдаст ошибку об отсутствие соответствующего преобразования..

dom1n1k Jun 28 2016 at 14:16

Формула не моя, её придумали задолго до меня :) И в настоящее время она определена как стандартная (тем же W3C). Я лишь хочу обратить на неё внимание.

Что касается разных пространств. Да, конечно, лучше и точнее считать всё по-взрослому. Но это сразу забросит нас в пучину нетривиальной и громоздкой колориметрической математики. Вот так быстро и сходу в ней разобраться сложно — да и не особо нужно, откровенно говоря. В 99% случаев, с которыми сталкивается рядовой программист, это себя не оправдает. Достаточно, чтобы он не использовал заведомо неправильные формулы, которые ему случайно нагуглились.

Ну а если кто-то решает более серьезные задачи — там, конечно, не обойтись. Но это отдельная и настолько большая тема, по ней пишут толстенные книжки, а не заметки на Хабр.

Randl Jun 28 2016 at 14:24

В 99% случаев визуальной разницей между двумя формулами можно пренебречь. Конечно, лучше и точнее считать по правильной формуле, но принципиальной разницы увидеть не удалось.

silvansky Jun 28 2016 at 14:34

Вообще, тут ещё от монитора зависит восприятие. Я тестировал на макбуке и внешнем монике Dell, на встроенном мониторе разница заметна слабее.

Randl Jun 28 2016 at 14:59

Ну у меня монитор хороший и калиброванный даже. Когда два изображения рядом, разница конечно заметна. Если встретить одно изображение где-то посреди статьи, никто и внимания не обратит.

dom1n1k Jun 28 2016 at 14:43

Какой-то радикальной, космической разницы — да, не будет.
Но зачем использовать заведомо неверные коэффициенты, если можно взять верные, и дополнительные трудозатраты для этого равны нулю? :)

amarao Jun 28 2016 at 13:56

А можно я задам глупый вопрос? Вот меня в курсе физики учили, что цвет определяется длинной волны. Которая меряется в нанометрах, или обратных к ним терагерцам.

А тут, вдруг, «координаты цветов». О чём речь, вообще? (Я понимаю, что это айтишные условности по перекладыванию байтиков из системы в систему, но, всё-таки).

dom1n1k Jun 28 2016 at 14:07

Метамерия. Цвет — это ощущение.
Если коротко, то длина волны однозначно соответствует цвету (и то с некоторыми оговорками) только в том случае, когда она одна — то есть имеем чистый спектральный свет. Если же имеем смесь волн (а на практике так почти всегда), ситуация резко становится намного сложнее.
Поэтому пришлось придумать свои особые, цветовые системы координат. Причем их много разных и у каждой свои плюсы и минусы.

UFO landed and left these words here

lockywolf Jun 28 2016 at 14:38

>>О чём речь, вообще?

Если на пальцах:

На глаз падет электромагнитная волна, зависящая от времени. Это не синусоида!
Глаз не ловит конкретных отклонений волны, и он не спектроанализатор (это было бы слишком накладно).

Глаз делает две вещи: режет сигнал по типичному времени (времени реакции) и каждый интервал раскладывает в сумму ряда из всего трёх членов. У этих собственных членов есть собственные функции — это примерно (но не точно!) гауссианы с центрами в длинах волн, которые мы называем «красным», «синим» и «зелёным».

Очень много функций можно разложить так, что их скалярные произведения с гауссианами одинаковы. И спектроанализатор покажет разницу, а глаз — нет.

sasha1024 Jun 28 2016 at 14:17

Когда-то в качестве развлечения делал игру. Стратежку. Там выдранные с какого-то сайта фришные картинки юнитов были в синей гамме. Чтобы получить картинки юнитов оппонентов, я делал «цветовой поворот» на 120° и 240° (т.е. R->G, G->B, B->R). Меня удивило, что цвета получались совсем неожиданные (из визуально-синей исходной картинки получались не визуально-красные, а какое-то сиреневые). Погуглил, понял что «мощности» каналов R, G и B неравны, стал подправлять их этими коэффициентами перед/после «поворота» (пробовал и sdtvWeights = [0.299, 0.587, 0.114], и hdtvWeights = [0.2126, 0.7152, 0.0722]). Визуально на моём мониторе с SDTV-коэффициентами выглядело лучше.

Ещё удивило, что gimp «поворачивает», кажется, вообще, без учёта коэффициентов. По крайней мере, в нём результат поворота получался совсем удручающий.

Randl Jun 28 2016 at 14:26

Цветовой поворот удобно делать в HSV, HSL и подобных.

sasha1024 Jun 28 2016 at 14:42

Эмм, нет. При (стандартном) переводе из RGB в HSL/HSV как раз эти коэфициенты и не учитываются. Т.е. RGB=[0,0,255] даёт L=50% и RGB=[0,255,0] тоже даёт L=50% (несмотря на то, что [0,0,255] — это синий, а [0,255,0] — это салатовый).

Да и вообще, зачем мне HSL/HSV, если у меня поворот ровно на 120° и 240° — достаточно поменять местами каналы (ну, с поправками, учитывая, что разные каналы имеют разную «мощность»).

Вот для этих поправок и нужны коэфициенты. Прикол в том, что более древние (и по логике неправильные) SDTV-коэфициенты на моём мониторе давали более правильный результат, чем более новые, рекомендуемые в т.ч. автором этой статьи.

sasha1024 Jun 28 2016 at 14:56

Возможно, я неправильно их называю SDTV- и HDTV-коэфициентами.
Вероятно, судя по статье, это YIQ и sRGB (накрайняк — NTSC и HDTV).
Но у меня в коде переменные почему-то были названы так.

Randl Jun 28 2016 at 14:56

Ну так у чисто зеленого и чисто синего одинаковая lightness. Менять надо hue, который в градусах и измеряется.

sasha1024 Jun 28 2016 at 15:00

Ну так в том-то и дело, что #0000FF — это синий (не голубой), а #00FF00 — это салатовый (не зеленый). Т.е. #00FF00 визуально намного ярче, чем #0000FF.

Поэтому и нужны эти коэфициенты.

А если просто менять hue, то получится та же херня, что и в gimp'е.

playermet Jun 28 2016 at 20:13

> визуально намного ярче
Эта характеристика называется «светлота».

sasha1024 Jun 28 2016 at 20:31

Т.е. lightness. Будем знать.

sasha1024 Jun 29 2016 at 21:43

Стоп, подождите, Вы меня запутали.
Если светлота (lightness?) — это то, какой цвет визуально выглядит светлее…
… то как тогда называется третий параметр (L) в HSL?

playermet Jun 30 2016 at 16:13

Это он и есть. При L равном 100% в результате будет белый цвет, вне зависимости от остальных настроек. Просто L в HSL регулирует светлоту (близость к белому) без учета текущего тона (hue).

sasha1024 Jun 30 2016 at 16:39

Ну так в том-то и дело, что #0000FF — это синий (не голубой), а #00FF00 — это салатовый (не зеленый). Т.е. #00FF00 визуально намного ярче, чем #0000FF.

Эта характеристика называется «светлота».

Тогда Вы сами себе противоречите. Я говорил о том, что #0000FF (синий) и #00FF00 (салатовый) в HSL имеют одинаковое L (50%) — несмотря на то, что #00FF00 визуально выглядит светлее #0000FF'а.

P.S.: Т.е. меня интересует «субъективная светлота» (не знаю как называется), а не параметр L в HSL.

playermet Jun 30 2016 at 16:54

> Тогда Вы сами себе противоречите
Не противоречу. Я лишь дал вам название термина.

> Я говорил о том, что #0000FF (синий) и #00FF00 (салатовый) в HSL имеют одинаковое L (50%) — несмотря на то, что #00FF00 визуально выглядит светлее #0000FF'а.
Именно это и называется «светлотой» (2).

> Т.е. меня интересует «субъективная светлота» (не знаю как называется), а не параметр L в HSL.
Объясню по другому. L в HSL отвечает за субъективную светлоту, но HSL не подразумевает что при одинаковом L она всегда будет одинаковой. В Lab эта же светлота, но формула устроена так что результативная светлота полностью определяется L.

sasha1024 Jun 30 2016 at 18:11

Т.е. в HSL параметр L регулирует светлоту (lightness) в пределах тона (hue, H). Короче говоря: если H_цв1=H_цв2, то (L_цв1>L_цв2) ⇔ (цв1 светлее цв2) — но если H_цв1≠H_цв2, то (L_цв1>L_цв2) ⇎ (цв1 светлее цв2).

playermet Jun 30 2016 at 18:28

Да, все правильно.

sasha1024 Jun 28 2016 at 15:01

Т.е. HSL/HSV тут никак не поможет (ну, я имею в виду, если не учитывать дополнительно эти коэфициенты, о которых речь в статье).

VioletGiraffe Jun 28 2016 at 20:05

Именно потому и недостаточно просто поменять каналы. По-моему, самое продвинутое цветовое пространство для манипуляций над воспринимаемыми цветами — Lab.

sasha1024 Jun 28 2016 at 20:21

Ну, я просто умножал/делил на эти коэфициенты перед/после обмена каналов. Для той задачи этого хватило: картинки юнитов получились приемлемые (из нормально-синего танк не превращался в ярко-салатовый, и не вылазили посторонние цвета — если до «поворота» танк был в синей гамме, то после он был в красной/зелёной, а не фиолетовой/рыжей/другой).

Про Lab надо почитать, это интересно; просто для той задачи это было явно излишне.

Тут я просто отвечал человеку, который зачем-то настойчиво советовал HSL/HSV; и я ему пытался объяснить, что HSL/HSV мне не помог бы (HSL/HSV мне нужен был бы, если бы у меня был поворот не на 120° или 240° ровно, а на другое число; но поворот hue на 120° или 240° это и есть обмен каналов); так как проблему неравноценности RGB каналов сам по себе HSL/HSV бы никак не решал (потому что при стандартных формулах перевода RGB <-> HSL/HSV каналы как раз считаются равноценными), просто была бы лишняя арифметика.

VioletGiraffe Jun 28 2016 at 20:28

Да, я всё понимаю — в том числе и что для той задачи ничего больше не требовалось. Просто я не так давно часа два изучал инфу о разных цветовых пространствах — есть идея сделать софтину для манипуляциями цветами, и хорошо бы это делать с учётом особенностей зрения человека. Пришёл к выводу, что Lab — единственный вариант, но там всё непросто с конвертацией. Вплоть до того, что я внятных формул для перевода из RGB не нашёл.

sasha1024 Jun 28 2016 at 20:50

Странно, что этого ещё нету в стандартном gimp'е или ещё где-то. Потенциально низкое удобство пользования отдельной софтиной меня смущает. Возможно такие софтины уже есть, просто мы не знаем.

Ну, формулы RGB<->Lab я как раз нашёл, там (вроде) всё просто:
RGB<->sRGB<->«CIE XYZ»<->Lab
(1) RGB<->sRGB и sRGB<->«CIE XYZ»
(2) «CIE XYZ»<->Lab
(Но не знаю насколько просто всё остальное, потому что суть Lab я пока не понимаю.)

А какого рода софтину Вы собираетесь делать? Т.е. какой у неё должен быть функционал? (Условно говоря: просто преобразовать 1 цвет типа такого но сложнее или именно работа с изображениями?)

VioletGiraffe Jun 28 2016 at 21:00

Спасибо! Википедию, конечно, я читал, (2) я находил, а (1) не смотрел (хотя и понимал, что это где-то задокументировано). Хотел прямое одноходовое преобразование, но хоть так.

Софтина именно для обработки изображений, конкретная задача, где нужен (ну или желателен) Lab — составление функции визуальной похожести цветов.

UFO landed and left these words here

DistortNeo Jun 28 2016 at 17:04

На самом деле плохо, что при работе с изображениями не заморачиваются с гаммой. И я имею в виду не только преобразование в YUV, но и использование алгоритмов обработки изображений в целом. Для многих задач игнор гаммы в угоду производительности не играет роли, но при работе с реальными изображениями, когда важна точность, гамму стоит учитывать.

Например, при гамме 2.2 смешение пикселей с интенсивностями 0 и 255 будет равно 186, а не 127.

dom1n1k Jun 30 2016 at 20:23

Эта гамма не дает мне покоя уже 2 дня. И вот я погрузился в справочники, провел кое-какие эксперименты и постепенно прихожу к выводу, что тут не всё так однозначно.

Эксперименты склонят меня к мысли, что для конвертаций (из пространства в пространство и в частности из rgb в grayscale) — гамму конечно же нужно учитывать.
Но для обработки изображений (например, регулировки яркости, контрастности, фильтры, смешивание и пр.) гамму лучше не трогать. Она же не просто так придумана — она нужна, чтобы сделать шкалу перцептивной. И гамма sRGB и L* делают это с разной степенью точности. Цвета нужно смешивать по перцептивной шкале, а не физической.

Я пока поостерегусь назвать эти выводы окончательными. Но похоже, что ФШ именно так и поступает.
И похоже, что мой апдейт 2 нужно проапдейтить, рассуждения в нём были частично ошибочные.

DrSmile Jun 30 2016 at 21:57

Всякую артистическую обработку можно проводить в нелинейном пространстве. Однако трансформации, имеющие конкретный физических аналог (смещения, изменения масштаба, повороты, в том числе нерегулярные; фильтры размытия и т. п.) обязаны быть реализованы физически корректно. В противном случае будут артефакты той или иной степени заметности в местах с сильными градиентами. Например, при движении тонкой линии, ее яркость будет заметно колебаться.

dom1n1k Jul 1 2016 at 10:57

А что означает «физически корректно»? Ведь (не)линейность пространства — штука относительная.
CIE Lab и любое гамма-корректированное RGB-пространство очень нелинейны (типичный показатель степени от 1.8 до 3) относительно CIE XYZ. Но относительно человеческого восприятия всё наоборот — они более линейны (для того гамма и придумана!), Lab получше, RGB похуже. Но оба они превосходят в этом смысле XYZ, которое очень сильно нелинейно (эллипсы МакАдама).
XYZ это такая математическая абстракция, которую придумали для удобства математики в докомпьютерную эпоху — считали все на логарифмических линейках, и отрицательные числа доставляли большие неудобства. Но оно вообще не перцептивное. Так почему же обработка в нём (или в его линейных преобразованиях, которыми являются RGB-пространства без гамма-коррекции) должна быть более корректна?

DrSmile Jul 1 2016 at 11:24

Потому что если картинку немного сдвинуть (на полпикселя), то количество света, приходящее от соответствующих областей, измениться не должно. Ибо так происходит в реальном мире, в котором пикселей нету. Стоит четко разделять то, что происходит со светом до прихода в глаз, и то, что происходит с сигналами в сетчатке и мозге. Если во втором случае, действительно, все относительно, то вот в первом — лучи подчиняются законам физики и там все строго и однозначно.

dom1n1k Jul 1 2016 at 11:54

Я как-то участвовал в подобной дискуссии на форуме rudtp, только там было всё наоборот :) Человек утверждал, что корректная интерполяция цветов обязана быть максимально перцептивна (т.е. всегда проводиться только в пространстве Lab).

Ошибка ваших рассуждений в том, что Y — это не физическое количество света. Потому что XYZ это тоже пространство «цветовых ощущений», а не физического количества фотонов.

DrSmile Jul 1 2016 at 14:16

XYZ пространство однозначно и физическо корректно определяется через количества фотонов. Есть 3 функции спектральной чувствительности, которые фотону определенной частоты ставят в соответствие тройку {X, Y, Z}. С точки зрения математики, базис XYZ — это трехмерное подпространство исходного бесконечномерного пространства физического цвета.

В контексте обсуждения важно, что это подпространство линейное, т. е. подчиняется принципу суперпозиции. Соответственно, если взять два источника света и посветить на одно место, то итоговой цвет будет суммой цветов источников в любом линейном пространстве (а уже конкретно ли это XYZ, RGB, или, вообще, функция от длины волны, не важно).

dom1n1k Jul 1 2016 at 17:28

Не совсем так — спектры-то скармливаются функциям в нормализованном виде (относительная SPD). Т.е. складывать два физических источника света эти формулы не умеют.

DrSmile Jul 1 2016 at 17:53

Это все линейные преобразования, на работоспособность принципа суперпозиции не влияют. Проблемы там возможны только при нелинейных операциях, например, при освещении поверхности источником умножается спектральная интенсивность на коэффициент поглощения, и делать это в «урезанных» цветовых координатах (XYZ или RGB) не совсем точно.

В общем, лучше один раз увидеть. Тонкие линии на разном сабпиксельном смещении
без учета гаммы:

с учетом:

Невооруженным глазом видны колебания яркости в первом случае.
(Картинки из темы на геймдеве, посвященной антиалиасингу.)

dom1n1k Jul 1 2016 at 18:37

Хм, ну так субпиксельные эффекты — это особый случай.
Если объект размером 1px нужно размазать на 2px, но при чтобы он выглядел так же — вполне ожидаемо, что потребуются какие-то компенсирующие ухищрения.

А в более простом случае, когда каждый пиксель это пиксель — получается как-то спорно.

Очень простой пример

Какой из серых квадратов субъективно наиболее равноудалён от черного и белого?

DrSmile Jul 1 2016 at 19:05

Субпиксельные эффекты — это не особый, а всего лишь частный случай наложения цветов. Какой-нибудь дефокус или наложение света от разных источников будут действовать точно так же.

А субъективные вопросы они на то и субъективные, чтобы не иметь однозначного ответа. Например, моя тренированная физическая интуиция говорит за нижний квадрат. Поэтому я предпочитаю обсуждать только объективные вопросы.

Например

Какой средний цвет будет у шахматки на большом расстоянии?

Или вот мой прошлый пример с яркостью цветов

Без учета гаммы зеленый должен быть ярче красного в полтора раза, с учетом — красный немного ярче зеленого.

dom1n1k Jul 1 2016 at 22:57

C красно-зеленым примером уже раньше разобрались. А что касается остального:

Мой пример.
Мое мнение — самый верхний. Но это моё, оно теоретически может быть предвзято. Я ещё опросил 4-х человек (никто их них не понимает значения букв на картинке). Двое сказали что средний квадратик, один что верхний, а еще один, что он бы еще немного затемнил верхний.

Шахматка.
На десктопе совпадает с верхним. На планшете и телефоне где-то посередине, но чуть ближе к нижнему. Сторонние мнения: у одного ближе к нижнему, у одного ближе к верхнему, у одного точно совпал с нижним.
И можно было бы списать разброс на разные калибровки разных экранов, но… два последних человека (с противоположным виденьем) смотрели на одном компьютере :)

DrSmile Jul 2 2016 at 00:22

У всех ЖК экранов сильно плавает цветопередача в зависимости от угла, особенно вертикального. Еще некоторые устройства отображения бывают испорчены разными «улучшайзерами» (у меня проектор этим грешит и приходится делать квадраты шахматки побольше, чтобы компенсировать эффект). Плюс, условия эксперимента необходимо понимать буквально: надо не субъективно оценивать похожий цвет, а отойти на такое расстояние, с которого квадраты перестанут быть различимы.

Но, вообще, все это лирика и законы физики предполагают только один ответ. Получение другого говорит о неправильной калибровке монитора и/или неправильной постановке эксперимента.

vconst Jul 11 2016 at 04:51

Если не влезать в математику, то все верно. Для полиграфии разработаны стандарты цвета, которые там очень тщательно соблюдаются, а в мире мониторов и экранов такой адский зоопарк, что практически нет никакого смысла заморачиваться такими тонкостями, потому что в пределах одной комнаты (несколько десктопов с разными мониторами, насколько ноутов разных фирм, насколько смартфонов и планшетов) мы получим столько вариантов отличных по цвету, яркости и константу — на скольких экранах мы посмотрим одну и ту же картинку. Потому в вебе практически не нужны специалисты такого уровня, как в полиграфии, достаточно только того, что картинка более-менее естественная по цвету

Теория требует тщательной работы, но на практике результаты будут мало отличимы. Например в одном издательстве, где я работал, было потрачено много усилий на то, что бы в кабинете допечатной подготовки у всего был правильный цвет, специальные лампы, тщательная калибровка принтера и мониторов, стены чистого серого цвета и тд тп. Я открывал картинку на эйзо, клал рядом с монитором цветопробу и журнал из тиражом — в идеале все картинки были одного цвета, некоторые отличия могли быть только в яркости. И эти усилия были оправданы.
Но в мире ноутов и смартов — это все не имеет смысла, даже гамма плавает в пределах ± хз сколько

DistortNeo Jul 1 2016 at 06:33

Для фотореалистичной обработки гамму учитывать нужно. Гамма придумана для того, чтобы сделать более-менее равномерным распределение отсчётов шкалы в соответствии с человеческим восприятием.

Например, черный провод на белом фоне после размытия должен пропать, а белая нить на чёрном фоне — стать толще, почти не потеряв в яркости. Без преобразования гаммы оба объекта бы стали серыми.

dom1n1k Jul 1 2016 at 10:23

Это почему так должно? Имею в виду пример с нитью.

DistortNeo Jul 1 2016 at 11:08

Потому что именно так и происходит в реальном мире.

dom1n1k Jul 1 2016 at 12:01

Где-то можно почитать более подробное объяснение и обоснование этого феномена?

dom1n1k Jun 28 2016 at 18:40

См. второй апдейт

homm Jun 28 2016 at 19:08

Добью вас про линейность цветового пространства. Вообще говоря перевод sRGB → RGB не ограничивается выправлением гаммы. Формула чуть сложнее.

dom1n1k Jun 28 2016 at 19:13

Не совсем понял, на что конкретно обращать внимание. На то, что график гаммы в sRGB состоит из двух кусков, линейного и степенного? Это я знаю. Или что-то еще?

sasha1024 Jun 28 2016 at 21:25

Вообще, во 2-м update'е он как раз считает по более сложной формуле (если я правильно понял).
Но за хорошую ссылку спасибо.

TheShock Jun 28 2016 at 23:19

А я вообще использовал когда-то (3r+6g+1b)/10. Визуально разницы почти не заметно, особенно в динамике.

Randl Jun 29 2016 at 13:28

Ну так относительная яркость — это всего лишь один из способов перевода изображения в ч/б. Иногда можно вообще один канал взять и готово, иногда надо изображение сначала обработать до перевода в ч/б. У Маргулиса про это хорошо написано, правда, конечно, в свете ручной обработки а не автоматической.

littleguga Jun 29 2016 at 07:59

У Вас ссылка на Chart.js битая.

По хорошему там везде надо issue открыть или кинуть pull request, но как аргументировать?

dom1n1k Jun 29 2016 at 08:16

Видимо они изменили систему сборки, потому что папка dist вообще пропала из ветки master. Но если скачать библиотеку со странички релизов — там всё на месте (Chart.js#L450). Но поскольку в их исходниках это место теперь не находится, это вероятно на самом деле тянулось из библиотеки третей стороны?

darkRabbit Jun 29 2016 at 11:52

Это библиотека github.com/chartjs/color, форк github.com/harthur/color, ноги которой растут из библиотеки github.com/brehaut/color-js (в которой, кстати, всё с этим хорошо: github.com/brehaut/color-js/blob/master/color.js#L271).

PaulZi Jun 29 2016 at 09:45

Я помню сталкивался с этим, когда занимался конвертацией в AviSynth. Я на сколько я помню, там была такая рекомендация:
использовать BT.601 — для старых не-HD источников (DVD и т. п.)
использовать BT.709 — для HD-видео
Не помню уже, откуда инфа, и на сколько она верна, но в памяти отложилось именно так.

dom1n1k Jun 29 2016 at 09:56

По факту выходит, что BT.601 верны только для американского NTSC до 1987 года и японского всех лет (японцы не переходили на новую спецификацию) и PAL/SECAM до 1970 года.
Для всего остального BT.709 будет лучше — более свежие версии NTSC/PAL/SECAM хоть и не соответствуют им в точности, но очень близки.

iroln Jun 29 2016 at 10:49

Посмотрел в scikit-image. Они используют вторую формулу.

The weights used in this conversion are calibrated for contemporary CRT phosphors

Ссылаются на этот документ.

sasha1024 Jun 29 2016 at 18:00

О, ещё одна отличная ссылка.

vconst Jun 29 2016 at 13:41

Я не программист, я фотошопер. Из своего опыта могу сказать, что правильный десатурейт должен не просто приводить все к определенной яркости, но еще и разделять цвета.

Все у кого есть под руками фотошоп, могут проверить два метода:
1) Создать RGB-изображение, залить фон градиентом радуги, применить к нему корректирующий слой Hue/Saturation в режиме наложения Normal и сдвинуть ползунок насыщенности в крайнее левое положение. Получится эффект команды Desaturate, аналогичный большинству аналогичных алгоритмов. Но картинка выйдет серая и плоская
2) Повторить все шаги, но корректирующему слою сделать режим наложения Color. Получается Ч/Б картинка совсем другого характера, даже без цвета она остается яркой и контрастной, все цвета максимально разделяются один от другого

Я не могу проверить описываемые в статье алгоритмы на своей картинке, но вот результат получающийся в фотошопе (прошу прощения, но полноценная работа с тегами мне недоступна, потому длинные текстовые ссылки):
Цветной исходник: www.dropbox.com/s/mxbr7fpos67xme6/rainbow-color.jpg?dl=0
Ч/б результат в режиме Normal: www.dropbox.com/s/oeky5jgi3wtncmh/rainbow-bw-normal.jpg?dl=0
Ч/б результат в режиме Normal: www.dropbox.com/s/j90vgvi77c9n79k/rainbow-bw-color.jpg?dl=0

Будет здорово, если кто нибудь десатурнет цветной исходник по обсуждаемым алгоритмам и покажет результат, для сравнения с фотошопным

vconst Jun 29 2016 at 13:45

Последняя ссылка «в режиме Color», конечно же

dom1n1k Jun 29 2016 at 14:17

Команда Desaturate в ФШ работает в координатах HSB, поэтому её результат и получается, очень мягко говоря, сомнительный (я бы не использовал его вообще).
Самый точный и правильный (с инженерной точки зрения) вариант обесцвечивания — это перевести картинку в Lab и взять канал L (lightness).
Mode > Grayscale по качеству где-то посередине (не идеально, но для большинства случаев достаточно).

vconst Jun 29 2016 at 14:42

Не согласен.
Я рассуждаю не как программист, а как ретушер-цветокорретор. Картинка должна быть не просто «правильная» с точки зрения математики, она должна быть яркой и контрастной, с минимальными потерями в деталях – то есть она должна быть красивой. А это не алгоритмизируется так просто

Вот примеры той же радуги:
L-канал из режима Lab: rainbow-Lab.jpg
Командой Grayscale: rainbow-gray.jpg

Если сравнить все варианты – то самый детализированный, то есть тот, у которого цвета максимально разделены друг от друга – десатурнутый с режимом наложения колор. У изображения есть не только детализация по пикселям, но и цветовая, я сейчас о ней и говорю. Пока обсуждаются абстрактные цветные квадратики, все это не наглядно, но когда приходится работать с реальной фотографией, то разница становится заметна и понятна

На самом деле все еще сложнее, грамотно перевести картинку в чб можно только с помощью команды Calculation, пробуя накладывать разные каналы друг на друга, в разных режимах и пропорциях, это сложная задача и после нее все равно придется доводить картинку корректирующими кривыми, но двухкликовый способ лучше всего тот, который я описал, Я плохо представляю, как его запрограммировать, хотя предполагаю, что это возможно, потому что наблюдал подобные задачи и их решения программными методами как на сервере, так и в браузере. Я не вспомню навскидку, но мне кажется, что в CSS есть возможность сделать подобную обработку не простым обесцвечиванием, а с наложением в разных режимах.

Я всего лишь добавил в чисто математический разговор, рассуждения о цвете профессионала-полиграфиста, который почти 20 лет занимается цветокоррекцией. Может это кому то окажется полезным, потому что, как показывает практика, мало кто представляет себе реальный процесс обработки изображений для глянцевых журналов, в инете этому уделяется куда меньше внимания, хотя бы потому, что разброс экранов по качеству и искажениям несравнимо больше, чем в полиграфии и многое прощается

dom1n1k Jun 29 2016 at 15:20

Я разобрался. Запрограммировать его сравнительно несложно. Адобовская документация говорит:

Color Creates a result color with the luminance of the base color and the hue and saturation of the blend color. This preserves the gray levels in the image and is useful for coloring monochrome images and for tinting color images.

При смешивании берется яркость от нижнего слоя и тон с насыщенностью от верхнего. Насыщенность равна нулю, тон в этих услових не определен и потерял смысл. То есть способ действительно достает из картинки яркостный канал, хотя и окольным путем. Фактически, обходится врожденный порок функции desaturate, которая работает в не-перцептивных координатах и потому полностью всё корёжит (когда я писал, что не советую её использовать — я имел в виду в чистом виде).

Вопрос только, что в точности они подразумевают под luminance. Скорее всего это нечто похожее на формулу, описанную в посте, но остается вопрос настроек (конкретные коэффициенты, учет гаммы и т.п.)

vconst Jun 29 2016 at 15:36

Можно чисто эмпирически выяснить, что они имеют в виду под luminance, измерив яркость пикселей пипеткой в фотошопе и посчитать, какое получается значение. Свойство из CSS «background-blend-mode» – подойдет? В описании сказано, что там аналоги наложений в фотошопе

dom1n1k Jun 29 2016 at 15:44

Там аналоги, близкие по смыслу, но не всегда точные копии.

vconst Jun 29 2016 at 16:29

Я думаю, что более полная информация есть в руководстве API Адоб по программированию плагинов

vconst Jun 29 2016 at 16:35

Ещё можно взять мои файлы, сделать с исходником наложение через CSS и сравнить с тем, что получилось в фотошопе

Randl Jun 29 2016 at 18:11

luminance — это L канал из HSL. Подробнее здесь.

dom1n1k Jun 29 2016 at 18:20

В HSL вообще-то lightness.
И более того, продукты Adobe никогда не были замечены в связях с моделью HSL, они предпочитают HSB/HSV.

Randl Jun 29 2016 at 18:31

Упс, и правда. Канал B из HSB, наверное первая буква в luminance меня сбила. Но вы лучше по ссылке перейдите, там все подробно и с примерами.

vconst Jun 29 2016 at 20:36

Забавный дядька, знает то он много, но скорее из разряда «кто не умеет работать — учит»

Alexufo Jul 10 2016 at 23:42

грамотно перевести картинку в чб можно только с помощью команды Calculation

Почему не корректирующий Black&White предназначенный именно для этого? Через калькуляции это же совсем не удобно.

Кстати Алексей Шадрин советовал мне делать так

переход RGB to Gray Gamma 2,2 через команду Convert To Profile в режиме Perceptual лучше всего вгоняет изображение в ч-б.

dom1n1k Jul 11 2016 at 00:43

Результат второго действия совершенно аналогичен банальному Mode > Grayscale (который и нужно использовать в большинстве случаев).

vconst Jul 11 2016 at 04:28

Алексей замечательный теоретик, большая часть того, что можно узнать по русски про цветокоррекцию — это его работы. Я уверен, что он знает про Calculation, а этот совет давал, как пример «быстрой коррекции», вроде того же, что и я с HSB по Color.

Фильтр B/W и перевод Gray, плохи тем, что очень не гибкие, с минимумом настроек, а все картинки разные, очень разные. Качественный перевод изображения в градации серого, это сложная и очень индивидуальная работа, связано это с тем, что цвета и цветовой контраст всех изображений сильно отличается. Например можно одинаково хорошо перевести в серый фото, на котором нет явно преобладающих цветов, но если на фото главным является небо с множеством его оттенков, или яркое красное платье, то тут нужно тщательно работать с каналами Calculation, что бы сохранить максимум деталей и контраста. Даже в обычной фотографам может потребоваться контрастно выделить один конкретный объект, который при простом переводе в серый — потеряется

У Алексея есть проблемы в том, что он теоретик и идеалист. Например, он считает, что если фото поделено в нужный профиль, то на этом работа закончена, но есть нюансы, которые требуют локальной коррекции и проблемы с конкретной печатной машиной, которые приходится учитывать заранее, более того, если хочется качественного результата, то надо и в цеху постоять на пресс-контроле

Alexufo Jul 11 2016 at 06:29

Опять же не понимаю преимуществ Calculation перед Black&White. Перед глазами именно все цвета спектра, контраст которых вам доступен

индивидуально

Небо, оттенки неба и т.п все о чем пишите. А в Calculation я себе не представляю как нужно напрячься для работы с теми же оттенками.

vconst Jul 11 2016 at 06:39

В Calc есть возможность выбрать не только каналы, но и тип наложения, это существенно более гибкий и немного более сложный инструмент. Никто не обещал, что обработка изображений должна быть простой

Alexufo Jul 11 2016 at 07:25

Режимы наложения используются для решения все той же задачи — вопрос контрастов одних цветов перед другими. Контраст между спектральными составляющими фотографии. В этом случае режимы наложения совершенно не гибки для управлениями конкретными цветами спектра так как вообще не связаны с этим напрямую. И упоминание гибкости здесь совсем лишнее, поскольку гибкость подразумевает предсказуемый и быстрый результат. Calculation скорее технический интерфейс и явно не дает инструментов для работы с цветами спектра, о работе с которыми вы и говорите, но почему то решаете что там где сложно — правильнее. Это не так. Black&White дает вам полный спектральный контроль.

Если ваша задача художественная, и результат вы оцениваете вкусом, его вам и нужно использовать.
Все в итоге сводится к контрастам цветов, не понимаю, зачем нужно использовать для этого совершенно не удобные обходные пути)

vconst Jul 11 2016 at 07:37

По моему вы не очень хорошо представляете то, о чем спорите. Результатом работы калька — является канал в градациях серого, что нам и нужно в итоге. Б/В это упощенный кальк без многих инструментов и для большинства случаев сойдёт. Если профессионалу нужен изощренный инструмент для максимального качества, он такими вещами пользоваться не станет

Alexufo Jul 11 2016 at 08:32

Ну давайте тогда разбираться.

Результатом работы калька — является канал в градациях серого, что нам и нужно в итоге.

В итоге все таки нужен результат. В канале или в слое с маской где он появится — не важно.

Б/В это упощенный кальк без многих инструментов и для большинства случаев сойдёт.

Разработчики программы Photoshop и lightroom с вами не согласны и встраивают в оба продукта Black&White. Не профессионалы же. Не понимают, что если вы работаете контрастами цветов, то вам и нужно дать контроль непосредственно над контрастами цветов.

Если профессионалу нужен изощренный инструмент для максимального качества, он такими вещами пользоваться не станет

Максимального качества? Всмысле меньше артфактов? Или мы говорим о качестве, профессионализм которого постоянно перетекает из области фотографического языка, в битие о книжки, где можно упрекнуть обывателя в необразованности, зачем то пользуясь интсрументом 15 летней давности никак не обоснованным математчиески перед более современным фильром предназначенным для этого.

Готов поспорить, что повторю любой результат любого профессионала перевода в чб через Black&White + Curve в десять раз быстрее без каких то там заметных отличий в «качестве».

vconst Jul 11 2016 at 09:31

ОМГ, какие артефакты? Чб изображение имеет только контраст, все остальное там не так важно. Адоб много всякой фигни встраивает в свои продукты, в том числе и автоконтраст, и прочий автошлак, но и ими даже новички не пользуются

Как раз строго математическим инструментом является кальк, но не все имеют достаточно терпения для того, что бы изучить математику работы в фотошоп, потому пользуются инструментами, в которых много удобных движков и их можно долго крутить без очевидной связи с логикой. Потому и появляются такие фильтры, как автоконтраст, изучив которые — очень много народу начинает думать, что они умеют работать в фотошоп

И поосторожнее с кривыми в чб, там цвет не будет маскировать огрехи, все на виду

littleguga Jul 2 2016 at 00:26

Кстати, я обратил внимание и в inkscape всё верно, ибо там помечено, что это для NTSC.

crystallize Apr 20 2022 at 05:39

https://openaccess.thecvf.com/content_cvpr_2017/papers/Nguyen_Why_You_Should_CVPR_2017_paper.pdf

Likita Sep 18 2022 at 14:23

Ссори, перенесла свои презентации в папку, теперь она по ссылке

https://vasilika.ru/presentations/webgl-texture/?full#39