Prosolver Dec 2 2012 at 04:55

Прецизионный поворот растрового изображения на произвольный угол

8 min

58K

Programming * Algorithms * Image processing *

+94

Comments 40

UFO landed and left these words here

vsespb Dec 2 2012 at 17:59

Это в какой программе?

belk Dec 2 2012 at 18:13

Adobe Photoshop.

UFO landed and left these words here

muzhig Dec 2 2012 at 06:08

А разве не достаточно простого увеличения разрешения, потом применения матрицы поворота для каждого субпикселя и последующего антиалиасинга/фильрации?

AgentSmith Dec 2 2012 at 06:17

3 преобразования => 3-х кратная потеря качества изображения.

muzhig Dec 2 2012 at 06:21

Единственное преобразование с потерями- это поворот. Когда вы увеличиваете разрешение, скажем в 2 или 4 раза — все пиксели делятся на соответственно 4 или 16 субпикселей. Это преобразование без потерь.

Теперь, если не делать поворот, и снова уменьшить изображение, применив хоть линейную интерполяцию — изображение вернется в исходное состояние.

Все потери именно из-за поворота.

abusalimov Dec 2 2012 at 13:27

Если я верно понимаю, то в этом случае многое будет зависеть от способа интерполяции пикселей при смене разрешений.

TimID Dec 2 2012 at 06:30

Кардинально неверный подход, по-моему.
Невозможно ставить задачу «прецизионного» преобразования для растрового изображения, которое само по себе уже приближение. Фактически, лучше всего было бы сделать векторизацию, а затем её растрирование после поворота.
Photoshop'овский метод в данном случае честнее — сделайте 5 последовательных поворотов направо, а затем — налево. Ваш алгоритм, скорее всего, очень сильно «размажет» изображение, а «профессиональные» — скорее всего сохранят хотя бы контуры.

dmitry_vk Dec 2 2012 at 06:34

А при суммировании цвета пикселя вы учитываете необходимость проведения гамма-коррекции? Так как RGB — это нелинейная шкала, то нельзя просто суммировать значения цвета в RGB: так получится неверный цвет пикселя.

homm Dec 2 2012 at 07:23

Впервые о таком слышу. Можно подробнее?

UFO landed and left these words here

kirias Dec 3 2012 at 06:49

Интенсивность цвета:

(R * 77 + G * 150 + B * 28) >> 8) & 255

Оно?

Mrrl Dec 3 2012 at 11:26

Нет, это

C_srgb = C_linear <= 0.0031308? 12.92*C_linear: (1+a)*C_linear^1/2.4-a; where a=0.055.

The forward transformation

efremovaleksey Dec 2 2012 at 10:47

Вам нужно преобразовать изображения к гамме 1.0, сделать необходимые операции, вернуть исходную гамму.
Будьте осторожны с sRGB и ему подобными системами, там гамма «плавающая», подробнее тут.

tronix286 Dec 2 2012 at 06:44

У меня, как правило, не стояло задачи аккуратно крутить, а стояла задача — быстро крутить. Поэтому юзал всю жизнь что-то типа такого:

// buffer = source buffer RGB565[320x200]
// scn   = target buffer RGB565[320x200]
void FastRotate(float scale, //the scaling factor
                float ang) //the rotation angle
{
    long xscale=sin(ang)*65536L/scale;
    long yscale=cos(ang)*65536L/scale;

    long xc=(screen_dx/2)*65536L - ((screen_dx/2)*yscale+(screen_dy/2)*xscale);
    long yc=(screen_dy/2)*65536L - ((screen_dy/2)*yscale-(screen_dx/2)*xscale);

    WORD far *scn=shadow_buffer;
    for (int y=0;y<screen_dy;y++) //normally from 0 to 199
    {
        long xlong=xc,ylong=yc; //init x/ylong to topleft of square
        for (int x=0;x<screen_dx;) //normally from 0 to 319
        {
            register int tempx=xlong>>16;
            register int tempy=ylong>>16;

            if( (tempx<0) || (tempx>=screen_dx) || (tempy<0) || (tempy>=screen_dy) )
                scn[x++]=0;
            else
		scn[x++]= buffer[tempx+y320[tempy]];
			
            xlong+=yscale;ylong-=xscale;
        }
        scn+=screen_dx; // WARNING
        xc+=xscale;yc+=yscale;
    }
}

Вроде бы брал алгоритм из demo.design.faq, если не ошибаюсь.

zuborg Dec 2 2012 at 07:10

Хороший подход, но теперь Вам ещё предстоит поработать над теорией цвета (и света). Дело в том, что коэффициенты смешения нельзя брать пропорциональными просто площади «осколков». Поясню на примере. Если белый пиксел на черном фоне сдвинуть на 50% в сторону, то результирующие два пиксела не будут содержать цвета (128,128,128) ни (127,127,127) — т.к. количество света, излучаемые парой таких серых пикселов, будет отличаться от количества света, излучаемое одним белым пикселом (из-за гаммы), хотя при прецизионном смещении очевидно, что яркость картинки должна была бы остаться полностью прежней.

Krovosos Dec 2 2012 at 08:07

А почему бы на сделать тест, при котором изображение поворачивается на небольшой угол за один шаг и обратно за два шага и сравнить изображения?

archim Dec 2 2012 at 08:17

Идея интересная.
Покажите, пожалуйста, сравнение результата поворота 365 раз на 1° вашим алгоритмом и фотошопом.
Желательно картинку поконтрастнее.

jerom Dec 2 2012 at 08:47

А почему 365, а не 360?

UFO landed and left these words here

NiGHt_LEshiY Dec 2 2012 at 09:30

360 + 5, чтобы сравнить с поворотом просто на 5.
Предполагаю.

archim Dec 2 2012 at 11:01

360 конечно, это я ошибся.

s0rr0w Dec 2 2012 at 09:29

Попутно отметим, что алгоритм поворота, реализованный в Photoshop, не претерпел за 10 лет каких-либо ощутимых изменений.

Наверное потому, что он является интеллектуальной собственностью компании и запатентован всеми мыслимыми и немыслимыми патентами. :)

Но некоторые изменения все же были внесены. Если я не ошибаюсь, то начиная с Creative Suite, поворот на углы кратные 90 градусам проводятся без потери качества.

MichaelBorisov Dec 2 2012 at 09:35

Ваш алгоритм, автор, эквивалентен следующему. Применим для увеличения разрешения исходного изображения Билинейную интерполяцию и повысим разрешение, скажем, в 100 раз. После этого выполним поворот простым алгоритмом «ближайшего соседа», который для каждого повернутого пикселя в результирующем изображени, имеющем такое же разрешение, как исходное, находит координаты пикселя в обработанном изображении, разрешение которого было многократно увеличено. Так как эти координаты, вообще говоря, будут не совпадать с координатами центров пикселей исходного изображения, а будут ближе к центрам каких-нибудь интерполированных пикселей — то в результирующем изображении и окажутся значения, промежуточные между соседними пикселями исходного изображения.

Неважно, что в реализации это как бы выглядит сложнее, но это позволяет по-другому взглянуть на задачу математически. Теперь можно подумать об использовании других видов интерполяции, кроме билинейной. Например, взять бикубическую интерполяцию, которая используется в настоящее время как один из прецизионных методов изменения разрешения изображения. Или можно провести найквист-интерполяцию исходного изображения. В общем, вариантов очень много, хотя ни один из них не является идеальным.

ltwood Dec 4 2012 at 23:46

Вы не правы. Очевидно, что предложенный алгоритм не содержит в себе (ни явно, ни неявно) билинейной интерполяции. Если говорить о формальном аналоге, то тут используется кусочно постоянная интерполяция исходного изображения, т.е. фактически точечные пикселы заменяются квадратными пикселами конечного размера (что явно написано в статье) и потом производится интегрирование полученной кусочно-постоянной функции-интерполянта по квадратам, соответствующим повернутым пикселам.

MichaelBorisov Dec 6 2012 at 14:26

Это вы не правы. Данный алгоритм содержит билинейную интерполяцию неявно. К ней приводит интегрирование кусочно-постоянной функции. Ведь интеграл от константы является линейной функцией!

Представьте себе ту же ситуацию в одномерном случае. Возьмем таблично заданную функцию y[i] в равноотстоящих точках x[i]: x[i+1]-x[i]=d=const при любом i. Проинтерполируем ее кусочно-постоянно с центрами постоянных кусков, расположенных в x[i]. Получим: y(x)=y[i] при x[i]-d/2<=x<x[i]+d/2.

Возьмем интервал (x1, x2), равный расстоянию между значениями в таблице: x2-x1=d. Это будет аналог повернутых пикселей. Проинтегрируем y(x) на этом интервале. Интеграл разобьется на два слагаемых, так как, в общем случае, в интервал (x1,x2) попадет два соседних интервала, на которых y(x) постоянна. Найдем i такое, что x[i]-d/2 <= x1< x[i]+d/2. Тогда значение интеграла будет равно:
I = y[i]*(x[i]+d/2-x1) + y[i+1]*(x2 — x[i] — d/2)

Если задать интервал координатой его центра x3, так что x1=x3-d/2, x2=x3+d/2 — то интеграл будет равен:

I(x3) = y[i]*(x[i] + d/2 — x3 + d/2) + y[i+1]*(x3 + d/2 — x[i] — d/2)
Упростим выражение:
I(x3) = y[i]*(x[i]+d-x3) + y[i+1]*(x3-x[i])

Но значение этого интеграла есть линейная интерполяция исходной функции, с поправкой лишь на постоянный множитель d. Если I(x3) разделить на d — то получится линейная интерполяция от исходной функции. В этом несложно убедиться, если подставить x3=x[i]. В этом случае второе слагаемое обращается в нуль, и значение интеграла, деленное на d, будет равно y[i], то есть интерполяция проходит через y[i], как и требуется. С другой стороны, если устремить x3 к x[i]+d (сделать равным нельзя, т.к. при этом требуемое значение i изменится) — то в пределе обратится в нуль первое слагаемое, а от второго, деленного на d, останется y[i+1]. То есть интерполяция проходит и через y[i+1]. Значение I является линейной функцией относительно x3. А через две точки (x[i],y[i]) и (x[i+1],y[i+1]) можно провести одну и только одну прямую, поэтому приведенный выше способ приводит к линейной интерполяции.

Все вышесказанное обобщается для двумерного случая и приводит к билинейной интерполяции.

Sardar Dec 2 2012 at 09:57

Человеческий глаз лучше воспринимает разницу в яркости (контраст) чем цвет. Именно поэтому качественные алгоритмы над графикой подгоняются под наше восприятие (предпочтение контрасту, а не цвету), а не математическую точность. Алгоритм в фотошопе дает более качественное изображение на выходе, т.к. не замыливает картинку. Это гораздо сложней, чем вы подумали.

BubaVV Dec 2 2012 at 10:02

Теперь бы к идеальному повороту добавить еще и идеальное повышение резкости

KvanTTT Dec 2 2012 at 10:57

Несмотря на критику метода в комментариях, статья мне понравилась. Побольше бы таких на хабре.

helarqjsc Dec 2 2012 at 13:45

В чем смысл, если картинка выглядит хуже, а потери все равно есть?)

0lympian Dec 2 2012 at 14:57

Неоправданно сложный алгоритм, в плане анализа различных геометрических case'ов наложения.

Намного проще (и с той же точностью) можно было бы сделать так: берем математически воображаемый градиент между центрами каждых соседних пикселей (2-мерный). Таким образом получаем непрерывную функцию по каждой компоненте изображения (r, g, b) = f(x, y), где x, y — любые вещественные. При повороте — соответственно пересчитываем новые значения для центров пикселей (для повернутого растра), и через ранее определенную функцию для каждого получаем цвет.

Это также позволяет, задавая различные варианты этой функции получать разные распределения «воображаемых межпиксельных градиентов» (он ведь не обязательно может быть линейный), и будем получать различный результат (например, как в фотошопе, более резкое изображение).

p.s. При повороте на 0* предложенный алгоритм вернет в точности то же изображение, т.к. центры поподут на «целочисленные» части функции, для которых цвет определен из исходных пикселей.

UFO landed and left these words here

nikita2206 Dec 2 2012 at 20:18

Помоему это жуткие потери.

Mrrl Dec 3 2012 at 11:34

Либо один из скосов пойдет в «косом» направлении, либо изображение придётся масштабировать. Выглядит не очень привлекательно, но, наверное, проще в реализации.

kriokamera Dec 2 2012 at 19:07

при этом создаёт «ореолы» искажённого цвета

У вас исходное изображение крепко шарплено. Возмите фотографию без обработки для примера.

Mrrl Dec 3 2012 at 11:31

Ореолы искаженного цвета будут почти всегда — цвет объекта при поворотах будет смешиваться с цветом фона. Чтобы их избежать, пришлось бы брать пиксель исходного изображения, площадь пересечения которого с нашим максимальна, и использовать его цвет (компоненту H или HS в пространстве HSL или компоненты AB в LAB), а яркость получать усреднением. Но не уверен, выйдет ли из этого что-нибудь хорошее.

Prosolver Dec 3 2012 at 19:32

Благодарю всех за отзывы! Они были действительно ценными и нтересными.
С вашего позволения, отвечу в одном сообщении на ключевое. Материал статьи я готовил месяц, потому и с комментарием задержался.

1. На практике редко возникает потребность в том, чтобы вращать одно и то же изображение много раз. В таких условиях применение любого алгоритма приведёт к накоплению ошибок и усилению искажений. На практике возникает задача повернуть одно изображение один раз. И здесь вполне уместно поставить вопрос, что ценнее: контрастные детали или информация о цвете? Фотошоп даёт ответ — контрастные детали важнее, цветом можно пожертвовать. Предложенный мной алгоритм отвечает на вопрос иначе — цвет важнее, контрастом можно пожертвовать. Я отнюдь не настаиваю на том, что мой алгоритм лучше всех алгоритмов. Он просто предоставляет выбор метода под конкретную задачу.

Вместе с тем, я всё же провёл эксперимент, подобный тому, который предложили Krovosos и archim. В итоге изображение, повёрнутое прецизионным алгоритмом, действительно, получилось более размытым, чем у фотошопа, но и ошибка в цвете у фотошопа получилась большей. Например, по каналу G для изображения тюльпана из теста №2 ошибка после 32 последовательных поворотов на 5° у Фотошопа достигла 0,4%, а у моего алгоритма оказалась на уровне 0,005% т.е. на 2 порядка лучше.
Тут же следует заметить, что размытость изображения — это не приговор. Можно подумать над эффективным алгоритмом шарпизации, специфичными для данного алгоритма поворота. Вопрос не так прост и очевиден, тут действительно есть над чем подумать.

2. Касательно гамма-коррекции я предлагаю провести такой мысленный эксперимент. Представим, что тестовое изображение получено непосредственно с идеальной фотоматрицы. Теперь представим, что мы повернули фотоматрицу на небольшой угол и снова сделали снимок таким образом, чтобы элемент изображения, который снимался одним фотоэлементом фотоматрицы оказался разделённым между двумя фотоэлементами. Совершенно понятно, что в таком случае каждый фотоэлемент получит в 2 раза меньше света, поэтому и в прецизионном алгоритме яркость этого пикселя должна разделиться. С другой стороны, если RGB шкала действительно нелинейная (что для меня новость), коррекцию итогового цвета произвести надо обязательно. Над этим нюансом я тоже обещаю подумать.

Ещё раз всем спасибо за комментарии.

gnomeby Dec 4 2012 at 09:39

>> Представим, что тестовое изображение получено непосредственно с идеальной фотоматрицы.
Вот именно, а теперь вернёмся в реальность и поймём что тестовое изображение получено с фотоматрицы очень далёкой от идеала, где пиксель нередко состоит из элементов RGGB (и это не опечатка). И соответственно признаем что гамма-коррекцию не то чтобы не всегда надо делать, а надо делать вообще всегда.

Prosolver May 29 2013 at 11:06

На досуге переработал и упростил структуру программы. Время расчётов при этом увеличилось примерно в 1,7 раз но память теперь расходуется только на хранение битмапов, что позволяет работать с изображениями любых размеров.
Скачать программу и исходники можно здесь: prosolver.kiev.ua/PreciseRotation2.zip