GMM Jan 7 2009 at 12:53

Делаем Liquid Resize своими руками

12 min

16K

Algorithms*

+223

125

Comments 125

zepps Jan 7 2009 at 12:55

Чем-то напомнило фрактальное масштабирование.

emostar Jan 7 2009 at 13:11

оу… как все сложно… но я сначала подумал… можно просто некоторые части изображения растянуть по горизонтали (там где нет НЛО или лошади)… и будет примерно то самое

GMM Jan 7 2009 at 13:20

Этот алгоритм практически так и делает, даже чуть больше. Он сам «ищет» участки, которые можно растянуть. Кроме того он может растягивать не только строго вертикальные участки. Например картинку со звездным небом таким способом, как описали вы, уже не растянуть.

А насчет сложности — может оно не так и сложно, просто я постарался детально описать, чтобы меньше вопросов оставалость после прочтения.

Alaunquirie Jan 8 2009 at 00:46

Узнаю старый добрый Хабрахабр… (скупая мужская слеза)

Baks Jan 7 2009 at 20:04

Тут работает золотое правило программиста: Лучше день потерять, а потом за 5 минут долететь.
Ручками можно сделать всё… вообще говоря, большие числа можно и без калькулятора делить… столбиком на бумажке…
но куда элегантней реализовать это в алгоритме.
:)

UFO landed and left these words here

collapse Jan 7 2009 at 13:24

Класс! Пойду попробую на чем нибудь реализовать! Спасибо!

UFO landed and left these words here

TWINc Jan 7 2009 at 13:32

Побежал реализовывать на питоне

GMM Jan 7 2009 at 13:42

Боюся, что на Питоне будет большая проблема с быстродействием. Лучше реализовать самые «тяжелые» операции на С/С++ и сделать интерфейс к Питону.

Dale Jan 7 2009 at 17:33

Ну если человеку не для производства надо, то почему бы и не реализовать. Интересно ведь :)

TWINc Jan 7 2009 at 18:40

я изучаю питон. все же приятней написать такой алгоритм, а не какий нибудь обсчет октарного дерева :)

Dale Jan 7 2009 at 19:56

Октарное дерево тоже неплохо сделать, если есть интересное применение. Например, когда игрушку пишешь на чистом D3D или OpenGL…

TWINc Jan 7 2009 at 20:07

Ага, OpenGL. Я давным давно тетрарным деревом обрезал невидимые части ландшафта.

Dale Jan 7 2009 at 20:10

Знакомо :)

prokoudine Jan 8 2009 at 21:18

Всё уже придумано :)

blog.eikke.com/index.php/ikke/2007/09/02/seam_carving_content_aware_image_resizin

ilya_ost Jan 7 2009 at 13:32

Классная статья. У меня дурацкий вопрос: нафига на два делить, а потом отбрасывать дробную часть, если важно распределение значений?

GMM Jan 7 2009 at 13:39

Дело в том, что там делится не всегда на 2, а на количество посчитаных соседей. Для большинства пикселей мы считаем по два соседа, но для крайних может быть и меньше.

Tishka17 Jan 7 2009 at 13:46

а почему два соседа используется? Почему не все 4?

GMM Jan 7 2009 at 13:57

Можно использовать и все 4 соседа, и даже все 8 :)
Но мне кажется, что 4 соседа мало чего поменяют, поскольку суммы с верхним и левим соседом учитываются когда мы считаем их энергии.

Хотя да, если считать 4 соседа, то ничего плохого не будет :)

akho Jan 7 2009 at 19:25

Ну как мало чего поменяют — минимальные цепочки иногда другие будут. А что визуально лучше — надо смотреть, зависит от картинки скорее всего.

Вообще производную можно оценивать по-разному. Возможно, для большинства картинок это лучше делать по большей окрестности точки; хотя черт его знает.

GMM Jan 7 2009 at 19:41

Не буду с вами спорить, поскольку согласен с вами, некоторые изменения действительно будут.

А еще лучше, как подсказал Toshas, использовать оператор Sobel: en.wikipedia.org/wiki/Sobel_operator (англ).

Но в статье я использовал только два соседа, чтобы излишне не усложнять, так как двух соседей хватает для приемлемого качества.

ilya_ost Jan 7 2009 at 13:51

Понял, спасибо.

CAH4A Jan 7 2009 at 13:32

НЛО прилетело и растянуло этот рисунок здесь!

pixxxel Jan 7 2009 at 13:32

уже знаю где применю это )

pavlick Jan 7 2009 at 13:37

как-то давно это предполагалось использовать в инете на резиновых сайтах. ну чтобы это поддерживалось браузерами

pixxxel Jan 7 2009 at 13:33

Кстати, на последних двух снимках — львов?

GMM Jan 7 2009 at 13:40

Да, Львов.

a2v Jan 7 2009 at 13:42

тоже хотел задать этот вопрос (=

pavlick Jan 7 2009 at 13:38

а как насчет двунаправленного растягивания?

Tishka17 Jan 7 2009 at 13:46

растянуть прогой, повернуть, ещё раз применить прогу (-;

pavlick Jan 7 2009 at 13:48

ну это напрашивается само собой ) интересно посмотреть на результат )

GMM Jan 7 2009 at 13:52

Я не хотел про него писать, потому что статья и так достаточно большая вышла. Если вкратце, то есть 2 способа двунаправленого растягивания:
1. Растянуть до нужного размера обычным растягиванием, сохранив пропорции, а потом применить этот способ.
2. Растягивать точно также, как и в случае одного направления, только одновременно искать как вертикальные, так и горизонтальные цепочки, и выбирать среди них постоянно минимум. Единственное замечание — если картинка не квадратная, то надо будет эти значения как-то нормализировать, например помножив суммы по горизонталных цепочках на высоту, а по вертикальных — на ширину.

Если владеете английским, то можете про это почитать тут: PDF от авторов

pavlick Jan 7 2009 at 14:09

вот как раз второй способ инетересен. Или же искать и выкидывать одновременно, или же по очереди. Но тогда имеет ли значение порядок (гориз/верт)? Если же одновременно искать, то как быть если по вертикали и горизонтали разное количество выкидывать надо?

GMM Jan 7 2009 at 14:18

Не совсем понял, что имеется ввиду по «одновременно, или же по очереди».

Порядок выкидывания имеет значение, поэтому надо делать по такому алгоритму:
1. Вычисляем какую цепочку лучше удалить — вертикальную или горизонтальную.
2. Удаляем.
3. Пока не урезали картинку до нужного размера — к пункту 1.

UFO landed and left these words here

Gbp Jan 7 2009 at 13:50

хабрачую

kaaquantum Jan 7 2009 at 13:47

Инвайта автору статьи!

homm Jan 7 2009 at 14:02

Ну, почти получилось…
stratero.ru/homm/SeamCarving.jpg

l2k Jan 7 2009 at 14:03

GMM Jan 7 2009 at 14:09

:)

Для таких случаев использование алгоритма комбинируется с ручной расстановкой зон, которые нельзя трогать. Похожый эффект бывает, если растягивать фотографию человека в лесу. Тогда алгоритм считает человека второстепенным объектом и тоже растягивает его.

UFO landed and left these words here

Popik Jan 7 2009 at 17:33

Индусу повезло меньше ipicture.ru/uploads/090107/QS61UIA3uh.jpg ))

l2k Jan 7 2009 at 14:02

Отличная статья и результат!
Спасибо большое!

tuxed Jan 7 2009 at 14:04

Мегастатья, спасибо, очень интересно!

Meshok Jan 7 2009 at 14:06

У меня на аукцион народ фотки лотов загружает всевозможных форматов (соотношений сторон).

Может попробовать этим алгоритмом их приводить к стандарту для более стройного дизайна страницы — имеются в виду превьюшки маленькие, конечно.

dadgo Jan 7 2009 at 14:37

только тогда надо дать возможность менять пользователям алгоритмы, ибо иногда этот может давать ошибочные результаты, как было видо из комментариев выше.

Meshok Jan 7 2009 at 14:44

Да.
Было бы неплохо еще как то автоматически понимать. Пригодна ли данная фотография для этого метода или нет.

peterdemin Jan 7 2009 at 14:59

да

peterdemin Jan 7 2009 at 14:59

нет

markshevchenko Jan 7 2009 at 14:07

Очень интересный и качественный материал. Автору респект.

По поводу увеличения картинок, думаю, можно попробовать так. Взять N цепочек с минимальной энергией. У каждой из них есть «вес», то есть сумма энергий всех пикселей, из которых они состоят.

Чем меньше вес, тем чаще должна повторяться цепочка. Скажем, если N = 2 и веса цепочек равны W1 = 20, W2 = 40, то цепочка W1 должна повторяться в 2 раза чаще, чем W2.

Скорее всего, N придётся выбирать в зависимости от того, насколько широко нужно растянуть картинку: чем шире, тем больше N потребуется. Думаю, нужно провести эксперименты и посмотреть, почти наверняка там линейная зависимость (если надо увеличить в 2 раза, достаточно 2-х цепочек, если в 3, то трёх и т.д.)

pixxxel Jan 7 2009 at 14:20

В этом нет смысла, цепочка и так будет посторяться несколько раз, пока не найдется более дешевая цепочка

pixxxel Jan 7 2009 at 14:21

*повторяться

pixxxel Jan 7 2009 at 14:26

Нужно просто новой цепочке добавлять немного бонусной энергии

markshevchenko Jan 7 2009 at 15:22

Старой при этом тоже надо добавлять, иначе она так и останется минимальной.

Ну и возникает тот же самый вопрос: а здесь в счём смысл? С N минимальными цепочками всё совершенно понятно, что и для чего делается.

pixxxel Jan 7 2009 at 17:05

Да, старой тоже конечно надо добавить.
Смысл в том, что, одна и та же цепочка может разрастаться в случае остутствия достойных альтернатив. А в вашем случае вы принудительно режете картинку даже если остальные цепочки в 100 раз дороже чем дешевая первая
Например если на картинке есть однородный кусок фона, мой вариант будет только его растягивать, а ваш — растянет несколько раз и пойдет рвать основную картинку. Если же картинка полностью сложная, например лес, то наши результаты будут схожими, я думаю

markshevchenko Jan 7 2009 at 17:25

Нет. Если веса различаются значительно (например, в 100 раз) то при добавлении 101-ой новой вертикальной цепочки, цепочка с меньшим весом будет вставлена 100 раз, а следующая за ней по весу — 1. Если же добавить нужно будет меньше цепочек, то цепочка с меньшим весом просто не будет вставлена ни разу.

pixxxel Jan 7 2009 at 17:08

А вообще надо экспериментировать конечно, я ведь просто предложио попробовать. Кстати, когда я работал в институте кибернетики, очень похожим методом распознавали горизонт :) Тоже искали пути с минимальной «энергией» от левого края картинки до правого, только энергия немного по-другому вычислялась

markshevchenko Jan 7 2009 at 19:28

> А вообще надо экспериментировать конечно, я ведь просто предложио
> попробовать.

На мой взгляд, предложить попробовать, это одно, а вот это:

> В этом нет смысла

больше похоже на другое.

markshevchenko Jan 7 2009 at 15:20

А откуда возьмётся более дешёвая цепочка?

pixxxel Jan 7 2009 at 16:58

Возьмется не более дешевая, а проведенная только что станет чуть дороже, чем какая-то другая, которая до этого была на 2-м месте по цене

markshevchenko Jan 7 2009 at 17:25

Вот в Вашем варианте как раз веса и не учитываются.

pixxxel Jan 7 2009 at 14:08

Онлайн ресайз
rsizr.com/

watabou Jan 7 2009 at 18:51

Ага, на флэше и уже года 2 назад

UFO landed and left these words here

pixxxel Jan 7 2009 at 14:30

На счет увеличения картинки — чтобы не раслягивалась одна и та же цепочка, попробуйте каждой новой вставленной цепочке искуственно повышать энергию (немножко), тогда алгоритм сам собой будет находить альтернативные цепочки, или тянуть одну, пока она не станет дороже какой-то другой альтернативы.

Kotter Jan 7 2009 at 14:34

Как автор статьи, благодарю всех за комменты и плюсы. Теперь я один из вас.

l2k Jan 7 2009 at 14:46

Спасибо, пишите ещё!

Yanis Jan 7 2009 at 14:58

При запуске бинарника:

---------------------------

SeamCarving.exe - Ошибка приложения

---------------------------

Ошибка при инициализации приложения (0xc0000135). Для выхода из приложения нажмите кнопку "ОК". 

---------------------------

ОК 

---------------------------

Yanis Jan 7 2009 at 14:59

Наверное потому, что у меня VS не установлена…

Kotter Jan 7 2009 at 15:05

Программа написана на Visual C# 2008 Express.
Для запуска надо .NET Framework, правда не знаю, какой версии, наверное 3.5.

Yanis Jan 7 2009 at 18:26

Спасибо. Ноутбук чужой, я не знал, что здесь нет НЕТ Фреймфорка. Установил и всё заработало.

jawbreaker Jan 7 2009 at 15:15

Спасибо за полезную статью! Узнал много интересного, пишите ещё!

Toshas Jan 7 2009 at 15:23

Автор молодец, изложил все доступно и понятно. Кстати, для вычисления производных изображения чаще применяют оператор Sobel.

Kotter Jan 7 2009 at 15:30

Да, наверное для реальных приложений лучше использовать оператор Sobel или Scharr. Я просто хотел максимально упростить статью, чтоб сконцентрироваться именно на самом Seam Carving.

sgzmd Jan 7 2009 at 15:32

Пока на Хабре есть такие статьи и такие авторы, все крики «Хабр стал не тот» предлагаю отправлять в /dev/null. Спасибо!

sgzmd Jan 7 2009 at 15:34

О. Щас пойду плюсану оригинального автора, так как достойны явно оба.

yAnTar_yAnTar Jan 7 2009 at 15:47

Интересная статья, понравилась, жаль что я не могу вам плюсик поставить :(

acy Jan 7 2009 at 15:48

Ты мне шкаф скукожил, демон!

From bugatak.ru/shared/i.jpg
To bugatak.ru/shared/i-resized.jpg

С другой стороны, я как-то по солидней стал.

borka66 Jan 7 2009 at 15:53

Очень нужная вещь. Только сегодня искал что-то подобное и тут бац. Спасибо! У меня есть теперь новые обои.

hellraiser09 Jan 7 2009 at 16:30

нечестно давать ссылку на ресурс требующий инвайта

pixxxel Jan 7 2009 at 17:15

дай инвайт на лепру

homm Jan 7 2009 at 17:41

Ваш хостинг картинок просит логин/пароль.

etc Jan 7 2009 at 16:13

Жаль не могу поставить +, автору просто нереальный респект. Очень умная статья :)

pluser Jan 7 2009 at 16:38

Ценная информация.
Спасибо.

wazd Jan 7 2009 at 16:43

Вот за что надо ноутбуки давать, а не за херню в притчах.

Nurked Jan 7 2009 at 16:50

шикарно. Алгоритм рулит

GMM Jan 7 2009 at 16:59

Могу также предложить свою модификацию программы. Она отличается тем что можна мастшабировать изображение обычным методом и паралельно посмотреть результат обработаным алгоритмом Seam Carving.

DuMMeR Jan 8 2009 at 00:38

Ааа! Демон, ты мне брата скукожил.
Было: Hosted on free image hosting Xmages.net

Стало:

Manowar Jan 8 2009 at 09:57

Нда, лучшей иллюстрации к слову «скукожить» мне еще не попадалось

alisey Jan 7 2009 at 17:48

Вот эту часть не понял: надо увеличивать изображение поэтапно, так, чтобы на каждом этапе охватывалось как можно больше «не важных» частей изображения, и как можно меньше «важных»

Kotter Jan 7 2009 at 18:03

Если увеличивать изображение сразу 100%->200%, то получится такой результат, как показано на рисунке: ipicture.ru/uploads/090107/32689/wMr4XEkBZ6.jpg.

При поэтапном увеличении изображение надо сначала увеличить, например, так: 100%->150%, а потом результат увеличить снова: 150%->200%. Тогда получиться результат, как тут: s1.ipicture.ru/uploads/090107/32689/Tjib6T1n3R.jpg.

alisey Jan 7 2009 at 22:30

Что происходит на каждом этапе? Пути с наименьшим энергетическим уровнем тупо клонируются по горизонтали? Мне кажется что не так, потому что тогда на следующем проходе мы найдём те же линии и клонируем их снова. В результате образуются заметные размазывания.

Kotter Jan 7 2009 at 22:39

Да, вы совершенно верно заметили, что каждый раз будут копироваться одни и те же линии, что и показано на рисунке ipicture.ru/uploads/090107/32689/Uiu6uRSUTT.jpg.

А чтоб так не происходило, мы выбираем не одну минимальную цепочку, а столько, сколько надо для увеличения. Например если мы увеличиваем от 100px до 120px, то выбираем 20 цепочек с минимальной энергией, и их копируем (точнее даже не копируем, а смешиваем их с соседями — смотрите реализацию функции PartialEnlarge в исходниках, хотя можно и просто копировать, но результат чуть хуже выйдет).

vadim2 Jan 7 2009 at 18:07

Прикольный алгоритм, было — harungo.cn/v.php?id=624a4b051ee2a67399070d5a953b3071, стало — harungo.cn/v.php?id=fdce7725eabe71f00d5a7ba6e7bd3002

DuMMeR Jan 8 2009 at 00:21

ага. Тело толстеет, а лицо остается прежним. Весело.

Error_403_Forbidden Jan 7 2009 at 18:41

Спасибо огромное! Давно интересовала реализация этой идеи

LDEV Jan 7 2009 at 18:49

Проделана отличная работа. Теперь-то мы знаем, как насолить Яндексу с его дубликатами картинок ;)

bagyr Jan 7 2009 at 19:31

Все здорово, прямо-таки чудесно, только одно замечание: желательно вынести в отдельный раздел как можно более все использованные источники, ибо часто это сильно повышает суммарную полезность любой публикации.
Вопрос по делу: почему бы не перейти в пространство HSI и во всех расчетах учитывать только канал яркость (I)?

Kotter Jan 7 2009 at 19:48

> почему бы не перейти в пространство HSI и во всех расчетах учитывать только канал яркость (I)
В принципе так сделать можно, но качество, думаю, тогда ухудшиться, поскольку мы не будем использовать информацию про цвет: если в изображении встретиться переход, например, с зеленого на синий с одинаковыми значениями яркости, то алгоритм посчитает, как будто там нет перехода.

Если у нас есть информация про цвет, то лучше ее использовать.

bagyr Jan 7 2009 at 21:45

Недавно вплотную занимался как раз численной оценкой структурных искажений в изображениях, так что могу сказать уверенно: цвет как таковой особой инфрмативной составляющей не несет, а держать в памяти и тем более обрабатывать три цветовых слоя вместо одного уместно далеко не всегда.

Kotter Jan 7 2009 at 22:01

Вполне возможно, я этим вопросом детально не занимался.

Но что касается данного алгоритма (в частности моей реализации) — то использование только яркости, вместо RGB ощутимого преимущества в скорости и памяти не даст, поскольку почти все вычисления производятся над вспомагательными матрицами, а оригинал изображения используеться только для вычисления энергий вначале работы алгоритма и формировании конечного изображения, а это не самые ресурсоемкие операции.

Поэтому если изображение уже находится в HSI, тогда есть смысл использовать только яркость, а если оно в RGB, то смысла в конвертации почти нет, хотя это еще зависит и от задачи, нельзя дать универсальный рецепт на все случаи жизни.

gabriell Jan 7 2009 at 20:02

Огромное спасибо! Одна из самых познавательных и качественных статей Хабры за последние месяца 2.

Kogol Jan 7 2009 at 20:49

Спасибо за статью. А где в фотошопе такая фича?

Kotter Jan 7 2009 at 20:55

Не могу сказать точно, где оно, потому что последний фотошоп, который я видел был 7.0, а фича появилась только в CS4, но можете посмотреть на этом видео: www.youtube.com/watch?v=019mu8FTy6M. Там показано, как пользоваться фичей.

Kogol Jan 7 2009 at 21:16

Спасибо, просто потрясающе!

Kotter Jan 7 2009 at 20:56

Или поищите по ключевым словам «Photoshop CS4 Content Aware Scaling»

moscow_beast Jan 8 2009 at 11:34

Спасибо! Я создал себе помощника.

yoyurec Jan 8 2009 at 12:47

Очень интересная статья, спасибо!!! Автору респект!

foxweb Jan 8 2009 at 19:37

Отличная тема! Вот за такие вещи надо повышать карму :) От себя добавлю, что узнал об этом алгоритме около года назад, когда искал плагины к GIMP. Так вот подобный плагин я нашёл (он кажется так и называется liquid resize), а скомпилировать его не получилось. Сейчас вроде бы этот плагин в репозиториях мандривы и убунту встречался…

Если у кого есть какой-либо опыт использования плагина — напишите обзор или хотя бы пару строк и скрины. Будет очень интересно.

foxweb Jan 8 2009 at 19:38

А сам алгоритм — благодатная почва для различных курсовых и дипломных работ по профилю.

prokoudine Jan 8 2009 at 21:15

Liquid Rescale всё-таки :)

klyavin Jan 8 2009 at 21:10

Познавательно! Спасибо! Интересно читать про основы алгоритмов, которые лежат в основе утилит, реально помогающих в обработке данных.

prokoudine Jan 8 2009 at 21:23

Автору спасибо, но вообще-то свободных реализаций алгоритма уже есть с полдюжины — от наиболее популярного Liquid Rescale для гимпа и написанной его же автором библиотекой liblqr, попутно используемой в ImageMagick до менее известной SeamCarvingGUI или упомянутых выше экзерсисов с петоном. Было бы неплохо упомянуть для очистки совести хотя бы :)

Kotter Jan 8 2009 at 21:37

Суть статьи была не в написании очередной утилиты по SeamCarving, а в описании самого алгоритма, поэтому я и не стал делать обзор готовых решений. А тот, кому надо будеть использовать подобную утилиту для работы, сможет все, что его интересует, найти в гугле. Кстати, в конце статьи я упомянул извесные на тот момент мне реализации — фотошоп и rsizr.com.

GMM Jan 9 2009 at 14:38

(конечно есть еще Photoshop и rsizr.com/, но в этих случаях у вас нет исходников);

Если же вы об этом, то я додал ссылки на свободные реализации алгоритма.

prokoudine Jan 14 2009 at 22:45

Да, я именно об этом :) Спасибо :)

snch Jan 9 2009 at 15:52

написано великолепно, даже я — нуб нубом — с удовольствием и интересом прочитал

xintrea Jan 9 2009 at 16:24

Статья написана хорошо и понятно. Пишите еще.

SaveTheRbtz Jan 11 2009 at 03:46

Небольшой совет автору:
Когда выкладываете изображения для сравнения качества, формат png24 использовать предпочтительнее, чем jpeg

stas_agarkov Aug 20 2009 at 20:43

блять, где рисунки, автор!?

GMM Aug 20 2009 at 20:59

Уже на месте. Если все же не видно, статью можно также прочитать в Хабрадайджесте

wersoo Mar 25 2010 at 13:49

Перезалейте изображения если они еще остались, пожалуйста.

GMM Mar 25 2010 at 22:05

Да, изображения ушли вместе с ipicture. Можете прочитать статью полностью с рисунками тут

KvanTTT Aug 19 2013 at 10:51

Ни бинарики, ни исходники уже не скачать. Не могли бы вы их перезалить на гитхаб или еще куда-нибудь «навсегда».

И еще:

Хочу обратить внимание, что операция уменьшения изображения на n пикселей и операция уменьшения изображения на 1 пиксел n раз не являются эквивалентными. Их отличие в том, что если мы уменьшаем на 1 пиксел n раз, то мы для каждой из промежуточных изображений ищем энергию пикселей, а если сразу уменьшаем на n, то энергии пикселей мы берем из исходного изображения.

А какой результат будет качественней при уменьшении на n пикселей?