smile_artem Feb 24 2020 at 15:22

Нужен ли нам такой формат?.. и немного статистики

5 min

3.1K

Research and forecasts in IT*Image processing*Vector graphics*Start-up developmentData compression*

Comments 38

Max8k Feb 24 2020 at 18:10

Пока что проект видится необнадеживающим, по причине имеющихся недостатков и отсутствия существенных преимуществ. Идея, сама по себе интересная, поскольку многие элементы (напр. Градиентный переход) имеют векторную логику, но при этом в иных случаях (напр. Мелкие детали) рациональнее использовать растр.

Но, как уже сказано выше, идею следует дорабатывать.

smile_artem Feb 24 2020 at 18:44

Согласен, дорабатывать надо, подскажите какие бы Вы видели существенные преимущества?

Max8k Feb 24 2020 at 19:20

Думаю, тут стоит определиться с областью применения. Это укажет на необходимость нового формата.

Если идти по пути наименьшего сопротивления (и если я всё верно оценил), то пожалуй, формат может стать очень актуальным для спецефических, но востребованых изображений. Например:

Фотообои с высоким боке/блуром
Однотонные/градиентные фоны
Фоторамки (для печати, открыток и т.д) где более 90% экрана — белый фон
Фото с минимализмом
С многократно однотипно повторяющимися элементами
С ограниченной палитрой (сюда автоматом монохром и рисованные с несколькими цветами)

Практически все вышеназванные примеры на мой взгляд логичнее описать математичесски (вектрно) с небольшими "попраками"растра. "Весить" такие изображения должны существенно меньше, а обрабатываться быстрее.
P.s.
С мобильника не очень удобно искать и вставлять ссылки на картинки (и возможно моя карма хабра этого не позволит), но надеюсь донести мысль удалось))

fougasse Feb 24 2020 at 19:46

Сдаётся мне, что автор будет долго эвристики писать даже для одного варианта.

smile_artem Feb 25 2020 at 13:47

Да, мысль понятна, особенно благодарю за первое предложение, но это не тот случай. Формат больше настроен на формы, чем на градиент и основной областью мне видится растр без потерь, альтернатива PNG (возможно для маленьких изображений) с преимуществом улучшения качества по сравнению с тем же PNG при масштабировании

fougasse Feb 24 2020 at 19:22

Надо определиться или без потерь, или с.
А там уже смотреть.
Мне кажется, что скорость, если без потерь.
И сжатие/качество если с потерями.
Подозреваю, что обогнать стандартные алгоритмы не выйдет в подавляющем большинстве случаев.
Теоретически, вы можете сделать чутьт лучше за счёт каких-либо эвристик в определении тех же градиентов и т.п., но нужно ли оно — большой вопрос, как и то, сможете ли вы это реально сделать га кроме достаточном для коммерческого использования.

smile_artem Feb 25 2020 at 13:54

Без потерь растр — основная миссия, надеюсь с помощью сделать видеокодек

Max8k Feb 25 2020 at 14:01

Не покидает мысль о фрактальном сжатии. Которое, например, уже используется в формате djvu

smile_artem Feb 26 2020 at 11:54

он с потерями(

Griboks Feb 24 2020 at 20:14

Очень интересно, но ничего полезного для своих изображений найти не удалось.
1. Было бы неплохо посмотреть сравнение с Full HD изображениями, реальными, а не зелёный пиксель.
2. Надо бы ещё сравнить с lossy форматами, которые визуально не отличаются (например, средний разброс на пиксель на канал < 10).
3. В чём заключается цель формата? Сжатие, скорость, гибкость, масштабируемость?

Какие техники сжатия вы используете? Цветовое/палитровое усреднение? Вейвлеты, градиенты?

smile_artem Feb 25 2020 at 14:00

Для этого надо переложить алгоритм на нормальный язык и оптимизировать его, пока могу проводить анализ лишь на небольших изображениях
Хорошая идея, подскажите как определить 10 или больше
В основном масштабируемость поворот без гал
Аналог дефлейта и кардинально новое кодирование

Griboks Feb 25 2020 at 14:20

def comapare(original:ndarray,lossed:ndarray,threshold):
  return (original.astype(float)-lossed.astype(float)).abs()/original.size <= threshold

Как-то так)

smile_artem Apr 1 2020 at 09:00

Сравнение с lossy форматами, которые визуально не отличаются (например, средний разброс на пиксель на канал < 10) — готово, анализ добавлен в статью, спасибо за идею

Griboks Apr 1 2020 at 09:29

Спасибо. Неожиданный результат (впрочем, мой критерий тоже весьма неточен, т. к. человеческий глаз различно чувствует каналы).

Жду с нетерпением возможность «пощупать» ваш формат и сравнить его со своей модификацией jpeg. Он у вас открытый, или требуются какие-то программы? Или вы его ещё не опубликовали?

smile_artem Apr 1 2020 at 10:39

А Вы какой результат ожидали?

Пока формат закрыт. Буду думать передать его кому-то, найти инвестора и дорабатывать, сделать сайт для пощупать (без исходного кода) или выложить в открытый доступ

Griboks Apr 1 2020 at 11:11

Я пытался сжать вот такое изображение.

Вот мои результаты с потерями:
Метод >> Размер [Рейтинг]
================
mozjpeg3_scan2q0.jpg >> 7172 [34,6997677147633]
mozjpeg3_scan2q10.jpg >> 43833 [9,30787229938271]
immagick_100kb.jpg >> 90852 [7,37031523276748]
mozjpeg3_scan2q50.jpg >> 176149 [4,72453414351851]
immagick_200kb.jpg >> 198639 [4,83299623842592]
immagick_stripInterlaceplaneQ75Gaussianblur005.jpg >> 275102 [4,76800620498971]
mozjpeg3_scan2msssimq75.jpg >> 278419 [3,72148517875514]
mozjpeg3_scan2q75.jpg >> 316395 [3,5429057355967]
mozjpeg3_defaultsq75.jpg >> 316431 [3,5429057355967]
mozjpeg3_baselineq75.jpg >> 324497 [3,54019257973251]
immagick_stripInterlaceplaneQ75Dctmethodfloat.jpg >> 333342 [3,36465020576131]
immagick_2Q75.jpg >> 334832 [3,37778147505144]
immagick_stripInterlaceplaneQ75.jpg >> 334832 [3,37778147505144]
immagick_stripInterlaceplaneQ75Samplingfactor420.jpg >> 334832 [3,37778147505144]
pingo_sb_sample1_srgb.jpg >> 408000 [1,95785027649176]
pingo_defaults.jpg >> 435437 [1,95785027649176]
mozjpeg3_scan2psnrq75.jpg >> 443252 [1,87784063143004]
mozjpeg3_scan2ssimq75.jpg >> 451224 [1,9114073752572]
mogrify_best.jpg >> 622008 [0,533710615997942]
immagick_stripInterlaceplaneQ100.jpg >> 1113882 [0,548464988425926]
mozjpeg3_scan2q100.jpg >> 1426281 [0,143501961162551]

Эти результаты тоже весьма интересные, т.к. качество 10% даёт рейтинг 9, но качество 10% — это, очевидно, сильно бросается в глаза. Возможно, я ошибся в функции рейтинга (код не сохранился).

p.s.
Проверял и другие форматы (всевозможные архиваторы, bpg, flif, jp2, png, webp, xz, zst), но они проиграли эту гонку.

smile_artem Apr 2 2020 at 04:15

Рейтинг здесь — это погрешность на пиксель на канал?

Griboks Apr 2 2020 at 06:52

Да. Как видите, у качества 0% (размытая картинка) точность изображения +-35 по модулю 256 на пиксель на канал. Если оценивать «на глаз», то рейтинг должен быть примерно меньше 4.
А у вас рейтинг < 10 только без потери качества? Что-то здесь не так… Возможно, вам стоит попробовать сжать моё изображение?

smile_artem Apr 2 2020 at 08:36

Дело в том, что я подбирал шаблоны для того, чтобы ни одно изображение, сжатое им не выходило > +-10 + у Вас размер изображения большой (ваше изображение без инвестора не смогу сжать — пока только маленькие), а у меня маленькие. Чем больше изображение, тем строже должен быть критерий. И нет не только без потери, но и JPG 80% 4:2:2

Попробуйте взять группу изображений и чтобы ни одно из них не выходило за рамки +-4 (так как изображения большие) в одном шаблоне сжатия. Интересно будет посмотреть, что у Вас выйдет.

Griboks Apr 3 2020 at 15:08

Вот что у меня получилось на 100 файлах с помощью pingo, которое даёт рейтинг ~2.
46 271 812 байт -> 33 247 962 байт

smile_artem Apr 3 2020 at 16:11

первая цифра — это оригинал в JPG? второе тоже в JPG? или как?

Griboks Apr 3 2020 at 16:30

Да, это суммарный вес 100 файлов jpg до и после обработки. Получается, было 0,544 бит/пиксель/канал, а стало 0,424 бит/пиксель/канал.
А если взять ваше яйцо с 961 точек, получается 0,014 VPR и 0,034 JPG. Разница на порядок.

smile_artem May 17 2020 at 06:58

Дело в размере, чем больше и сложнее картинка тем больше нужно бит на пиксель

smile_artem Aug 7 2022 at 06:12

Небольшое описание формата выложил здесь: https://boosty.to/macreative/posts/6187937f-e4b1-48f8-ad4c-a9aa2938b7d1?share=success_publish_link

smile_artem Jun 6 2024 at 17:26

Вообщем, суть была найти фигуры (прямоугольник, треугольник, линия, пиксель), покрывающие наибольшую площадь в каждом изображении с разрядом (8битное цветное - это 24 разрядное, то есть 24 монохромных), где все пиксели обращаются в 0 или 1 (смотря что в итоге выходит меньше по размеру - координаты фигур), потом фигуры сортируются по количеству углов, потом в каждой группе фигуры сортируются по координатам (по очереди - в итоге мы знаем, что следующая фигура имеет последнюю координату больше, чем предыдущая, или такую же, но тогда для следующей координаты то же самое), таким образом можно писать не сами координаты, а их разницы, что снижает размер, и потом пройтись дефлейтом

smile_artem Jun 6 2024 at 17:37

Конкретнее та версия, что в статье:

VRP...

Он основан на пяти примитивах - точка, ровная горизонтальная, ровная вертикальная, произвольная прямая линия, треугольник. Происходит поиск набора таких примитивов, чтобы их количество было минимальным и чтобы они перекрывали всю чёрную/белую область однобитного слоя изображения. Далее они сортируются таким образом, чтобы их описание (координаты, размеры) были минимальными (то есть, если мы уже описали все горизонтальные линии выше опрелелённой ординаты, нет смысла использовать полный набор возможных ординат для дальнейшего описания). После этого получившееся описание сжимается (арифметическим кодированием или LZ-77/78), в зависимости что лучше в конкретном случае

smile_artem Aug 7 2022 at 06:12

Небольшое описание формата выложил здесь: https://boosty.to/macreative/posts/6187937f-e4b1-48f8-ad4c-a9aa2938b7d1?share=success_publish_link

Deosis Feb 25 2020 at 04:28

Монетизировать формат практически нереально. Никто не согласится покупать фотоаппарат, если фотографии можно будет просматривать только на нем, либо доплачивать за отдельную программу.
Это имеет право на жизнь, только если формат будет на порядок лучше существующих.

smile_artem Feb 25 2020 at 14:06

Да, на порядок лучше сразу вряд ли, что посоветуете? Забыть? Выложить в открытый доступ и надеяться, что кто-то будет им заниматься?

smile_artem Feb 27 2020 at 16:32

А если просто например в фотоаппарате будет такая опция сохранять фото в VRP, просматривать в бесплатной программе(программах) с преимуществами формата, конвертировать в ней без потерь в любой другой формат, а также с потерями, оставляя исходник на всякий случай, который не занимает много места?

YuriiSig Feb 26 2020 at 11:54

У Вас реализован алгоритм сжатия бинарных изображений без потерь?

smile_artem Feb 26 2020 at 11:56

Любых растровых (пока до 8 бит на канал) без потерь реализован (на 5-ом слайде 4,5 строчки)

YuriiSig Feb 26 2020 at 19:28

Я имел в виду битовое изображение — бинарное изображение, для представления и хранения которого в цифровом виде используется битовая карта, где на каждый элемент изображения (пиксель) отводится 1 бит информации.
Существует алгоритм сжатия без потерь (см. Six-page legal document: www.cartesianinc.com/Tech/samples.html), который сжимает изображение более чем в 600 раз. Какой эффект для данного случая от Вашего алгоритма?

smile_artem Feb 27 2020 at 14:06

Я понимаю, в скором времени представлю анализ, спасибо за образцы изображений (жаль что их придётся уменьшить в габаритах, думаю пока 150х150 только потяну), 600 раз в редких случаях там, в среднем 100 раз

smile_artem Jun 6 2024 at 17:45

В Википедии написано он с потерями

borisxm Mar 2 2020 at 07:54

А почему с webp не сравнили?

smile_artem Mar 11 2020 at 15:00

скоро сравнение с форматами, поддерживающими сжатие с потерями

smile_artem Apr 1 2020 at 09:01

Сравнение с webp и другими готово, анализ добавлен в статью