mvideo Dec 1 2021 at 09:50

Главное — скорость. Новый графический формат QOI в 20−50 раз быстрее PNG

10 min

9.6K

М.Видео-Эльдорадо corporate blogOpen source*Algorithms*Image processing*Data compression*

+56

Comments 16

tas Dec 1 2021 at 10:18

Новый формат хорош не только тем, что он при среднем сжатии очень быстрый, но и тем, что не связан ни с какими лицензионными соглашениями/ограничениями.

Если не зажмут на этом вопросе, то почему бы и не быть новому формату?

klounader Dec 1 2021 at 19:05

Я - ЗА! А то задолбало уже всё тормозить и требовать новых мощностей каждый год.

johnfound Dec 1 2021 at 10:50

Скорость енкодинга в большинстве случаев не очень важна. Скорость декодинга важнее. А вот здесь уже QOI не настолько быстрее. Хотя, грех жаловаться на 3 раза быстрее. ;)

Ну, короче, я прослежу за QOI.

knstqq Dec 1 2021 at 12:35

> Скорость енкодинга в большинстве случаев не очень важна.

В большинстве случаев не важна, но всегда будут случаи, когда это узкое место. Например, в случае встроенной электроники и ограниченных ресурсов это критично.

Ну и всегда будут случаи, когда скорость копирования картинки незначительно быстрее скорости сжатия - это будет плюсом для проекта, например захват экрана для удалённого рабочего стола с минимальным оверхедом который работает даже на древнем селероне. Или в случае если графического ускорителя нет вообще, а поэтому сжимать картинки на лету - только CPU, который хорошо бы использовать для чего-то более полезного чем перекладывать пиксели.

gudvinr Dec 1 2021 at 16:54

Была же новость уже

ilmarin77 Dec 2 2021 at 02:10

Формат упаковки внутри png - это gzip , если gzip тупо заменить на lz4, можно тоже нехилый прирост скорости получить.

red_andr Dec 21 2021 at 10:06

Или вообще Lizard, он же LZ5.

DeepFakescovery Dec 11 2021 at 13:16

код еще может быть оптимизирован с учетом instruction-level параллелизма.

Еще например vr > -17 && vr < 16 && vg > -17 && vg < 16 &&нужно заменять на & для ускорения

xmikex Dec 21 2021 at 10:21

а точно результат сравнения двух чисел будет содержать единицу в одном и том же месте? true - любое ненулевое значение и результат true && true и true & true в общем случае не совпадает же.

DeepFakescovery Dec 21 2021 at 12:12

результат будет одинаков, но с & быстрее, потому что & - не ветвление, нету jmp в асм.

&& нужен чтобы отсечь дальнейшие проверки,

например obj.is_circle() && obj.get_radius() != 0 в таком случае get_radius не будет вызываться если объект не круг.

С числами лучше использовать & потому что нет множественных ветвлений и branch predictor не задействуется.

Можете сами проверить конечно же производительность.

xmikex Dec 21 2021 at 12:47

я про то, что операция сравнения a>17 или a<17 обязана возвращать идентичные значения в качестве True или же может возвращаться произвольное ненулевое значение?

DeepFakescovery Dec 21 2021 at 13:34

0 или 1

qw1 Dec 21 2021 at 10:47

Такие оптимизации должен делать компилятор. Зависит от архитектуры, и даже от конкретного CPU, что выгоднее. А если && заменить на &, у компилятора уменьшится пространство для маневра.

DeepFakescovery Dec 21 2021 at 12:18

Интересно, одни пишут что С для полного контроля над происходящим, а тут вы утверждаете, что компилятор сам сделает, что ему вздумается. Вы уж определитесь :))

&& - это жесткий уход в jmp, гарантирующий, что следующие проверки не вызовутся. && и & это серьезная разница в том какой код будет вызываться.

См мой коммент https://habr.com/ru/company/mvideo/news/t/592699/comments/#comment_23850159

конечно я допускаю что какой-нибудь навороченный компилятор на базе llvm оптимизаций может и поймет что числовые проверки можно провести без jmp для ускорения (что вряд ли, надо тестить), но библиотека позиционируется как низкоуровневая, а значит пользователи будут компилить на чем угодно для своих ембед-девайсов, так не лучше ли писать сразу оптимизированный код под самый тупой компилятор? =)

qw1 Dec 21 2021 at 17:30

&& — это жесткий уход в jmp, гарантирующий, что следующие проверки не вызовутся. && и & это серьезная разница в том какой код будет вызываться

GCC умеет оптимизировать && в таких проверках диапазонов, как в процитированных выше:
godbolt.org/z/879cT7Pf6

И кстати переход не всегда зло. Предсказанный переход выгоднее, чем 3-4 арифметических инструкции.

DeepFakescovery Dec 21 2021 at 19:11

твой пример не корректен. Компилятор оптимизировал результат функции исходя из данных сравнения.

Проверять надо исполняемый код, который следует после сравнения.

https://godbolt.org/z/cdW5d3fnr

4 проверки - 4 джампа. Если заменить на & то 2 джампа, хотя должен быть 1.

С & и -O0 - 1 джамп.

Предсказанный переход выгоднее, чем 3-4 арифметических инструкции.

нет, арифметика выполняется в любом случае как бы забегая вперед, и предсказанный перхеод позволяет сразу выбрать нужный результат из веток результатов, которые выполнились параллельно. Больше веток - больше нагрузки.