Fil Aug 31 2010 at 15:23

Декодирование JPEG для чайников

9 min

298K

Algorithms * Image processing *

+402

140

Comments 140

vectorg Aug 31 2010 at 15:39

это прекрасно! очень давно искал подобную статью, кратко и понятно.

Fil Aug 31 2010 at 15:42

Спасибо! Значит я не зря старался :)

Colwin Sep 1 2010 at 02:42

Только недавно пытался въехать в спецификацию, со скрипом — и вот тебе готовое, разжёванное решение =) (ну, не совсем, конечно, но с ним намного проще).
Автор — молодец!

UFO landed and left these words here

xspander Aug 31 2010 at 15:49

«Обратное дискретно-косинусное преобразование»
Такое в школе вроде не изучают…

Lifz Aug 31 2010 at 15:49

Ну не в 7 классе, чуть позже. Но все таки стоит!

UFO landed and left these words here

Lifz Aug 31 2010 at 15:56

Далеко не факт, скорее будет куча глупых вопросов.

Colwin Sep 1 2010 at 02:44

Не меньше ) если нет базы, то все эти ценнейшие знания пройдут мимо.
А базу, как показывает практика, нарабатывают только те, кто сам задается целью изучить устройство компа и программирование. А для остальных все это будет мусором, увы )

Coderr Aug 31 2010 at 15:51

не буду утверждать, что так во всех школах, но, приходилось сидеть на уроке информатики в 5 классе, в школе. Детей спрашивают, что такое монитор, они отвечают контакт. Детей спрашивают, что такое интернет — дети отвечают контакт и Мой мир@mail.ru. Детям пытаются объяснить базовые принципы устройства компьютера, то же устройство байта, etc., дети ничего не слушают, им бы быстрее «вконтактик»…
Сейчас образование не на самом высшем уровне, и информатика — не исключение.

UFO landed and left these words here

infi Aug 31 2010 at 18:24

Да, и математику нафиг, у меня же калькулятор.

UFO landed and left these words here

b8c6 Sep 1 2010 at 07:24

Да ладно вам умножение, расплачиваетесь — проверяйте сдачу. И тренировка, и простые алгоритмы будете в голове держать.

Это как отжиматься — вроде само по себе оно не нужно, а не такой развалиной себя чувствуешь.

ostapbender Sep 1 2010 at 07:35

Пластик?

b8c6 Sep 2 2010 at 10:08

На пластике надо проверять особенно :-)

UFO landed and left these words here

b8c6 Sep 2 2010 at 10:20

С другой стороны это даже здорово. Конкуренцию легче составлять, так сказать…

IraRio Aug 31 2010 at 19:31

честно говоря большинство моих преподов арифметические ошибки ошибками не считали, и ничего против калькуляторов не имели.

Colwin Sep 1 2010 at 02:46

Какое упущение с их стороны ) арифметика и ее закономерности — одна из самых интересных областей математики в начальной школе.

P0figist Sep 1 2010 at 07:53

Интересно — понятия слишком субъективное, чтобы судить по нему об опрометчивости преподавателей.
Да и вообще, как по мне, в школе инетесно все, что понятно. А понятно становится когда тебе понятно объясняют. Так что: не могут заинтересовать, пусть хоть не насилуют.

mono2k Aug 31 2010 at 19:44

арифметику.

kurokikaze Sep 1 2010 at 09:01

Как же вы узнаете что именно нажимать на калькуляторе? :)

Beltoev Dec 17 2013 at 11:50

Тоже предпочитаю считатт в уме. Кстати, картинка по теме:

Никто не знает, где про такую методику подробнее можно почитать?

Beltoev Dec 17 2013 at 12:18

Хм, не прикрепилось что-то изображение в предыдущем комментарии.

wapoo Aug 31 2010 at 18:28

Вы хотите сказать, что сейчас школьники понимают, как работает телевизор или микроволновка, и что эти устройства упростились? Если не объяснять основы, как «устройство байта» и прочее, то такая «информатика» даром не нужна.

UFO landed and left these words here

Colwin Sep 1 2010 at 02:50

Нет, почему же ) Например, бизнес-аналитику вовсе не обязательно понимать устройство байта. И отсутствие такого знания вовсе не мешает ему анализировать систему.
И еще — а действительно ли школьнику необходимо знать устройство телевизора? Физику-электронщику надо, программисту, пожалуй, тоже имеет смысл, а вот школьнику… не факт )

grimskin Sep 1 2010 at 11:10

ну почему же. в случае с ЭЛТ-шками телевизоры являлись хорошим примером применения ряда физических законов на практике.

MAXH0 Aug 31 2010 at 16:20

Меня один 9 класник доставал этим вопросом. Дам пусть грызет.
Респект автору. И забавное совпадение — с момента вопроса школьника прошло меньше недели.

Fil Aug 31 2010 at 16:23

Доставал именно структурой jpeg?

MAXH0 Sep 1 2010 at 08:52

Да! BMP он освоил :) Кстати, хотел писать свой архиватор… Дам ему дискретку, пусть пишет.
Бредовый школьник — толи изобретатель очередной болгенос, то ли гений необструганный. Все начинает, все бросает на пол дороги. Писал игру на паскале — бросил, за 3 урока освоил Блендер отрубил мартышке ухо нарисованным мечем — забросил. Скачал игровой движок — строит свой CS.

Это АД для учителя… Я за ним не успеваю. Программа ему не интересна.
Если получится вывезу его осенью на конференцию в Москву, может чуть мозга прибавит. А то быть самым умным на деревне — черевато манией величия.

mezastel Sep 1 2010 at 14:03

Плоховато вы к ученикам относитесь. Быть самым умным на деревне, при наличии хорошего стимула и поддержки, означает быть самым успешным в жизни.

MAXH0 Sep 3 2010 at 06:55

1. Я к нему плохо не отношусь. Иначе бы им не занимался, а гнал бы программу.
2. Я плохо отношусь к его привычке — снимать сливки и не лезь в глубь. Что-то нужно освоить, а не только по верхам бегать.
3. Его последняя фраза — «я за 3 дня освоил HTML». Я ее уже где то слышал. Поэтому поручил ему сделать поиск в Интернет по фразе Болгенос и сформулировать мнение.
Как то так.

UFO landed and left these words here

shogunkub Aug 31 2010 at 17:12

В BMP «по дефолту» нет сжатия вообще, легко проверяется по размеру — размер BMP точно равен (ширина*высота*BPP картинки)+заголовок. Поддержка RLE есть, но не знаю, насколько это актуально для простых графических редакторов. Возможно в более новых вариантах BMP есть что-то более продвинутое, чем RLE.

UFO landed and left these words here

shogunkub Aug 31 2010 at 19:55

>да есть там RLE, и все всегда его умели, не спорьте :)
Может и умели, достоверно всего не знаю. По стандарту он есть, так что спорить не буду, естессна :)
У TIFF тоже куча вариантов сжатия, да ещё и слои и прочая лабуда, слишком он навороченный. А вот PCX — это да, штука подходящая.

NickyX3 Sep 1 2010 at 06:43

У первых спецификаций TIFF было только LZW (во времена Aldus, от которой все досталось Adobe), а так же тег NewSubfileType давал делать только «страницы» внутри TIFF, хранение слоев приделала уже Adobe, им проще — они владельцы спецификации, могут расширять теги как угодно.

Такой же формат (за исключением хидера и в точном соответствии с первоначальными спецификациями и без сжатия) используется в формате Scitex CT

bombardier Nov 18 2021 at 13:31

Хотите формат ещё интереснее - поглядите на древний эппловский PICT, который в одном контейнере содержал и вектор и растр и текстовые объекты и черт знает что ещё, причём как последовательность команд.

shogunkub Aug 31 2010 at 17:14

Википедия говорит, что есть как минимум JPEG и PNG(Deflate), по крайней мере у biCompression есть значения для этих алгоритмов.

tyomitch Aug 31 2010 at 17:20

Значения есть, но Windows такие файлы не поддерживает, я проверял.
Может быть, их какой-то редкий особый софт поддерживает.

UFO landed and left these words here

Colwin Sep 1 2010 at 02:53

Вселенная не терпит вопросов вообще ) Она просто дает ответы на те из них, на которые сочтет нужным ответить )

Kuper Aug 31 2010 at 15:45

Интересненько…

biseptol Aug 31 2010 at 15:48

Классная статья (я кстати, дочитал «до этого места», где мой пирожок). Правда непонятно зачем это все — для jpeg'а есть уже миллиард разных библиотек разной степени велосипедности. :-)

Fil Aug 31 2010 at 15:50

Как зачем? Интересно же самому поковыряться :)

AlexTikhonov Aug 31 2010 at 21:41

Не поймите неправильно, но все-таки интересно — неужели чисто и только академический интерес? Без практического применения и/или использования в качестве работы в университет или подобного.

Просто работа действительно не шуточная, особенно если в конце концов получился работающий декодер, и добиться не просто понимания как оно работает, а имплементации…

Кроме уважения к проделанной работе у меня все-таки просыпается легкое недоумение (и кажется не только у меня).

beeruser Sep 1 2010 at 00:02

Потому что это базовые знания.
Кто хочет развиваться — ищет то, чего не знает. А кто не хочет — сидит в болоте, расчитывая на чужие знания.
Реально раздражают люди, которые спрашивают — «а зачем ты это сделал», да «за тебя это уже сделали» и т.п.
Лучше сидеть вКонтакте и пересмотреть все тупые сериалы когда-либо созданные человечеством.

В средние века людей сжигали за тягу к знаниям, а теперь сжигают глупыми насмешками и глупыми вопросами.

AlexTikhonov Sep 1 2010 at 06:13

Простите, но я спрашивал не почему автор разобрался как оно работает, а есть ли этот труд где-то в применении (читай можно ли посмотреть готовую работу и где она применяется).

Fil Sep 1 2010 at 06:19

Конкретной цели не было, применения нет. Но раз уж сделал, была мысль сделать сделать свой просмотрщик, однако понимаю, что это довольно тяжело.

AlexTikhonov Sep 1 2010 at 07:50

Спасибо.

А как Вы смотрите на реализацию многопоточного пакетного конвертора? Дело в том, что я заметил, что большество готовых конверторов совершенно не утилизируют 2+ ядерные системы (тот же FastStone когда я ему скормил 1к фотографий мрачно взял 80% одного ядра на моем квадре, и отрабатывал довольно долго).

Задача, насколько я понимаю, довольно хорошо паралелится — и не только работу с матрицами (что уже очень не плохо), но можно реализовать в виде нескольких этапов, которые ставятся в очередь исполнения. Если взять 4 ядра и несколько сотен фотографий большого резолюшена, то пока происходит просчет матрицы квантования на одном jpeg, другие worker-ы могут выполнить другие операции от других jpeg-ов (то же построение дерева). Или паралельный поиск оптимального алгоритма сжатия с анализом потерь — этому ваабще цены небыло бы :)

На стандартных декодерах такое сложно сделать, разве что паралельно загружать картинки, но разбить загрузку на этапы… не уверен.

В общем, вот такая идейка, куда реально можно было бы применить полученный результат.

Fil Sep 1 2010 at 08:00

Параллелится отлично, но действительно, это редко используется. Кодирование посложнее. Подумаю, спасибо за совет :)

beeruser Sep 1 2010 at 19:15

Параллельно можно обрабатывать и 1 картинку.
В случае декодирования, по сути, всё упирается в скорость последовательного участка — разборки huffman-а. DCT/color-transform можно разложить на любое число тредов.

Huffman можно декодировать simd-ом, но это несколько геморно в случае jpeg-а (в mpeg фиксированные таблицы huffman-а и имеются simd реализации) но реализуемо.
Если изображение большое, то можно и поспекулировать — декодировать битовый поток с нескольких мест файла — нужно только найти начало кода. Т.е. по-идее тупо декодируем с произвольного бита и если не декодировалось, возвращаемся к изначальной точке и смещаемся на 1 бит.

У меня в PS3 SPU реализации Jpeg декодера около 70% уходило на huffman, но правда я не оптимизировал этот участок, а оптимизировать там есть что. В принципе декодер и так давал 40-50MPix/s с 1 SPU — так что я не особо загонялся по этому поводу.

>> Или паралельный поиск оптимального алгоритма сжатия с анализом потерь
У jpeg один алгоритм (не считая lossless)
Но можно играть таблицей квантизации и фильтровать блоки 8x8 чтобы они занимали меньше памяти после DCT.

Fil Sep 2 2010 at 11:32

Гм, я тоже распараллеливал. Но только ДКП, так как это жрало процентов 80. На двухядерном E8500 стало выдавать примерно такую же скорость. А разбор битового потока шел довольно быстро.

anatoly314 Nov 2 2020 at 17:37

Например одна фирма сделала загадку при решении которой можно подать туда CV и я думаю будут получены некоторые бонусы. А загадка это битый jpeg файл который надо ручками в hex редакторе восстановиться, чтобы найти ссылку на следующую загадку. Вот пытаясь это дело решить я сюда и забрел.

beeruser Aug 31 2010 at 23:51

лучше что-то знать и уметь чем не знать и не уметь

Colwin Sep 1 2010 at 02:54

Пример — работа с очень большими изображениями ) почти все готовые либы работают с JPEG в памяти. А если памяти не хватает? Вот тут уже приходится и ручками покопаться, и алгоритмы понапридумывать )

DeadFine Aug 31 2010 at 15:49

Большое спасибо, очень качественная статья!

inspush Aug 31 2010 at 15:51

Блин, торт! Тортище!

vmysla Aug 31 2010 at 15:52

А если не секрет, зачем вы писали свой декодер? Довольно специфичная задача

vmysla Aug 31 2010 at 15:54

уже нашел ответ в коментах

PDEMON Aug 31 2010 at 15:53

Спасибо. Не знал что в фавиконке гугла столько «Яд»а :)

Fil Aug 31 2010 at 15:59

Он есть во всех jpg-файлах :)

UFO landed and left these words here

root_sashok Aug 31 2010 at 16:01

Месье знает толк в извращениях!

Palehin Aug 31 2010 at 16:09

Помнится читал что в GIF изображения можно без труда поместить php код и большинство загрузчиков файлов пропустят такое изображения и код корректно выполнится на сервере. А что с jpg в этом случае?

Fil Aug 31 2010 at 16:20

Можно поместить что угодно(если какие-либо 2 байта не будут совпадать с маркером) после окончания любой из секций, у которой известна длина. Декодировщики, после чтения секции пропускают байты пока не встретят маркер. Как это применимо в плане помещения туда php-кода я не знаю.

UFO landed and left these words here

Palehin Aug 31 2010 at 16:59

я читал вот это -> «Марсель Низамутдинов — Тактика защиты и нападения на Web-приложения»
Других книг на русском языке по безопасности я увы не нашёл…

s1im Sep 1 2010 at 04:48

скорее всего, там имелось в виду следующее:
* старые непропатченные версии ИЕ6/ИЕ7 могут выполнить js код спрятанный в картинке;
* если разработчик не сделал обработку картинки после ее загрузки на сервак и она тупо копируется в папку доступную из веб, то можно загрузить картинку в теле которой будет php-скрипт и попытаться выполнить его (например, при наличии уязвимости класса php-including);

www.dsec.ru/about/articles/web_xss/

impass Aug 31 2010 at 20:49

никто не мешает дописать что угодно в конец файла :)

impass Aug 31 2010 at 20:52

Сам по себе PHP из картинки, естественно, не выполнится просто так, как ни старайтесь. Для этого требуется убедить интерпретатор (часто путём добавления .php в середину или конец имени файла) выполнить файл, содержащий картинку и добавку в виде PHP кода.

ZiNTeR Aug 31 2010 at 16:19

Отсюда вывод: правоверный jpeg начинается с «яШяю» :)

Fil Aug 31 2010 at 16:22

Не совсем :) Начинается всегда «яШ». Но порядок остальных маркеров(кроме SOS, конца файла, и еще некоторых) не регламентирован.

likenoother Aug 31 2010 at 16:24

[00 11] Длина: 16 байт.
17

Fil Aug 31 2010 at 16:27

О, недоглядел, спасибо за внимательность!

iosis Aug 31 2010 at 16:25

оу, классно! Разжевано хорошо достаточно! спасибо.

BReal Aug 31 2010 at 16:25

Не совсем понял, это jpeg картинка, сделанная из ico?

Fil Aug 31 2010 at 16:29

Верно. От ico там ничего нет.

Fil Aug 31 2010 at 16:31

А пережал так сильно, чтобы уменьшить размер, и в особенности деревья Хаффмана.

Banzeg Aug 31 2010 at 16:28

Хорошо расписано, с картинками :)
В вузе на младших курсах развлекался, ковыряя все подряд в hex-редакторах, изучая форматы. После таких упражнений спецификации читались как худлит.

BarsMonster Aug 31 2010 at 16:30

Простите, а зачем надо с нуля писать? Реализаций навалом )

Fil Aug 31 2010 at 16:32

Я уже отвечал

BarsMonster Aug 31 2010 at 16:34

Ясно… Круто, сам ковырял просто тоже :-)

Magnifico Aug 31 2010 at 16:36

«Вам когда-нибудь хотелось узнать как устроен jpg-файл? Сейчас разберемся!» — говорится в сааамом начале текста ;)

shogunkub Aug 31 2010 at 16:31

Офигенно, спасибо. Пока не успел прочитать, сижу работаю сверхурочно, но именно такую статью по структуре графических файлов в своё время искал. Может напишете серию про различные распространенные мультимедиа-форматы? Интересно, и адски полезно для многих.

Fil Aug 31 2010 at 16:35

Пожалуйста! Я подумаю. Это занимает много времени, но может на досуге еще что-нибудь расковыряю :)

shogunkub Aug 31 2010 at 16:38

Радует, что любознательность еще не все растеряли. Благодаря таким как вы, хабр ещё торт ;)

Colwin Sep 1 2010 at 02:59

Если надумаете, может, на сайте своем выложите?
И людям искать удобно, и свой ресурс продвинете уникальным и ценным контентом.

Zubchick Aug 31 2010 at 16:34

Хотелось бы что бы после этой статьи число студентов, собственноручно написавших курсовой по структурам и алгоритмам, увеличилось хотя бы на толику :)

Colwin Sep 1 2010 at 03:00

Главное, чтобы не старые алгоритмы заново реализовывали, а новые идеи находили ) Иначе большого смысла нет.

webrover Aug 31 2010 at 16:36

Вы как оптимизировали ДКП? насколько я помню, каконичный алгоритм оперирует произведением матриц. SSE накручивали?

Fil Aug 31 2010 at 16:46

Я думал насчет SSE. Но мне показалось компилятор сам, при определенных опциях, использует SSE-оптимизацию. Но не могу это утверждать.

Fil Aug 31 2010 at 16:54

Моя оптимизация простая — формулу свел к перемножению матриц, косинусы заменил массивом констант, и выделил некоторые частные случаи, когда в матрице преобладают нули.

webrover Aug 31 2010 at 17:14

ну тоже самое что и RES*IMG*DCT^T

> Но мне показалось компилятор сам, при определенных опциях, использует SSE-оптимизацию.
некоторые преобразуют раскрытые циклы…

Fil Aug 31 2010 at 19:05

Я тоже читал статью на codenet :) Что-то они там намудрили. IMG — исходная матрица, RES — полученная матрица ДКП, но что тогда значит RES*IMG? Вероятно они имели в виду RES = DCT*RES*DCT^T

cooch Aug 31 2010 at 16:45

Если интересно — могу рассказать о своих опытах расковыривания формата Fruity Loops Score (fsc).

gionet Aug 31 2010 at 19:58

Вот это было бы тоже интересно! Давайте

andrew_b Aug 31 2010 at 16:50

Интересно, а на сколько реально «рисовать» jpeg в hex редакторе?

shogunkub Aug 31 2010 at 17:06

В HEX-редакторе реально сделать всё что угодно. Вопрос только в навыке и наличии большого количества свободного времени :)

Colwin Sep 1 2010 at 03:02

Насчет большого количества — это вы в самую точку )
Зато компенсируется самоудовлетворением )

UFO landed and left these words here

Garrett Aug 31 2010 at 18:22

Выше таки написали что-то вроде =)

UFO landed and left these words here

thoth Aug 31 2010 at 17:41

Статья хорошая, понравилась.
Ностальгия. Как то писал на Verilog, JPEG-encoder. Ну и соответственно пришлось постигать так же процесс построения самого JPEG файла.

UFO landed and left these words here

KwI Aug 31 2010 at 18:05

Класс! Спасибо огромное!
Очень приятно, что кратко и понятно.

olegi Aug 31 2010 at 18:17

До сих пор помню, она занимала 7 секунд. Но это и неудивительно, если бездумно пользоваться приведенной формулой, то для вычисления одного канала одного пикселя потребуется нахождения 128 косинусов, 768 умножений, и сколько-то там сложений. Только вдумайтесь — почти тысяча непростых операций только на один канал одного пиксела! К счастью, тут есть простор для отимизации (после долгих экспериментов уменьшил время загрузки до предела точности таймера 15мс, и после этого сменил изображение на фотографию в 25 раз большей площадью. Возможно, напишу об этом отдельной статьей).

я только за

Bas1l Aug 31 2010 at 18:38

На самом деле, в качестве отправной точки оптимизации надо брать быстрое преобразование Фурье: en.wikipedia.org/wiki/Fast_Fourier_transform, en.wikipedia.org/wiki/Cooley%E2%80%93Tukey_FFT_algorithm

Fil Aug 31 2010 at 18:54

Да, я на них тоже наткнулся, но так и не решился разбираться.

thoth Sep 1 2010 at 10:21

Согласен, во первых FFT. А во вторых косинусы не пересчитывать а держать константами. (ха, капитан очевидность)

ripsomeday Aug 31 2010 at 18:21

большое спасибо, как раз сам сидел разбирался.
вот бы еще про lossless jpeg так подробно расписали. эх.

avz Aug 31 2010 at 19:38

Хм. А мне казалось что в jpeg'е обязательно должен быть JFIF

Fil Aug 31 2010 at 19:52

А, да, JPEGsnoop говорит, что это идентификатор. Он находится в секции с маркером FFE0. А все секции с маркерами FFEn отданы для приложений. В них же хранится и EXIF. Возможно есть договоренность по этому идентификатору JFIF, но спецификация этого не предусматривает. Поэтому я просто удалил эту секцию.

demoded Aug 31 2010 at 19:53

вагон респекта за столько труда!

Vordigont Aug 31 2010 at 21:09

Супер! То что я искал! Спасибо автору!!!

Christmas Aug 31 2010 at 21:26

Я так когда-то при помощи бинарного просмотрщика (в Тотал Коммандере) и пэйнта без посторонней документации разобрал полноцветный bmp, написал генератор на php и рисовал прямые линии :-)
Пользы ноль, удовольствия — тонна.

UFO landed and left these words here

Christmas Aug 31 2010 at 22:51

Да вы что, исключительно вертикальные и горизонтальные :-) Я в том юном возрасте даже фамилию такую прочитать не смог бы)

Christmas Aug 31 2010 at 23:01

Хотя пробовал рисовать под углом — понял, что ничего не смогу, а про алгоритмы читать негде — интернета не было.

Colwin Sep 1 2010 at 03:05

Полноцветный — вполне возможно )
А вот если бы 16-битный формат разобрал — я бы медаль дал ) таких гениев мало )

b8c6 Sep 1 2010 at 07:43

А какие с ним сложности? Что два байта на три цвета?
Сам не разбирал, но не думаю, что это задача уровня гения.

А JPG не так подробно, но ковырял: надо было быстро получать из файла размеры картинки и EXIF (чтобы скриптом перелопатить под миллион картинок): так прочесть пару байт из файла оказалось куда быстрей, чем использовать готовые библиотеки, которые грузят картинку в память (может, есть такие, которые не грузят, но за полдня я таких не нашёл).

Alvein Sep 1 2010 at 06:52

Я бы засунул эту статью в перевод, т.к. текст очень похож на англоязычный вариант того, по которому я учился декодить JPEG примерно 8 лет назад. Писал программу на Си для конвертации картинок в ANSII графику…

Fil Sep 1 2010 at 07:31

Какой еще перевод! Я потратил все вечера недели на написание статьи. Сам взял пример, сам декодировал его, сам нарисовал схемы и деревья, сам получил эти таблицы, сам описал процесс. А процесс декодирования он один для всех, поэтому похож.

Alvein Sep 1 2010 at 07:34

возможно в тот момент спецификация была не 180 страничная. Пороюсь в документах и попробую привести то что было. А за работу спасибо, прав я или нет, перевод это или нет, главное что работа проделана и проделана качественно и, думаю, поможет многим интересующимся и перспективным пиплам, коих с каждым годом не становиться больше :(

bbbb Sep 1 2010 at 07:28

Спасибо, напомнили мне о студенчестве.
Неделю этот алгоритм в Борланд Паскале отлаживал :))

VYBGSS Sep 1 2010 at 08:22

О души благодарю автора статьи. Впрочем — количество добавивших избранное показывает, что я не один :).

Fil Sep 1 2010 at 08:23

Рад, что понравилось! Я сам в шоке от количества :)

kurokikaze Sep 1 2010 at 09:03

Супер!!! Будет что нибудь подобное для PNG?

Fil Sep 1 2010 at 09:19

Спасибо :) Возможно, но на это уходит куча времени.

Alkzndr Sep 1 2010 at 09:46

Я бы добавил ссылку на Independent JPEG Group откуда можно скачать исходники на С. Там же можно посмотреть на используемые оптимизации, так, например, есть несколько реализаций ДКП и ОДКП. Следует правда отметить, что код написан очень мудрёно.

Также когда-то попадалась на глаза реализация от Intel.

DjOnline Oct 16 2011 at 08:42

Из-за грёбанных патентов до сих пор в jpeg не применяется арифметическое сжатие.
А есть ведь ещё разработки типа типа PackJPG (и другие), обеспечивающие на 30% лучшее сжатие чем обычный jpeg при абсолютном байт-в-байт сходстве распакованной картинки, но тоже проблема — никаких плагинов для браузеров/просмотрщиков/редакторов.

DjOnline Oct 16 2011 at 16:54

p.s. хотя патенты то уже несколько лет как кончились.

whoozle Sep 21 2014 at 07:34

В стандарте описан (Figure C.2) очень простой способ генерировать коды хаффмана, вот псевдокод:

//code_counts - массив количеств кодов из 16 элементов.
code = 0
for(i in 0..16)
{
  for(j in 0..code_counts[i])
  {
    codes[(i + 1,  code)] = read_next_value(); //i + 1 — битовая длина кода, в младших битах (i + 1) code сам код
    ++code;
  }
  code <<= 1;
}

monah_tuk Oct 14 2021 at 04:32

11 лет прошло, а оказалось очень актуально. @Fil,большое спасибо!

Fil Oct 15 2021 at 20:40

jpeg не изменился и все так же популярен :) Рад, что пригодилось!

monah_tuk Oct 16 2021 at 04:37

Мне больше таблицы нужны были, для конфигурации JPEG IP Core на FPGA, но всё же :)

KILYAV Sep 23 2022 at 16:34

Спасибо.