NewTechAudit 10 авг 2022 в 07:27

Слова одни скрывают часто слова другие

5 мин

3.1K

Комментарии 6

iig 10 авг 2022 в 10:56

Любой алгоритм сжатия (если без потерь) работает приблизительно так же - часто встречающиеся символы заменяются более короткими кодами. Есть у арифметичекого кодирования какие-то преимущества/недостатки по сравнению с алгоритмом Хаффмана, например?

Zara6502 10 авг 2022 в 14:15

есть, дробная длина кода в битах, то есть Хаффман в самом меньшем значении оперирует 1 битом и сильнее чем в 8 раз он не сожмёт

iig 11 авг 2022 в 12:11

"В 2013 году была предложена модификация алгоритма Хаффмана, позволяющая кодировать символы дробным количеством бит — ANS"

Zara6502 12 авг 2022 в 04:50

и как это связано? или вы разговаривая про LZ77 подразумеваете десятки всех LZ алгоритмов сразу, кто вас тогда поймёт правильно? Хаффман к ANS никакого отношения не имеет, поэтому вы либо говорите про алгоритм Хаффмана либо про ANS - это абсолютно разные алгоритмы.

NewTechAudit 11 авг 2022 в 09:41

Алгоритм Хаффмана эффективен, когда частоты появления символов пропорциональны 1/2n (где n – натуральное положительное число). Это утверждение становится очевидным, если вспомнить, что коды Хаффмана для каждого символа всегда состоят из целого числа бит. Рассмотрим ситуацию, когда частота появление символа равна 0,2, тогда оптимальный код для кодирования это символа должен иметь длину –log2(0,2)=2,3 бита. Понятно, что префиксный код Хаффмана не может иметь такую длину, т.е. в конечном итоге это приводит к ухудшению сжатия данных.

Арифметическое кодирование предназначено для того, чтобы решить эту проблему. Основная идея заключается в том, чтобы присваивать коды не отдельным символам, а их последовательностям.

Zara6502 12 авг 2022 в 04:54

Ну и ваше "приблизительно" слишком приблизительно. Вы говорите только об энропийном кодировании, а оно не единственное.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий