Комментарии 17
7z почему нет?
xz сжимает тем же LZMA/LZMA2
Не только. В 7z есть PPmD, который сжимает с лучшим коэффициентом, но намного медленнее.
Да, вы правы.
Просто ставилась цель не протестировать все возможные алгоритмы, а ограничиться только наиболее «стандартными». В результате я посчитал, что основной алгоритм в 7z, LZMA, уже протестирован в воплощении xz, и не уделил времени тестированию PPMd.
Просто ставилась цель не протестировать все возможные алгоритмы, а ограничиться только наиболее «стандартными». В результате я посчитал, что основной алгоритм в 7z, LZMA, уже протестирован в воплощении xz, и не уделил времени тестированию PPMd.
1) а где разные типы данных? Кто сказал что в проекте только текст? Зачастую в проекте лежат всякие вспомогательные файлы
2) также забыты parallel версии bzip/gzip и то что в последней версии xz уже понимает ключик -T. Скорости будут соовсем другими.
2) также забыты parallel версии bzip/gzip и то что в последней версии xz уже понимает ключик -T. Скорости будут соовсем другими.
Если вы прочитаете внимательно, то в статье описаны тестовые наборы. Там есть комбинированный набор (дистрибутив исходных кодов в котором есть и pdf и двоичные данные), бинарный дистрибутив (исполняемый код), двоичные числовые данные, и набор чисто исходных текстов.
Да, многопоточные программы не затрагивались.
Да, многопоточные программы не затрагивались.
А как же многопоточные архиваторы? Я уже сколько раз сталкивался, что предача данных упирается либо в сеть, либо в процессор, где одинокий gzip жмёт данные. А вот так чтобы данные хорошо жались и при этом упирались в сеть вообще не видел 8)
>>bzip2 основан на алгоритме BWT (англ.), остальные же основаны на алгоритме LZ77 (англ.) и его модификациях.
BWT не сжимает данные. Какое-то сравнение теплого с мягким.
bzip2 сжимает Хаффманом. А BWT и MTF просто могут повысить степень сжатия. А могут и не повысить :)
BWT не сжимает данные. Какое-то сравнение теплого с мягким.
bzip2 сжимает Хаффманом. А BWT и MTF просто могут повысить степень сжатия. А могут и не повысить :)
Согласитесь, BWT — ключевой компонент bzip2. Поэтому фраза вполне корректна.
Ключевой компонент bzip2 — все-таки Хаффман.
И совсем некорректно говорить, что BWT сжимает что-либо. Это лишь препроцессинг данных, без уменьшения их объема.
И совсем некорректно говорить, что BWT сжимает что-либо. Это лишь препроцессинг данных, без уменьшения их объема.
Так у меня и не написано что BWT что-то сжимает. bzip ОСНОВАН на BWT. А Хаффман используется и в gzip (и где только ещё не используется) и вряд ли может считаться определяющей чертой bzip2.
Там еще RLE есть.
Получается, gzip со сжатием больше 5 использовать нет смысла?
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Сравнение программ сжатия в применении к передаче больших объёмов данных