Спасибо за совет! Нет, не пробовал. В какой-то момент решил не копать глубже чтобы не переусложнять статью. И так есть опасения, что объём материала отпугнёт большинство потенциальных читателей.
Объяснение через цепи Маркова придумал сам. Но сейчас мне уже кажется, что оно тут скорее на правах аллегории — способ посмотреть на процесс кодирования под неожиданным улогм.
4 бита на счётчик в PackBits будет оптимально, если дина повторов И длина промежутков между ними находятся в интервале (один бит уйдёт на знак).
В предобработанных данных появляются очень длинные повторы (сотни символов), и на их кодирование затраты увеличатся. На вскидку почему-то кажется, что оптимум должен быть ближе к 6 битам (когда значения счётчиков не превосходят 32), но нужно проверять.
Спасибо за совет!
Нет, не пробовал. В какой-то момент решил не копать глубже чтобы не переусложнять статью. И так есть опасения, что объём материала отпугнёт большинство потенциальных читателей.
Спасибо за высокую оценку!
Объяснение через цепи Маркова придумал сам. Но сейчас мне уже кажется, что оно тут скорее на правах аллегории — способ посмотреть на процесс кодирования под неожиданным улогм.
Интересная мысль. Не проверял.
4 бита на счётчик в PackBits будет оптимально, если дина повторов И длина промежутков между ними находятся в интервале
(один бит уйдёт на знак).
В предобработанных данных появляются очень длинные повторы (сотни символов), и на их кодирование затраты увеличатся. На вскидку почему-то кажется, что оптимум должен быть ближе к 6 битам (когда значения счётчиков не превосходят 32), но нужно проверять.
Ого! Большое спасибо за наводку.
Посмотрю-поизучаю как будет время.