All streams
Search
Write a publication
Pull to refresh
23
0
Андрей @pythe

программист

Send message
Не уловил логики… А, там тоже про комментарии? :)
Попробую. Из графика частотности видно, что решающее значение для общего показателя компрессии имеют лишь несколько первых интервалов: 6, 12 и 2, 4, 8, 10. По сути без разницы, какие коды использовать — лишь бы эти несколько были наиболее короткими. В предложенном варианте они наиболее короткие.
Наверно я чего-то не понял. Это уменьшит таблицу НАТУРАЛЬНЫХ чисел, исключив из них 3/4 и все неподозрительные на простоту. Таблицу ПРОСТЫХ это увеличит, добавив в нее помимо простых еще и подозрительные на простоту.
Построение на лету хорошо для разовых задач, но усложнение программирования ставит под вопрос выполнимость самих таких задач. Прикладные задачи потребуют дополнить построение на лету кэшированием и сложность программирования возрастет в разы.
Гм, хорошая идея :) В голову не пришло.
Отдельные вещи можно проверить у альтернативных источников. Например, последнее простое в использованной мной таблице 999999999989, имеет порядковый номер 37607912018, здесь primes.utm.edu/nthprime этому можно получить подтверждение. Значит, во всяком случае пропусков нет. А вот проверить на предмет перестановок и подмен — тут увы. Только поэлементное сравнение с такой же таблицей, либо поштучная проверка на простоту. Собственно, этим-то простые и замечательны, что другого способа нет.
И как это скажется на размере таблицы?
Берем все числа в промежутке, который вызывает у Вас подозрения. И проверяем все по очереди :)
Вообще-то таблицы так и строят — берут все числа по очереди. Как тут пропустить что-то можно?
Это песочница какие тут могут быть объяснения :))

У меня такое чувство. что половина из отметившихся в комментариях не уловила, суть идеи в строго детерминированном характере частотности интервалов. Традиционное же кодирование исходит из некоторых общих представлений о данных. Поскольку частотность интервалов детерминирована, нет никаких проблем рассчитать эффективность любого другого метода кодирования, на последней диаграмме я несколько таких примеров привел. Есть предложение? Посчитайте сами. Итоги в студию.
До конца наверно не дочитали. Время доступа почти не отличается от времени доступа к несжатым данным.
Не думаю, что будет большая разница между традиционной компрессией последовательности простых и последовательности интервалов между простыми, между ними нет принципиальной разницы. Т.е., сжатие будет приличное, но не олимпийское. Пробовать, честно говоря, лень :)
Точно. За одним минусом — с этого момента восстановление простого по его порядковому номеру становится нетривиальной задачей, что уравнивает метод с более продвинутым.

Information

Rating
Does not participate
Location
Екатеринбург, Свердловская обл., Россия
Date of birth
Registered
Activity