Bodigrim 21 ноя 2011 в 12:22

Еще раз о поиске простых чисел

7 мин

225K

Алгоритмы *

+143

Комментарии 28

korvindest 21 ноя 2011 в 14:25

Спасибо, читал с удовольствием.

Eddy_Em 21 ноя 2011 в 15:05

Было бы так же просто вычислять длинные простые числа (скажем, в районе 10³²), тогда пришлось бы срочно выдумывать что-нибудь новое в области защиты информации :)

Bodigrim 21 ноя 2011 в 15:19

Найти несколько последовательных простых такого порядка — не проблема. Например, следующее после 10³² — это 100000000000000000000000000000049. Но это вычисляют не методом решета, а индивидуальными тестами. Метод решета, скажем, при 10²⁴ потребует несколько сотен гигабайт памяти.

ardentum 22 ноя 2011 в 09:41

Вроде бы с этой задачей может справиться решето Сундарама.

Bodigrim 22 ноя 2011 в 17:09

Формально вы правы, решето Сундарама не требует предварительного построения таблицы простых до sqrt(n), так что на этом память можно сэкономить совершенно. Однако нам понадобится хранить в памяти просеиваемый интервал. Если он длиннее [n, n+sqrt(n)], то мы уже имеем потребление памяти порядка O(sqrt(n)) и без потери порядка асимптотики можем применить решето Эратосфена или Аткина. Если же он короче [n, n+sqrt(n)], то решето Сундарама по производительности проиграет даже поэлементной проверке перебором делителей.

sainnr 21 ноя 2011 в 15:25

Статья, во-первых, очень интересная и познавательная, а во-вторых, прекрасно оформленная. За это автору двойное спасибо.

andyceo 21 ноя 2011 в 15:30

> Из элементарной теории чисел следует, что все простые, большие 3, имеют вид 12k+1 (случай a), 12k+5 (снова a), 12k+7 (случай b) или 12k+11 (случай c).

не понял, а как же 5, 7?

Hint 21 ноя 2011 в 15:31

k = 0

Volkman 21 ноя 2011 в 15:39

k >= 0.
5 и 7 получаются при k = 0.

agmt 22 ноя 2011 в 01:12

Кстати, а почему тогда не 6k+-1, k>0 — можно ещё в 1.5 раза уменьшить потребление памяти.

-2

Bodigrim 22 ноя 2011 в 01:19

Не совсем понял, причем здесь потребление памяти. Нам нужно было только показать, что все простые числа покрываются приведенной в статье теоремой. Wheel factorization в случае решета Аткина носит довольно изощренный характер — в оригинальной статье [4] есть подробное описание.

WiseLord 22 ноя 2011 в 10:01

Вы в логике ошиблись. Из того, что все простые, большие 3 имеют такой вид, вовсе не означает, что все числа, имеющие такой вид, простые.
Иначе, если из A следует B, это не значит, что из B следует B.
Если все крокодилы зелёные, это не значит, что все зелёные предметы — крокодилы.

WiseLord 22 ноя 2011 в 10:03

опечатался. Второй абзац следует читать как "… из B следует A".

Finom 21 ноя 2011 в 17:40

Я в своё время писал курсач на тему «сравнения эффективности алгоритмов дискретного логарифмирования». Практическую часть делал на JS. Для работы с большими числами использовал библиотеку BigInt, для распараллеливания юзал Воркеров. Может быть кому-то интересен данный опыт, поэтому спрашивайте. Ну и с простыми числами знаком не по наслышке. Единственный известный детерминированный алгоритм тестов на простоту — это тест Агравала — Каяла — Саксены. Но я делал по-другому: для поиска очень крупных (сотни знаков) простых чисел, выбиралось случайное нечетное число и применялся алгоритм Миллера-Рабина много раз (используя теорему Рабина, вероятность получения псевдопростого числа можно снизить почти до нуля).

borisko 21 ноя 2011 в 20:15

Спасибо за статью.
Вроде бы, O(n^(1/2)) — это не экспоненциальный рост, а экспоненциальный — это O(a^n).

FeferIvan 21 ноя 2011 в 23:58

Он становиться экспотенциальным если мы учтем длинну числа, что актуально для больших простых, когда, например, сложение сложение 2 чисел занимает не О(1), как для чисел до 10^9 на привычных нам 32-хбитных системах, а О(длинна числа)

borisko 22 ноя 2011 в 00:09

N-ое простое число имеет порядок примерно n * ln n, значит его длина — ln n + ln ln n или примерно ln n (если верить статье и считать, что ln ln n это очень мало). Получается, алгоритм работает за O(ln n * n^(1/2)). А это тоже совсем не экспоненциально, и даже быстрее, чем линейно.

vics001 22 ноя 2011 в 01:48

Если взять машину Тьюринга, относительно к которой применяются и изучаются, все тесты сложности, то там число представляется как длина входных данных, а это длина битового слова. То есть n — это длина 2-го числа, само число же до 2^n.

Теорема P/NP тоже формулируется относительно машины Тьюринга.

P.S: ошибочность этого мнения происходит из того, что в повседневной жизни мы оцениваем сложение двух чисел как O(1), потому что они ограничены 2^32.

Bodigrim 22 ноя 2011 в 00:14

Смотря относительно чего. Я в статье пишу, что O(n^(1/2)) — это величина, которая «растет экспоненциально относительно битовой длины n», т. е. относительно log_2 n. АФАИР это стандартный подход: сложность алгоритма измеряется относительно длины входных данных. Относительно самого n это, конечно, полиномиальный рост.

gribozavr 22 ноя 2011 в 00:36

Экспоненциальный относительно длины n, то есть относительно log n.

philpirj 21 ноя 2011 в 23:04

>JavaScript-подобный псевдокод
Раньше писали «C-подобный».

Bodigrim 22 ноя 2011 в 00:22

Он JavaScript-подобный в том смысле, что на самом деле это рабочий JS, хотя и несколько варварски написанный.

zeksa 22 ноя 2011 в 00:07

Сразу вспомнились из теории чисел тесты Мюллера-Рабина и Соловея- Штрассена на проверку простоты числа. Надо бы и их тоже закодить.

Joo 22 ноя 2011 в 10:19

Прекрасная статья. Спасибо!

ArturSitnikoff 2 фев 2018 в 00:28

А зачем, позвольте спросить, обсчитывать все числа, если 2/3 математического ряда вообще не участвуют в списке претендентов на простые числа?

     $list = array();

     for ($row = 1, $start = 1, $finish = 1000000; $start < $finish; $start++)
     {
       if ($row == 1 || $row == 5)
       {
         if (substr($start, -1) != 5)
         {
           $list[] = $start;
         }
       }

       $row++;

       if ($start % 6 == 0) $row = 1;
     }

     // echo count($list); // 266 666

Bodigrim 2 фев 2018 в 00:38

В тексте статьи написано про wheel optimization.

ArturSitnikoff 2 фев 2018 в 00:57

Там происходит деление на 2, потом на 3, потом на 5, потом на 7. Чтобы не делить на 2 и 3 нужно разбить числа на ряды по 6 штук и выбросить 2,3,4 и 6-й ряды чтобы избежать математики. Лишь это хотел подчеркнуть, про оптимизацию то написано, а как она устроена ни слова.

Nashev 18 мая 2022 в 14:24

выбросить 2,3,4 и 6-й ~~ряды~~ столбцы

Зарегистрируйтесь на Хабре , чтобы оставить комментарий

Еще раз о поиске простых чисел

Комментарии 28

Публикации

Истории