Comments / Profile of ripatti / Habr

Артём Рипатти @ripatti

Математик-программист

ProfileArticles13PostsNewsComments197

10 новых сказок о потерянном времени

ripatti Dec 28 2016 at 07:01

Спасибо за предложение, я может до выходных еще оптимизаций на #10 повешу.

Look

10 новых сказок о потерянном времени

ripatti Dec 28 2016 at 06:57

Я запускал 20000 в 6 потоков на 4-ядерном i7-3770 3.4GHz (каждый поток замедляется из-за гипертрединга, но общее время улучшается). 50000 и 100000 я запускал так: 6 потоков на 4-ядерном i7-3770 3.4GHz, 10 потоков на 6-ядерном i7-5820K 3.3GHz.

Look

10 новых сказок о потерянном времени

ripatti Dec 28 2016 at 05:06

Ну, сейчас, вызовов этого gcd — O(n) с малой константой (около 1/144). Но доказать, что эта оценка справедлива при любом n, наверно, не проще, чем найти третье решение уравнения.

Look

10 новых сказок о потерянном времени

ripatti Dec 27 2016 at 20:21

У вас в коде

for (int a=2; a<=n; a++) {
  for (int b=a-1; b<a; b++) {

ЭТО создает линейное число элементов вместо квадрата

Look

10 новых сказок о потерянном времени

ripatti Dec 27 2016 at 20:18

Тут явно или что-то меряется, что-то сортится, или что-то выводится не так.
В разрыв по времени в 10 раз я может и поверю, но не в 10000 раз.
Ибо в каждом куске кода мы всегда как минимум создаем вектор за линейное время.

Look

10 новых сказок о потерянном времени

ripatti Dec 27 2016 at 19:05

Число простых с ростом n растет как n / ln n, т.е. для n=1000000 их уже всего всего 7%… Но если это утверждение хотя бы доказать — то тогда вполне можно добавить.

Look

10 новых сказок о потерянном времени

ripatti Dec 27 2016 at 18:08

Это все действительно интересно и я, на самом деле, немного думал об ускорении сортировки в этом направлении. Если n достаточно мало, то массив действительно получается почти отсортированным и я пробовал его сортировать его вставками. К сожалению, с ростом n эта частичная отсортированность пропадает. Попробуйте померить вашим кодом случай, когда n порядка 10000.

Look

10 новых сказок о потерянном времени

ripatti Dec 27 2016 at 17:41

Это имело бы смысл, если бы у меня была машина с 120Гб оперативной памяти.

Look

10 новых сказок о потерянном времени

ripatti Dec 27 2016 at 17:34

Ну тогда я буду ускорять потихоньку. Сейчас вот экспериментировал в заменой сортировки с указателями на хэш-таблицу, и… получил двукратное ускорение и решение за O(N^3). Т.е. почти полностью вырезал все то время, который жрал лишний логарифм.

Look

10 новых сказок о потерянном времени

ripatti Dec 27 2016 at 15:34

Ну так я свое #5 даже и не пытался ускорять дальше из-за того, что оно квадрат памяти требует. То есть насчет него — я согласен, что может и больше, чем в 10 раз ускорится. Ну а толку от него, если оно в память не лезет?

Look

10 новых сказок о потерянном времени

ripatti Dec 27 2016 at 14:39

Совершенно верно, у меня совсем вылетело из головы указать, что я ищу решения только для a,b,c,d,e>0. Сейчас уточню это в статье.

Look

10 новых сказок о потерянном времени

ripatti Dec 27 2016 at 14:38

Если я верно понял, но у Вас для n=20 в случае без сортировки после (a=19 b=18) будет идти (a=20 b=1). Но ведь 19^5+18^5 = 4365667 > 3200001 = 20^5+1^5. То есть, если для n=10 оно вроде работает, то потом, с ростом n, при переходе от (a (a-1)) к ((a+1) 1) получаем, что первое число будет где-то в 2 раза больше второго.

Look

10 новых сказок о потерянном времени

ripatti Dec 27 2016 at 12:05

С другой стороны — если не будет дополнительных ресурсов — то и оптимизировать особо смысла нет. Не думаю, что там можно более чем в 10 раз ускорить.

А так да, конечно, при возможной ресурсной поддержке — засяду оптимизировать насколько это возможно, опыт подобных расчетов есть (правда, «всего» на 55000 ядрочасов). Ну и не сразу миллион, а шажками: сначала 200000, потом 500000, а потом можно и за 1000000 взяться.

Look

10 новых сказок о потерянном времени

ripatti Dec 27 2016 at 08:59

gcd там нужен чисто для отбраковки решений, в которых параметры имеют общий делитель. Поскольку решений, для которых нам нужно сделать такую проверку, очень мало, то сложность gcd можно не учитывать. Но если смотреть с формальной точки зрения — то да, надо везде домножить на логарифм. И решение #10 тогда получается со сложностью O(n⁵log n) (ouch!).

Look

10 новых сказок о потерянном времени

ripatti Dec 27 2016 at 08:01

Насколько мне известно — нет.

Look

10 новых сказок о потерянном времени

ripatti Dec 27 2016 at 07:23

Конкретно тут вроде неважно в каком порядке идут сравнения, но, скажем, в аналогичных циклах позже нужно будет сначала проверить, что j>=0, а только потом посмотреть что лежит в массиве по индексу j.

&& — это И для типа bool, & — логическое И для целочисленной маски.

Look

10 новых сказок о потерянном времени

ripatti Dec 27 2016 at 06:51

Там же происходит j--, поэтому в процессе выполнения цикла условие i < j может нарушиться.
По хорошему, i < j надо вставить еще в следующий if, но когда это не выполняется, будет i=j и, в принципе, индекс массива j остается валидный.

Look

Логика сознания. Часть 9. Искусственные нейронные сети и миниколонки реальной коры

ripatti Dec 16 2016 at 07:53

сорян, я немного вклинюсь в ваш диалог
> вектора из модели word2vec — 300 действительных чисел
но ведь слов любого языка всего порядка 50000 и их можно закодировать 16 битами

Look

Судоку: так сколько же их? Часть 2/2

ripatti Nov 16 2016 at 06:00

Интересно. К сожалению, больше информации по этому проекту нагуглить не могу.

Зато я нагуглил информацию по другому проекту. Они другим алгоритмом через BOINC подтвердили результаты, которые я привел в тексте перевода. Вот ссылки: раз два.

Look

Судоку: так сколько же их? Часть 2/2

ripatti Nov 16 2016 at 05:38

Впрочем, я припоминаю подобную историю с проверкой нулей зета-функции Римана. Вроде из-за этого закрыли проект ZetaGrid, поскольку они там всей толпой распределенными вычислениями проверили меньше нулей, чем один математик на своем десктопе…

Look

1 2

4 5 ...

9 10