BarsMonster Dec 31 2012 at 20:00

Новогоднее хабра-соревнование по программированию-2013 (C++)

3 min

47K

C++ * Algorithms * Sport programming *

+45

Comments 86

gribozavr Dec 31 2012 at 20:46

> в исполнении clang 3.1

А почему не 3.2?

BarsMonster Dec 31 2012 at 20:50

Потому что я пропустил релиз :-) Но замечание справедливое, изменил на 3.2.

grishkaa Dec 31 2012 at 20:57

Можно использовать ассемблерные вставки?

BarsMonster Dec 31 2012 at 20:59

Ограничений нет, главное в 1024 байта уложитесь :-)

safinaskar Dec 31 2012 at 21:04

Можно юзать pthread?

BarsMonster Dec 31 2012 at 21:12

Да.

gridem Dec 31 2012 at 21:37

Можно ли использовать С++11?

BarsMonster Dec 31 2012 at 21:42

Да, на всякий случай укажите свою версию libc++

VladVR Dec 31 2012 at 23:09

Сделал в студии — надеюсь прокатит и скомпилится.

BarsMonster Dec 31 2012 at 23:13

Если код корректно написан, и не использует Microsoft-specific типов — то конечно прокатит.

VladVR Dec 31 2012 at 23:38

Не уверен __int64 микрософтовский или общий.
unsigned char еще использовал, два типа итого.

EuroElessar Jan 1 2013 at 01:50

__int64 — майкрософтовский, надо использовать int64_t из стандарта плюсов

VladVR Jan 1 2013 at 08:42

Нда, поздно увидел поправку «для тех кто в студии». Два раза переотправлял. Так и хочется сказать — «не ругайсо, нащяльника». Ну да ладно.
Эхх, теперь до завтра ждать результатов. Особый, программистский накал страстей.

nicolausYes Jan 1 2013 at 09:19

А можно просто писать long long?

safinaskar Jan 1 2013 at 10:06

Конечно, да :)

BelBES Dec 31 2012 at 23:33

OpenMP/TBB можно использовать?

BarsMonster Dec 31 2012 at 23:47

К сожалению, это уже выпадает за пределы стандартных библиотек.
Так что остаются средства pthreads/C++11

MrGobus Jan 1 2013 at 08:49

Вопрос, в приведенном пример учитывалось общее время работы программы вместе с вводом данных или только цикла расчета ???

safinaskar Jan 1 2013 at 10:06

Конечно, с вводом. Да и вообще, какая разница? Мы же читаем только одно число и пишем одно число

MrGobus Jan 1 2013 at 10:48

Ну как вам сказать, ввод числа руками, ввод из файла и константа это разные по времени обработки методы ввода. Например константа вообще не требует обработки, ввод из файла зависит от скорость диска и т.п. ввод руками вообще зависит от пользователя, (что если я пойду чайку хлебнуть а интер не нажму)
А время как мы видем идет на миллисекунды, это важно, надо либо обозначить как именно все должны делать ввод данных либо ваша time неочем.

dordzhiev Jan 1 2013 at 11:09

Ввод в данном случае не важен, т.к. важно время, занятое у ЦП (колонка user у time).

Mrrl Jan 1 2013 at 11:14

А с какой точностью оно измеряется? До 1 миллисекунды или хуже? И входит ли в него время на запуск программы?

dordzhiev Jan 1 2013 at 11:34

All times are measured in terms of the number of clock ticks used.

Получается измеряется в тиках
Насчет второго сказать ничего не могу, с никсами почти не имел дела.

deNULL Jan 1 2013 at 11:52

Колонка user считает суммарное время на каждом из 4-х ядер. Если распараллеливать, то значение получится в 4 раза больше реального.

shock_one Jan 1 2013 at 15:23

Если бы в условиях задачи программа должна была бы принимать число как параметр, никаких проблем бы не было бы.

BarsMonster Jan 1 2013 at 16:21

Очевидно, при тестировании руками никто ничего вводить не будет. :-)

shock_one Jan 1 2013 at 08:57

Напишите параметры, с которыми вы компилируете.

BarsMonster Jan 1 2013 at 16:37

clang++ --std=c++11 -O3 -pthread yourfile.cpp

ilnarb Jan 1 2013 at 09:24

Судя по ограничениям, можно использовать готовый массив простых чисел, если уложиться в 1024 байт?

namespace Jan 1 2013 at 09:33

Дядя, вы тут предсчетом не пролезете — 1024 байт = 1024 символов (а то и меньше). Там до 2^30 — не прокатит. Нужно писать блочное решето и генерировать числа в разных потоках, а вообще нужно подумать.

ilnarb Jan 1 2013 at 12:04

Нужно написать некоторый код, а на остатке байтов предподссчет засунуть, diff-кодирование.

aamuvirkku Jan 1 2013 at 10:49

Начнём с однопоточного решета. На Core i5 430UM 1200 Mhz в минуту уложился.

nicolausYes Jan 1 2013 at 11:05

Хм, у меня тест Миллера-Рабина на 2 в 30-ой степени в минуту не помещается.

nicolausYes Jan 1 2013 at 12:18

Хм, а решето Аткина, похоже, справляется.

ancalled Jan 1 2013 at 14:28

миллер-рабин тоже в минуту не уложился, а актин что-то с segfault-ом вылетает, может как-то от промежуточного массива избавиться или сократить, но ковыряться глубже сегодня сил нет никаких)

UFO landed and left these words here

ancalled Jan 1 2013 at 14:57

std::bitset-ом пользуетесь? у меня и на нем вылетает, где-то на 90 млн., гуглю…

ancalled Jan 1 2013 at 15:04

понял, на стеке большие массивы создавать больше не буду)

namespace Jan 1 2013 at 14:05

Попробуйте линейное решето Эратосфена — должно проходить.

aamuvirkku Jan 1 2013 at 14:36

Не надо подсказывать! По крайней мере сегодня.

namespace Jan 1 2013 at 15:29

Дак что тут из подсказки. Оно находится по запросу «решето эратосфена за линейное время» за 1 минуту. Просто такой вот тезис.

middle Jan 1 2013 at 14:44

Для 2³⁰-1?

aamuvirkku Jan 1 2013 at 14:50

Да.

UFO landed and left these words here

BarsMonster Jan 1 2013 at 16:39

habrahabr.ru/post/164515/#comment_5661887

madkite Jan 1 2013 at 13:09

> Побеждает тот, кто напишет самое быстрое решение
Время оценивается какое? Wall clock?

BarsMonster Jan 1 2013 at 16:41

Да, wall clock. Ввод перенаправляется из файла, потому ждать его не придется.

UFO landed and left these words here

BarsMonster Jan 1 2013 at 20:08

Маньячина, а теперь разархивированную версию ;-)

Mrrl Jan 1 2013 at 20:13

Я паковал 8 чисел, взаимно простых с 30 (от 30k+1 до 30k+29) в 1 байт. Выбивал числа так же умножая только на взаимно простые с 30, да еще запоминал таблицу умножения данного простого на числа 1..29 в системе счисления «сдвиг — бит». Плюс борьба с тем, чем массив c решетом не вмещался в кэш.
На i5 2.67МГц для N=10^9 время 0.65 сек.
Но это если решение вообще работает.

madkite Jan 1 2013 at 20:38

И даже на тесте 268588319 укладывается в секунду? ;)

UFO landed and left these words here

Mrrl Jan 1 2013 at 20:48

результат такой же, время 0.156 s (на i5)

UFO landed and left these words here

ilyanik Jan 2 2013 at 09:23

А в нечитаемом можно посмотреть? :)

Ещё мне кажется, что для i == 0 можно просто начать с res = (-1) + 2 + 3 + 5 + 7 + 11 + 13; и сэкономить немало байтов кода, например для бОльшей таблицы предподсчета.

Да и саму таблицу можно сделать эффективнее, вместо лестницы if-ов используя массив и цикл.

ilyanik Jan 2 2013 at 10:31

Правда надо будет отдельно обрабатывать N < 13, суммируя primes[j]

ilyanik Jan 2 2013 at 10:06

Ещё можно избавиться от относительно дорогого деления, заранее подсчитав:

k[j] = start_from / primes[j];

И после просеивания

k[j] -= block_size;

Не уверен, что улучшит, но вдруг :)

И ещё — просеивание можно делать до sqrt(i), а не до j < primes_count;

UFO landed and left these words here

ilyanik Jan 2 2013 at 10:28

Ну и распараллелить должно быть несложно.
Хотя ради этого придётся уменьшить таблицу, что в итоге может оказаться невыгодным.

madkite Jan 1 2013 at 21:02

gcc — это вообще другой разговор. Почти всё на gcc будет чуть быстрее. Зачем Вы спрашивали ключи компиляции тогда?
Просто на 268588319 у меня Ваше решение работает больше секунды (на 3,6ГГц) и раза в 3 медленнее, чем 2^30 — 1 (на clang 3.2 в linux x64 с флагом -O3) — из-за предподсчёта.

UFO landed and left these words here

dark1ight Jan 1 2013 at 21:05

написал так:
1) считаем простые числа в диапазоне от 1 до sqrt(n)
2) так как чисел всего 2^31, определяет рабочий интервал, для которого уже просчитана сумма чисел в предыдущем интервале. интервалов 16, в среднем надо просчитать от начала интервала до его середины. итого 1/32
3) считаем сумму оставшихся простых чисел в рабочем интервале, блочным решетом эратосфена с примитивными оптимизациями чётных значений.

блочное решето с примитивными оптимизациями работает на значениях 2^29 около 0,5 секунд. С предпросчётом от 0,01 до 0,05

NickLion Jan 2 2013 at 08:32

Совсем не понял зачем там G, D, F. Если их убрать, код уменьшится на 59 байт.

NickLion Jan 2 2013 at 08:42

PS и т.к. сказано, что тестироваться на Linux x86_64 будет, то int64_t можно было на long заменить. 3 байта всего, но может ещё что полезное поместится в суммарные 62 байта. :)

Mrrl Jan 1 2013 at 20:07

Какие прогнозы на лучшее время?
Думаю, 0.3-0.5 сек на тест.

BarsMonster Jan 1 2013 at 20:09

Думаю и 0.01 будет ;-)

Mrrl Jan 1 2013 at 20:15

Да, про явные формулы я забыл. Хакеры-математики, конечно, непобедимы.

BarsMonster Jan 1 2013 at 20:21

Нет-нет, формул тут никаких нет, кроме китайской теоремы об остатках (она максимум даст ускорение в 2-3 раза).

Mrrl Jan 1 2013 at 20:37

А дзета-функция точно никак не поможет?

BarsMonster Jan 1 2013 at 20:39

Первый раз слышу, детали в студию :-)

Mrrl Jan 1 2013 at 20:46

Я уже всё забыл. Но она как-то использовалась для оценок количества простых чисел.

safinaskar Jan 2 2013 at 14:11

Не, дзета-функция не даёт точного количества простых. С её помощью асимптотики находят

madkite Jan 1 2013 at 20:45

Общих формул то может нет, но есть предподсчёт — те же формулы. А с таким слабым ограничением на входные данные и указанием, что тестироваться будет на числах, близких 2^30, его очень резонно делать.

ilyanik Jan 2 2013 at 08:08

Я бы оценивал по суммарному результату на N случайных числах (одинаковых для всех), двоичные логарифмы которых (с плавающей точкой) распределены равномерно в интервале [20,30]

ilyanik Jan 2 2013 at 09:11

А потом, для десятки лучших на ещё бОльшем количестве тестов.

michaelarshinov Jan 2 2013 at 16:54

Можно спросить почему Вы бы оценивали иначе? И где можно прочитать про метод подборки входных тестовых данных, вамиприведенный?

ilyanik Jan 2 2013 at 17:07

Дело в том, что заранее зная тесты, можно написать программу, эффективную именно для этого.

Например, программа, печатающая 454396537 независимо от ввода, победит в конкурсе программ, которые будут тестироваться только числом 100000.

michaelarshinov Jan 2 2013 at 17:28

Использовать словарь Вам не даст ограничение размера программы в Х байт, где Х равен, как я смею предположить, не больше 1-2К.

ilyanik Jan 2 2013 at 17:39

Я привёл радикальный пример — словарь не обязательно должен быть полным, чтобы давать хороший результат в заданной узкой области за счёт остальных возможных значений.

michaelarshinov Jan 2 2013 at 17:39

Ограничений нет, главное в 1024 байта уложитесь :-)

откоментировал BarsMonster, к тому же выше уже писали любители читов, что «ничего не выходит, мама что делать?».

Mrrl Jan 2 2013 at 17:04

Нет, лучше, чтобы равномерно были распределены сами числа. Иначе половина примеров окажется меньше 2^25, а там время практически нулевое.

ilyanik Jan 2 2013 at 17:08

Да, вы правы — обычное равномерное распределение лучше, а я перемудрил.

ilyanik Jan 2 2013 at 17:35

Ещё интересным был бы рейтинг «по худшему времени» — подозреваю, что после обфускации большинство решений легко укладываются в 1024 байта, поэтому для дальнейшего ускорения логично использовать таблицу предварительно вычисленных значений.

Тесты на небольшом наборе вводов могут легко превратиться в лотерею — и победит тот, кто лучше угадает с таблицей.

А вот если отсортировать участников по лучшему «худшему времени» на одном вводе и потом тщательно проверять лучших, найдя худшее время каждого.

michaelarshinov Jan 2 2013 at 17:43

С какой таблицей?

Mrrl Jan 2 2013 at 17:50

С таблицей предпросчитанных значений, судя по всему.