BarsMonster 1 янв 2013 в 00:00

Новогоднее хабра-соревнование по программированию-2013 (C++)

3 мин

47K

Спортивное программирование*C++*Алгоритмы*

+45

Комментарии 86

gribozavr 1 янв 2013 в 00:46

> в исполнении clang 3.1

А почему не 3.2?

BarsMonster 1 янв 2013 в 00:50

Потому что я пропустил релиз :-) Но замечание справедливое, изменил на 3.2.

grishkaa 1 янв 2013 в 00:57

Можно использовать ассемблерные вставки?

BarsMonster 1 янв 2013 в 00:59

Ограничений нет, главное в 1024 байта уложитесь :-)

safinaskar 1 янв 2013 в 01:04

Можно юзать pthread?

BarsMonster 1 янв 2013 в 01:12

Да.

gridem 1 янв 2013 в 01:37

Можно ли использовать С++11?

BarsMonster 1 янв 2013 в 01:42

Да, на всякий случай укажите свою версию libc++

VladVR 1 янв 2013 в 03:09

Сделал в студии — надеюсь прокатит и скомпилится.

-1

BarsMonster 1 янв 2013 в 03:13

Если код корректно написан, и не использует Microsoft-specific типов — то конечно прокатит.

VladVR 1 янв 2013 в 03:38

Не уверен __int64 микрософтовский или общий.
unsigned char еще использовал, два типа итого.

-1

EuroElessar 1 янв 2013 в 05:50

__int64 — майкрософтовский, надо использовать int64_t из стандарта плюсов

VladVR 1 янв 2013 в 12:42

Нда, поздно увидел поправку «для тех кто в студии». Два раза переотправлял. Так и хочется сказать — «не ругайсо, нащяльника». Ну да ладно.
Эхх, теперь до завтра ждать результатов. Особый, программистский накал страстей.

-1

nicolausYes 1 янв 2013 в 13:19

А можно просто писать long long?

safinaskar 1 янв 2013 в 14:06

Конечно, да :)

BelBES 1 янв 2013 в 03:33

OpenMP/TBB можно использовать?

BarsMonster 1 янв 2013 в 03:47

К сожалению, это уже выпадает за пределы стандартных библиотек.
Так что остаются средства pthreads/C++11

MrGobus 1 янв 2013 в 12:49

Вопрос, в приведенном пример учитывалось общее время работы программы вместе с вводом данных или только цикла расчета ???

safinaskar 1 янв 2013 в 14:06

Конечно, с вводом. Да и вообще, какая разница? Мы же читаем только одно число и пишем одно число

MrGobus 1 янв 2013 в 14:48

Ну как вам сказать, ввод числа руками, ввод из файла и константа это разные по времени обработки методы ввода. Например константа вообще не требует обработки, ввод из файла зависит от скорость диска и т.п. ввод руками вообще зависит от пользователя, (что если я пойду чайку хлебнуть а интер не нажму)
А время как мы видем идет на миллисекунды, это важно, надо либо обозначить как именно все должны делать ввод данных либо ваша time неочем.

dordzhiev 1 янв 2013 в 15:09

Ввод в данном случае не важен, т.к. важно время, занятое у ЦП (колонка user у time).

Mrrl 1 янв 2013 в 15:14

А с какой точностью оно измеряется? До 1 миллисекунды или хуже? И входит ли в него время на запуск программы?

dordzhiev 1 янв 2013 в 15:34

All times are measured in terms of the number of clock ticks used.

Получается измеряется в тиках
Насчет второго сказать ничего не могу, с никсами почти не имел дела.

deNULL 1 янв 2013 в 15:52

Колонка user считает суммарное время на каждом из 4-х ядер. Если распараллеливать, то значение получится в 4 раза больше реального.

shock_one 1 янв 2013 в 19:23

Если бы в условиях задачи программа должна была бы принимать число как параметр, никаких проблем бы не было бы.

BarsMonster 1 янв 2013 в 20:21

Очевидно, при тестировании руками никто ничего вводить не будет. :-)

shock_one 1 янв 2013 в 12:57

Напишите параметры, с которыми вы компилируете.

BarsMonster 1 янв 2013 в 20:37

clang++ --std=c++11 -O3 -pthread yourfile.cpp

ilnarb 1 янв 2013 в 13:24

Судя по ограничениям, можно использовать готовый массив простых чисел, если уложиться в 1024 байт?

namespace 1 янв 2013 в 13:33

Дядя, вы тут предсчетом не пролезете — 1024 байт = 1024 символов (а то и меньше). Там до 2^30 — не прокатит. Нужно писать блочное решето и генерировать числа в разных потоках, а вообще нужно подумать.

ilnarb 1 янв 2013 в 16:04

Нужно написать некоторый код, а на остатке байтов предподссчет засунуть, diff-кодирование.

aamuvirkku 1 янв 2013 в 14:49

Начнём с однопоточного решета. На Core i5 430UM 1200 Mhz в минуту уложился.

nicolausYes 1 янв 2013 в 15:05

Хм, у меня тест Миллера-Рабина на 2 в 30-ой степени в минуту не помещается.

nicolausYes 1 янв 2013 в 16:18

Хм, а решето Аткина, похоже, справляется.

ancalled 1 янв 2013 в 18:28

миллер-рабин тоже в минуту не уложился, а актин что-то с segfault-ом вылетает, может как-то от промежуточного массива избавиться или сократить, но ковыряться глубже сегодня сил нет никаких)

НЛО прилетело и опубликовало эту надпись здесь

ancalled 1 янв 2013 в 18:57

std::bitset-ом пользуетесь? у меня и на нем вылетает, где-то на 90 млн., гуглю…

ancalled 1 янв 2013 в 19:04

понял, на стеке большие массивы создавать больше не буду)

namespace 1 янв 2013 в 18:05

Попробуйте линейное решето Эратосфена — должно проходить.

aamuvirkku 1 янв 2013 в 18:36

Не надо подсказывать! По крайней мере сегодня.

namespace 1 янв 2013 в 19:29

Дак что тут из подсказки. Оно находится по запросу «решето эратосфена за линейное время» за 1 минуту. Просто такой вот тезис.

middle 1 янв 2013 в 18:44

Для 2³⁰-1?

aamuvirkku 1 янв 2013 в 18:50

Да.

НЛО прилетело и опубликовало эту надпись здесь

BarsMonster 1 янв 2013 в 20:39

habrahabr.ru/post/164515/#comment_5661887

madkite 1 янв 2013 в 17:09

> Побеждает тот, кто напишет самое быстрое решение
Время оценивается какое? Wall clock?

BarsMonster 1 янв 2013 в 20:41

Да, wall clock. Ввод перенаправляется из файла, потому ждать его не придется.

НЛО прилетело и опубликовало эту надпись здесь

BarsMonster 2 янв 2013 в 00:08

Маньячина, а теперь разархивированную версию ;-)

Mrrl 2 янв 2013 в 00:13

Я паковал 8 чисел, взаимно простых с 30 (от 30k+1 до 30k+29) в 1 байт. Выбивал числа так же умножая только на взаимно простые с 30, да еще запоминал таблицу умножения данного простого на числа 1..29 в системе счисления «сдвиг — бит». Плюс борьба с тем, чем массив c решетом не вмещался в кэш.
На i5 2.67МГц для N=10^9 время 0.65 сек.
Но это если решение вообще работает.

madkite 2 янв 2013 в 00:38

И даже на тесте 268588319 укладывается в секунду? ;)

НЛО прилетело и опубликовало эту надпись здесь

Mrrl 2 янв 2013 в 00:48

результат такой же, время 0.156 s (на i5)

НЛО прилетело и опубликовало эту надпись здесь

ilyanik 2 янв 2013 в 13:23

А в нечитаемом можно посмотреть? :)

Ещё мне кажется, что для i == 0 можно просто начать с res = (-1) + 2 + 3 + 5 + 7 + 11 + 13; и сэкономить немало байтов кода, например для бОльшей таблицы предподсчета.

Да и саму таблицу можно сделать эффективнее, вместо лестницы if-ов используя массив и цикл.

ilyanik 2 янв 2013 в 14:31

Правда надо будет отдельно обрабатывать N < 13, суммируя primes[j]

ilyanik 2 янв 2013 в 14:06

Ещё можно избавиться от относительно дорогого деления, заранее подсчитав:

k[j] = start_from / primes[j];

И после просеивания

k[j] -= block_size;

Не уверен, что улучшит, но вдруг :)

И ещё — просеивание можно делать до sqrt(i), а не до j < primes_count;

НЛО прилетело и опубликовало эту надпись здесь

ilyanik 2 янв 2013 в 14:28

Ну и распараллелить должно быть несложно.
Хотя ради этого придётся уменьшить таблицу, что в итоге может оказаться невыгодным.

madkite 2 янв 2013 в 01:02

gcc — это вообще другой разговор. Почти всё на gcc будет чуть быстрее. Зачем Вы спрашивали ключи компиляции тогда?
Просто на 268588319 у меня Ваше решение работает больше секунды (на 3,6ГГц) и раза в 3 медленнее, чем 2^30 — 1 (на clang 3.2 в linux x64 с флагом -O3) — из-за предподсчёта.

НЛО прилетело и опубликовало эту надпись здесь

dark1ight 2 янв 2013 в 01:05

написал так:
1) считаем простые числа в диапазоне от 1 до sqrt(n)
2) так как чисел всего 2^31, определяет рабочий интервал, для которого уже просчитана сумма чисел в предыдущем интервале. интервалов 16, в среднем надо просчитать от начала интервала до его середины. итого 1/32
3) считаем сумму оставшихся простых чисел в рабочем интервале, блочным решетом эратосфена с примитивными оптимизациями чётных значений.

блочное решето с примитивными оптимизациями работает на значениях 2^29 около 0,5 секунд. С предпросчётом от 0,01 до 0,05

NickLion 2 янв 2013 в 12:32

Совсем не понял зачем там G, D, F. Если их убрать, код уменьшится на 59 байт.

NickLion 2 янв 2013 в 12:42

PS и т.к. сказано, что тестироваться на Linux x86_64 будет, то int64_t можно было на long заменить. 3 байта всего, но может ещё что полезное поместится в суммарные 62 байта. :)

Mrrl 2 янв 2013 в 00:07

Какие прогнозы на лучшее время?
Думаю, 0.3-0.5 сек на тест.

BarsMonster 2 янв 2013 в 00:09

Думаю и 0.01 будет ;-)

Mrrl 2 янв 2013 в 00:15

Да, про явные формулы я забыл. Хакеры-математики, конечно, непобедимы.

BarsMonster 2 янв 2013 в 00:21

Нет-нет, формул тут никаких нет, кроме китайской теоремы об остатках (она максимум даст ускорение в 2-3 раза).

Mrrl 2 янв 2013 в 00:37

А дзета-функция точно никак не поможет?

BarsMonster 2 янв 2013 в 00:39

Первый раз слышу, детали в студию :-)

Mrrl 2 янв 2013 в 00:46

Я уже всё забыл. Но она как-то использовалась для оценок количества простых чисел.

safinaskar 2 янв 2013 в 18:11

Не, дзета-функция не даёт точного количества простых. С её помощью асимптотики находят

madkite 2 янв 2013 в 00:45

Общих формул то может нет, но есть предподсчёт — те же формулы. А с таким слабым ограничением на входные данные и указанием, что тестироваться будет на числах, близких 2^30, его очень резонно делать.

ilyanik 2 янв 2013 в 12:08

Я бы оценивал по суммарному результату на N случайных числах (одинаковых для всех), двоичные логарифмы которых (с плавающей точкой) распределены равномерно в интервале [20,30]

ilyanik 2 янв 2013 в 13:11

А потом, для десятки лучших на ещё бОльшем количестве тестов.

michaelarshinov 2 янв 2013 в 20:54

Можно спросить почему Вы бы оценивали иначе? И где можно прочитать про метод подборки входных тестовых данных, вамиприведенный?

ilyanik 2 янв 2013 в 21:07

Дело в том, что заранее зная тесты, можно написать программу, эффективную именно для этого.

Например, программа, печатающая 454396537 независимо от ввода, победит в конкурсе программ, которые будут тестироваться только числом 100000.

michaelarshinov 2 янв 2013 в 21:28

Использовать словарь Вам не даст ограничение размера программы в Х байт, где Х равен, как я смею предположить, не больше 1-2К.

ilyanik 2 янв 2013 в 21:39

Я привёл радикальный пример — словарь не обязательно должен быть полным, чтобы давать хороший результат в заданной узкой области за счёт остальных возможных значений.

michaelarshinov 2 янв 2013 в 21:39

Ограничений нет, главное в 1024 байта уложитесь :-)

откоментировал BarsMonster, к тому же выше уже писали любители читов, что «ничего не выходит, мама что делать?».

Mrrl 2 янв 2013 в 21:04

Нет, лучше, чтобы равномерно были распределены сами числа. Иначе половина примеров окажется меньше 2^25, а там время практически нулевое.

ilyanik 2 янв 2013 в 21:08

Да, вы правы — обычное равномерное распределение лучше, а я перемудрил.

ilyanik 2 янв 2013 в 21:35

Ещё интересным был бы рейтинг «по худшему времени» — подозреваю, что после обфускации большинство решений легко укладываются в 1024 байта, поэтому для дальнейшего ускорения логично использовать таблицу предварительно вычисленных значений.

Тесты на небольшом наборе вводов могут легко превратиться в лотерею — и победит тот, кто лучше угадает с таблицей.

А вот если отсортировать участников по лучшему «худшему времени» на одном вводе и потом тщательно проверять лучших, найдя худшее время каждого.

michaelarshinov 2 янв 2013 в 21:43

С какой таблицей?

Mrrl 2 янв 2013 в 21:50

С таблицей предпросчитанных значений, судя по всему.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Показать лучшие за всё время

Новогоднее хабра-соревнование по программированию-2013 (C++)

Комментарии 86

Публикации

Истории