sannikovdmitry Dec 13 2018 at 17:06

HighLoad Cup #2. Чемпионат для backend-разработчиков снова в строю

7 min

16K

VK corporate blogHigh performance*Programming*Website development*Sport programming*

+54

Comments 37

sat2707 Dec 13 2018 at 17:13

Огонь!

freezlite Dec 13 2018 at 17:20

3 приза на ~449 человек

sannikovdmitry Dec 13 2018 at 17:20

почему 3? шесть же, как и было

freezlite Dec 13 2018 at 17:25

невнимателен, прошу прощения.

SuperKozel Dec 13 2018 at 21:12

топовые решения будут опубликованы/разобраны?

sannikovdmitry Dec 14 2018 at 00:10

Мы очень попросим участников :)

morozovsk Dec 14 2018 at 01:09

Хотелось бы попробовать новый стек, но боюсь что размер данных будет небольшой, всё влезет в память как в прошлом году и в подходах особо ничего не изменится.

sannikovdmitry Dec 14 2018 at 01:32

На данный момент в бете 810 мб, но с 21 числа будет совсем другая цифра.

Dju Dec 14 2018 at 09:27

Про фильтрацию и группировку вопросов нет, а как вы будете оценивать корректность ответа на запросы /recomnend и /suggest?

snizovtsev Dec 14 2018 at 10:05

На сайте описаны запросы подробнее, /suggest там определён однозначно. А вот про recommend совсем непонятно — то ли нужно отсортировать лексикографически по 4м параметрам, то ли возможен более творческий подход.
И ко всем запросам, включая фильтраци и сортировку — как оцениваются возможные различия из-за конфликтов GET-POST, ведь как там написано — танк посылает запросы в нескольких TCP сессиях параллельно?

Dju Dec 14 2018 at 10:55

понадобилось время чтобы найти правила https://highloadcup.ru/media/condition/accounts_rules.html

sannikovdmitry Dec 14 2018 at 13:57

Сегодня правила найти будет очень просто

vanxant Dec 14 2018 at 10:06

Ребят, и сразу вопрос — вы там фамилию запрашиваете при регистрации. Без условий и прайвеси полиси. Как там у вас с персональными данными, 152-ФЗ и вот этим вот всем? Входит ли в обязательные условия участия подписка на пожизненный персонализированный спам от партнёров мейл.ру?

sannikovdmitry Dec 14 2018 at 13:56

Оууу, ты прав. Добавим соглашение об обработке сегодня же. Оно у нас стандартное для всех проектов чемпионатов. Ознакомиться можно здесь https://mlbootcamp.ru/static/core/files/agreement.pdf. Для HighLoad Cup тоже самое)

sannikovdmitry Dec 14 2018 at 14:16

и персонализированного спама не ждите!!! :)

voidnugget Dec 14 2018 at 11:21

А можно без контейнеров, а то это совсем несерьёзный HighLoad получается ?

Q2W Dec 14 2018 at 11:59

А расскажите про оверхед контейнеров.
А то нынче все эти docker'ы в моде.

voidnugget Dec 14 2018 at 12:55

Оверхед сейчас в основном в persistence/network layer'aх, OverlayFS до сих пор радует, надо менять на что-то DPDK/SPDK совместимое, иначе этот весь лощёный Highload не более чем масштабирование простоя процессора. В целом, наличие Control Group'ы и соответствующих namespace'ов тоже даёт overhead, он почти такой-же как и от KVM'a сейчас...

Вряд ли они используют sriov для выполнения DPDK драйверов… С SPDK ситуация сейчас посложнее и готового решения для blobfs нету, ContainerD пока не поддерживает pluggable storage.

Лучшим примером DPDK приложения сейчас можно назвать ScyllaDB, по сравнению с ней все местные поделки на golang'e по 200К RPS выглядят довольно блекло.

snizovtsev Dec 14 2018 at 13:31

Да до DPDK в прикладных задачах вроде этой как до луны, там упрёшься в алгоритмы и структуры данных (диск/cpu/память) раньше чем в IO. В суровом продакшен энтерпрайзе до асинхронщины-то с epoll часто не доходит, хватает просто кучи preemptive тредов.

voidnugget Dec 14 2018 at 13:52

там упрёшься в алгоритмы и структуры данных (диск/cpu/память) раньше чем в IO

Я думаю мне не стоит это комментировать, но действительно, многих и масштабирование простоя железа устраивает, и сопутствующий ClusterFuck тоже вроде как норм… слишком много притворства и невежества, к жизнеспособности решений отношения особо не имеет. Это как шутка про профилирования питона в Uber'e...

В суровом продакшен энтерпрайзе до асинхронщины-то с epoll часто не доходит

Обычно уже решено на уровне каких-то netty/jetty/uvloop/libev etc.

sannikovdmitry Dec 14 2018 at 13:53

А почему не хотите контейнеры?

voidnugget Dec 14 2018 at 13:56

На контейнерах 200-300К RPS потолок, на DPDK/SPDK 2-6M RPS потолок…
По этому подобные условия соревнований особо серьёзно не воспринимаю.

UFO just landed and posted this here

sannikovdmitry Dec 14 2018 at 13:52

Сегодня будет там все самое необходимое по новому чемпионату.

gturk Dec 14 2018 at 17:29

Рейтинг решения рассчитывается так: берем время всех верных ответов, которые успел дать API во время обстрела, прибавляем штрафное время за каждый неправильный ответ или запрос, ответ на который мы не смогли получить (штрафное время всегда равно общему таймауту запроса).

Тоесть не важно ответил ты правильно или нет — всёравно рейтинг посчитается как сумма ответов? Только в случае верного ответа это назовётся «временем ответа», а в случае ошибочного — «штрафом»
Можно на каждый запрос отвечать сразу return 200 c задержкой в 20ns

evnuh Dec 14 2018 at 17:50

Логично, что нет. Штрафное время = таймауту, аля 30с, или что-то типа этого.

aangairbender Dec 15 2018 at 03:37

Из Украины не заходит на сайт (при том что сайт другого Вашего чемпионата — RAIC прекрасно работает). Хотелось бы поучаствовать, но для этого нужно заморачиваться с обходом блокировки. Будет ли эта проблема как-то решаться?

sannikovdmitry Dec 15 2018 at 03:41

Ого… Обязательно проверим, но я думаю, что это нужно задать вопрос вашему провайдеру — почему оно так.

VanquisherWinbringer Dec 15 2018 at 11:38

Елки палки, надеюсь кто — то сделает там решение на Rust. Сам я к сожалению, не обладаю пока что для этого должным уровнем навыков. Только опозорю технологию, почем зря. А вообще да, как выше уже говорили, тестировать производительность в докер контейнерах это такое себе.

rfq Dec 16 2018 at 14:09

" Перед началом обстрела у пользовательского решения есть несколько минут (точное количество зависит от задачи), чтобы обработать данные из полученного JSON-файла. "
Никак не могу найти, каким образом получать JSON-файл. Я уже сделал контейнер, который при запуске разворачивает http сервер. В него что-то надо добавить?

AterCattus Dec 16 2018 at 16:54

Отсюда highloadcup.ru/media/condition/accounts_rules.html

После запуска контейнера в папке /tmp/data будет доступен файл data.zip с архивированными «боевыми» данными (примерно 10 MB данных для предварительного и 1 GB для полного обстрела). Обратите внимание, что каталог /tmp/data доступен только для чтения, поэтому решение должно загружать архив в ОЗУ для обработки. В самом архиве будут лежать файлы с названиями вида «accounts_<номер файла>.json». Внутри таких файлов — валидные данные в формате JSON.

Пример такого файла можно взять тут highloadcup.ru/ru/round/3 (раздел «Тестовые данные»)

Dju Dec 17 2018 at 06:39

а что за файл options.txt в архиве data.zip?

AterCattus Dec 17 2018 at 14:49

Этот файл лежит в архиве рядом с *.json файлами. Из него (его первой строки) нужно получать время генерации датасета, чтобы запрос с today/now работали корректно.

nagayev Oct 31 2019 at 18:24

Будет в 2019?

nagayev Oct 31 2019 at 18:25

Или уже был?
Хотелось поучаствовать

DarkCoder May 3 2020 at 00:19

Будет в 2020? :)

voidnugget May 24 2020 at 17:39

Без DPDK/SPDK смысла участвовать особо то нет...