All streams
Search
Write a publication
Pull to refresh
41
0
Стыценко Илья @sat2707

Пользователь

Send message
Видим, что пригорает :)
Всем не угодишь, к сожалению. Мы рассматривали вариант дать прям живых тачек, отказались от него по понятным причинам
В первом чемпионате мы решили эту проблему за вас — первая фаза это readonly-запросы, вторая — post с редактированием/добавлением данные, третья — снова get-запросы
нет, чемпионат состоит ровно из одного раунда. возможно мы добавим еще немного факультативных раундов (для желающих посложнее например). но перечисленные 6 призов — по результатам одного раунда
напишем конечно. верю, что вам не менее интересно, чем нам
Несколько. Процитирую с сайта:

Перед обстрелом запланировано 180 секунд ожидания для того чтобы решение участника могло проанализировать переданные тестовые данные и подготовиться к обстрелу.
180 секунд длится первая фаза с линейным профилем от 1 до 200 RPS.
120 секунд длится вторая фаза с постоянным профилем в 100 RPS
120 секунд длится третья фаза с линейным профилем от 200 до 2000 RPS.
Дааа! Всё это у нас в планах :) Просто в первом, тестовом чемпионате мы не стали так упарываться. Чтобы, во-первых, порог входа, а во-вторых, сложность отладки для нас самих. Сами знаете, как это бывает :)
Но упороться очень хочется! Если первый чемпионат пройдет хорошо, обязательно обмеряем и durability, и распределенные игрища, и контейнеры будет рандомно шатдаунить, чтобы посмотреть на балансировку…
Короче, у нас много веселых идей, но все они не для первого запуска, поэтому и делаем пока что вот такой странный хайлоад, который больше просто про нормальный backend :)
Наверное логичнее это воспринимать как нулевой километр города, да :)
Город -> Достопримечательность -> Визит < — Юзер
Что-то такое

Некоторые участники пишут кастомные плюсовые велосипеды :)
Так что возможно нас всех ждет сюрприз. В любом случае, очень интересно какой стек попадет в топ

Да, именно так. У нас там есть Москва внутри Аргентины, Кремль в 100 км от Москвы, 130-летние люди, все это посещающие… Это все прелести генеренных тестовых данных, отнеситесь к ним с юмором :)

Принято. Если этот пилотный чемпионат взлетит — до следующего проведения подумаем о пороге входа с точки зрения докера )
Честно говоря, с докером и так много повоевали, на compose просто сил не хватило. А с compose мы получили бы какое-то убер-преимущество?
А мне кажется, за месяц все успеют и чистку датасета расковырять, и собственно саму модель
Ну если рассуждать логически и представить себе оцифровку медкарты, то скорее можно ожидать ошибку ввода любых параметров, _исключая_ наличие ССЗ :)
Честно говоря, я совсем не силен в медицине. Но вот как я на это смотрю:
Естественно, ни один врач не поставит диагноз лишь по этим 11-ти параметрам (были еще анализы, анамнез, в конце концов интуиция специалиста). И возможно, что у пациента были какие-то еще причины заинтересоваться состоянием своего здоровья, помимо простой диспансеризации.
Но так или иначе, вот мы имеем 100 тысяч пациентов, о которых мы знаем ровно 11 параметров и точно знаем факт наличия ССЗ после доп.исследований (если я вас верно понял, факт отсутствия ССЗ мы даже в этом случае можем знать лишь условно?). Почему бы не исследовать возможные корреляции. Конечно, вряд ли мы сразу же на выходе получим модель предсказания группы риска, подходящую для всех и каждого (я наконец-то понял смысл вашего первого комментария о «выборка далека от среднего человека»). Но с чего-то нужно начинать, я уверен, что результаты будут интересны :)
Кроме того, возможно чемпионат выявит DS-специалистов, заинтересовавшихся именно этой тематикой и желающих работать дальше именно в этом направлении.
По правилам чемпионата, участники из топ-10 присылают решения для валидации (грубо говоря, «проверка на списывание»).
Но решения участников принадлежат участникам.
Не, на самом деле есть куча причин, по которым человеку могут измерить рост, вес, глюкозу итп. Та же диспансеризация, к примеру, так что выборка довольно репрезентативная
Нет, честное слово, ничего не портили. Просто не чистили, дали как есть :)
А поделено равномерно. То есть, да, в тестовом должны сработать все те же ухищрения по чистке датасета
Нет, специально мы данные не портили. Но мы специально не стали их чистить :)
Довольно сложно собрать 100 x 100k. Мы бы с удовольствием, но… К тому же, не всё разрешено обнародовать
Доброго дня! Мы не испытываем в них недостатка, но если есть желание показать — можно в личку, посмотрим :)

Information

Rating
Does not participate
Location
Москва и Московская обл., Россия
Works in
Date of birth
Registered
Activity