Найти бозон Хиггса может каждый!


    12 мая ЦЕРН объявил «Higgs Boson Machine Learning Challenge», конкурс на лучший алгоритм по поиску событий с участием бозона Хиггса в наборе экспериментальных данных. Конкурс продлится до 15 сентября, победителей ждут денежные призы от $2000 до $7000. Удачное решение может быть интегрировано в реальный процесс обработки данных с детектора ATLAS. Для участия в конкурсе не нужны специальные знания в физике элементарных частиц.

    Бозон Хиггса в Большом адронном коллайдере детектируют не непосредственно, а по продуктам распада. Протоны огромной энергии сталкиваются в центре детектора. В процессе столкновения может родиться бозон Хиггса, который за короткое время распадается на другие частицы. По предсказаниям стандартной модели самый популярный канал распада — на пару кварков B и анти-B. В конкурсе предлагается сосредоточиться на более редких событиях, когда бозон Хиггса распадается на тау-лептон и антитау-лептон. Так как эти лептоны тоже быстро распадаются по различным каналам, детектор «видит» лишь продукты их распада. Однако подобный набор продуктов распада может получиться множеством других способов, поэтому многие события образуют фон и, чтобы изучать именно бозон Хиггса, надо отличать события с бозоном от фона.

    В коллайдере происходит огромное количество столкновений, поэтому очень важно быстро и качественно отличать интересные события от неинтересных по данным с детектора. Этим и предлагается заняться конкурсантам.

    Каждое событие описывается тридцатью числами, из которых 17 — непосредственные данные с детектора, а 13 — производные величины, вычисленные по сырым данным, которые по мнению экспертов могут оказаться полезными для предсказания. Среди сырых данных, например, PRI_tau_pt — перпендикулярная компонента импульса детектированного «адронного тау» (тау-лептона, восстановленного по адронному каналу распада). Среди производных, например, DER_mass_MMC — оценочная масса бозона Хиггса, который мог с наибольшей вероятностью сгенерировать это событие (если там вообще был бозон Хиггса). Полное теоретическое описание параметров приводится в специальной статье, хотя, возможно, не стоит её читать, чтобы подойти к задаче с незашоренным взглядом.

    Участникам предлагается обучающий набор из 250 тысяч событий, для которых известно, являются они сигналом или шумом, и предлагается классифицировать 550 тысяч заранее известных контрольных событий. Результаты будут оцениваться по формуле, учитывающей количество правильных и неправильных ответов. Чтобы затруднить подгонку результатов, вам не сообщается точный результат проверки: до окончания конкурса проверка ведётся на случайном поднаборе размером 18% от контрольной выборки.

    Участники могут объединяться в команды до четырёх человек и посылать до пяти решений за сутки. Можно обсудить подходы к решению на форуме. Для проверки вашего решения достаточно послать файл с предсказаниями: загружать исходники можно уже потом, если будете претендовать на приз.

    Авторы трёх лучших решений получат денежные призы: $7000, $4000 и $2000. Также коллаборация ATLAS выберет команду победителей, решение которой наилучшим образом будет подходить для использования в эксперименте (с учётом производительности, надёжности и других параметров). Эта команда будет приглашена в ЦЕРН для встречи с коллаборацией ATLAS (с покрытием транспортных расходов).
    Поделиться публикацией
    Комментарии 22
      +10
      Найти бозон Хиггса может каждый!
      Физика*, Программирование*, Спортивное программирование*
        0
        «Каждый на хабре» наверное
        0
        Что-то маловато платят за такой труд.
          +6
          Иными словами, строчки в учебниках по физике вам мало.
            –4
            Зачем нужна эта строчка в учебнике?
              +1
              Мне — нужна :). Жаль что ее пока не за что писать.
            +2
            Не надо преувеличивать значимость контеста) С точки зрения каглей, история про Бозон Хиггса — это красивая и ничего не значащая легенда. Топовые участники уже давненько все задачи решаются путем построения «правильного» стека классификаторов, результаты которого не всегда имеют какой-то практический смысл, вместо анализа предметной области и тд и тп.
              0
              Если анализ предметной области приносит результат, его тоже вероятнее всего кто-то сделает.
                +1
                С точки зрения «кегля» это все равно забавно, там дали названия факторов у которых есть физический смысл, а не просто назвали «factorXXX» и дали несколько сотен факторов (как в конкурсе про страхование)
                +3
                Ньютон вообще бесплатно работал!
                  –1
                  Это не так. Он получал большое жалование, будучи профессором Кембриджа и впоследствии президентом Королевского общества.
                    0
                    Исаак Ньютон тратил кучу времени занимаясь наукой, а жалование получал не за исследования, а за статус как ученого. Не путайте финансирование ученой деятельности и оплату служебного положения.
                      +1
                      Вы написали, что он работал бесплатно, не уточнив при этом, за что именно он не получал жалование. Очевидно, что исполнение обязанностей профессора срач с Гуком и президента Королевского общества — это очень много работы, помимо формального статуса.
                  0
                  Вполне обычные призы для kaggle.
                  кегль геймифицирован и там «расплачиваются» очками, а денежные призы как небольшой бонус к первым местам.
                  +5
                  Почувствуй себя огромной нейронной сетью: нужно будет загрузить выборку из 250 тыс результатов и прогнать «через себя» оставшиеся 550 тыс. За $7000
                    +1
                    Почему «через себя». Попробуйте алгоритмизировать. Применить те же нейронные сети…

                    Суммы не большие, т.к. при высокой оплате может случится, что внутренняя мотивация (желание найти) подменяется внешней (желание заработать). По этому суммы чисто символические.
                      +1
                      Думаю, что настоящая причина такой скромности награды в том, что организаторы конкурса ориентируются на студентов, что выглядит вполне здравой идеей.
                      0
                      не получится)

                      даже если Ваш результат будет «in the money» нужно будет код представить который получает ваши результаты…
                        0
                        Или отдать свой мозг
                      +2
                      Начал ковыряться в конкурсе.

                      Данные которые висят на конкурсе — это не «экспериментальные данные», а симуляции…

                      "Using simulated data with features characterizing events detected by ATLAS, your task is to classify events into «tau tau decay of a Higgs boson» versus «background.»

                      А вот победителю может быть и дадут побаловаться с реальными данными…

                      «The winning method may eventually be applied to real data and the winners may be invited to CERN to discuss their results with high energy physicists.»
                        –1
                        image
                          –2
                          Ждем:
                          «Находим Бозон Хиггса на JavaScript (30 строк кода)»

                          Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                          Самое читаемое