В рамках конкурса Shifts Challenge мы выкладываем в открытый доступ крупнейший в мире датасет для обучения беспилотных автомобилей, а также данные Яндекс.Переводчика и Погоды. Приглашаем исследователей в области машинного обучения присоединиться к поиску решения проблемы сдвига распределения данных в реальном мире по отношению к тому, с чем моделям приходится иметь дело при обучении.
Меня зовут Андрей Малинин, я старший исследователь в Yandex Research. Сегодня я расскажу о проблеме, о наших датасетах, а также о конкурсе, который мы проводим в рамках международной конференции NeurIPS 2021 совместно с учеными из Оксфордского и Кембриджского университетов.
Международный коллектив исследователей и практиков Shifts Project запускает соревнование Shifts Challenge 2022, рассказали Хабру в пресс-службе мероприятия. В рамках конкурса опубликованы датасеты по оценке потребления топлива в грузовых морских перевозках и сегментации очагов рассеянного склероза в трёхмерной магнитно-резонансной томографии. В таких областях риск несоответствия данных особенно высок, а датасеты помогут учёным исследовать эту проблему. Исследователи в области машинного обучения должны найти решение проблемы сдвига распределения данных в реальном мире по отношению к тому, с чем моделям приходится иметь дело при обучении.