Как стать автором
Обновить

Data Mining Cup 2011

Время на прочтение2 мин
Количество просмотров3.7K
Хотелось бы рассказать про соревнованию по анализу данных, которое скоро начнется. Полная информация про него может быть найдена на официальном сайте. В соревновании могут участвовать только студенты, поэтому если Вы студент и Вас интересует анализ данных – то вы можете зарегистрироваться (email можно использовать обычный, а не университетский, если такого нет) и поучаствовать.
Дальше Вы найдете расписание конкурса, основные правила этого соревнования. Так же ссылку на условия предыдущих лет (для тренировки и тех, кто уже не студент).

Расписание конкурса DMC 2011
Событие Местоположение Дата
Начало регистрации на соревнование DMC 2011 online 01 Марта 2011 по 31 Мая 2011
Начало соревнований DMC 2011 online 15 Апреля 2011
Последняя дата отсылки результатов DMC 2011 online 31 Мая 2011
Награда победителей DMC 2011 Pentahotel Leipzig, Germany 21 Июня 2011 по 22 Июня 2011
Основные правила:
  1. Участвовать могут только студенты
  2. Максимум 2 команды от университета.
  3. Регистрирует глава команды, он же ответственный за всю команду, и будет получать награду в случае выигрыша.
  4. Ограничений на размер команды нет
  5. Призы:
    • 1 место — 2500 EUR
    • 2 место — 1500 EUR
    • 3 место — 1000 EUR
Остальные правила менее значительны (или относятся к выше приведенным датам) можно найти по ссылке.

Условий, как Вы поняли из расписания, ещё нет, поэтому для подготовки, или для тех, кто уже не студент, но интересуется, предлагаю посмотреть условия предыдущих лет.
К примеру я работал с данными DMC 2006. Эти данные были по продажам IPod на eBay в немецком секторе. И нужно было построить модель, которая бы определяла был ли продан бид выше или ниже средней цены в категории. Самый сок был в анализе текстовой переменных TITLE и SUBTITLE – в которых и хранилась различная информация, а текст сам был с опечатками, без четкого формата.
Я занимался с этими данными некоторое время – и лучшее, что я получил с помощью Gradient Boosting, было №8 место. Если интересно, могу написать более подробную статью о том, что я делал и как.
Теги:
Хабы:
Всего голосов 15: ↑14 и ↓1+13
Комментарии10

Публикации

Истории

Работа

Data Scientist
79 вакансий

Ближайшие события

15 – 16 ноября
IT-конференция Merge Skolkovo
Москва
22 – 24 ноября
Хакатон «AgroCode Hack Genetics'24»
Онлайн
28 ноября
Конференция «TechRec: ITHR CAMPUS»
МоскваОнлайн
25 – 26 апреля
IT-конференция Merge Tatarstan 2025
Казань