Хотелось бы рассказать про соревнованию по анализу данных, которое скоро начнется. Полная информация про него может быть найдена на официальном сайте. В соревновании могут участвовать только студенты, поэтому если Вы студент и Вас интересует анализ данных – то вы можете зарегистрироваться (email можно использовать обычный, а не университетский, если такого нет) и поучаствовать.
Дальше Вы найдете расписание конкурса, основные правила этого соревнования. Так же ссылку на условия предыдущих лет (для тренировки и тех, кто уже не студент).
Расписание конкурса DMC 2011
Основные правила:
Условий, как Вы поняли из расписания, ещё нет, поэтому для подготовки, или для тех, кто уже не студент, но интересуется, предлагаю посмотреть условия предыдущих лет.
К примеру я работал с данными DMC 2006. Эти данные были по продажам IPod на eBay в немецком секторе. И нужно было построить модель, которая бы определяла был ли продан бид выше или ниже средней цены в категории. Самый сок был в анализе текстовой переменных TITLE и SUBTITLE – в которых и хранилась различная информация, а текст сам был с опечатками, без четкого формата.
Я занимался с этими данными некоторое время – и лучшее, что я получил с помощью Gradient Boosting, было №8 место. Если интересно, могу написать более подробную статью о том, что я делал и как.
Дальше Вы найдете расписание конкурса, основные правила этого соревнования. Так же ссылку на условия предыдущих лет (для тренировки и тех, кто уже не студент).
Расписание конкурса DMC 2011
Событие | Местоположение | Дата |
Начало регистрации на соревнование DMC 2011 | online | 01 Марта 2011 по 31 Мая 2011 |
Начало соревнований DMC 2011 | online | 15 Апреля 2011 |
Последняя дата отсылки результатов DMC 2011 | online | 31 Мая 2011 |
Награда победителей DMC 2011 | Pentahotel Leipzig, Germany | 21 Июня 2011 по 22 Июня 2011 |
- Участвовать могут только студенты
- Максимум 2 команды от университета.
- Регистрирует глава команды, он же ответственный за всю команду, и будет получать награду в случае выигрыша.
- Ограничений на размер команды нет
- Призы:
- 1 место — 2500 EUR
- 2 место — 1500 EUR
- 3 место — 1000 EUR
Условий, как Вы поняли из расписания, ещё нет, поэтому для подготовки, или для тех, кто уже не студент, но интересуется, предлагаю посмотреть условия предыдущих лет.
К примеру я работал с данными DMC 2006. Эти данные были по продажам IPod на eBay в немецком секторе. И нужно было построить модель, которая бы определяла был ли продан бид выше или ниже средней цены в категории. Самый сок был в анализе текстовой переменных TITLE и SUBTITLE – в которых и хранилась различная информация, а текст сам был с опечатками, без четкого формата.
Я занимался с этими данными некоторое время – и лучшее, что я получил с помощью Gradient Boosting, было №8 место. Если интересно, могу написать более подробную статью о том, что я делал и как.