Eugene713 Mar 24 2017 at 22:11

Соревнование mlbootcamp от mail.ru. Кратко о рецепте второго места

9 min

11K

Python*Machine learning*

+35

Comments 10

ServPonomarev Mar 25 2017 at 04:56

По поводу алгоритма отбора квадратичных фич, который неделю грел комнату. Вполне можно ожидать, что некоторые фичи сами по себе не играют, но заиграют в связке с другими. Отбрасывание не улучшающих результат фич навечно рубит возможность найти подобные играющие пары и ансамбли фич. Этот процесс, в принципе, похож на градиентный спуск, только осуществляемый в пространстве фич (подключена/отключена). Надо возвращаться и снова пробовать отброшенные фичи после некоторого числа шагов спуска.

romanegunkov Mar 25 2017 at 05:40

Сами обучающие данные можно у себя поделить на обучающие и тестовые, тогда можно оценить работу метрик и отловить момент переобучения без выполнения сабмита на сервер с ограничением 5 в день. Вы это использовали?

devpony Mar 25 2017 at 08:21

кросс-валидируйтесь

romanegunkov Mar 25 2017 at 09:44

Кросс-валидация даже лучше, если по ресурсам подходит.

QtRoS Mar 25 2017 at 08:22

Спасибо моей девушке за терпение и еще раз терпение)

Жизненно…

markhor Mar 25 2017 at 08:57

Вот я не понимаю, честно. Какой смысл упарываться ради 0.1-1%? В продакшне на котором миллионы сэмплов франкенштейн-ансамбль не применишь, в нем может и VW будет по швам трещать. Какая разница в логлоссе между линрегом на one hot encoding-е и супер навроченным ансамблем? Кому это нужно?

ServPonomarev Mar 25 2017 at 09:08

реклама себя любимого, призовой фонд, строчка в резюме.

Eugene713 Mar 25 2017 at 09:29

В продакшене все по другому, статья не про продакшен. Соревнование — оно для того и соревнование, чтобы упарываться.

tyamgin Mar 25 2017 at 10:28

кратко о рецепте второго места

О рецепте стабильного второго места.
Поздравляю с дублем!

gaploid Mar 25 2017 at 11:55

А сколько получилась точность предсказания модели, что человек «выйдет из игры»? В каком-нибудь более понятном показателе, а то я не очень понимаю этот Log loss. Простите за болванство.