Насколько я понял из раздела кернелов, результаты ближе к топу получаются не каким-то тщательным анализом данных и составлением признаков, а тюнингом и комбинацией моделек/их результатов. От .79 можно получить просто посчитав среднее арифметическое предсказаний xgboost и lightgbm, выше по всей видимости в дело идет стэкинг.
Также было бы интересно почитать, как в этой задаче может показать себя Catboost. По заверениям ребят из Yandex он должен чуть ли не лучше всех проявлять себя в таких задачах, но вот лично у меня не получилось его «приготовить».
Абсолютно некорректно сравнивать детерминированные алгоритмы и результаты решения задач оптимизации. Математический аппарат машинного обучения по большому счету говорит лишь о том, как алгоритмы сходятся и сходятся ли вообще, а повышение точности предсказаний использованием комбинаций этих алгоритмов — лишь инженерный трюк.
Недавно предложили выполнить тестовое, рассчитанное на два полных рабочих дня, за (внимание) два дня. Впрочем, это научный стартап с требованиями к образованию и умениям, постоянными публикациями и, судя по всему, хорошим финансированием, поэтому требуется высокая мотивация сотрудников. Но в любом случае это попахивает поиском готовых работать много и за бесплатно.
Насколько я понял из раздела кернелов, результаты ближе к топу получаются не каким-то тщательным анализом данных и составлением признаков, а тюнингом и комбинацией моделек/их результатов. От .79 можно получить просто посчитав среднее арифметическое предсказаний xgboost и lightgbm, выше по всей видимости в дело идет стэкинг.
Также было бы интересно почитать, как в этой задаче может показать себя Catboost. По заверениям ребят из Yandex он должен чуть ли не лучше всех проявлять себя в таких задачах, но вот лично у меня не получилось его «приготовить».
Уровень middle/senior за 3 месяца и 40к рублей — звучит как абсолютная чушь.
А почему не senior?