На здоровье, ну а касательно точности и рейтингов, судя по тому, что там у лидеров точность прогноза 100%, то видимо, все пути идеально предсказать данные, наверняка известны, так что пример, скорее нужен чтобы поверить себя и как раз «покрутить фичи» :)
где-то был неодобренный комментарий про обучение на полной выборке для повышения качества (пока отвечал он пропал), но свой ответ оставлю.
ну это само собой, но тут существенно можно поднять качество если например, вместо 1 дерева применить лес деревьев, поэтому данные важны, но и из алгоритма обучения еще вполне можно что-то выжать. Просто это не было целью статьи.
«Айсберг вместо Оскара!» или как я пробовал освоить азы DataScience на kaggle