Обновить

Комментарии 5

С чем связано ограничение фактора в RandomForest на 32 уровня фактора и как обходится?
Обходится легко — трансформацией факторов в дамми (0,1) переменные.
Это я понимаю, но вопрос зачем введено такое ограничение?
Это связано с реализацией алгоритма случайного леса в R,
он раскладывает датасет на все комбинации, а их число 2^N,
очевидно, что с ростом N вычислительная сложность слишком велика,
поэтому и введено данное ограничение.

У Xgboost есть обертка под R. А сия реализация идей Фридмана плюс десяток эвристик — это лучшее, что существует на сегодняшний день. Раз уж вы на Kaggle ссылаетесь.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Информация

Сайт
www.infopulse.com
Дата регистрации
Дата основания
1992
Численность
1 001–5 000 человек
Местоположение
Украина