Как стать автором
Обновить

Комментарии 5

С чем связано ограничение фактора в RandomForest на 32 уровня фактора и как обходится?
Обходится легко — трансформацией факторов в дамми (0,1) переменные.
Это я понимаю, но вопрос зачем введено такое ограничение?
Это связано с реализацией алгоритма случайного леса в R,
он раскладывает датасет на все комбинации, а их число 2^N,
очевидно, что с ростом N вычислительная сложность слишком велика,
поэтому и введено данное ограничение.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий