qc-enior 22 июл 2016 в 11:56

Лучшие пакеты для машинного обучения в R, часть 2

6 мин

11K

Блог компании Инфопульс УкраинаR*Машинное обучение*

Перевод

+12

Комментарии 5

danaki 29 июл 2016 в 15:01

С чем связано ограничение фактора в RandomForest на 32 уровня фактора и как обходится?

atikhonov 1 авг 2016 в 11:30

Обходится легко — трансформацией факторов в дамми (0,1) переменные.

danaki 2 авг 2016 в 17:16

Это я понимаю, но вопрос зачем введено такое ограничение?

atikhonov 3 авг 2016 в 09:27

Это связано с реализацией алгоритма случайного леса в R,
он раскладывает датасет на все комбинации, а их число 2^N,
очевидно, что с ростом N вычислительная сложность слишком велика,
поэтому и введено данное ограничение.

yorko 3 авг 2016 в 18:26

У Xgboost есть обертка под R. А сия реализация идей Фридмана плюс десяток эвристик — это лучшее, что существует на сегодняшний день. Раз уж вы на Kaggle ссылаетесь.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий