Комментарии 3
Есть в беклоге аналогичная идея для задач в рамках своей команды, но чуть более сложная:
добавьте еще параллельно построение леса для оценки важности признаков по которым строите свое дерево и уже по оценке важности через лес ранжируйте результат сегментации деревом.
Дерево - слабый классификатор, а лес уже посерьёзнее будет, поэтому его feature_importance предпочтительнее.
Можно еще построить деревья на разных подмножествах предикатов, выбрать те, где хорошее качество, а среди них выбрать то, где очередность признаков в иерархии ветвления больше соответствует важности признаков по feature_importance ранее рассчитанного леса.
Будет ли сервис выложен в опенсорс? Хотелось бы запустить у себя!
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Сегментация данных — это не больно. Применяем ML-модели в аналитике