Data Scientist
Привет!
Про ML модели рассказали подробно, но почему-то не рассказали, как хорошо все эти модели решают конечную задачу прогнозирования CLV из заголовка.
У нас в плане ещё статьи про CLTV, где будет рассказано как используются прогнозы ML-моделей.
Если не секрет, расскажите каких объёмов получаются обучающие выборки?
Порядка 15 миллионов строк.
Почему используете catboost, а не бустинги на спарке?
Пока руки не дошли попробовать бустинги на спарке. Поэтому сэмплируем репрезентативную выборку и обучаем catboost.
Привет!
У нас в плане ещё статьи про CLTV, где будет рассказано как используются прогнозы ML-моделей.
Порядка 15 миллионов строк.
Пока руки не дошли попробовать бустинги на спарке. Поэтому сэмплируем репрезентативную выборку и обучаем catboost.