Комментарии 1
Высокая разрежённость (низкая плотность) данных. Значительная доля фичей
, у большинства пользователей будет иметь нулевые (или же пустые) значения, что негативно скажется на обобщающих способностях моделей и возможном переобучение.
В статье пару раз упоминается разреженность фичей. Вопрос: это проблема какого-то конкретного датасета? Или есть какая-то специфика в построении фичей для аплифта, которая и приводит к разреженности?
Кажется, что разреженность фичей - это характеристика которая разнится от задачи к задаче: в коллаборативной фильтрации мы получаем разрнженные данные, а в каком-то классическом датасете с агрегатами над поведением пользователей (частота посещений, клики, глубина скролла, платежи) разреженности может и не быть (если с продуктом все нормально)
KD+SM Uplift Modeling. Вошли и вышли, приключение на 20 минут