Как стать автором
Обновить

Комментарии 1

  1. Высокая разрежённость (низкая плотность) данных. Значительная доля фичей  X=x, у большинства пользователей будет иметь нулевые (или же пустые) значения, что негативно скажется на обобщающих способностях моделей и возможном переобучение.

В статье пару раз упоминается разреженность фичей. Вопрос: это проблема какого-то конкретного датасета? Или есть какая-то специфика в построении фичей для аплифта, которая и приводит к разреженности?

Кажется, что разреженность фичей - это характеристика которая разнится от задачи к задаче: в коллаборативной фильтрации мы получаем разрнженные данные, а в каком-то классическом датасете с агрегатами над поведением пользователей (частота посещений, клики, глубина скролла, платежи) разреженности может и не быть (если с продуктом все нормально)

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации