Как стать автором
Обновить

Комментарии 2

Не могу найти notebook с EDA, но по памяти — feature_1 — дата добавления фильма в каталог OKKO. Очень легко проверить, если сопоставить feature_1 и момент первой транзакции. Для тех фильмов, которые добавлялись в каталог в train-период, видно на графике, что сразу после момента feature_1 идёт всплеск транзакций.
Меня смутило то, что если использовать то же преобразование чтобы получить оригинальную дату, что и для транзакций, то многие из значений feature1 спускаются к 1970-ому. Причем, если бы было идентичное низкое значение, то можно было бы предположить что это missing values, но там был разброс.
Ну а также для матчинга потребовались бы точные даты добавления в каталог ОККО. Полученный StartDate как-то не подходил.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий