Хабр Курсы для всех
РЕКЛАМА
Практикум, Хекслет, SkyPro, авторские курсы — собрали всех и попросили скидки. Осталось выбрать!
Ну, статья не дописана: вы упомянули об оптимизации и ничего не сделали, тоже самое и с дополнением признаков.
И во-вторых, эта статья явно не тянет на "сложный" уровень.
Спасибо за статью. Мне кажется, что уровень сложности статьи не должна быть "сложный", т.к. я, учащий ml около полгода (не особо интенсивно), смог понять практически всё, описанное в статье. Есть только один вопрос: "Удалим переменную years_employed, так как она является неинформативной". Можно поподробнее, почему двукратная разница между кол-вом клиентов, начавших работать в 14 и 18 лет, делает признак не информативным?
Предварительная обработка данных для машинного обучения