Comments 7
подписался, ушёл читать, и да
у вас там горизонт завален
Приветствую!)
А какие особенности предобработки данных были ? Остались ли у Вас ноутбуки ?) Хотелось бы посмотреть
Приветствую) Ноутбуки остались, но моя команда их не публиковала. Согласую с ребятами этот момент и вернусь к вам в личку.
Спасибо!) Могу я Вам написать, например, в телеграме ?) Я не опытный, появляютсявопросы иногда. Сейчас вот с датасетом работаю, в одной переменной 35% выбросов, и в максимальных значениях, и в минимальных. Хотелось бы показать, а потом узнать мнение специалиста :)
Вы пишете про дисбаланс классов во второй задаче. Надо ли было делать Upsampling отдельным этапом, если вы использовали Catboost, ведь там, насколько я помню, есть специальный параметр, которым можно указать, что данные несбалансированы, чтобы он сам разбирался? Или такой вариант чем-то плох?
Мой краш-тест чемпионата: Победа в Data Science треке