Комментарии 5
Отличный гайд! Хотелось бы еще, может, про collab как альтернативу увидеть тут, для тех ,у кого машина не тянет. Ну и если вы не против, буду ссылаться на него теперь, как неплохой гайд по DS для начинающих, чтобы с инструментарием знакомились.
Нет метода градиентной регрессии. Есть ансамбль решающих деревьев на градиентном бустинге, который можно использовать для решения задачи регрессии.
В описании LabelEncoder говорится, что его не следует применять для кодирования фич, он специально называется LabelEncoder, потому что служит для кодирования целевой переменной. Заменять в столбце с ценой NaN на медиану без учета валюты не стоило. Если бы мы знали, за какую дату эти данные, то можно было бы конвертировать всё в одну валюту и с ней уже работать. Выбрасывать целиком адрес правильно ли? Если у нас целевая переменная - возраст здания, то город/район могли бы быть полезными, но здесь они без сожаления отброшены.
А что модель предсказывает?
Шпаргалка для подготовки к экзамену по машинному обучению