Search
Write a publication
Pull to refresh
14
0
Максим Лерман @maksler

data analyst

Send message

такой вопрос. В результате модель прогнозирует стандартизированную целевую переменную. На графиках отмечены прогнозное и фактическое значение, но и то и другое стандартизированы. А как получить реальное значение?

Это особенность построения графика. Дело в том, что на графике изображен не типичное распределение hist (где дискретные колонки обозначают абсолютное количество значений величины), а ПЛОТНОСТЬ распределения. И кривая аппроксимирует (сглаживает) дискретные значения. Площадь под кривой при этом равна 1. Поэтому и называют "плотность". Отрицательная зона - это просто часть сглаженной кривой. Конечно, отрицательных сроков окупаемости нет.

Спасибо за коммент, да, согласен с вами по поводу цен. В недвижимости, как и в авто, цена продажи и цена в объявлении часто отличаются. В качестве тепловой карты у меня кластеры нанесены на карту. Их оттенок зависит от средней цены в кластере

Спасибо за коммент, согласен с Вами, есть много дополнительных факторов и особенностей. К сожалению, данные не позволяют учесть все. Данные были спарсены с авито и циан, поэтому располагаем только той информацией, которая содержится в объявлениях. Мне, например, еще было бы очень интересно видеть не только объявления актуальные, но и все закрытые объявления за длительный период. Это позволило бы точнее определять сроки экспозиции объявлений в кластерах, т.е. как быстро в данном кластере объект сдается и продается. Но к сожалению, авито и циан не позволяют увидеть закрытые объявления. (т.е. сделать запрос: показать все закрытые)

Information

Rating
Does not participate
Location
Екатеринбург, Свердловская обл., Россия
Date of birth
Registered
Activity

Specialization

Data Analyst
Junior
Python
PostgreSQL
English