
Комментарии 6
Это даже не trainy-уровень, это словно описание первых нескольких часов изучения ML
Где пояснения по принятым решениям? Почему xgboost? Какие метрики у модели на валидационных данных?
Зачем вам 1000 дней вместо 720, почему прогнозы будут лучше? Просто потому что больше = лучше? Всегда ли? Какая именно компонента вашего временного ряда должна улучшить прогноз вашей модели? Вы ведь не провели никакой валидации и не знаете лучше она работает или хуже.
Шкалы на графиках нечитаемые, любой аналитик по голове бы настучал сразу же
Вы же понимаете что LLM написало бы весь этот код за 2 минуты и сделало бы это корректнее ответив на каждый из этих вопросов? Так какую ценность несёт такой "базовый пример"?
Поскольку это time series задача в какой-то степени, тут нужно очень тщательно подходить к подготовке данных. У меня сложилось впечатление, что вы не как к TS задаче подходите, а как к обычному "обучению с учителем". Или нет? У вас подготовка фич полностью "под капотом", в статье ничего не разъясняется, так нельзя. Нужно всё-таки объяснять - как вы фичи готовите, что у вас получается входные данные, а что target. Тем более если вы не TS алгоритм берёте, навроде ARIMA, а обычную ML модель и сами для неё фичи готовите. Используется ли у вас скользящее среднее, выделяете ли вы сезонность, что вы вообще делаете с данными? Без объяснения этого у вас получается просто какой-то чёрный ящик, который непонятно что и непонятно как предсказывает. В финансовой сфере такой "чёрный ящик" никто всерьёз применять просто не будет.
В статье рассказывается про использование библиотеки, конкретно про "прогноз в 3 строки кода". Библиотека вышла недавно, и мне ещё предстоит её дорабатывать, пока собираю обратную связь и параллельно дорабатываю. В документации рассказывается какие фичи используются, в статье нет. Более того, в статье много чего не рассказывается про библиотеку, только т.н. прогноз в три строки. Я учту ваши замечания в последующих обновлениях библиотеки и статьях, спасибо.
Было бы люблопытно взглянуть на прогноз и реальность на каком либо реальном тикере
Прогноз волатильности в 3 строки кода без знания ML