denchikslaz23 мар в 03:16

Прогноз волатильности в 3 строки кода без знания ML

Средний

5 мин

7.7K

Python * Искусственный интеллектМашинное обучение * Финансы в IT

Туториал

Из песочницы

Комментарии 6

AChevozerov 23 мар в 05:38

Это даже не trainy-уровень, это словно описание первых нескольких часов изучения ML

Где пояснения по принятым решениям? Почему xgboost? Какие метрики у модели на валидационных данных?

Зачем вам 1000 дней вместо 720, почему прогнозы будут лучше? Просто потому что больше = лучше? Всегда ли? Какая именно компонента вашего временного ряда должна улучшить прогноз вашей модели? Вы ведь не провели никакой валидации и не знаете лучше она работает или хуже.
Шкалы на графиках нечитаемые, любой аналитик по голове бы настучал сразу же

Вы же понимаете что LLM написало бы весь этот код за 2 минуты и сделало бы это корректнее ответив на каждый из этих вопросов? Так какую ценность несёт такой "базовый пример"?

denchikslaz 23 мар в 06:02

Спасибо за комментарий. Статья и библиотека ориентирована на тех, кто в мл не разбирается вообще, чтобы им можно было без погружения в детали сразу обучить модель. Библиотека вышла недавно, мне нужна была обратная связь. Я учту вашу критику при последующих обновлениях.

CrazyElf 23 мар в 11:31

Поскольку это time series задача в какой-то степени, тут нужно очень тщательно подходить к подготовке данных. У меня сложилось впечатление, что вы не как к TS задаче подходите, а как к обычному "обучению с учителем". Или нет? У вас подготовка фич полностью "под капотом", в статье ничего не разъясняется, так нельзя. Нужно всё-таки объяснять - как вы фичи готовите, что у вас получается входные данные, а что target. Тем более если вы не TS алгоритм берёте, навроде ARIMA, а обычную ML модель и сами для неё фичи готовите. Используется ли у вас скользящее среднее, выделяете ли вы сезонность, что вы вообще делаете с данными? Без объяснения этого у вас получается просто какой-то чёрный ящик, который непонятно что и непонятно как предсказывает. В финансовой сфере такой "чёрный ящик" никто всерьёз применять просто не будет.

denchikslaz 23 мар в 13:51

В статье рассказывается про использование библиотеки, конкретно про "прогноз в 3 строки кода". Библиотека вышла недавно, и мне ещё предстоит её дорабатывать, пока собираю обратную связь и параллельно дорабатываю. В документации рассказывается какие фичи используются, в статье нет. Более того, в статье много чего не рассказывается про библиотеку, только т.н. прогноз в три строки. Я учту ваши замечания в последующих обновлениях библиотеки и статьях, спасибо.

NeverIn 23 мар в 12:51

Было бы люблопытно взглянуть на прогноз и реальность на каком либо реальном тикере

denchikslaz 23 мар в 13:44

Хорошо, в следующих статьях будет и это тоже.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий