Comments 31
Вот это да.
Краткий ответ:
1) Потому что не работают деревья\бустинги (почему - читайте публикации)
2) Не работают прочие Optune/Scikit-learn
3) В HFT\на биржах уже читают новости
4) И еще 1000 ньюансов, связанных с машинным обучением
Просто удивительно, правда? )
Пытался давно писать робота для торговли. Довольно быстро понял, что нельзя заставить железяку предвидеть будущее. А если ты умеешь угадывать будущее сам - то и робот не нужен.
Попытки обучения на истории - это просто подгонка решения под имеющийся ответ. Отличный способ избавиться от излишка денег.
Это ведь не попытка увидеть будущее - предполагается что ищутся неэффективные закономерности в прошлом.
Нормально боты работают. Уже год. . И все намного проще чем у автора.
Можно найти некоторые закономерности которые человек не видит или они на небольших тф (соответственно человек не может их обработать) плюс, человек не может сидеть круглосуточно соответственно будет пропускать входы и тем ломать всю математику.
Плюс есть «стратегии» которые требуют минимальной логики, та же торговля в диапазоне, что на ура автоматизируется.
Попытки обучения на истории - это просто подгонка решения под имеющийся ответ
я и до нейросетей видел, как люди берут на графиках торгов (например, криптовалюты) две последние точки, сравнивают их и типа прогнозируют, что растет или падает. А для убедительности из последней точки проводят касательную к какой-нибудь произвольной точке графика, чтобы уже эта прямая типа показывала рост или падение.
Вы бы ещё гадание на кофейной гуще использовали бы для торговли на бирже
Как правильно заметили выше, бустинги не работают на таких временных рядах. На рынке действительно есть циклы, но они не периодичны. Что бы найти такое, нужно очень много торговать "руками" и делать кучу разметок ,только тогда начинаешь замечать их. И если и применять ML в чистом виде, без знаний трейдинга, то нужно смотреть в сторону трансформеров) а вообще это очень философская тема и тут можно очень много всего обсуждать )
Почитайте про хаотические системы(теорию). Станет понятно , почему больше 0,5 не получится.
Единственный, кто стабильно зарабатывает на биржевых торгах, это брокер.
Ни один институциональный инвестор не торгует руками уже очень давно. Все, что может дать матеша, давно реализовано. То есть все заметные разбалансировки рынка гарантированно отторговываются автоматически. И тут выходит Вася Еmpenoso и такой "а ну-ка сбацаю поиск неиспользованных торговых возможностей и переиграю системы с многолетним опытом и миллиардными ресурсами". Очень упрощенно.
А на сколько система в плюсе в прошлом? Не обязательно тренироваться в реальном времени, можно скачать все данные за прошлые года и пытаться найти ответ в любой точке времени. Отличная тренировка, нет?
Имхо, без связи с реальным миром (новости, сделки) очень сложно.
Имхо2, может быть лучше посмотреть в сторону иностранного рынка.
Эта система похожа на казино: ты играешь против таких же людей. Твой выигрыш - это чей-то проигрыш, за вычетом комиссии. И если ты догадался применить крутой алгоритм, то надо думать, по ту сторону экрана сделают тоже самое. В пределе, ты будешь получать угадывание в 50, минус проценты.
Как выше отметили, разбаланировку рынка уже давно отыгрывают автоматы.
Если хотите заработать на фондовом рынке - лучше быть мужем Ненси Пелосси. А так -- Вы пытаетесь определить погоду по тому, как деревья качаются: связь есть, но это следствие, а не причина.
делаю выборку — в неё входят только те, у которых есть фьючерсы.
А в чем смысл фильтрации с таким ограничением?
А, может, поискать проблему не в решении, а в задаче?
Ошибка в методологии?
- да. вообще непонятно почему этот подход будет работать на бирже.Мало данных?
- не влияет.Предсказывать не направление, а волатильность?
- ничего не получится "предсказать", только оценить с некой долей вероятностиПерейти на более высокие таймфреймы (4H, 1D), где комиссия съедает меньшую долю движения?
- почему торговля на таймфреймах должна вообще работать?Нужно использовать данные из стакана (Order Book)? С получением истории стакана для частного лица большие проблемы. Бесплатно доступен лишь очень ограниченный набор инструментов.
- можно использовать данные стакана, но для чего? плюс есть скрытые ордера, которые не отображаются в стакане, а какие-то ордера стоят сотые или тысячные доли секунды.CatBoost слишком прост, нужны трансформеры?
- для чего они нужны непонятно
ещё стоит обратить внимание на следующий момент. выше идет бэктестинг, когда начинается реальная работа на рынке, боты и другие hftишники могут очень быстро реагировать на ваши ордера. Получается, что по бектестингу, что вы в момент Х времени можно закрыться по цене Y, а в реальности такая цена могла быть в стакане сотые доли секунды. а на ваш ордер по этой цене будет моментальный отлик от других участников, например, стакан с другой стороны просто исчезнет и другие варианты.
имхо, прогнозы на теханализе дело неблагодарное. нормально заработать можно только продавая обучение, книги, курсы и автоследование по "авторской" методике.
Несколько месяцев потратил на обучении мл моделей, не получил хорошего результата,переключился на разработку советника на основе пробоев Дончиана и уже в процессе этой разработки пришел к выводу касательно машинного обучения ,что неправильно формулировал цель. И вот подумалось, что если дать модели набор индикаторов и поставить задачу запоминать значения параметров при которых будет наибольшая прибыль и соответственного на основе этого знания мл будет знать при каких значениях можно входить в сделку ,а при каких нет. Мне кажется должно сработать. В будущем хочу попробовать.
ML на Мосбирже — почему мой грааль не работает?