Комментарии 45
Статья хорошая, в вашей программе можно добавить такое направление как определение айсберг сделок
У меня слабые познания в айти как пишется код, но очень сильно углубленые знания в других направлениях. Системное мышление развито, вашем проекте в принципе не сложно приблизить к идеальной отметки точности. У меня есть идеи как определять скрытые крупные сделки в свое время тестил эфеект очень сильный по определению.
И как его определить? У меня в примере тикеры по дням
Поэтому я использовал AUC (Area Under Curve) — показывает, насколько хорошо модель отличает ситуации, после которых цена действительно росла, от тех, после которых она падала:
AUC < 0.5: модель работает хуже случайного угадывания.
А если AUC близок к 0,1 то это значит, что я могу действовать от обратного? Т.е. модель предсказала рост, а я продаю и наоборот.
Самое слабое место таких методик и инструмент эра - ошибочный посыл что можно с минимально приемлемой долей достоверности предсказать движение рынка на основании данных уже проведенных сделок. Сейчас не 1825 год когда почта из-за океана могла идти месяцы. С современным уровнем информированности и как следствие влиянием на рынок событий, высказываний, действий такие прогнозы невозможны. Доказательство - количество высаженных на остановке (иногда с летальным исходом) трейдеров в последнем сотрясении рынков. А всего-то Трамп что-то там сказал.
Надо на вход нейронки подавать не только котировки, но и новостную ленту
трейдерам с 10x плечами на 100% депо никакие алгоритмы не помогут. И по некоторым последним разборам, что там Трамп сказал - неважно. Важнее - что сделал некий CZ, подловив момент.
Случайность на рынке есть, но она не 100%-ая. Т е есть и закономерные процессы, которые часть движения цены задают. Самое интересное, что с точки зрения игрока на рынке, лучше бы рынок был полностью случайным. В этом случае действовал бы простой алгоритм: купил или продал и сиди жди пока цена окажется в точке, где у тебя прибыль. Математически она там окажется со 100% вероятностью, т к случайные изменения цены были бы одномерными случайными блужданиями. Для них доказано, что рано или поздно будет пройдена каждая точка. Проблема в том, что это так не работает. Может случиться масса событий, которая эту картинку искажает. Плюс не у всех нервы выдерживают смотреть как твои деньги в моменте тают, даже с учётом того, что ты знаешь что это временно. Отсюда две классических стратегии: инвесторы - пересиживают ход цены вниз, пока она не отскочет. Трейдеры - фиксируют убытки с прицелом за то же время совершить больше сделок, угадав не случайную часть рынка. Скажем так - обе стратегии так себе 😁 Легко потерять деньги.
Точность любой модели не может определять изза скрытых сделок (айсберг сделки) которые делают крупные организации типа банков. Изза этого и теряется показатель точности. В свое время научился использовать научные направление в психологии распозновать тренд экономики куда будет идти направление.
Мне кажется, что есть смысл дополнить алгоритм делением акций на хорошие (высокое качество прогноза) и плохие (низкое качество прогноза). Если модель будет уметь не просто предсказывать движения котировок, но перед этим выбирать с какими котировками вообще работать, то её точность может сильно вырасти.
Полагаю, что живые трейдеры тоже не торгуют чем попало и что некоторые акции реально могут иметь котировки близкие к случайным.
за 2 года разработок, я выявил что наилучший результат получается при правильной нормализации данных во временном окне, с использованием перцентилей. Тогда результат 64% при торговле в лонг/шорт, но это касается только криптовалют.
Интересно, спасибо что поделились. А можно уточнить — вы работали именно с котировками (временными рядами), или использовали какие‑то текстовые признаки тоже?
Судя по описанию нормализации и перцентилей — это, похоже, чисто числовая модель. Какая архитектура у вас лучше всего показала себя — классический ML (CatBoost/XGBoost) или нейросети (LSTM/GRU)?
использую только котировки, обучал модель на исторических данных за 5 лет на 20 монетах. LSTM с генетическим алгоритмом + ML, достаточно быстр. 12 разных признаков (Цена открытия, объем, стакан, ATR и тд.) на вход и агент сам определяет входить в сделку или нет в зависимости от уверенности. Однако есть фундаментальная проблема, которую я все еще решаю, зачастую агенты учатся читерить и показывать высокий фитнес одной или двумя сделками. Но через optune получилось выявить оптимальные и низкорисковые правила торговли. Сделать 100% профитную торговлю нереально, просто грамотный риск менеджмент со стопами.
стакан
Подскажите
Они нетак сложны как кажутся на первый взгляд, крупно скрытые сделки предсказуемы в большинстве их совершения. Главное понимание работы стакана и графика
Краткое описание от нейронки:
вопрос возможно прогнозировать фиксинг
Прогнозировать фиксинг Московской биржи теоретически возможно, но с определёнными оговорками. Фиксинг — это усреднённое посекундное значение цен заявок и сделок за фиксированный период (например, с 12:15 до 12:30 по МСК), отражающее рыночную стоимость инструмента в этот момент.
Для прогнозирования фиксинга необходимо моделировать динамику:
безадресных заявок на покупку и продажу (их цены и объёмы),
цен и объёмов сделок по инструменту,
рыночных настроений и активности участников торгов.
Сложность прогнозирования связана с высокой волатильностью и изменчивостью котировок и объёмов на бирже, а также с чувствительностью фиксинга к рыночным событиям.
В практике прогнозирования могут использоваться исторические данные, методы машинного обучения и временные ряды, чтобы попытаться предсказать средневзвешенную цену по заявкам и сделкам на момент расчетного периода. Однако точность таких прогнозов ограничена рыночными условиями и непредсказуемостью поведения участников.
Резюмируя, фиксинг можно пытаться прогнозировать на основе анализа текущих и прошедших рыночных данных, но это не гарантия высокой точности ввиду природы финансовых рынков и алгоритма усреднения котировок и сделок за конкретный период.
И дополню от себя: есть методики которые могут хорошо понять мотивы торговли участников биржи, как они будут поступать.
В том и крутость рынка если идеально выявлять уметь крупно скрытые сделки, за их счет можно обоготится)). Чтото подобной моделью пользуюсь щас в пасивоном формате мне нравится финансовый инструмент от россельхозбанк с их месячными облигациями выплатой. Облигации привязаны к ставке цб поюс1. 5 % с верху.
айсберги - это сигнал лезть или не лезть? )
Термен (айсберг) это скрытые заявки которые не отоброжаются в стакане. Они невидимые как инструмент.
но в буке же будет видно всплытие объёмов. и встречные выкупы, если absorption
В стакане видно только малая часть к примеру поставили 100 а пофакту 1000 будет это и есть скрытые заявки.
Вот про то и говорю, что по факту волюм то виден по исполненным, особенно если много за раз выкатили. Если потихоньку порциями выкатывают, да не по одной и той же цене, то да, хз как увидеть сходу.
Это достаточно не сложно, используя общий объем исторический, тайм часового времени дня, средне вывести крупных игроков сколько их. Дальше определить где находятся эти крупные игроки по часовому времени понять их регион. Дальше можно моделировать систему которая сможет прогнозировать с высокой вероятностью когда будут торговаться.
Товарищи если интересно будет поделится всем опытом давайте создадим группу, лично я готов показать свои наработки рабочие в реализации анализа экономики. От вас только помочь реализовать в айти сегменте.
напишите мне в телегу (на сайте визитке есть контакт), но я через две недели только смогу предметно посмотреть, конфа смартлаба на носу :)
интересно. выкатываюсь из айтишки, щупаю все эти грабли, бывает лбом.
Интересный подход. Я ж брал тупо числа. Их преобразовывал в индикаторы и все эти данные скармливал в собственную нейронку. Брал данные за последние 10 лет по биткоину и цель была простая: на основе последних 24 свечей в часовом таймфрейме указать какая цена будет в следующие 6 часов. Чаще всего модель угадывала направление, иногда делала ошибки, но конечно же точную цену никогда не называла.
Я понял, что цена битка сильно волотильна и зависит от внешних факторов. Она буквально может идти расти вверх, а потом в одночасье упасть до самого низа. И я бросил эту затею.
Но сейчас думаю, может быть стоит попробовать с фиатными валютами или другими ценными бумагами и даже акциями компаний?
Кто знает
Из своего опыта могу предложить такой вариант очень хороший сам пользуюсь им щас. Мне нравится работать с облигациями которые привязаны к ставке ЦБ на них еще дополнительно накидывают процент. Так вот вся информация есть перед началом сколько выложили обьем шт. Облигаций и сколько купили и также есть сроки, делаю некоторые вычесления привожу к среднему значению, на первом этапе 10-30% от срока работы облигации слежу как ведется торговля по графику выявляю часовой формат в какое время были скачки торговли, по карте страны выявляю примерно в какой области торговали, определяю какие там крупные предприятия или банки, фиксирую после делаю коректировки, и слежу за графиком если действие повторяется значит получилось выявить точный патерн когда будут с высокой вероятностью торговать.
В основном торгуют боты и выявить закономерность не сложно, я лишь часть описал идеи выше. Если тема будет интересной можем создать клуб по интересам)
Берт это не ллм типа. Щас ллм это декодеры типа жпт. А берт -тупа трансформер, при чём энкодер. Не знаю что ещё совал туда в итоге, но в целом идея старая довольно. Ты хочешь вытянуть статистику, вот только котировки - это шум чисто, поэтому там не будет трансформер работать обычный. Либо ты должен инсайдерской торговлей заниматься

Сможет ли языковая модель научиться читать биржевые графики? Эксперимент с LLM на данных Московской биржи