Банально, но ИИ это дорого. В странах, с которыми мы постоянно сравниваемся, деньгами заливают ошибки инженеров и менеджеров. По сложившейся традиции заимствуем, повторяем и улучшаем, с запазднием. Хотим дёшево и быстро, а потом ругаемся на качество.
В части баснасловных сумм. Представьте, что у вас штат 1000+ в RnD и их нужно занимать чем-то где есть спрос. Не следует трактовать эти цифры будто это исключительно инвестиции. Часто это OPEX и небольшие (по меркам корпораций) вложения под ожидаемую выручку. Не прибыль. Выручку. Далее маркетинг делает своё дело и появляются истории для всех целевых аудиторий:
для чиновников ради субсидий;
для разработчиков ради найма;
для пользователей ради хайпа.
Итого, вы просто перераспределили бюджет прошлого года. Далее, например, придумали такую смелую историю как "коммерциализация". Идея в том, чтобы начать продавать то, что делается внутри и для собственных нужд организации. Улучшая собственные процессы вы пытаетесь отбить затраты делая Продукты, заключаете партнёрства и подписываете соглашения о намерениях для дальнейшей продажи/внедрения. Выглядит как правильное дело! Если вы продуктовая компания, то даже проще.
В заключении, эффект от всех перечисленных историй крайне сложно посчитать, а в силу отсутствия конкуренции в стране денежные потоки оборачиваются и оборачиваются. Тот самый эффект подтверждается под честное слово. Бюджет переносится в новый год. Бонусы за отечественный ИИ платятся. Всем выгодно, кроме конечного потребителя, но куда мы денемся благодаря помощи государства в лице РКН и прочих лобистов, кому не выгодно терять тот самый бюджет?
Модель, которая описана в статье, ничего сверхъествественного не делает. Её ключевые особенности в следующем:
Тайминг. RL-агент открывает позицию чаще успешно, чем в убыток. Причём процент успеха не такой большой.
Следование тренду. RL-агент присоединяется к крупным рыночным движениям в спокойное время.
Ограничение риска. В зависимости от режима на рынке Агент перераспределяет активы из риска в защиту и наоборот.
Эти 3 правила работают, если не заниматься спекуляциями (завышать риск, покупать активы без фундамента), а сосредоточится на ивестировании. Если говорить о поиске неэффектвностей рынка, то они пропадают также случайно, как и появляются. На этот класс алгоритмов изложенный подход не претендует.
Для корректного ответа нужен период и условия. Для параметров тестирования, которые приведены в статье, лучшая модель (метрики из главы 8) показывает следующие результаты:
PRIMARY (tlt_hybrid_dsr_dngdown_s42)
Period: 2024-09-11 → 2026-04-20, 402 trading days
Initial NAV: 1,003,313
Final NAV: 1,632,246
Total return: +62.69% over 1.60y
CAGR: +35.67%
Daily: mean +0.1268%, median +0.1688%, std 1.0390%
Weekly: mean +0.636%, median +0.867%, std 2.253%
Monthly: mean +2.703%, median +3.343%, std 4.359%
Yearly: mean +40.548%, median +40.548%
Max DD: 13.58%
Annualized Sharpe: +1.938
% winning days: 57.6%
Благодарю за вопрос. Строго говоря такой эксперимент не проводился. На ранних этапах я пробовал MLP и что-то посложнее, но результаты были скромные. К моменту, когда появилась обвязка с определением режима и прочими фишками этап тестирования базовых моделей уже прошёл.
Далее, на место SAC действительно можно вставить другую модель и получить лучший результат, однако есть ряд нюансов, которые нужно учитывать:
Ограниченность данных. После фильтрации по режимам для дневного таймфрейма остаётся не так много данных для обучения. Т.е. нужно добиться достаточного уровня генерализации и не переобучится на 5 окнах с разными распределениями режимов.
Простые правила под каждый режим ещё нужно сформулировать. Т.е. это ещё одна плоскость (специалзированные правила для режима) для оптимизации, коих и так уже не мало.
Эксперт получает специализацию за счёт конфигурации функции награды. Здесь за конфигурацию будут отвечать рукотворные фичи и сами данные. Из коробки наверняка не сработает.
Бустинг с предсказанием доходностей это в целом другой подход. Наверняка он может дать позитивный результат, но это десятки моделей в ансамблях со сложными сценариями их задействования.
Попробую на досуге что-то простое. Буду признателен за рекомендации.
Банально, но ИИ это дорого. В странах, с которыми мы постоянно сравниваемся, деньгами заливают ошибки инженеров и менеджеров. По сложившейся традиции заимствуем, повторяем и улучшаем, с запазднием. Хотим дёшево и быстро, а потом ругаемся на качество.
В части баснасловных сумм. Представьте, что у вас штат 1000+ в RnD и их нужно занимать чем-то где есть спрос. Не следует трактовать эти цифры будто это исключительно инвестиции. Часто это OPEX и небольшие (по меркам корпораций) вложения под ожидаемую выручку. Не прибыль. Выручку. Далее маркетинг делает своё дело и появляются истории для всех целевых аудиторий:
для чиновников ради субсидий;
для разработчиков ради найма;
для пользователей ради хайпа.
Итого, вы просто перераспределили бюджет прошлого года. Далее, например, придумали такую смелую историю как "коммерциализация". Идея в том, чтобы начать продавать то, что делается внутри и для собственных нужд организации. Улучшая собственные процессы вы пытаетесь отбить затраты делая Продукты, заключаете партнёрства и подписываете соглашения о намерениях для дальнейшей продажи/внедрения. Выглядит как правильное дело! Если вы продуктовая компания, то даже проще.
В заключении, эффект от всех перечисленных историй крайне сложно посчитать, а в силу отсутствия конкуренции в стране денежные потоки оборачиваются и оборачиваются. Тот самый эффект подтверждается под честное слово. Бюджет переносится в новый год. Бонусы за отечественный ИИ платятся. Всем выгодно, кроме конечного потребителя, но куда мы денемся благодаря помощи государства в лице РКН и прочих лобистов, кому не выгодно терять тот самый бюджет?
ЦИПР хорош. Выводы делает каждый сам.
Библиотека для загрузки котировок:
t-tech-investments==0.3.3Модель, которая описана в статье, ничего сверхъествественного не делает. Её ключевые особенности в следующем:
Тайминг. RL-агент открывает позицию чаще успешно, чем в убыток. Причём процент успеха не такой большой.
Следование тренду. RL-агент присоединяется к крупным рыночным движениям в спокойное время.
Ограничение риска. В зависимости от режима на рынке Агент перераспределяет активы из риска в защиту и наоборот.
Эти 3 правила работают, если не заниматься спекуляциями (завышать риск, покупать активы без фундамента), а сосредоточится на ивестировании. Если говорить о поиске неэффектвностей рынка, то они пропадают также случайно, как и появляются. На этот класс алгоритмов изложенный подход не претендует.
Для корректного ответа нужен период и условия. Для параметров тестирования, которые приведены в статье, лучшая модель (метрики из главы 8) показывает следующие результаты:
Благодарю за вопрос. Строго говоря такой эксперимент не проводился. На ранних этапах я пробовал MLP и что-то посложнее, но результаты были скромные. К моменту, когда появилась обвязка с определением режима и прочими фишками этап тестирования базовых моделей уже прошёл.
Далее, на место SAC действительно можно вставить другую модель и получить лучший результат, однако есть ряд нюансов, которые нужно учитывать:
Ограниченность данных. После фильтрации по режимам для дневного таймфрейма остаётся не так много данных для обучения. Т.е. нужно добиться достаточного уровня генерализации и не переобучится на 5 окнах с разными распределениями режимов.
Простые правила под каждый режим ещё нужно сформулировать. Т.е. это ещё одна плоскость (специалзированные правила для режима) для оптимизации, коих и так уже не мало.
Эксперт получает специализацию за счёт конфигурации функции награды. Здесь за конфигурацию будут отвечать рукотворные фичи и сами данные. Из коробки наверняка не сработает.
Бустинг с предсказанием доходностей это в целом другой подход. Наверняка он может дать позитивный результат, но это десятки моделей в ансамблях со сложными сценариями их задействования.
Попробую на досуге что-то простое. Буду признателен за рекомендации.