HFT + LLM: почему «просто добавить ИИ» не работает и как строить системы без потери микросекунд / Хабр

Если вы читали восторженные статьи о том, как ИИ трансформирует финансовые услуги, у вас могло сложиться впечатление, что внедрение больших языковых моделей и агентных систем в институциональные торговые среды — это в первую очередь инженерная задача: нужно лишь выбрать подходящую модель, настроить нужные параметры и дождаться роста эффективности.

Проработав почти пять лет архитектором по ИИ и интеграциям для платформы, обрабатывающей HFT-данные петабайтного масштаба более чем для 100 институциональных клиентов, включая Bank of America, Merrill Lynch, JPMorgan Chase и Citigroup, Лев Яцемирский, директор по искусственному интеллекту и интеллектуальным системам в Банке Монреаля, утверждает, что такое представление упускает самую важную часть проблемы. Самая сложная часть применения ИИ в высокочастотном трейдинге — это не сам ИИ. Это ограничения.

LLM не вписываются в микросекундный контур

Высокочастотный трейдинг работает в масштабах микросекунд. Разница между системой, реагирующей за 50 микросекунд, и системой, реагирующей за 500 микросекунд, — это не просто небольшое отличие в производительности. Это разница между жизнеспособной торговой стратегией и стратегией, которая постоянно исполняется по невыгодным ценам.

Большие языковые модели вносят задержку инференса, измеряемую миллисекундами, — то есть работают на три-четыре порядка медленнее, чем требуют основные исполнительные системы HFT. Простое и прямолинейное внедрение LLM в такие среды не создаёт интеллектуальную торговую инфраструктуру. Оно создаёт медленную торговую инфраструктуру с прикреплённым чат-ботом.

Архитектурное решение заключается в разделении функций. Необходимо определить те области внутри HFT-стека, где задержка инференса LLM допустима. Например:

Запросы по рискам на естественном языке
Помощь в настройке конфигураций
Генерация документации
Поддержка принятия решений для операторов

И выстроить строгие границы между этими функциями и критически важным с точки зрения задержек контуром исполнения сделок.

В результате получается система, действительно усиленная ИИ в тех областях, где он приносит пользу, без ущерба для характеристик производительности, необходимых высокочастотному трейдингу.

На платформе Nasdaq Risk Platform такое архитектурное разделение позволило автору статьи внедрить системы запросов по рискам с поддержкой LLM, благодаря которым институциональные клиенты получили возможность анализировать сложные данные о рисках в режиме реального времени на естественном языке — возможность, которая ранее требовала специализированной технической экспертизы. При этом удалось сохранить доступность на уровне 99,9% и производительность в микросекундном диапазоне, необходимую для их торговых операций.

Ограничения, связанные с комплаенсом: прозрачность как требование, а не опция

Второе ограничение, значение которого во многих обсуждениях ИИ в финансах недооценивается, — это нормативное соответствие, а именно требования регуляторных рамок FINRA и SEC, согласно которым автоматизированные системы должны быть проверяемыми, логика принятия решений должна быть объяснимой, а обработка данных — соответствовать строгим требованиям корпоративного управления.

Обычные нейронные сети по своей природе не удовлетворяют этим требованиям. Их процесс принятия решений непрозрачен: результат возникает как следствие взаимодействия миллиардов взвешенных параметров и не может быть разложен на проверяемую логическую цепочку.

Это не просто теоретическая проблема. Регуляторы активно проверяют автоматизированные системы торговых компаний, и система ИИ, неспособная объяснить свои выводы в форме, удовлетворяющей требованиям проверки, становится источником комплаенс-рисков.

Подход Retrieval-Augmented Generation (RAG) решает эту проблему, привязывая ответы LLM к явным и подлежащим аудиту базам знаний. Вместо того чтобы формировать ответы исключительно на основе скрытых параметров модели, архитектуры RAG сначала извлекают конкретные исходные документы, а затем генерируют ответы, которые можно напрямую связать с этими источниками. Таким образом, механизм аудита встроен в саму архитектуру.

Второй аспект комплаенса связан с управлением данными. Институциональные торговые данные — информация о позициях, сведения о клиентах, потоки ордеров — относятся к числу наиболее чувствительных данных в финансовой системе и подпадают как под регуляторные требования, так и под обязательства по сохранению коммерческой конфиденциальности.

Архитектуры ИИ, отправляющие такие данные во внешние API моделей, неприемлемы для институциональной среды. Разработанные Львом Яцемирским в Nasdaq решения сохраняют чувствительные данные внутри периметра инфраструктуры организации, используя ИИ для распознавания закономерностей и обработки запросов без необходимости вывода данных за пределы контролируемой среды.

Преимущества агентной архитектуры: локализация отказов

Подход к ИИ, который обеспечивает наиболее стабильные результаты, — это агентная архитектура: системы, в которых ИИ-агенты обладают определённой степенью автономности, но действуют в рамках тщательно заданных ограничений.

Преимущество агентных подходов по сравнению с монолитными ИИ-системами в данном контексте сводится к локализации отказов.

В монолитной ИИ-системе сбой одного компонента может непредсказуемым образом распространиться на всю систему. В агентной архитектуре каждый агент отвечает за строго определённую часть рабочего процесса, а возникающие сбои остаются локализованными в пределах этой части. Это позволяет сохранить работоспособность остальных агентов и обеспечивает возможность целевого вмешательства человека без нарушения работы всей системы.

Для институциональной финансовой инфраструктуры — где система, обслуживающая 100 клиентов, не может позволить себе каскадный отказ только потому, что необычные данные одного клиента привели к неожиданному состоянию общего ИИ-компонента — это свойство не является приятным дополнением. Оно представляет собой фундаментальное требование.

Рост эффективности процессов подключения клиентов на 200% и сокращение времени конфигурирования на 30%, которых автору статьи удалось добиться на Nasdaq Risk Platform, были достигнуты благодаря агентным архитектурам, специально разработанным на основе этого принципа. Результат был получен не за счёт бездумного добавления интеллекта повсюду, а благодаря внедрению именно того интеллекта, который был нужен, именно в тех местах, где он был нужен, и в границах, сохраняющих операционную устойчивость, необходимую для подобных сред.

Когда теория встречается с практикой

Всё, о чём говорилось выше — разделение функций, строгие границы между критическим и некритическим контурами, комплаенс-совместимые RAG-архитектуры, агентный подход с локализацией отказов — работает только при одном условии. Базовая инфраструктура исполнения сделок должна быть безупречной.

Потому что никакая LLM не исправит задержку в 500 микросекунд на маршрутизации ордера. Никакой агент не скомпенсирует потерю пакета на последней миле. Никакой интеллект не сделает стратегию прибыльной, если исполнение систематически происходит по невыгодным ценам из-за неоптимального подключения к бирже.

И здесь возникает следующий уровень проблемы, уже не архитектурной, а инфраструктурной.

Для институциональных игроков и профессиональных алготрейдеров, работающих на высоких частотах, скорость доступа к бирже — это не конкурентное преимущество. Это пороговое условие. Без него остальные optimisations просто не имеют смысла.

Прямой доступ к биржевым торговым системам, минуя брокерские прослойки, собственные выделенные каналы, colocation оборудования в дата-центрах биржи — всё это становится таким же фундаментальным требованием, как и описанные выше архитектурные принципы.

И если вы — создатель стратегий или инженер рынка, который уже прошёл путь от идеи до готового алгоритма, то следующий логичный шаг — обеспечить этому алгоритму инфраструктуру, которая не будет его тормозить.

Что нужно для реальной работы

Без глубокого погружения в маркетинговые описания, вот суть инфраструктурных требований, которые предъявляет HFT-среда к брокерскому и биржевому подключению:

Скорость исполнения заявок и доступа к рыночным данным должна быть на порядки выше стандартного подключения. Речь идёт о разнице в 1000–5000 раз. Это не проценты и не доли процента — это разница между тем, чтобы стратегия работала, и тем, чтобы она гарантированно проигрывала.
Сетевая задержка доступа к бирже должна измеряться микросекундами. В идеале — менее 50 микросекунд. Каждая добавленная микросекунда — это дополнительный риск проскальзывания и неисполнения.
Собственный выделенный канал до биржи с единой точкой подключения ко всем рынкам (фондовый, срочный, валютный) и возможностью построения резервируемого соединения.
Поддержка всех необходимых протоколов — как проприетарных (Plaza II для срочного рынка, TEAP для фондового и валютного), так и универсальных (FIX, FAST, TWIME). Причём поддержка должна быть реализована на уровне, обеспечивающем высокую частоту раздачи данных и полный журнал заявок.
Отказоустойчивость на уровне TIER 3 — горячее резервирование систем, сопоставимое с уровнем профессиональных дата-центров.
Colocation — возможность разместить собственные торговые серверы в непосредственной близости от биржевых систем, чтобы исключить сетевые задержки, связанные с географической удалённостью.

Именно такой набор параметров превращает теоретически работающую стратегию в практически реализуемую. Без него даже самая изощрённая агентная архитектура останется лишь упражнением в академическом программировании.

HFT-инфраструктура для ваших стратегий

Если вы дочитали до этого места, то уже понимаете: качество исполнения сделок определяет жизнеспособность стратегии не меньше, чем сама логика алгоритма.

Решение «Финама» для квалифицированных инвесторов, использующих алго- и HFT-трейдинг, обеспечивает:

⚡ Скорость
Исполнение заявок и доступ к рыночным данным в 1000–5000 раз выше стандартного подключения. Прямой доступ на биржи — менее чем за 50 микросекунд.

🔌 Все протоколы подключения
Поддержка FIX/FAST, Plaza II, MOEX Bridge, FIFO, TWIME, SIMBA и других — с высокой частотой раздачи данных и полным журналом заявок.

🏢 Colocation
Размещение ваших торговых серверов рядом с биржами. Скорость подключения — менее 50 микросекунд. Настраиваем подключения и обеспечиваем интернет-канал с прямым доступом к торговым площадкам.

📡 Собственный выделенный канал до биржи
Единая точка подключения ко всем рынкам Московской биржи. Низкая сетевая задержка. Возможность построения резервируемого соединения.

🛡️ Надёжность уровня TIER 3
Горячее резервирование и отказоустойчивость систем на уровне профессиональных дата-центров — для стабильной работы при любом количестве сделок в день.

📊 Маржинальная торговля
С технологиями post-trade контроля и учёта обеспечения.

🏦 Условия доступа
Услуга доступна клиентам с суммой на счёте от 5 млн рублей.

HFT + LLM: почему «просто добавить ИИ» не работает и как строить системы без потери микросекунд