Мы заставили ИИ-модели торговать на бирже. И вот что из этого вышло / Хабр

Могут ли языковые модели торговать на бирже — и не слить, а реально заработать? «Финам» завершил первый этап «Финам Арены» — эксперимента, в котором шесть ведущих языковых моделей торговали на реальных биржах России и США полностью автономно, без участия человека. 100 000 ₽ и $10 000 каждому, период: 2 февраля-31 марта 2026 года, 39 торговых дней, два рынка. Пора посмотреть, что из этого вышло.

Как это было

Каждый ИИ-трейдер получил стартовый капитал — 100 000 ₽ на российском рынке и $10 000 на американском — и набор инструментов: актуальные котировки через «Финам Trade API», новостной фон, веб-поиск и возможность выставлять заявки. Торговые сессии проходили раз в день, вечером перед закрытием торгов. Инструкция была намеренно простой:

Ваша долгосрочная цель — максимизировать доходность через данный портфель.

Никаких деривативов, опционов и фьючерсов — только классические длинные позиции. Агенты вели себя не как спекулянты, а как долгосрочные инвесторы.

В эксперименте сошлись шесть ведущих моделей от конкурирующих между собой технологических компаний: Claude Sonnet 4.5 (Anthropic), Gemini 3 Flash Preview (Google), GPT-5.2 (OpenAI), DeepSeek v3.2, Qwen3 Max и Grok 4.1 Fast (X.AI). Дополнительно был запущен ИИ-ансамбль — коллективное решение нескольких моделей.

И вот что у нас получилось.

Российский рынок: ансамбль в плюсе, остальные у нуля

На российском рынке Индекс МосБиржи за 39 дней потерял 0,33% — рынок был фактически боковым с небольшим снижением. Большинство агентов закончили вблизи нуля: Qwen3 Max +0,30%, Grok и GPT-5.2 по −0,24%, DeepSeek −0,73%. Единственным участником с заметным результатом стал ИИ-ансамбль — +1,67%, итоговый баланс: 101 670 ₽.

Стратегия ансамбля была проста и консервативна: основу портфеля с первых дней занял «Сбербанк». На протяжении всего периода модель наращивала позицию в SBER, в итоге держа 162 акции — крупнейшую долю портфеля. Второй ключевой ставкой стал «Газпром», добавленный в начале марта и также удерживавшийся до конца. Из пяти инструментов, которых коснулся ансамбль «Сбербанк» (SBER), «Газпром» (GAZP), МТС (MTSS), «Роснефть» (ROSN), «Новатэк» (NVTK), именно эти два составили основу — и оба оказались удачным выбором на фоне бокового рынка.

Примечательно поведение в середине марта: на фоне иранского кризиса и кратковременного роста российского рынка ансамбль сначала следовал за ним, достигнув пика +3,01% к 20 марта, но затем рынок откатился — и итоговый результат оказался скромнее пикового. Ансамбль опережал индекс в 28 из 40 сессий — больше, чем любой одиночный агент.

Модель	Sharpe	Доходность%	Годовая доходность %	Годовая вол.%
ИИ Ансамбль	2,34	1,67	10,81	4,63
Qwen3 Max	0,24	0,30	2,45	10,17
Grok 4.1 Fast	-0,09	-0,24	-0,98	10,60
GPT-5.2	-0,13	-0,24	-1,18	8,83
DeepSeek v3.2	-0,41	-0,73	-4,21	10,26
Claude Sonnet 4.5	-1,39	-2,00	-12,64	9,08
Gemini 3 Flash Preview	-2,87	-5,97	-38,87	13,56
Индекс МосБиржи	-0,14	-0,33	-1,54	11,11

Американский рынок: падение индекса и один победитель

За 39 торговых дней S&P 500 потерял 5,50% — рынок снижался практически непрерывно, и агенты без возможности открывать короткие позиции могли лишь выбирать, в каких акциях терять меньше. Большинство моделей с задачей не справились: те, кто держал технологические бумаги — NVIDIA (NVDA), Apple (AAPL), Broadcom (AVGO) — несли потери вместе с ними. Qwen3 Max и DeepSeek потеряли больше индекса (−6,35% и −6,51%). Grok и GPT-5.2 держались лучше рынка (−4,05% и −4,43%). Единственным участником в плюсе стал Gemini 3 Flash Preview (+0,38%). В феврале он агрессивно зашёл в NVDA и Broadcom и к 25 февраля достиг пика — $10 779 (+7,79%). Но именно в этот момент сделал разворот: полностью вышел из технологических позиций и переложил почти весь капитал в Walmart. Пока другие модели продолжали держать падающие акции, Gemini стоял в защитном активе и постепенно перекладывался в другие бумаги. В марте, когда падение ускорилось, терять было практически нечего.

Модель	Sharpe	Доходность %	Годовая доходность %	Годовая вол. %
Gemini 3 Flash Preview	0,23	0,38	7,03	30,56
Grok 4.1 Fast	-0,72	-4,05	-22,08	30,64
GPT-5.2	-1,45	-4,43	-27,54	18,98
Qwen3 Max	-2,18	-6,35	-40,64	18,63
DeepSeek v3.2	-2,38	-6,51	-41,94	17,61
ИИ Ансамбль	-3,03	-5,14	-33,45	11,04
Claude Sonnet 4.5	-3,30	-8,25	-54,23	16,44
SPDR S&P 500	-2,36	-5,50	-35,46	15,03

Машины против людей

Параллельно с экспериментом проходило открытое соревнование трейдеров ArenaGo Open Cup. Мы взяли его результаты к 20 марта как ориентир — чтобы понять, где ИИ-модели оказались бы в общем зачёте, если бы участвовали на тех же условиях.

К 20 марта картина выглядела так: ИИ-ансамбль занимал 8-е место с доходностью 3,00%, Grok 4.1 Fast — 10-е (2,92%), DeepSeek — 12-е (2,43%), GPT-5.2 — 13-е (2,23%), Qwen3 Max — 15-е (1,93%). Нижнюю часть таблицы заняли Gemini (65-е место, −3,61%) — тот самый, кто выиграл на американском рынке, но провалился на российском.

Результат обнадёживающий: ансамбль уверенно конкурировал с живыми участниками в верхней части таблицы. Если это только начало — следующий этап обещает быть интереснее.

Место в общем топе	Модель	Доходность %
8	ИИ Ансамбль	3,00
10	Grok 4.1 Fast	2,92
12	DeepSeek v3.2	2,43
13	GPT-5.2	2,23
15	Qwen3 Max	1,93
39	Claude Sonnet 4.5	-0,71
65	Gemini 3 Flash Preview	-3,61
-	Индекс МосБиржи	3,26

Наши инсайты

Несколько наблюдений, которые стали очевидны по итогам эксперимента:

Без коротких позиций на падающем рынке не заработать. Агенты хорошо справлялись с растущим рынком — максимально держали позиции и следовали за ростом. На падающем рынке уходили в кеш. Но зарабатывать на падении не могли: короткие позиции были недоступны. Именно это сделало американский рынок особенно болезненным — индекс падал, а инструментов использовать это в свою пользу не было.
Коллективный разум работает лучше одиночного. ИИ-ансамбль — агрегированное решение нескольких моделей — стал лучшим участником на российском рынке, показал наименьшую волатильность и единственный финишировал с положительным коэффициентом Шарпа (2,34). Отдельные модели давали разброс от уверенного плюса до глубокого минуса — ансамбль сглаживал крайности и стабильно держался выше рынка.
ИИ хорошо читает новостной фон. Рейтинг акций, который модели формировали параллельно с торговлей, оказался достаточно точным: первое место занял «Сбербанк» — и простая стратегия «держать “Сбер”» на российском рынке действительно была бы одной из лучших. Следом шли «Лукойл», «Газпром», «Роснефть» — нефтяной сектор, который также держался устойчиво. Посмотреть актуальный рейтинг можно во вкладке «ИИ Рейтинг акций».

Что дальше

Первый этап был только началом с ограниченным набором бумаг, несложными агентами, только длинными позициями и демо-капиталом. Но мы намерены продолжать с улучшениями:

Снять ограничения на набор бумаг, классы активов и инструменты — дать агентам возможность самостоятельно искать возможности на всём рынке.
Исследовать новые архитектуры и стратегии: специализированные модели (на определенном типе анализа или классе актива), гибридные модели (совмещают разные подходы); рой моделей.
Усилить соревновательную составляющую — с таблицей лидеров, системой поощрений и полного выбывания из состязания.

Арена станет открытой — любой сможет запустить своего агента и проверить его в реальных условиях. В перспективе — передача торговых сигналов в копитрейдинг, чтобы результаты эксперимента работали не только как исследование, но и как реальный инструмент заработка.

Первый период показал: ИИ способен торговать автономно, не сливать депозит и в ряде случаев уверенно конкурировать с живыми трейдерами. Но стабильно обыгрывать рынок — пока задача нерешённая. Вопрос лишь в том, надолго ли.

Следите за «Финам Ареной»! 📈

Мы заставили ИИ-модели торговать на бирже. И вот что из этого вышло