
Могут ли языковые модели торговать на бирже — и не слить, а реально заработать? «Финам» завершил первый этап «Финам Арены» — эксперимента, в котором шесть ведущих языковых моделей торговали на реальных биржах России и США полностью автономно, без участия человека. 100 000 ₽ и $10 000 каждому, период: 2 февраля-31 марта 2026 года, 39 торговых дней, два рынка. Пора посмотреть, что из этого вышло.
Как это было
Каждый ИИ-трейдер получил стартовый капитал — 100 000 ₽ на российском рынке и $10 000 на американском — и набор инструментов: актуальные котировки через «Финам Trade API», новостной фон, веб-поиск и возможность выставлять заявки. Торговые сессии проходили раз в день, вечером перед закрытием торгов. Инструкция была намеренно простой:
Ваша долгосрочная цель — максимизировать доходность через данный портфель.
Никаких деривативов, опционов и фьючерсов — только классические длинные позиции. Агенты вели себя не как спекулянты, а как долгосрочные инвесторы.
В эксперименте сошлись шесть ведущих моделей от конкурирующих между собой технологических компаний: Claude Sonnet 4.5 (Anthropic), Gemini 3 Flash Preview (Google), GPT-5.2 (OpenAI), DeepSeek v3.2, Qwen3 Max и Grok 4.1 Fast (X.AI). Дополнительно был запущен ИИ-ансамбль — коллективное решение нескольких моделей.
И вот что у нас получилось.
Российский рынок: ансамбль в плюсе, остальные у нуля
На российском рынке Индекс МосБиржи за 39 дней потерял 0,33% — рынок был фактически боковым с небольшим снижением. Большинство агентов закончили вблизи нуля: Qwen3 Max +0,30%, Grok и GPT-5.2 по −0,24%, DeepSeek −0,73%. Единственным участником с заметным результатом стал ИИ-ансамбль — +1,67%, итоговый баланс: 101 670 ₽.
Стратегия ансамбля была проста и консервативна: основу портфеля с первых дней занял «Сбербанк». На протяжении всего периода модель наращивала позицию в SBER, в итоге держа 162 акции — крупнейшую долю портфеля. Второй ключевой ставкой стал «Газпром», добавленный в начале марта и также удерживавшийся до конца. Из пяти инструментов, которых коснулся ансамбль «Сбербанк» (SBER), «Газпром» (GAZP), МТС (MTSS), «Роснефть» (ROSN), «Новатэк» (NVTK), именно эти два составили основу — и оба оказались удачным выбором на фоне бокового рынка.
Примечательно поведение в середине марта: на фоне иранского кризиса и кратковременного роста российского рынка ансамбль сначала следовал за ним, достигнув пика +3,01% к 20 марта, но затем рынок откатился — и итоговый результат оказался скромнее пикового. Ансамбль опережал индекс в 28 из 40 сессий — больше, чем любой одиночный агент.

Модель | Sharpe | Доходность% | Годовая доходность % | Годовая вол.% |
ИИ Ансамбль | 2,34 | 1,67 | 10,81 | 4,63 |
Qwen3 Max | 0,24 | 0,30 | 2,45 | 10,17 |
Grok 4.1 Fast | -0,09 | -0,24 | -0,98 | 10,60 |
GPT-5.2 | -0,13 | -0,24 | -1,18 | 8,83 |
DeepSeek v3.2 | -0,41 | -0,73 | -4,21 | 10,26 |
Claude Sonnet 4.5 | -1,39 | -2,00 | -12,64 | 9,08 |
Gemini 3 Flash Preview | -2,87 | -5,97 | -38,87 | 13,56 |
Индекс МосБиржи | -0,14 | -0,33 | -1,54 | 11,11 |
Американский рынок: падение индекса и один победитель
За 39 торговых дней S&P 500 потерял 5,50% — рынок снижался практически непрерывно, и агенты без возможности открывать короткие позиции могли лишь выбирать, в каких акциях терять меньше. Большинство моделей с задачей не справились: те, кто держал технологические бумаги — NVIDIA (NVDA), Apple (AAPL), Broadcom (AVGO) — несли потери вместе с ними. Qwen3 Max и DeepSeek потеряли больше индекса (−6,35% и −6,51%). Grok и GPT-5.2 держались лучше рынка (−4,05% и −4,43%). Единственным участником в плюсе стал Gemini 3 Flash Preview (+0,38%). В феврале он агрессивно зашёл в NVDA и Broadcom и к 25 февраля достиг пика — $10 779 (+7,79%). Но именно в этот момент сделал разворот: полностью вышел из технологических позиций и переложил почти весь капитал в Walmart. Пока другие модели продолжали держать падающие акции, Gemini стоял в защитном активе и постепенно перекладывался в другие бумаги. В марте, когда падение ускорилось, терять было практически нечего.

Модель | Sharpe | Доходность % | Годовая доходность % | Годовая вол. % |
Gemini 3 Flash Preview | 0,23 | 0,38 | 7,03 | 30,56 |
Grok 4.1 Fast | -0,72 | -4,05 | -22,08 | 30,64 |
GPT-5.2 | -1,45 | -4,43 | -27,54 | 18,98 |
Qwen3 Max | -2,18 | -6,35 | -40,64 | 18,63 |
DeepSeek v3.2 | -2,38 | -6,51 | -41,94 | 17,61 |
ИИ Ансамбль | -3,03 | -5,14 | -33,45 | 11,04 |
Claude Sonnet 4.5 | -3,30 | -8,25 | -54,23 | 16,44 |
SPDR S&P 500 | -2,36 | -5,50 | -35,46 | 15,03 |
Машины против людей
Параллельно с экспериментом проходило открытое соревнование трейдеров ArenaGo Open Cup. Мы взяли его результаты к 20 марта как ориентир — чтобы понять, где ИИ-модели оказались бы в общем зачёте, если бы участвовали на тех же условиях.
К 20 марта картина выглядела так: ИИ-ансамбль занимал 8-е место с доходностью 3,00%, Grok 4.1 Fast — 10-е (2,92%), DeepSeek — 12-е (2,43%), GPT-5.2 — 13-е (2,23%), Qwen3 Max — 15-е (1,93%). Нижнюю часть таблицы заняли Gemini (65-е место, −3,61%) — тот самый, кто выиграл на американском рынке, но провалился на российском.
Результат обнадёживающий: ансамбль уверенно конкурировал с живыми участниками в верхней части таблицы. Если это только начало — следующий этап обещает быть интереснее.
Место в общем топе | Модель | Доходность % |
8 | ИИ Ансамбль | 3,00 |
10 | Grok 4.1 Fast | 2,92 |
12 | DeepSeek v3.2 | 2,43 |
13 | GPT-5.2 | 2,23 |
15 | Qwen3 Max | 1,93 |
39 | Claude Sonnet 4.5 | -0,71 |
65 | Gemini 3 Flash Preview | -3,61 |
- | Индекс МосБиржи | 3,26 |

Наши инсайты
Несколько наблюдений, которые стали очевидны по итогам эксперимента:
Без коротких позиций на падающем рынке не заработать. Агенты хорошо справлялись с растущим рынком — максимально держали позиции и следовали за ростом. На падающем рынке уходили в кеш. Но зарабатывать на падении не могли: короткие позиции были недоступны. Именно это сделало американский рынок особенно болезненным — индекс падал, а инструментов использовать это в свою пользу не было.
Коллективный разум работает лучше одиночного. ИИ-ансамбль — агрегированное решение нескольких моделей — стал лучшим участником на российском рынке, показал наименьшую волатильность и единственный финишировал с положительным коэффициентом Шарпа (2,34). Отдельные модели давали разброс от уверенного плюса до глубокого минуса — ансамбль сглаживал крайности и стабильно держался выше рынка.
ИИ хорошо читает новостной фон. Рейтинг акций, который модели формировали параллельно с торговлей, оказался достаточно точным: первое место занял «Сбербанк» — и простая стратегия «держать “Сбер”» на российском рынке действительно была бы одной из лучших. Следом шли «Лукойл», «Газпром», «Роснефть» — нефтяной сектор, который также держался устойчиво. Посмотреть актуальный рейтинг можно во вкладке «ИИ Рейтинг акций».

Что дальше
Первый этап был только началом с ограниченным набором бумаг, несложными агентами, только длинными позициями и демо-капиталом. Но мы намерены продолжать с улучшениями:
Снять ограничения на набор бумаг, классы активов и инструменты — дать агентам возможность самостоятельно искать возможности на всём рынке.
Исследовать новые архитектуры и стратегии: специализированные модели (на определенном типе анализа или классе актива), гибридные модели (совмещают разные подходы); рой моделей.
Усилить соревновательную составляющую — с таблицей лидеров, системой поощрений и полного выбывания из состязания.
Арена станет открытой — любой сможет запустить своего агента и проверить его в реальных условиях. В перспективе — передача торговых сигналов в копитрейдинг, чтобы результаты эксперимента работали не только как исследование, но и как реальный инструмент заработка.
Первый период показал: ИИ способен торговать автономно, не сливать депозит и в ряде случаев уверенно конкурировать с живыми трейдерами. Но стабильно обыгрывать рынок — пока задача нерешённая. Вопрос лишь в том, надолго ли.
Следите за «Финам Ареной»! 📈
