Обновили Yandex AI Studio: рассуждающие ИИ‑агенты, оптимизация инференса и новый уровень безопасности

В платформе Yandex Cloud для создания ИИ‑приложений большое обновление: теперь Yandex AI Studio предоставляет больше возможностей для создания рассуждающих агентов, способных последовательно выполнять сложные поручения. Помимо этого появились новые инструменты для обеспечения безопасности: например, можно настроить агента так, чтобы он передавал данные в облачную модель по корпоративной сети и без логирования запросов.
Рассуждающие агенты
На платформе появилась возможность использования модели DeepSeek V3.2 (reasoner). Это LLM, рассчитанная на многошаговые задачи: планирование, последовательные действия и вызовы инструментов. Такая reasoning‑нейросеть подходит для сложных агентских приложений, где нужно не только генерировать текст, но и выполнять цепочки действий.
Все характеристики модели:
Размер контекста: 128 000 текстовых токена
Поддерживаемые API: Responses API, Completions API
Поддерживаемые режимы работы: sync, background
Function calling: поддерживается
Функция Reasoning (Размышления): Доступно
Инференс модели в Yandex AI Studio был доработан специально для российского рынка:
Комплаенс‑контур. Модель доступна в российской юрисдикции: обработка данных происходит внутри РФ, в соответствии с требованиями российского законодательства о персональных данных (152-ФЗ). При необходимости предоставляем комплект подтверждающих материалов и регламентов (по договору/запросу).
Платформа инференса оптимизирована под долгие сессии и предсказуемую работу. Вся инфраструктура доработана для работы с длинными агентскими сессиями в условиях стабильной производительности — учитываются длинные контексты, множество шагов и повторные обращения. Платформа оптимизирована на предсказуемую задержку и устойчивую работу при росте нагрузки.
Совместимость по контракту с ChatCompletion API и Responses API. За счёт этого можно быстро мигрировать с уже привычных интеграций на DeepSeek в облаке без переписывания логики агента.
Доступность DeepSeek под Responses API позволяет получить максимум качества в агентских сценариях: эффективное сохранение контекста рассуждений между итерациями агентами, доступ к набору встроенных тулов (fileSearch, webSearch, MCP)Инфраструктура для многошаговых агентских циклов. Мы адаптировали инференс и биллинг под агентские итерации: поддерживаем кеширование/повторное использование контекста между шагами агента, чтобы снижать стоимость длинных сессий. В pay‑as‑you‑go отдельно тарифицируются токены, связанные со встроенными инструментами (fileSearch, webSearch, MCP) и агентскими вызовами — прозрачно и управляемо для клиентов. Системы кеширования и стабильно низкое время на выходной токен улучшают интерактивность агентов, использующих инфраструктуру Yandex Cloud.
Всё это в том числе позволяет снижать стоимость длинных сессий агентов. Например, появление токенов инструментов позволит сократить стоимость сессий до 4 раз.
Новые инструменты безопасности
Также мы добавили возможности для использования ИИ в облачной инфраструктуре с учётом специфических требований к информационной безопасности.
Частные эндпоинты
Команды с повышенными требованиями к информационной безопасности смогут по запросу подключиться к облачной инфраструктуре по безопасному приватному соединению. Это позволит использовать ИИ‑агентов и передавать данные в генеративные модели без выхода в интернет.
On‑premises‑инсталляция Yandex AI Studio
Платформа Yandex AI Studio доступна в формате on‑premises и гибридной поставке. Таким образом можно полностью перенести работу с моделями во внутренний контур или использовать гибридный вариант доступа к нейросетям, когда часть данных обрабатываются внутри компании, а другая — в облаке.
