Обновить
32K+
183,88
Рейтинг
35 943
Подписчики

Обновили Yandex AI Studio: рассуждающие ИИ‑агенты, оптимизация инференса и новый уровень безопасности

В платформе Yandex Cloud для создания ИИ‑приложений большое обновление: теперь Yandex AI Studio предоставляет больше возможностей для создания рассуждающих агентов, способных последовательно выполнять сложные поручения. Помимо этого появились новые инструменты для обеспечения безопасности: например, можно настроить агента так, чтобы он передавал данные в облачную модель по корпоративной сети и без логирования запросов.

Рассуждающие агенты

На платформе появилась возможность использования модели DeepSeek V3.2 (reasoner). Это LLM, рассчитанная на многошаговые задачи: планирование, последовательные действия и вызовы инструментов. Такая reasoning‑нейросеть подходит для сложных агентских приложений, где нужно не только генерировать текст, но и выполнять цепочки действий. 

Все характеристики модели:

  • Размер контекста: 128 000 текстовых токена

  • Поддерживаемые API: Responses API, Completions API

  • Поддерживаемые режимы работы: sync, background

  • Function calling: поддерживается

  • Функция Reasoning (Размышления): Доступно

Инференс модели в Yandex AI Studio был доработан специально для российского рынка:

  1. Комплаенс‑контур. Модель доступна в российской юрисдикции: обработка данных происходит внутри РФ, в соответствии с требованиями российского законодательства о персональных данных (152-ФЗ). При необходимости предоставляем комплект подтверждающих материалов и регламентов (по договору/запросу).

  2. Платформа инференса оптимизирована под долгие сессии и предсказуемую работу. Вся инфраструктура доработана для работы с длинными агентскими сессиями в условиях стабильной производительности — учитываются длинные контексты, множество шагов и повторные обращения. Платформа оптимизирована на предсказуемую задержку и устойчивую работу при росте нагрузки. 

  3. Совместимость по контракту с ChatCompletion API и Responses API. За счёт этого можно быстро мигрировать с уже привычных интеграций на DeepSeek в облаке без переписывания логики агента.
    Доступность DeepSeek под Responses API позволяет получить максимум качества в агентских сценариях: эффективное сохранение контекста рассуждений между итерациями агентами, доступ к набору встроенных тулов (fileSearch, webSearch, MCP)

  4. Инфраструктура для многошаговых агентских циклов. Мы адаптировали инференс и биллинг под агентские итерации: поддерживаем кеширование/повторное использование контекста между шагами агента, чтобы снижать стоимость длинных сессий. В pay‑as‑you‑go отдельно тарифицируются токены, связанные со встроенными инструментами (fileSearch, webSearch, MCP) и агентскими вызовами — прозрачно и управляемо для клиентов. Системы кеширования и стабильно низкое время на выходной токен улучшают интерактивность агентов, использующих инфраструктуру Yandex Cloud.

Всё это в том числе позволяет снижать стоимость длинных сессий агентов. Например, появление токенов инструментов позволит сократить стоимость сессий до 4 раз. 

Новые инструменты безопасности

Также мы добавили возможности для использования ИИ в облачной инфраструктуре с учётом специфических требований к информационной безопасности.

  • Частные эндпоинты

    Команды с повышенными требованиями к информационной безопасности смогут по запросу подключиться к облачной инфраструктуре по безопасному приватному соединению. Это позволит использовать ИИ‑агентов и передавать данные в генеративные модели без выхода в интернет.

  • On‑premises‑инсталляция Yandex AI Studio

    Платформа Yandex AI Studio доступна в формате on‑premises и гибридной поставке. Таким образом можно полностью перенести работу с моделями во внутренний контур или использовать гибридный вариант доступа к нейросетям, когда часть данных обрабатываются внутри компании, а другая — в облаке.

Теги:
Всего голосов 8: ↑7 и ↓1+6
Комментарии0

Публикации

Информация

Сайт
yandex.ru
Дата регистрации
Численность
свыше 10 000 человек
Местоположение
Россия
Представитель
Вера Сомова