smvlx16 фев в 08:16

Подключаем российские AI-сервисы к OpenClaw: GigaChat, YandexGPT и Yandex 360

Средний

8 мин

14K

Искусственный интеллектPython * Яндекс API * Node.JS * Open source *

Из песочницы

Комментарии 16

rPman 16 фев в 12:31

А на практике, старшие модели от yandex и и сбербанк имеют хотя бы пользу? они держат контекст в чате, способны к верному структурному выводу без кандалов structured outputs генератора? Как часто ваши агенты не смогут найти ожидаемый текст в ответе модели?

smvlx 17 фев в 08:21

Хороший вопрос. Я сам был немного удивлён, но старшие модели Яндекса и Сбера на практике показали себя вполне адекватно для простых и средних задач — в том числе на английском языке.

Контекст удерживается не только за счёт самой модели, но и за счёт памяти OpenClaw: у каждого агента есть своя история и состояние, которые мы явно прокидываем в запросы. Это сильно снижает требования к «идеальной» контекстной способности модели.

По структурным выводам: для большинства рутинных сценариев (поиск, сбор, первичный анализ, суммаризация) они справляются без жёсткой привязки к structured outputs. Случаи, когда агент не находит ожидаемый фрагмент в ответе, бывают, но пока это скорее редкие edge-cases, а не системная проблема.

Буду дальше тестировать, но с учётом низкой стоимости российских моделей вполне рассматриваю их для фоновых и массовых задач — сбор и анализ статей, постов, подготовка черновиков и т.п.

rPman 17 фев в 09:13

вы пробовали подключить топовую модель от yandex к openhands? или mini-swe-agent?

smvlx 17 фев в 10:49

Не пробовал, для разработки использую Claude Opus 4.6 и иногда Codex.

MAT-POC 5 апр в 15:23

>"GigaChat не совместим с OpenAI API из коробки. Используем gpt2giga "

Я правильно понимаю что из-за этого невозможно переключить локальную модель qwen3.5:9b на локальный ГигаЧат forzer/GigaChat3-10B-A1.8B ? У меня хоть всё настроено правильно при попытке сменить модель пишет : Agent failed before reply: Unknown model: forzer/GigaChat3-10B-A1.8B. Logs: openclaw logs --follow

Dirlandets 17 фев в 07:55

Спасибо за наводки! Прикидывал (пока в уме) как бы яндекс диск интегрировать, а оно вон как просто (главное чтобы не стер все нафиг)

У меня обсидиан синкается через яндекс диск, вот как раз нехватающий кусочек!

smvlx 17 фев в 08:18

Права доступа можно настроить достаточно гранулярно. Самый безопасный вариант (и именно так работает по умолчанию) — Яндекс создаёт отдельную папку на Диске под приложение, и OpenClaw получает доступ только к ней.

При необходимости дальше можно аккуратно расширять права под конкретные сценарии.

Pavel_Vibe 18 фев в 18:31

Спасибо за табличку с подводными камнями — вот это реально полезно. Сам наступал на грабли с IAM-ролями в Yandex Cloud: полчаса искал почему 403, оказалось роль на SA навесил, а не на folder. Классическая яндексовая магия.

Кстати, не пробовали вместо gpt2giga использовать LiteLLM? Он тоже умеет в прокси для нестандартных провайдеров, и там хотя бы supervisord не нужен — демонизируется нормально.

smvlx 18 фев в 18:39

Спасибо!
Готовлю еще одну статью, там подводных камней будет кратно больше чем тут :)

Нет, пробовал только gpt2giga. У LiteLLM не видел поддержку gigachat из коробки, поэтому пришлось бы делать кастомный коннектор, а это по сути gpt2giga

deutelion 24 фев в 11:04

А чё по ценам? Гигачат Алиса имеют бесплатные лимиты?

smvlx 24 фев в 11:05

Гигачат - да, Алиса - нет.

Зависит от моделей, gigachat lite в ~30 раз дешевле Opus 4.6. Топовая модель Yandex примерно в 2.7 раз дешевле Opus 4.6

Saint_toniK 3 мар в 05:13

Cпасибо большое, весь вечер вчера убил в самостоятельных попытках создания мостов

smvlx 4 мар в 10:03

Надеюсь моя статья и код помогли.

Saint_toniK 4 мар в 11:29

Конечно, ещё раз спасибо! Единственное, вот сейчас наблюдаю проблемы с выходом за лимит контекста (OpenClaw настаивает, что должно быть минимум 16к, что сразу отключает lite и обычный), а когда накапливается больше 32к, то и мощная отваливается и включается fallback на более морщные модели). Что делать пока не придумал.

Saint_toniK 6 мар в 07:18

В общем, покопался ещё, мне помогла замена "if (url === "/v1/chat/completions" && req.method === "POST")" на "if (url === "/chat/completions" && req.method === "POST")" (точнее я добавил и такую и такую интерпреаптцию, потому что openclaw принудительно забирал с /chat/completions

После этого ещё встал вопрос с тем, что openclaw ждал стриминга (хотя принудительно был отключен), а яндекс его не возвращал. В итоге дорисовал искусственный стрим в прокси, заработало :)

Возможно, кому-то пригодится...

stereodenis 25 мар в 20:06

Я настроил интеграции, оплатил 3млн токенов на ГигаЧатМакс и они улетели у меня за считанные минуты. Вот анализ от Яши о том, почему так произошло и как этого избежать(вдруг кому поможет):

Яша: Денис, токены GigaChat Max сгорели за считанные минуты, потому что:

Между 18:14 и 18:28 OpenClaw бомбил прокси сотнями запросов POST /chat/completions (по нескольку штук в секунду с разных локальных портов).
Основная сессия была настроена на gigachat/GigaChat-Max, поэтому даже служебные операции — компакции, проверки, ответы вида NO_REPLY — шли через самый дорогой тариф.
В 18:27–18:28 журнал зафиксировал ошибки 402 Payment Required — квота закончилась, что подтверждает перерасход.

Чтобы этого не повторялось:

• включай GigaChat Max только вручную через /agent, когда он реально нужен; • переведи фоновые задачи и автоматические ответы на Lite или Pro; • задай лимит/квоту в gpt2giga (rate limit или лимит по токенам), чтобы фоновые сервисы не съедали весь бюджет.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий