Comments 7
Искренне удивлен количеству танцев с бубном. Низкий поклон за настойчивость.
Сам буквально несколько дней, как сижу в Hermes. Точнее - Hermes Desktop. Переключение моделей просто по клику из интерфейса. Сейчас сливаю по 100 млн. токенов в день на бесплатных моделях из OpenRouter. На Gigachat, наверное, разорился бы 🤔
Крутое исследование! Как раз задался недавно вопросом, как и куда можно прикрутить GigaChat относительно coding-агентов. Спасибо за содержательную статью и ссылку на GitHub.
1) У Сбера есть репо где-то на гитхабе с проксёй которая переводит их странный api в нормальной openAI формат.
2) Модельки не проходят никакого адекватного RL, поэтому агентности от нах не ждите особо.
Да, проксю видел, но это менее удобный костыль. Лучше бы на платформе сделали поддержку.
Да, второго 2 поколение не очень порадовало, но вот 3.1 думаю пободрее будет, к сожалению модель отсутствовала в сбер студии
Была идея тоже как-то адаптировать это уникальное API Гигачата. Но цель была сначала подключить к Xcode и AndroidStudio (ну и одну утилитку запилить).
Хорошо, что велосипед изобретал только 2 дня, потом нашел проксю, она завелась сразу же (через Docker) и все в итоге подключилось через OpenAI API (в утилите был Langchain и тоже с этим проблем не возникло).
Где-то читал они форканулись от Langchain и есть их собственная библиотека.
Но ради экспериментов пилить библиотеку смысла не вижу.
Гигачат больше для живого общения, в программистких задачах 2.0 даже Max модель не сильно помогает (с точки зрения практики).
В итоге перешел на агрегатора с уже совместимым с OpenAI API, и юзаю пока DeepSeek. С прокси переход занял только подмену базового урла и названия модели.
Самое смешное, что на том агрегаторе тоже Гигачат есть и цена не сильно выше.
Как я прикрутил GigaChat к OpenCode и что из этого понял