Articles / Bookmarks / Profile of Rai220 / Habr

Константин Крестников@Rai220

AI agents developer (e/acc)

Subscribers

ProfileArticles8PostsNewsComments281

dmitrykabanov Apr 29 at 08:01

Open source-экосистемы — как Сбер развивает GigaChain

9 min

9.4K

Open source * Product Management * Artificial IntelligenceCommunity management * Biography of geeks

Interview

Мне удалось пообщаться с Константином Крестниковым @Rai220, управляющим директором и техлидом команды GigaChain, которая занимается агентными системами и разработкой SDK для GigaChat в Сбере. Константин глубоко погружен в развитие экосистемы вокруг GigaChat, поэтому разговор получился подробным, богатым на примеры и управленческие инсайты.

+13

Mikser_777 Dec 3 2025 at 08:15

Укрощаем зоопарк API: универсальный Python-клиент для GigaChat, YandexGPT и локальных моделей (v0.5.0)

6 min

7.4K

Python * Artificial IntelligenceWebsite development *

From sandbox

Привет, Хабр! 👋

Если вы пробовали внедрять российские LLM в свои проекты, то наверняка сталкивались с "зоопарком" API. У GigaChat — OAuth2 и свои эндпоинты, у YandexGPT — IAM-токены и gRPC/REST, у локальных моделей через Ollama — третий формат.

В какой-то момент мне надоело писать бесконечные if provider == 'gigachat': ... elif provider == 'yandex': ..., и я решил создать универсальный слой абстракции.

Так появился Multi-LLM Orchestrator — open-source библиотека, которая позволяет работать с разными LLM через единый интерфейс, поддерживает умный роутинг и автоматический fallback (переключение на другую модель при ошибке).

Сегодня расскажу, как я её проектировал, с какими сложностями столкнулся при интеграции GigaChat и YandexGPT, и как за пару дней довел проект до релиза v0.2.0 на PyPI с 88% покрытия тестами.

aeremenok Dec 3 2025 at 11:10

Российский ИИ на рабочем месте: заменяем Qwen на GigaChat для Roo Code

Medium

3 min

7.5K

System Analysis and Design * Information Security * System administration *

Tutorial

Многие компании запрещают сотрудникам использовать ChatGPT и Claude — инфобез не пропускает иностранные сервисы. При этом российские ИИ-решения от Сбера и Яндекса работают в отечественном правовом поле, проходят аудит и размещены на территории РФ.

В этой статье показываю, как за 20 минут подключить Sber GigaChat к Roo Code — связке, которую мы разбирали в предыдущем материале про автоматизацию рутины аналитика. Понадобится локальный прокси gpt2giga, который принимает запросы в формате OpenAI и транслирует их в облако Сбера.

Пошагово: установка через pip/Docker, получение API-ключа в Sber Studio, настройка .env, подключение в Roo Code. Плюс таблица типичных ошибок и их решений.

Статья для аналитиков, тестировщиков и разработчиков, которым нужен ИИ-инструмент, совместимый с корпоративными политиками безопасности.

dmitrykabanov Nov 23 2025 at 15:33

Open source-мероприятия в России: предстоящие конференции и встречи

3 min

8.6K

Open source * System Programming * Artificial IntelligenceMachine learning * Studying in IT

Digest

Предлагаю вашему вниманию подборку ближайших событий по open source. Фокус на открытых, бесплатных тематических мероприятиях различного формата (очных, онлайн и гибридных), в том числе с научным и управленческим уклоном.

Если вы планируете подобное событие (или проводите личный доклад по теме open source, который можно послушать бесплатно) в начале следующего года, присылайте посмотреть ссылки для потенциального включения в новую подборку.

+15

vltnmmdv Nov 21 2025 at 14:46

GigaChat 3 Ultra Preview — тяжёлый open source

Easy

15 min

37K

SberDevices corporate blogСбер corporate blogMachine learning * Artificial Intelligence

Review

Салют, Хабр!
В этот раз мы хотим поделиться с вами чем-то большим... буквально большим — 712
миллиардами параметров! И всё это под открытой лицензией MIT!

Мы подготовили двух представителей моделей нового поколения с открытыми весами: компактная модель для локального запуска на своем ноутбуке и наш флагман, о котором сегодня и поговорим.

Скачать 712 миллиардов весов без СМС и...

+122

sterling239 Nov 21 2025 at 09:07

Наш новый LLM-based синтез речи

Easy

16 min

15K

Сбер corporate blogArtificial IntelligenceNatural Language Processing * SoundMachine learning *

Review

Рассказываем о нашем новом синтезе речи.

Мы так и называем его — «новый синтез», или GigaTTS. Под капотом у него GigaChat 3b, аудио адаптер, собственный токенизатор речи и 30 тысяч часов данных. Никаких диффузий. Очень много работы было проделано над обучением модели, на студии и при подготовке данных для обучения.

Новый синтез до мурашек естественный. Он говорит как живой человек, умеет смеяться и выражать эмоции со всеми нюансами. По метрикам он обгоняет наши прошлые модели в 2-4 раза, особенно большой выигрыш по естественности голоса.

Под катом вас ждем большой технический обзор того, как мы пришли к такому качеству. Покажем freespeech и специально сделанные голоса операторов колл-центров. Поделимся деталями, как у нас получился синтез текста любой длины, prompt following и клонирование голосов

+56

antipov_dmitry Oct 3 2025 at 12:33

Зоопарк фреймворков для AI-агентов: как выбрать подходящий — делаем бенчмарк и большое сравнение

10 min

9.2K

Artificial IntelligenceMachine learning * Big Data * System Analysis and Design *

Привет! В этой статье я детально разберу основные фреймворки для AI-агентов, попробую их побенчить и детально распишу их плюсы и минусы. Если вы подступались к агентам, то первым вопросом наверняка стало «а на чем их делать?». Отовсюду все говорят про langchain и десяток других фреймворков, звучат аббревиатуры типа MCP и A2A, какие-то Swarmы и CrewAI, мультиагентность и самое всякое разное.

Давайте попробуем все это разложить по полочкам, потестировать, замерить и собрать материал, который поможет за раз во всем разобраться. А в качестве задачи мы возьмем мой проектик, который я с удовольствием поделываю в качестве развлекухи по ночам: сложный выбор товаров на маркетплейсах LLMкой.

Что будем тестировать: LangChain, LangGraph, AutoGen, CrewAI, OpenAI Swarm, LlamaIndex, MetaGPT, ControlFlow, Haystack, Phidata, Pydantic AI, smolagents, DSPy, SuperAGI, Semantic Kernel, Claude Agent SDK

+10

Rai220 Sep 4 2025 at 10:00

Гайд: AI-агент на GigaChat и LangGraph (от архитектуры до валидации) на примере Lean Canvas

Medium

17 min

23K

Сбер corporate blogMachine learning * Artificial Intelligence

Tutorial

Запуск стартапа — это не только идея, но и понимание, как она станет бизнесом. Lean Canvas, предложенный Эшем Маурья, помогает на одной странице структурировать ключевые аспекты: проблемы клиентов, решения, каналы продаж и издержки.

Но Lean Canvas за пять минут не заполнить: нужны гипотезы, исследования, слаженная работа команды. А что если большую часть рутины возьмёт на себя ИИ-агент? Мы в GigaChain решили попробовать. Рассказываем, что из этого получилось.

В Сбере мы активно внедряем искусственный интеллект для решения сложных бизнес-задач. Одно из перспективных направлений — ИИ-агенты: автономные системы, умеющие рассуждать, планировать и использовать инструменты для достижения цели. Мы подробно разбираем подходы к их разработке в руководстве «Разработка и применение мультиагентных систем в корпоративной среде». А в этой статье мы покажем, как создать такой агент на примере автоматического генерирования Lean Canvas.

+22

trashchenkov Aug 11 2025 at 06:00

Современный ReAct-агент: подробное руководство по созданию с помощью LangGraph

Medium

18 min

31K

Сбер corporate blogMachine learning * Artificial Intelligence

Tutorial

Привет, на связи команда GigaChain!

ReAct — фундаментальный паттерн, с которого началась эра LLM-агентов. Но как его реализовать сегодня, используя всю мощь function-calling и графовую логику? Разбираем эволюцию концепции, проводим чёткую грань между LangChain и LangGraph и пошагово разбираем создание гибкого ReAct-агента на современном стеке. Никакой магии, только воспроизводимый код и понятная теория.

+25

GrinRus May 12 2025 at 12:00

Как довести фичу до продакшена без боли: пошаговый гайд от команды RuStore. Часть 2

5 min

1.4K

VK corporate blogDevelopment Management * Project management * IT Standards * Web services testing *

Tutorial

В первой части гайда RuStore по доставке фичей мы — техлид backend-команды Rustore Григорий Рябов и руководитель команды разработки RuStore: направление платежей, Александр Котельников, разобрали подготовительные этапы, которые закладывают прочный фундамент для всей разработки: от Kick-off и архитектурного планирования до Technical Design и тестовой стратегии.

+32

vorobeevich Mar 13 2025 at 12:36

GigaChat 2.0 в API

Medium

14 min

42K

SberDevices corporate blogСбер corporate blogArtificial IntelligenceMachine learning * Big Data *

Review

Салют, Хабр! Время летит незаметно. Будто совсем недавно мы знакомили вас с GigaChat MAX, но мы не стоим на месте и сегодня готовы представить вам обещанный апгрейд. За полгода мы значительно улучшили обучающие данные, поработали над инфраструктурой обучения моделей, а также уделили особое внимание всему процессу Alignment-а, в том числе RLHF.

Представляем вам GigaChat 2 — полностью обновлённую линейку моделей в версиях Lite, Pro и Max. Все модели серьёзно улучшены: мы обновили pretrain’ы, улучшили большинство метрик по сравнению с предыдущими версиями, добавили поддержку контекста в 128 тысяч токенов, улучшили вызовы функций, и в целом повысили понимание инструкций.

GigaChat 2 — не просто сухие числа и технические улучшения. Теперь это надёжный помощник в повседневных задачах. Например, он легко оформит отчёт для работы, напишет чистый и эффективный код, поздравит с днём рождения или даст мудрый совет. Мы уверены: с ним вы сможете делать больше, быстрее и лучше как на работе, так и в жизни. Попробуйте GigaChat 2 уже сейчас в Playground — пользовательском интерфейсе для продвинутой работы с промптами!

GigaChat 2

+67

techevangelist Nov 27 2024 at 14:22

Task изнутри: управление потоками в .NET и создание своих планировщиков

Easy

5 min

15K

OTUS corporate blog.NET * C# *

Привет, Хабр! Сегодня поговорим о том, как работают задачи в .NET, зачем может понадобиться собственный TaskScheduler и как его реализовать.

+16

MaxRokatansky Nov 27 2024 at 18:12

Run, change, disrupt или как эффективно управлять различными видами деятельности в организации

5 min

7.3K

OTUS corporate blogProject management * Development Management *

Современные компании постоянно сталкиваются с необходимостью управлять множеством разных процессов и инициатив. Чтобы не запутаться в этом сложном мире и максимально эффективно использовать ресурсы, важно разделять проекты и задачи на три основные категории: run, change и disrupt. Это не просто модель для описания потоков работ — это практический подход к управлению деятельностью в организации, помогающий расставить приоритеты и распределить ресурсы с умом.

+14

MaxRokatansky Nov 28 2024 at 08:28

Фасилитация стратегической сессии по методике Уолта Диснея

5 min

7.2K

OTUS corporate blogProduct Management * Project management *

Методика Уолта Диснея — это подход к разработке идей, который сочетает креативность, реализм и критическое мышление. Она помогает командам генерировать смелые идеи, превращать их в реализуемые планы и находить решения для преодоления препятствий. Такой структурированный процесс часто применяется для стратегического планирования, инноваций и проектного менеджмента.

Уолт Дисней был придумал этот метод, поскольку был мастером креативного процесса. В основе его метода лежит смена ролей участников, что позволяет взглянуть на задачу с разных точек зрения. Эта методика может быть полезна в самых различных сферах: от разработки новых продуктов до трансформации бизнес‑процессов.

Методика предполагает разработку решения через одевание разных шапок последовательно. Давайте разберем каждую из них.

+12

badcasedaily1 Nov 28 2024 at 11:17

Динамические SQL-запросы в PostgreSQL: когда, зачем и как

Easy

4 min

22K

OTUS corporate blogDatabase Administration * Programming * SQL * PostgreSQL *

Review

Сегодня поговорим о мощной штуке в PostgreSQL, которая одновременно помогает и открывает портал в ад: динамические SQL‑запросы. Динамика — это когда SQL собирается на лету, а не пишется заранее статичным текстом. Звучит неплохо, но при неправильном подходе легко превращается в катастрофу.

+20

kmoseenk Nov 28 2024 at 14:13

Мастерство работы с Java Stream

Medium

14 min

45K

OTUS corporate blogJava * Programming *

Translation

Опираясь на свой повседневный опыт разработки, я составил подробное резюме основных моментов, сложных аспектов использования, типичных сценариев и других важных аспектов работы со Stream. Надеюсь, это поможет вам лучше понять Stream и применять его в разработке проектов более эффективно.

+23

Andrey_Biryukov Nov 28 2024 at 19:09

Безопасная разработка в Flask

6 min

5.4K

OTUS corporate blogProgramming *

Тема безопасной разработки актуальна для различных языков программирования и фреймворков, использующих данные языки. Ранее мы уже говорили о безопасной разработке на Python, а сегодня рассмотрим безопасную разработку в Flask, облегченном фреймворке, написанном на Python для разработки веб-приложений WSGI. Flask был разработан для быстрого и простого начала работы с возможностью масштабирования до сложных приложений.

По сути, Flask представляет собой набор библиотек и модулей, которые позволяют разработчикам веб-приложений писать приложения, не сильно беспокоясь о деталях низкого уровня, таких как протокол, управление потоками и так далее. При этом, в нем есть много интересных функций, таких как маршрутизация URL-адресов, механизм шаблонов и т.д.

+17

techevangelist Nov 29 2024 at 06:03

Что такое переобучение и как его избежать: основы

Easy

8 min

13K

OTUS corporate blogMachine learning *

Review

Если вы только начинаете свой путь в машинном обучении или уже успели столкнуться с его непредсказуемыми сюрпризами, то сегодняшняя статья для тех, кто хочет понять и победить переобучение (оно же overfitting).

С технической точки зрения, переобучение происходит, когда модель имеет слишком много параметров относительно объёма и разнообразия тренировочных данных. Модель начинает подстраиваться под шумы и случайные отклонения в данных, вместо того чтобы уловить истинные закономерности.

+19

techevangelist Nov 30 2024 at 09:37

Garbage Collection в Kubernetes: основы

Easy

9 min

3.8K

OTUS corporate blogKubernetes * IT Infrastructure *

Привет, Хабр! Сегодня мы рассмотрим механизмы garbage collection в Kubernetes: как удалять orphaned pods, утилизировать устаревшие данные и управлять томами.

Garbage Collection в Kubernetes — это автоматизированный процесс очистки неиспользуемых ресурсов, который предотвращает засорение кластера «мусором». Без GC кластер может превратиться в лабиринт забытых подов, устаревших ConfigMaps и ненужных томов, что очевидно приведет к снижению производительности и увеличению затрат.

+11

evgenijkkk Nov 2 2024 at 10:28

GigaChat MAX — новая, сильная модель GigaChat

Medium

22 min

75K

SberDevices corporate blogСбер corporate blogMachine learning * Artificial IntelligenceBig Data *

Review

Салют, Хабр! Прошедший сезон оказался богат на релизы: ровно год назад мы делились новостями о GigaChat Pro, затем весной рассказали об увеличении контекста и улучшении возможностей модели, а совсем недавно завершили обучение GigaChat Vision: мы научили GigaChat понимать картинки и уже пишем про это статью.

Наши модели непрерывно развиваются, обретая всё больше новых функций, и сегодня повод рассказать о них. Встречайте наш новый GigaChat MAX!

GigaChat MAX

+101

100

2 3