kliment_ceo May 26 at 21:18

Два игрока на весь российский рынок ИИ: что показал ЦИПР-2026

Easy

12 min

17K

Artificial IntelligenceMachine learning * ConferencesThe future is here

Reportage

+23

Comments 38

verticalacid May 27 at 01:33

Сбер объяснил наконец, каким образом создал с нуля Gigachat 3 на своих A100, и почему поведение получилось дипсика, со всей унаследованной от GPT русофобией?

До этого ни о каких российских LLM говорить смысла нет. У Яндекса квен за безумные деньги - тоже ни о чем.

formerchild May 27 at 06:49

Там вообще сплошная фобия. Меня забанили за безобидный вопрос по философии Хайдеггера (именно по философии, по БиВ, а не по его политическим взглядам). Человеческие админы подтвердили бан. Пытаюсь понять, это что вообще было? 451 градус какой-то

kliment_ceo May 27 at 11:56

Где забанили? Не понял комментарий, если честно

ogukuu May 27 at 09:30

Модель АвтоВАЗа это максимум на что можно рассчитывать в нашем государстве сейчас.

Ну или москвич 3)

kliment_ceo May 27 at 11:56

Будем надеятся что ИИ не постигнет учесть АвтоВАЗ :)

kliment_ceo May 27 at 11:55

Тут не могу сказать. Лучше у самого Сбера спросить. В целом мы подобный вопрос с ними обсуждали - но они настаивают что у них своя модель полностью обученная с нуля (во что, лично я, слабо верю)

Weron2 May 27 at 18:41

Сами данные такие в большинстве своем, я так думаю

UFO landed and left these words here

ITDiver77 May 27 at 06:41

Совершенно сугубо. По хорошему крупняк должен не фигнёй страдать, из серии яша/сбер запили нам своё. А открывать специализированные отделы а то и депы, проектирующие интеграцию с ИИ. На крайняк - нанимать профи для настройки процессов и поддержания потом, но это такое. "приходящий сисадмин" актуален для компании в 10 человек, но аутсорсить айти для корпорации - нонсенс. Тут ровно всё так-же, и лишь костность мышления ЛПР компаний сдерживает от бурного роста. Да, с железом есть сложности, но решаемые на уровне корпораций.

kliment_ceo May 27 at 11:54

Спасибо за разбор по делу, приятно читать такие комментарии :)

Где вы правы - там не спорю. HBM против GDDR, bandwidth как боттлнек на больших батчах, ECC, bit flip от перегрева - всё так.

Про перегрев именно четырых 5090 в стаднатрных 19 дюймах серверных юнитах - пока лично я не могу сказать, тк мы как раз в изучении данного вопроса. Но есть заявление, как минимум, одного поставщика, что так работать может и уже проведены нагрузочные тесты. Как узнаю - напишу результат.

Под задачи на 7–32B, а их в корпоратах большинство — спокойно живут на потребительском железе, и там оно дешевле. Фронтир и 70B+ требуют датацентровых карт с NVLink и ECC - я так и писал.

Далее Вы пишите что корпам нужен on-premise в закрытом контуре. ИИ-Фабрика - это и есть on-premise в контуре заказчика, данные не покидают периметр. Возможно, вы упустили это в моем тексте.

Про «панику агрегатора», чтобы обвинить меня в том, что агрегатор мёртв, надо пропустить целый абзац в моей статье и не читать мои другие статьи на хабре, где я пишу что на чистом агрегаторстве, как это массово сложилось сейчас в России (обертка поверх чужих апи) - бизнес не построишь, и мы уже давно не там. Я это говорю с начала 2025 года :)

Спасибо за комментарий, еще раз!

SaNNy32 May 31 at 21:27

Это же полностью сгенерированный нейросетью комментарий

SaNNy32 Jun 1 at 11:20

Ну вот, наконец таки НЛО удалило этот нейрослоп.

ToniDoni May 27 at 01:57

А почему у вас в gptunnel кэшированные токены не тарифицируются отдельно, если что, они обычно в 10 раз дешевле ;)

А модель уровня 30B в квантизации спокойно живёт на потребительском Blackwell — RTX 5090 с 32 ГБ

И сколько клиентов такой сервер одновременно обслужит?

Обучение конкурентоспособной фронтир-модели - это, по оценкам, которые звучали на форуме, расходы порядка триллиона рублей

А чего не квадралион?
А то вот чуваки из Стэнфорда не знают, говорят LLaMA 3 400 B всего за 75M $ обучили
https://www.youtube.com/watch?v=9vM4p9NN0Ts&t=3496s

Сверху маржу давят крупные игроки с собственной инфраструктурой. Когда у тебя свои дата-центры, доступ к моделям перестаёт быть отдельным бизнесом и становится копеечной услугой поверх того, что и так есть.

А почему же у них тогда цены в сто (или в тысячу?) раз дороже, чем в остальном мире?

У Ростелекома есть Нейрошлюз. Билайн пошёл к малому бизнесу и ИП: доступ к топовым моделям — Claude, Seedance 2.0, Veo, NanоBanana и тд — можно подключить прямо в личном кабинете оператора; ход, на мой взгляд, разумный.

А покупать у Билайна чатгпт который забанил РФ это надежное решение?) Кстати где у Билайна Seedance?

ToniDoni May 27 at 02:34

подключить Claude для написания кода... ИИ-Фабрика делает ту же задачу внутри собственного контура компании

ну чудеса)

kliment_ceo May 27 at 12:00

Данные у вас - а не в Клоде. Клод - api, которое потом можно еще и на GLM в своем контуре, например, переключить.

ToniDoni May 27 at 15:46

Клод - api

А апи сервер клода в Америке)

Если ли вы и пользователям такие чудеса рассказываете, то приготовьтесь что к вам могут прийти, за то что не уведомили о возможной трансграничной передаче ПД.

UFO landed and left these words here

ayteayoga May 27 at 05:47

Всю статью можно поместить в десяток хороших абзацев, но тогда придётся бахнуть весь нейрослоп. Чудовищный жест, ничего не скажешь. Будем читать нейрослоп.

kliment_ceo May 27 at 12:03

спасибо за обратную связь! Тут даже не столько нейрослоп, сколько моя "неоптимизированная" подача мысли в статье. Дальше буду стараться более компактно писать, что бы повышать дочитываемость текста.

ZamirHa May 27 at 06:47

За статью спасибо. Хотя она интересна не оценками, а информацией, поверх которой эти оценки делаются.

Действительно, в России пока никаких более менее заметных подвижек с ИИ не видно и не предвидится. Не вовремя мы с колен начали вставать, уж извините за такое проявление нелояльности.

И, кстати, дежурное уже "но специалисты у нас все равно клевые" не сильно соответствует действительности. Разработчики действительно клевые, но они такие везде, а вот другие слои, которые должны этих разработчиков направлять и оборачивать - в полном Ж.

kliment_ceo May 27 at 12:07

Спасибо. И спасибо отдельно за «интересна информацией, а не оценками» — это ровно то, чего я и хотел: оценки мои личные, верно. А вот по фактуре каждый может сделать свои выводы.

Про «слои, которые оборачивают разработчиков» - соглашусь, но смягчу. Не везде Ж. Там, где продуктом занимаются люди, которые сами понимают технологию, а не пересказывают её с чужих слайдов, то там получается нормально. Но проблема в том, что таких пока мало.

LinkToOS May 27 at 07:25

Весь промышленный ИИ в России сегодня держится на двух компаниях — на Сбере и Яндексе.
Но ЦИПР — форум не про общие модели, а про промышленный ИИ.

Явное противоречие в этих фразах. Раз уж “промышленный ИИ” это общее понятие, а не только про генеративные модели, то “промышленный ИИ” никак не сводится к двум компаниям.

И вот тут ключевая мысль всего текста.
Промышленный ИИ в России сегодня нельзя купить как готовый продукт. Потому что это пока и не продукт — это серия партнёрств вокруг доступа к данным. ОАК пускает партнёра к своим данным по нервюрам — и тот обучает модель. ОДК пускает к данным с производства двигателей — и появляется компьютерное зрение. Каждый промышленный кейс — это отдельная сделка про данные, а не покупка лицензии.

Ключевая мысль сгенерирована ИИ ?

Объединённая двигателестроительная корпорация (ОДК) делает со Сбером компьютерное зрение

Компьютерным зрением начали заниматся задолго до распространения генеративных моделей. Компаний, которые занимаются компьютерным зрением, явно больше чем две.

allowq May 27 at 08:03

Банально, но ИИ это дорого. В странах, с которыми мы постоянно сравниваемся, деньгами заливают ошибки инженеров и менеджеров. По сложившейся традиции заимствуем, повторяем и улучшаем, с запазднием. Хотим дёшево и быстро, а потом ругаемся на качество.

В части баснасловных сумм. Представьте, что у вас штат 1000+ в RnD и их нужно занимать чем-то где есть спрос. Не следует трактовать эти цифры будто это исключительно инвестиции. Часто это OPEX и небольшие (по меркам корпораций) вложения под ожидаемую выручку. Не прибыль. Выручку. Далее маркетинг делает своё дело и появляются истории для всех целевых аудиторий:

для чиновников ради субсидий;
для разработчиков ради найма;
для пользователей ради хайпа.

Итого, вы просто перераспределили бюджет прошлого года. Далее, например, придумали такую смелую историю как "коммерциализация". Идея в том, чтобы начать продавать то, что делается внутри и для собственных нужд организации. Улучшая собственные процессы вы пытаетесь отбить затраты делая Продукты, заключаете партнёрства и подписываете соглашения о намерениях для дальнейшей продажи/внедрения. Выглядит как правильное дело! Если вы продуктовая компания, то даже проще.

В заключении, эффект от всех перечисленных историй крайне сложно посчитать, а в силу отсутствия конкуренции в стране денежные потоки оборачиваются и оборачиваются. Тот самый эффект подтверждается под честное слово. Бюджет переносится в новый год. Бонусы за отечественный ИИ платятся. Всем выгодно, кроме конечного потребителя, но куда мы денемся благодаря помощи государства в лице РКН и прочих лобистов, кому не выгодно терять тот самый бюджет?

ЦИПР хорош. Выводы делает каждый сам.

ENick May 27 at 08:27

"""Любопытно, что отставания в кадрах и фундаментальной науке эксперты на форуме как раз не фиксируют """ - а оно им надо??? В МГУ открыли факультет ИИ. Интересно узнать мнение Автора статьи о предполагаемых зарплатах выпускников, насколько меньше доставщиков пиццы?

kliment_ceo May 27 at 12:11

Отвечу за себя - мы нанимаем сеньоров и сильных людей, команда у нас относительно небольшая (сейчас 52 человека), и идём мы несколько быстрее рынка за счёт уровня, а не числа рук. Платим таким людям по рынку.

ENick May 27 at 12:37

Очень интересно (вопрос не академический), а после мехмата у Вас есть народ? Я сомневаюсь

kliment_ceo May 29 at 07:44

Конкретно после мехмата у нас, по-моему, нет, но тут могу ошибаться, специально не отслеживаю. Я на образование почти не смотрю. Смотрю на перформанс конкретного человека и на то, какие задачи он реально закрывает.

Для примера: у нас есть ряд ребят, кто много лет работал в Яндексе на разных позициях, в том числе топовых - показывают отличный результат. А есть сотрудники 2004–2005 года рождения, без высшего образования вообще, и это не мешает им работать на высоком уровне. Причём это люди уже с другим мышлением, чем поколения родившиеся в 1980-90-х.

Так что диплом сам по себе, лично для меня, мало о чём говорит.

Lisitsina May 27 at 10:43

"С кем из корпоратов ни заговоришь про ИИ, за спиной у него либо Сбер, либо Яндекс"

вопрос оптики. Вы говорите с теми, кто плохо знаком с промышленным ИИ. Да, рынок молодой, не все решения зрелые и упакованы как продукт. Но компаний, которые пушат эту тему, более чем достаточно. Просто они не готовы сливать бюджеты на выставочные стенды как Сбер.

kliment_ceo May 27 at 12:13

Справедливо - "вопрос оптики". Конкретно ЦИПР показывает тех, кто на ЦИПР приехал.

Опять же, повторюсь, возможно, картину я вижу не всю. Будет фактура, которая её поправит - скидывайте, с удовольствием разберу.

Lisitsina May 28 at 10:20

версия Форбс. Но даже она сильно субъективна, в фокусе только компании, которые активно работают со СМИ и участвуют в выставках. Год назад мы анализировали рынок, игроков с 1-3 типовыми решениями было более сорока.

KonstantinTokar May 27 at 14:31

Вот статья, которая человеческим языком раскрывает все тайны Российского ИИ: https://www.comnews.ru/content/245257/2026-05-14/2026-w20/1008/vychislitelnyy-tupik-pochemu-rossiyskiy-ii-ostaetsya-bez-moschnostey

Вкратце. За единицу приняли H100. В России (как примерно и у автора) 20.000 карт. А дальше сравните порядки цифр: и всё становится ясно. Никаких отечественных моделей не существует, и дело не в данных.

Сергей Миневич назвал топ стран по ИИ-вычислениям (TRG Datacenters / Forbes, сентябрь 2025):

1. США (39.7 млн H100e) 2. ОАЭ (23.1 млн H100e) - за счёт масштабных госпрограмм и партнерства с Microsoft (G42) 3. Саудовская Аравия (7.2 млн H100e) 4. Южная Корея (5.1 млн H100e) 5. Франция (2.4 млн H100e) 6. Индия (1.2 млн H100e) 7. Китай - в официальном рейтинге Epoch AI Китай занижен из-за "темных вычислений", но реальные оценки (GeoCoded) ставят его на уверенное второе место.

rPman May 29 at 06:58

у ОАЭ мощности виртуальные или физические? а то договор аренды 23млн железок у США это не плюс а минус.

KonstantinTokar May 29 at 07:09

Не знаю. В том контексте о котором и я написал, и автор это непринципиально

octoMax May 27 at 15:40

так, стоп, не ныть! Мы тут сверх (всего) держава! у нас самые стойкие оловянные солдатики и самый мудрый пендальф-правитель! а вы тут со своим ИИ лезете! кому надо - тот стойки привез откуда нада! вместо писательства -все валим на заводы - собирать стимпанк-дроны!

vladimir-habr May 28 at 05:23

Поделитесь пожалуйста опытом. Вот вы 32B модель раскатываете на RTX5090. А под нагрузкой параллельных запросов от пользователей куда деваете KVкэш?

rPman May 29 at 07:13

llama.cpp server делает их в ram автоматически (объем в –cache-ram), и на диск по запросу slots/3?action=save/restore, к сожалению не поддерживает vision модели.

помню был прокси, который это использует и управляет этим на лету

Scank May 28 at 07:47

Спасибо за обзор, приятно читать, хотя местами показалось водянисто.
Не ясно почему тот же Сбер и Яндекс не строят Цоды - купить H200 по паралельному не сложно. Все есть в наличии. Возможно вопрос договоров на коммерческие поставки.

Яндекс со своими ценами в 100 раз выше на модели чем западные компании идет в лес.
Вместо того чтобы занять поляну розничного инференса, которая освобождается в свете блокировок западных компаний, кажется они всеми силами делают все наоборот. Ощущение что развитие ИИ и ИТ отрасли специально тормозят.
И тот же Сбер буксует, скорее всего из за лютой бюрократии и не понимания менеджмента. Гигачат который успешно стартанул в прошлом году, сейчас отстал, и давно не обновлялся. Статьи сравнения, можно найти тут на хабре.

inf May 29 at 22:59

Спасибо, интересный обзор. Совпадает с собственными ощущениями от происходящего.