ignatenkosergey9 мар в 12:03

Я изучил десятки ИИ-стартапов в России. Вот почему большинство из них обречены

Средний

5 мин

9.5K

Венчурные инвестицииУправление продуктом * Бизнес-модели * Искусственный интеллектМашинное обучение *

Мнение

Комментарии 14

aborouhin 9 мар в 12:53

Ценность - отраслевая экспертиза и доступ к данным. Поскольку порог входа в создание собственных моделей сейчас выше, чем в авиакосмическую промышленность, - почти любой стартап обречён быть обёрткой над чужим API. Но если этот стартап собрал и использовал опыт в предметной сфере / данные, которые не получить общением с LLM или гуглением - он имеет шансы выжить. Благо, предметных экспертов, способных структурировать свои знания в пригодном для AI-автоматизации виде, кот наплакал, так что наличие такового в команде может стать главным преимуществом.

А готовность к суверенным моделям - это на уровне готовности к апокалипсису. Очевидно, что если суверенные модели, соответствующие озвучиваемым сейчас требованиям, и будут созданы (что само по себе вряд ли) - то они будут гораздо глупее LLMок образца 2022 года, и построить на них что-то полезное будет невозможно. Наступит это "светлое будущее" - придётся или, как обычно, компенсировать строгость закона необязательностью исполнения (принимая все риски), или уходить на другие рынки, на которых суицидальных регуляций не принято.

Ну и, кстати, масштабируемость на рынки за пределами РФ как-то забыта. Даже при самом замечательном стечении обстоятельств нельзя забывать, что рынок в России очень и очень небольшой. И хотя сейчас выход на внешние рынки объективно затруднён, заранее закладывать такой задел, IMHO, обязательно.

ignatenkosergey 9 мар в 13:13

Согласен про отраслевую экспертизу - это действительно сильный барьер, и в статье я это упоминаю как "экспертиза в нише". Предметный эксперт, который структурировал знания в пригодном для автоматизации виде, стоит дороже любого промпт-инженера. Тут мы на одной волне.

По суверенным моделям - не соглашусь что это уровень апокалипсиса. Речь не идёт о том, что появится российский GPT-4 на базе процессора Эльбрус. Закон о доверенных моделях скорее всего будет работать по принципу "модель развёрнута на территории РФ, данные не уходят за границу". А это как раз то, что open-source модели уже позволяют. DeepSeek V4(который вот-вот выйдет) и Qwen 3.5 прямо сейчас сопоставимы с Claude/GPT на задачах кодогенерации, и их можно развернуть на Timeweb, Selectel или собственном железе. Не нужно ждать суверенную модель - нужно взять open-source и захостить в РФ. Требование закона выполнено.

Про масштабируемость за пределы РФ - справедливо, но это зависит от типа продукта. Если стартап строит обёртку над ChatGPT для российского рынка, ему нечего предложить за рубежом - там таких обёрток тысячи. А вот вертикальные решения с глубокой интеграцией (1С, Wildberries, Ozon) масштабируются на СНГ и развивающиеся рынки, где западные решения тоже недоступны или неактуальны. Рынок не ограничивается РФ - есть Казахстан, Узбекистан, Беларусь с похожими экосистемами.

aborouhin 9 мар в 13:29

Не нужно ждать суверенную модель - нужно взять open-source и захостить в РФ. Требование закона выполнено.

Мне кажется, Вы невнимательно прочитали законопроект :) Суверенная модель (в отличие от национальной) должна быть обучена только на данных, сформированных в РФ, и без использования компонентов, разработанных за границей (т.е. весь минимально популярный опенсорс под запретом). Поэтому я и считаю их создание скорее невозможным (для начала попробуем решить для достаточно большого набора данных задачку "выяснить, где они были сформированы"), а если вдруг кто-то в этом и преуспеет, то результат - весьма плачевным.

ignatenkosergey 9 мар в 14:35

Важное уточнение: в законопроекте различаются суверенные и национальные модели. Я нигде не утверждал что DeepSeek или Qwen претендуют на статус суверенных.

Суверенная модель - обучена на российских данных, без зарубежных компонентов. Это GigaChat, Alice AI. Для госсектора и критической инфраструктуры. Тут согласен - создать сложно, качество будет ниже.

Национальная модель - любая модель, развёрнутая на территории РФ, данные не пересекают границу. DeepSeek на Timeweb, Qwen на Selectel. Полноценные модели уровня GPT-4, просто хостятся в РФ. Для бизнеса, e-commerce, маркетинга.

Закон предусматривает градацию, а не полный запрет. Критическая инфраструктура - суверенные. Всё остальное - национальные. Open-source модели на российских серверах закрывают 90% бизнес-задач, и это уже работает сегодня.

Кстати, про суверенный интернет к 2028 году тоже уже обсуждают. В этом контексте платформа с LLM-роутером, которая переключается между моделями за час - это не "готовность к апокалипсису", а базовая инженерная гигиена.

aborouhin 9 мар в 18:41

Ну в статье-то про суверенные...

Что касается селф-хостинга опенсорсных моделей - тут скорее за экономику этой затеи опасения. Даже железо, которое способно просто потянуть инференс топовой оперсорсной модели (она всё равно будет уступать топовой коммерческой, но допустим придётся) уже стоит миллионы. Железо, которое способно обеспечить этот инференс так, чтобы сотни-тысячи одновременных пользователей получали приемлемый tps - это уровень затрат не стартапа, а крупного бизнеса.
Каков должен быть средний ценник для пользователя, чтобы окупить такие затраты? И есть ли в России столько пользователей, которые готовы платить такие деньги? А с учётом стремительного устаревания подобных капвложений? У нас тут не Силиконовая Долина, миллиарды инвестиций в планово убыточные на обозримом горизонте компании желающих делать что-то не наблюдается...
Малый бизнес, который о многомилионных прибылях и не мечтает, вообще в пролёте оказывается. Но даже если теоретически стартап через какое-то время экономику содержания собственной стойки с Nvidia DGX потянет - как на такой рынок входить-то? И кто будет рисковать на старте вкладывать сотни миллионов, понимая объективный риск неудачи? Так что начинать всё равно со сторонних API. Ну или с аренды GPU в стороннем облаке, что с т.зр. стабильности и гарантий не лучше.

Spyman 14 мар в 18:05

Я думаю тут есть интересный нюанс. Недавно на Хабре была статья от человека, который в академических целях разрабатывал своего кодинг агента (аналог codex/clode но своими руками), и он утверждал, что длительная донастройка требуется даже при переключении между gpt-5.2/5.3-codex, и падение качества существенное, а при переходе между сетками ещё более существенное. Так-что высока вероятность, что просто роутер между разными llm - это меньшая проблема, а большая - под поведение новой llm подстроиться.

ignatenkosergey 15 мар в 10:32

Верное наблюдение. На практике проблема даже острее чем кажется.

При переключении между моделями меняется не только качество кода, но и поведение на уровне tool calling. Одна модель корректно вызывает функции через API, другая генерирует tool call как обычный текст в ответе. Одна строго соблюдает порядок сообщений (assistant с tool_calls → tool result), другая спокойно принимает произвольный порядок. Вставка системного сообщения между ними у одного провайдера проходит незаметно, у другого вызывает 400-ю ошибку.

Решение, к которому я пришёл после работы с несколькими провайдерами: не монолитный агент на одной модели, а мульти-агентная архитектура с разделением ролей. Планировщик, кодер, ревьюер, дизайнер — каждый со своим промптом, каждый может работать на своей модели. Если конкретная модель хорошо планирует но плохо кодит, она работает только планировщиком. Переключение провайдера затрагивает одну роль, а не всю систему.

Плюс обязательный слой защиты: regex-детекция текстовых tool calls с retry, нормализация порядка сообщений перед отправкой, fallback между провайдерами при 403/400. Без этого роутер между LLM действительно бесполезен

riv9231 10 мар в 04:36

ИМХО, всё что касается персональных данных - это не про бищнес, а ппо то как отсечь от него тех кого не надо: все размыто, по сути отдано на откуп чиновнику или конторе кого надо, вам всенда могут на ровном месте придумать не реализуемые требования. Нет денег, чтобы договариваться - даже не лезти.

Уверен, что с суверенным ии будет ещё хуже, от любоно стартапа будут ожидать милионных вложений в чиновников.

ignatenkosergey 10 мар в 05:09

Доля правды в этом есть, спорить не буду. Регулирование в РФ часто работает именно так.

Но есть нюанс: закон про суверенные модели направлен на критическую инфраструктуру - банки, госсектор, оборонка. Это про Сбер, Яндекс, Ростелеком. Им есть что терять и есть бюджеты на compliance.

Малый бизнес, который делает бота для кофейни или лендинг для автомойки, регулятор не тронет. Не потому что не хочет, а потому что физически не дотянется. Как с 152-ФЗ: формально каждый ИП должен хранить персональные данные на серверах в РФ, по факту - проверяют только крупных.

Для стартапа стратегия простая: строй архитектуру так, чтобы в момент X можно было переключиться на любую сертифицированную модель за час. Не нужны миллионные вложения в чиновников - нужен LLM-роутер в коде. Это дешевле.

FSmile 10 мар в 08:54

С какой суверенной моделью вы там генерить проекты за вечер?

ignatenkosergey 10 мар в 15:33

VibePilot использует Qwen и DeepSeek через API. Это не суверенные модели, таких для генерации кода пока ни у кого нет - закон вступает в силу в сентябре 2027. Готовые проекты разворачиваются на российских серверах (Timeweb Cloud). Когда появятся конкурентоспособные российские модели, переключимся. Архитектура это позволяет.

zverobaken 10 мар в 11:19

Возможно ошибаемся, но вспоминая экономические термины, "чем больше регулирование рынка, тем меньше становится его ёмкость (обьем)". Это к вопросу о национальных и суверенных моделях. Мудрый подход гос-ва был бы (любого) установить единые правила игры, ведущие к росту, и следить за их выполнением, не пытаясь самому в этом процессе зарабатывать, "соревнуясь" с бизнесом. Вероятно, что в RU это может оказаться невозможно

tester37 12 мар в 11:36

Сам технарь, но бизнес проекты очень редко стреляют или погибают из за инфры и техстека. У многих успешных под капотом ад для понимающего, как должно быть по уму... технаря

ignatenkosergey 12 мар в 11:41

Абсолютно верно. Twitter годами работал на монолите Ruby on Rails. WhatsApp обслуживал 900 миллионов пользователей командой из 50 инженеров на Erlang, который большинство считает экзотикой. Бизнес убивает не плохой стек, а отсутствие продукта, который кому-то нужен.

Но есть нюанс: если техстек позволяет итерироваться быстро, шансы найти product-market fit выше. Не потому что код красивый, а потому что можно проверить 10 гипотез вместо одной за то же время.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий