Обновить

Я изучил десятки ИИ-стартапов в России. Вот почему большинство из них обречены

Уровень сложностиСредний
Время на прочтение5 мин
Охват и читатели9K
Всего голосов 19: ↑10 и ↓9+3
Комментарии12

Комментарии 12

Ценность - отраслевая экспертиза и доступ к данным. Поскольку порог входа в создание собственных моделей сейчас выше, чем в авиакосмическую промышленность, - почти любой стартап обречён быть обёрткой над чужим API. Но если этот стартап собрал и использовал опыт в предметной сфере / данные, которые не получить общением с LLM или гуглением - он имеет шансы выжить. Благо, предметных экспертов, способных структурировать свои знания в пригодном для AI-автоматизации виде, кот наплакал, так что наличие такового в команде может стать главным преимуществом.

А готовность к суверенным моделям - это на уровне готовности к апокалипсису. Очевидно, что если суверенные модели, соответствующие озвучиваемым сейчас требованиям, и будут созданы (что само по себе вряд ли) - то они будут гораздо глупее LLMок образца 2022 года, и построить на них что-то полезное будет невозможно. Наступит это "светлое будущее" - придётся или, как обычно, компенсировать строгость закона необязательностью исполнения (принимая все риски), или уходить на другие рынки, на которых суицидальных регуляций не принято.

Ну и, кстати, масштабируемость на рынки за пределами РФ как-то забыта. Даже при самом замечательном стечении обстоятельств нельзя забывать, что рынок в России очень и очень небольшой. И хотя сейчас выход на внешние рынки объективно затруднён, заранее закладывать такой задел, IMHO, обязательно.

Согласен про отраслевую экспертизу - это действительно сильный барьер, и в статье я это упоминаю как "экспертиза в нише". Предметный эксперт, который структурировал знания в пригодном для автоматизации виде, стоит дороже любого промпт-инженера. Тут мы на одной волне.

По суверенным моделям - не соглашусь что это уровень апокалипсиса. Речь не идёт о том, что появится российский GPT-4 на базе процессора Эльбрус. Закон о доверенных моделях скорее всего будет работать по принципу "модель развёрнута на территории РФ, данные не уходят за границу". А это как раз то, что open-source модели уже позволяют. DeepSeek V4(который вот-вот выйдет) и Qwen 3.5 прямо сейчас сопоставимы с Claude/GPT на задачах кодогенерации, и их можно развернуть на Timeweb, Selectel или собственном железе. Не нужно ждать суверенную модель - нужно взять open-source и захостить в РФ. Требование закона выполнено.

Про масштабируемость за пределы РФ - справедливо, но это зависит от типа продукта. Если стартап строит обёртку над ChatGPT для российского рынка, ему нечего предложить за рубежом - там таких обёрток тысячи. А вот вертикальные решения с глубокой интеграцией (1С, Wildberries, Ozon) масштабируются на СНГ и развивающиеся рынки, где западные решения тоже недоступны или неактуальны. Рынок не ограничивается РФ - есть Казахстан, Узбекистан, Беларусь с похожими экосистемами.

Не нужно ждать суверенную модель - нужно взять open-source и захостить в РФ. Требование закона выполнено.

Мне кажется, Вы невнимательно прочитали законопроект :) Суверенная модель (в отличие от национальной) должна быть обучена только на данных, сформированных в РФ, и без использования компонентов, разработанных за границей (т.е. весь минимально популярный опенсорс под запретом). Поэтому я и считаю их создание скорее невозможным (для начала попробуем решить для достаточно большого набора данных задачку "выяснить, где они были сформированы"), а если вдруг кто-то в этом и преуспеет, то результат - весьма плачевным.

Важное уточнение: в законопроекте различаются суверенные и национальные модели. Я нигде не утверждал что DeepSeek или Qwen претендуют на статус суверенных.

Суверенная модель - обучена на российских данных, без зарубежных компонентов. Это GigaChat, Alice AI. Для госсектора и критической инфраструктуры. Тут согласен - создать сложно, качество будет ниже.

Национальная модель - любая модель, развёрнутая на территории РФ, данные не пересекают границу. DeepSeek на Timeweb, Qwen на Selectel. Полноценные модели уровня GPT-4, просто хостятся в РФ. Для бизнеса, e-commerce, маркетинга.

Закон предусматривает градацию, а не полный запрет. Критическая инфраструктура - суверенные. Всё остальное - национальные. Open-source модели на российских серверах закрывают 90% бизнес-задач, и это уже работает сегодня.

Кстати, про суверенный интернет к 2028 году тоже уже обсуждают. В этом контексте платформа с LLM-роутером, которая переключается между моделями за час - это не "готовность к апокалипсису", а базовая инженерная гигиена.

Ну в статье-то про суверенные...

Что касается селф-хостинга опенсорсных моделей - тут скорее за экономику этой затеи опасения. Даже железо, которое способно просто потянуть инференс топовой оперсорсной модели (она всё равно будет уступать топовой коммерческой, но допустим придётся) уже стоит миллионы. Железо, которое способно обеспечить этот инференс так, чтобы сотни-тысячи одновременных пользователей получали приемлемый tps - это уровень затрат не стартапа, а крупного бизнеса.
Каков должен быть средний ценник для пользователя, чтобы окупить такие затраты? И есть ли в России столько пользователей, которые готовы платить такие деньги? А с учётом стремительного устаревания подобных капвложений? У нас тут не Силиконовая Долина, миллиарды инвестиций в планово убыточные на обозримом горизонте компании желающих делать что-то не наблюдается...
Малый бизнес, который о многомилионных прибылях и не мечтает, вообще в пролёте оказывается. Но даже если теоретически стартап через какое-то время экономику содержания собственной стойки с Nvidia DGX потянет - как на такой рынок входить-то? И кто будет рисковать на старте вкладывать сотни миллионов, понимая объективный риск неудачи? Так что начинать всё равно со сторонних API. Ну или с аренды GPU в стороннем облаке, что с т.зр. стабильности и гарантий не лучше.

ИМХО, всё что касается персональных данных - это не про бищнес, а ппо то как отсечь от него тех кого не надо: все размыто, по сути отдано на откуп чиновнику или конторе кого надо, вам всенда могут на ровном месте придумать не реализуемые требования. Нет денег, чтобы договариваться - даже не лезти.

Уверен, что с суверенным ии будет ещё хуже, от любоно стартапа будут ожидать милионных вложений в чиновников.

Доля правды в этом есть, спорить не буду. Регулирование в РФ часто работает именно так.

Но есть нюанс: закон про суверенные модели направлен на критическую инфраструктуру - банки, госсектор, оборонка. Это про Сбер, Яндекс, Ростелеком. Им есть что терять и есть бюджеты на compliance.

Малый бизнес, который делает бота для кофейни или лендинг для автомойки, регулятор не тронет. Не потому что не хочет, а потому что физически не дотянется. Как с 152-ФЗ: формально каждый ИП должен хранить персональные данные на серверах в РФ, по факту - проверяют только крупных.

Для стартапа стратегия простая: строй архитектуру так, чтобы в момент X можно было переключиться на любую сертифицированную модель за час. Не нужны миллионные вложения в чиновников - нужен LLM-роутер в коде. Это дешевле.

С какой суверенной моделью вы там генерить проекты за вечер?

VibePilot использует Qwen и DeepSeek через API. Это не суверенные модели, таких для генерации кода пока ни у кого нет - закон вступает в силу в сентябре 2027. Готовые проекты разворачиваются на российских серверах (Timeweb Cloud). Когда появятся конкурентоспособные российские модели, переключимся. Архитектура это позволяет.

Возможно ошибаемся, но вспоминая экономические термины, "чем больше регулирование рынка, тем меньше становится его ёмкость (обьем)". Это к вопросу о национальных и суверенных моделях. Мудрый подход гос-ва был бы (любого) установить единые правила игры, ведущие к росту, и следить за их выполнением, не пытаясь самому в этом процессе зарабатывать, "соревнуясь" с бизнесом. Вероятно, что в RU это может оказаться невозможно

Сам технарь, но бизнес проекты очень редко стреляют или погибают из за инфры и техстека. У многих успешных под капотом ад для понимающего, как должно быть по уму... технаря

Абсолютно верно. Twitter годами работал на монолите Ruby on Rails. WhatsApp обслуживал 900 миллионов пользователей командой из 50 инженеров на Erlang, который большинство считает экзотикой. Бизнес убивает не плохой стек, а отсутствие продукта, который кому-то нужен.

Но есть нюанс: если техстек позволяет итерироваться быстро, шансы найти product-market fit выше. Не потому что код красивый, а потому что можно проверить 10 гипотез вместо одной за то же время.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации