
Привет, Хабр. Меня зовут Антон, я технический директор ERA2.AI. Несколько лет назад мы плотно занимались YouTube, контентом и продакшеном: снимали обзоры, стримили процессы, монтировали ролики, делали обложки, озвучку, тексты, аудиодорожки, рендеры и всё то, из чего обычно состоит бодрая контентная мясорубка.
Расскажу, как мы упёрлись в потолок по штату сотрудников, почему новые руки не ускорили процесс, как Telegram-боты заморозили готовые наработки и чуть не отправили проект в кому, зачем мы вернули деньги части клиентов и как всё это доросло до ERA2 Voice и ERA2 Music. Так факап стал для нас жёстким пинком к перезагрузке.
О чём будет мой рассказ
Исторически всё выросло из товарного бизнеса и ремонта техники Apple, но сейчас этот этап кажется таким далёким, будто был в другой жизни. Для этой истории важнее другой этап: как вокруг YouTube, обзоров, стримов и продакшена вырос поток контентных задач. Именно там мы начали активно использовать AI, собирать первые внутренние инструменты и постепенно пришли к продуктовой логике.

Сначала всё выглядело почти как стартаперская мечта: команда горит своим делом, YouTube живёт, клиенты приходят, идеи сыплются быстрее, чем мы успеваем их оформлять в задачи. Казалось, достаточно работать много, шумно и с огоньком — и вся эта машина как-нибудь сама доедет до популярности и сверхдоходов. Потом реальность начала бить ключом. По голове. Газовым. YouTube в России начал работать нестабильно, доступ для части аудитории, мягко говоря, усложнился, просмотры стали не те, поведение пользователей изменилось, партнёрка, с которой мы работали, закрылась, привычная экономика контента поплыла, а внутри продакшена накопилось столько ручной работы, что хотелось не развивать бизнес, а лечь лицом в клавиатуру.
Параллельно мы активно использовали нейросети: для генерации изображений, текстов, аудиодорожек, озвучки, идей для роликов и маркетинговых материалов. И довольно быстро столкнулись с тем, что AI в рекламных демо и AI в реальном рабочем процессе — две разные сущности, как деревянный Буратино и живой человек. Вроде оба похожи на человека, но один бодро улыбается на витрине, а второй устаёт, спотыкается, требует нормальных условий и иногда вообще отказывается работать. Кроме того, нужны VPN, посредники, аккаунты, обходные способы оплаты, терпение, крепкая нервная система и отдельный человек, который помнит, где какой сервис снова отвалился.
Сначала мы собирали для себя внутренние инструменты — читайте: костыли. Потом сделали Telegram-ботов, потому что это казалось быстрым и логичным стартом. Потом Telegram сам превратился в хрупкую подпорку, которая внезапно начала бить нас по рукам. В итоге мы пришли к собственной веб-платформе ERA2.AI с личным кабинетом, историей генераций, оплатой, статусами задач и нормальными сценариями для пользователя.
Как начинался наш продукт
В этой статье не будет истории о том, как искусственный интеллект изменил мир и теперь мы все заживём. Таких текстов и без нас хватает. Мы скорее пришли к обратному выводу: сам по себе AI может принести больше проблем, чем пользы. Без автоматизации, нормальной обвязки и понятного сценария для пользователя ИИ быстро превращается в ещё один источник бардака.
Материал скорее для тех, кто управляет продуктом, командой или процессами и пытается понять, как набор разрозненных AI-инструментов превращается в рабочий сервис. Спойлер: через боль, поддержку, возвраты, спорные решения, посыпание головы пеплом и внезапное понимание, что интерфейс иногда важнее самой модели.
Здесь я поведаю о нашем пути: от YouTube-продакшена и контентных задач до AI-сервисов, которые мы сначала делали для себя. О наших ошибках, странных, мягко говоря, решениях, которые в моменте казались гениальными, недооценённых рисках из серии пока гром не грянет, попытках на ходу чинить процессы и о том, как мы постепенно пришли к простому выводу: ИИ-продукт начинается с нормального сценария для пользователя.
С чего всё началось: YouTube, контент и продакшен
Сначала вокруг нашей основной деятельности появился контент. Мы снимали обзоры, показывали процессы, стримили, делали ролики, обложки, озвучку и короткие форматы. Хотелось показывать готовый результат через понятную, живую и местами развлекательную историю.
Так появился YouTube-канал Техно Батя. Сейчас в нём 13 000 подписчиков и больше 300 роликов. Сначала канал работал как медиа вокруг основной деятельности. Потом медиа начало жить самостоятельной жизнью. Люди смотрели ролики, приходили с запросами и просили сделать круто, как у нас на канале.

Так появились заказные обзоры, ролики для клиентов, монтаж, озвучка, рендеринг, короткие форматы, стримы и отдельные задачи под маркетинг. Мы уже занимались полноценным продакшеном для внешних заказчиков.
И вот тут начался тот самый момент, который в компаниях обычно называют масштабированием, а в реальной жизни он чаще выглядит как управленческая горячка: каждую неделю появляется новая гениальная фишка, команда срочно пытается её реализовать, под неё нанимают людей, вкладывают деньги, а потом мы сидим над цифрами, грустно вздыхаем и делаем вид, что эта идея сама как-то завелась в беклоге.
Я тогда ещё искренне верил, что если мы просто добавим людей, процессы выдержат. Примерно на этом месте опытные продакты могут начать сочувственно улыбаться.
Больше народу — меньше кислороду, или Как мы упёрлись в потолок в найме
Пока задач было немного, мы держались на энтузиазме. Один человек снимал, второй монтировал, третий делал обложки, кто-то параллельно отвечал клиенту, кто-то выгружал ролик, кто-то ночью вспоминал, что в финальной версии забыли поправить звук.
Когда заказов стало больше, такая схема начала трещать по швам. Клиентская база росла, моделей взаимодействия становилось больше, задачи разъезжались по разным людям, и всё чаще появлялась ситуация: работа есть, деньги на рынке есть, спрос есть, а закрыть всё вовремя физически нечем.
Первое решение было очевидным: нанимать больше сотрудников. Мы усилили команду. Наняли ещё одного монтажёра, второго человека на озвучку, помощника на обложки и менеджера для общения с клиентами.
В фантазии всё выглядело логично: было 4 человека в продакшене — стало 8, значит, роликов должно стать почти в два раза больше. В реальности так не вышло. Вместо 40 роликов в месяц мы стали делать не 80, а 55–60.
Координация, отчёты, созвоны, согласования и правки съели эффективность. Мы искали узкое горлышко, но быстро выяснилось, что оно сидит не в одном человеке или этапе. Оно расползлось по самой схеме работы. Так мы на практике встретились с законом убывающей отдачи: каждый следующий человек добавлял всё меньше скорости и всё больше организационной нагрузки.
Особенно сильно это чувствовалось в разработке. Всегда нужен ещё один фронтенд. Потом ещё один бэкенд. Потом DevOps, потому что всё это надо где-то стабильно крутить. Потом аналитик, потому что без цифр непонятно, что происходит. Потом менеджер проекта, потому что иначе задачи начинают жить своей отдельной жизнью, заводят друзей, размножаются и возвращаются в беклог уже целой стаей.
Радость от того, как нас стало много, быстро сменилась посыпанием головы пеплом, когда в конце года мы посчитали окупаемость вложений. Людей стало больше, расходы выросли, а скорость не увеличилась пропорционально. И тогда нам пришлось расстаться с частью сотрудников — полюбовно, без драмы, но с очень неприятным ощущением, что красивая управленческая гипотеза разбилась о таблицу с цифрами. До сих пор помню один из таких разговоров. Передо мной сидел сильный сотрудник, к которому не было претензий по работе. Проблема была в нас: мы переоценили модель и раздули штат. После этого я почти не спал всю ночь. Самое неприятное было понимать, что человек теряет работу из-за нашего стратегического просчёта. Хорошо, что у наших клиентов нашлась для него работа: мы остались в хороших отношениях, а позже ещё и запустили совместный долгосрочный проект.
Когда привычная экономика контента начала проседать
Пока YouTube и партнёрки давали стабильную отдачу, схема выглядела рабочей. Контент привлекал аудиторию, аудитория приводила клиентов, клиенты давали заказы, заказы помогали развивать команду. Производственный цикл крутился и казался вполне работоспособным.
Потом эта конструкция начала шататься. YouTube в России начал работать нестабильно, доступ для части аудитории усложнился, просмотры стали не те, поведение пользователей изменилось. Партнёрка, с которой мы работали, закрылась. Деньги из привычных источников стали менее предсказуемыми. Telegram тоже начал подводить. Боты зависели от ограничений мессенджера: где-то ломалась загрузка файлов, где-то пользователи не понимали статус задачи, где-то сценарий упирался в лимиты и превращал поддержку в ручной разбор каждого случая.
Для меня это был неприятный, но полезный момент. Вроде бы у команды есть опыт, контент, аудитория, клиенты, понимание маркетинга и продакшена. Но старые каналы уже не дают прежней уверенности, а Telegram, который сначала казался удобным трамплином, постепенно сам превращается в источник рисков. Сегодня всё работает, а завтра у пользователя не грузится файл, и поддержка снова идёт с фонариком по логам.
Тогда мы начали двигаться сразу в двух направлениях. Первое — уходить в собственную веб-платформу, чтобы не держать продукт на чужом интерфейсе и не зависеть от каждого чиха мессенджера, платёжки или внешнего сервиса. Второе — активнее встраивать AI в продакшен, потому что нейросети уже стали мейнстримом и реально могли ускорить работу над текстами, обложками, озвучкой, аудиодорожками, короткими форматами и рекламными материалами.
По сути, нам нужно было сделать две вещи: подтянуть экономику и перестать зависеть от чужих правил. Веб-платформа давала свою площадку: личный кабинет, оплату, статусы, историю задач и понятный путь пользователя без угадывания, что опять сломалось и на чьей стороне проблема. Нейросети должны были разгрузить продакшен: быстрее делать тексты, обложки, озвучку, музыку и короткие форматы, без расширения штата после каждой новой идеи.
Так мы пошли двумя дорогами: собирали собственный веб и глубже встраивали AI в работу. С вебом всё было понятно: больно, дорого, долго, зато своё. С AI оказалось веселее. В презентациях он обещал ускорение и новую экономику, а в реальности быстро потребовал обвязку, контроль, нормализацию, поддержку и отдельное место для наших управленческих граблей.
Не скрою, нейросети меня поначалу очень цепляли. Было в этом что-то волшебное: нажимаешь кнопку — и будто будущее само летит к тебе в продакшен через форточку. Сначала я ходил вдохновлённый и местами даже опасно счастливый. Потом быстро выяснилось, что будущее пришло не одно, а с багами, лимитами, кривыми результатами, платными доступами, VPN и характером избалованной рок-звезды. Восторг сменился раздражением, потом разочарованием, потом рабочим азартом уже без розовых очков. Мы перестали ждать от AI чуда и начали строить вокруг него нормальный процесс. Вот тогда всё и поехало снова — уже трезво, по-взрослому.
Почему мы вообще посмотрели в сторону AI
Мы не садились за стол с идеей построить стартап на ИИ как идейные новаторы. Всё было приземлённее. У нас был контент-продакшен, растущий поток задач и очень понятная боль: нужно быстрее делать сценарии, обложки, озвучку, монтажные заготовки, рекламные ролики, короткие форматы и музыкальные подложки.
Нейросети вошли в работу естественно. Для YouTube и маркетинга мы использовали генерацию изображений, аудиодорожек, текстов, голосов и идей для роликов. Иногда это действительно экономило время. Иногда аттракцион с перегенерациями доводил до отчаяния, и возникала предательская мысль: лучше бы мы с самого начала сели и сделали всё руками.
Первые инструменты, с которыми мы экспериментировали, были сырыми. Сейчас это звучит почти мило, но тогда многие сервисы выглядели скорее как баг, чем как фича. Вроде бы модель что-то умеет, вроде бы результат иногда впечатляет, но повторить его стабильно сложно. Так, поиграться на разок.
Отдельный аттракцион — доступ. Зарубежные сервисы, аккаунты, подписки, посредники, VPN, ограничения, оплата, которая то проходит, то внезапно решает поучаствовать в психологическом триллере. Мы привычно платили с комиссией за разные инструменты, искали посредников, разбирались с покупкой аккаунтов и доступов. Несколько блокировок подряд — и в какой-то момент появилось стойкое ощущение, что половина AI-пайплайна состоит из самой генерации, а вторая половина — из попыток вообще добраться до кнопки генерации.
Тогда я впервые поймал себя на простой мысли: если нам, людям внутри контентной и технической команды, всё это неудобно, массовому пользователю будет ещё сложнее.
Как AI без обвязки устроил бардак
С чем мы столкнулись на практике?
Нейросеточный сценарий получался слишком гладким и не попадал в нужный тон. Голос хорошо звучал на короткой фразе, но на длинном тексте начинал утомлять: появлялась искусственность, однообразие, странные паузы. Демовидео выглядело красиво, а в реальном процессе внезапно всплывали ограничения по длительности, формату, скорости, стоимости и стабильности результата.
Аватар диктора часто получался искусственным: с рыбьим взглядом, неуместной улыбкой и ощущением пластикового человека в кадре. Музыкальная генерация могла дать интересный фрагмент, но потом начиналось мучение с длиной, повторяемостью, жанром, не тем ритмом и настроением.
Быстро стало понятно: просто подключить нейросеть к процессу мало. Если дать человеку пустое поле промта и сказать: ну, погнали генерировать, он хлопает глазами и зависает. Особенно если это не разработчик, не ИИ-энтузиаст и не тот, кто готов полвечера подбирать формулировки идеального промпта.
Так восторг быстро сменился раздражением, а если честно — геморроем и разочарованием. Нам был нужен рабочий пайплайн, который не разваливается при первом реальном заказе.
От использования чужих сервисов к своим решениям
Перелом случился, когда мы перестали относиться к ИИ как к готовой коробке и начали собирать вокруг него нормальный производственный процесс.
На примере озвучки это выглядело так. Очевидно, что письменная речь отличается от устной по структуре и ритму. Сначала мы разбивали текст на короткие фрагменты. Длинные абзацы модель читала хуже: сбивалась интонация, появлялись странные паузы, голос становился монотонным. Поэтому мы делили текст на смысловые блоки, чтобы каждый кусок звучал как отдельная нормальная реплика.
Потом чистили текст перед генерацией. Убирали лишние пробелы, странную пунктуацию, мусор после копирования, случайные переносы строк. Без этого модель могла делать паузы там, где их не должно быть, или читать фразу неестественно.
Отдельно обрабатывали числа, даты, сокращения и аббревиатуры. Например, 10:00 лучше заранее превратить в десять утра, №5 — в номер пять, а сложные технические сокращения — в форму, которую голосовая модель прочитает внятно. Мы создали целую базу таких автозамен и чистили тексты в полуавтоматическом режиме: корректор читал текст на выходе и исправлял только сложные и нестандартные случаи.
Дальше мы добавляли правила для пауз и темпа. В рекламном ролике нужна одна подача, в обучающем видео — другая, в коротком вертикальном ролике — третья. Один и тот же текст при разной скорости и разной расстановке пауз воспринимается совершенно по-разному.
После генерации мы проверяли результат не целиком, а по фрагментам. Если ломался один кусок, не нужно было заново пересобирать всю озвучку. Достаточно было перегенерировать конкретный блок, а потом склеить дорожку.
Так появился простой пайплайн:
принять текст;
очистить его;
разбить на смысловые фрагменты;
обработать числа, сокращения и аббревиатуры;
задать параметры голоса, темпа и пауз;
отправить фрагменты на генерацию;
проверить проблемные куски;
перегенерировать только неудачные фрагменты;
склеить аудио;
отдать пользователю готовый файл.
Сначала это были внутренние костыли для собственного продакшена: скрипты, простые формы, связки между сервисами, ручные проверки. Но именно они дали главный эффект. Мы перестали каждый раз воевать с моделью вручную и начали управлять процессом.
Как внутренний костыль начал превращаться в продукт
Сначала мы делали всё это для себя. Нужно было быстрее закрывать задачи по YouTube, обзорам, рекламным роликам, озвучке и маркетинговым материалам. Но чем больше мы собирали внутренних инструментов, тем яснее становилось: проблемы есть не только у нас.
Клиенты и знакомые команды задавали похожие вопросы. Где нормально сделать озвучку? Как сгенерировать музыку без возни с зарубежными сервисами? Как оплатить инструмент? Почему в одном сервисе нужен VPN, во втором нужен особый аккаунт, в третьем непонятный интерфейс, а в четвёртом результат хороший только в демо?
Стало очевидно: пользователь хочет готовый сценарий. Ему всё равно, как мы добьёмся результата — с помощью AI или с божьей помощью (скриптами, ручными проверками, автозаменами, очередями или связкой всего сразу). Он не хочет думать, как писать промт, как обходить лимит, как чистить текст, как склеивать результат и почему API сегодня отвечает медленнее, чем вчера. Он хочет загрузить текст, выбрать задачу, накликать конкретные параметры и получить нормальную озвучку.
Вот здесь внутренняя автоматизация начала превращаться в продукт. Не по красивому стратегическому плану на 10 слайдов, а скорее через повторяющуюся боль, которую мы сначала прожили сами, а потом увидели у внешних пользователей.
Так началась новая эра, а точнее ERA2.AI.
Что мы решили делать в ERA2
Мы не хотели делать очередную витрину ИИ-инструментов, где перед пользователем список сервисов, сбивающий с толку. Идея была другой: дать понятный сценарий — выбрал задачу, задал параметры, получил результат.
Так родились ERA2 Voice и ERA2 Music.
Для Voice это озвучка, дикторский голос, работа с текстом, подготовка аудио. Для Music — генерация музыкальных идей и треков под конкретные задачи. Дальше логично появляются видео, изображения, текстовые инструменты, агенты, общий аккаунт, общий баланс и единая система аналитики.
Но к этой логике мы пришли не сразу. Перед этим был этап, который сейчас хочется назвать ошибкой, но тогда он выглядел для нас быстрым стартом и почти гениальным решением. Да, я знаю, обычно именно так и начинаются хорошие истории с последующим разгребанием проблем.
Telegram-боты: быстрый старт, который позже ударил нас по рукам
Когда мы думали, как быстро дать пользователям доступ к AI-сценариям, Telegram выглядел идеальным вариантом. Привычный интерфейс, низкий порог входа, быстрый запуск, не нужно сразу строить полноценный личный кабинет, не нужно объяснять человеку, где что находится.
Так мы начали делать ботов под озвучку, генерацию, обработку отдельных задач. Под капотом — бэкенд, очереди, внешние API, хранение результатов, выдача файлов пользователю, оплата и поддержка.
На старте решение казалось здравым. Можно быстро проверить гипотезы, собрать первых пользователей, посмотреть, какие сценарии заходят. Где-то так и произошло: мы действительно сделали большой объём работы и получили первые подтверждения, что людям нужен готовый, простой и продуманный сценарий на базе ИИ.
Проблемы тоже появились быстро. Telegram как интерфейс удобен, пока сценарий простой. Но как только появляются несколько параметров, длинный ввод, загрузка тяжёлых файлов, статусы задач, история генераций, повторные попытки, оплата и поддержка, бот начинает превращаться в шкаф размером с многоэтажку с крошечными выдвижными ящиками.
Даже нам самим, профессиональной команде, не всегда было удобно этим пользоваться. Пользователь запускал задачу, переходил по шагам, ждал результат, потом пытался вспомнить, где он лежит и почему бот снова молчит как партизан. Если даже мы иногда смотрели на собственный сценарий и чесали затылок, массовому пользователю там было совсем не курорт.
Например, пользователь загружал текст на озвучку, бот принимал файл, задача уходила в очередь, а дальше человек видел тишину. В поддержке это выглядело коротко: не работает. А внутри мы разбирали сразу несколько возможных причин: Telegram, внешний API, очередь, файл, оплата, лимит или наш собственный сценарий, который снова решил показать характер.

Решение напоминало расследование Холмса и Ватсона: проблема в API, в очереди, в файле, в Telegram, в пользователе или в том, что мы сами придумали слишком хитрый сценарий и теперь делаем вид, что так и было задумано?
Когда Telegram стал точкой отказа
А потом начались ограничения в работе Telegram. Значительная часть уже готовых решений просто встала колом. Работу по нескольким направлениям пришлось заморозить и думать, как всё это вернуть к жизни уже в другой архитектуре.
Итак, к этому моменту проседали уже все привычные источники прибыли: и YouTube, и Telegram. Когда несколько опор начинают шататься одновременно, это очень бодрит. Примерно как холодный душ: мерзко, внезапно, зато мозг включается моментально.
Прилетели конфликты и возвраты средств. Пользователям было всё равно, что проблема не на нашей стороне. Для них сервис просто перестал работать, а переход в ручной режим выглядел как обман ожиданий.
Один из самых неприятных моментов был именно в этом: мы могли сколько угодно объяснять себе, что подвёл внешний интерфейс, что ограничения появились не по нашей воле, что под капотом всё ещё живо. Для клиента всё выглядело проще: он пришёл за результатом, заплатил деньги, а сервис не отработал как обещал. В таких ситуациях оправдания только раздражают.
Нас это отрезвило. Быстрый внешний интерфейс даёт скорость на старте, но легко становится причиной провала, особенно если вокруг него уже вырос продукт, появились пользователи, платежи и поддержка. Мы судорожно перестраивались.
Для меня это был момент, когда стало окончательно ясно: критичный продукт нельзя держать на платформе, которую ты не контролируешь. Там можно проверять гипотезы, собирать первых пользователей и быстро стартовать. Но строить серьёзный AI-сервис только на Telegram-ботах — удовольствие для людей с очень крепкой психикой.
Что мы изменили после Telegram
После истории с ограничениями мы начали всерьёз уходить в собственную систему. Telegram был простым началом. В вебе всё это пришлось собирать самим.
Мы сделали личный кабинет, загрузку файлов, историю генераций, статусы задач, повторные попытки, оплату, уведомления и нормальную аналитику. То, что в Telegram частично держалось на самом мессенджере, на сайте пришлось превращать в отдельные экраны, формы и сценарии.
Главный вывод был простой: в ИИ-сервисе интерфейс решает если не всё, то очень многое. Если пользователь криво ставит задачу, даже сильная модель может выдавать мусор. Если нет статуса задачи, пользователь пишет в поддержку. Если нет истории генераций, он теряет результат. Если непонятно, где скачать файл, виноват, конечно, сервис, а не пользователь.
Мы хотели создать платформу, которая будет удобнее российской аудитории: с нормальной оплатой, понятным доступом, личным кабинетом, историей, скачиванием файлов и работой без постоянных обходных путей через VPN, посредников и шаманский бубен.
Постепенно мы начали собирать продукты вокруг конкретных задач пользователя.

Почему Voice и Music вышли первыми
Voice был логичным продолжением нашего опыта в контенте. Мы сами постоянно работали с озвучкой: делали ролики, обзоры, рекламные вставки, короткие форматы, сценарии для клиентов. Поэтому хорошо понимали, где слабые места голосовых моделей в реальном продакшене.
Голосовая модель может быть сильной, но без нормализации текста она всё равно будет странно читать числа, сокращения, сложные конструкции, технические термины и длинные фразы. В демо это может быть незаметно. В рабочем заказе это превращается в серию перегенераций, и каждый раз выскакивает что-то новое.
Music появился рядом по той же причине. Для роликов нужны заставки, фоны и короткие музыкальные фрагменты под разные форматы. Брать чужую музыку рискованно: можно получить жалобу или санкции площадки. Поэтому хотелось генерировать свои треки под конкретную задачу.
С Music похожая история: важны не только промты, но и сценарии, жанровые ограничения, длина, повторяемость результата и ожидания пользователя. Можно попросить бодрый трек для рекламы, а получить заставку к второсортному сериалу.
К этому моменту мы уже усвоили главный урок. Сам по себе ИИ редко закрывает бизнес-задачу до конца. Это крутая штука, но продукт начинается там, где есть простота для пользователя, контроль процесса и повторяемый результат.
Что сейчас происходит с командой
Сейчас ERA2.AI продолжает расти, но уже продуманнее и осторожнее. В команде работают два бэкенд-разработчика, два фронтенд-разработчика, DevOps, аналитик, менеджер проекта, маркетолог. Мы подключаем специалистов из других проектов и работаем с клиентами по всему миру.
Часть пользовательских сценариев всё ещё живёт в Telegram, потому что ограничения затронули не всех клиентов. Ключевые продукты мы постепенно переносим в собственный веб-интерфейс.
Отдельная боль — фронтенд. Его всегда мало. Как только появляется новый сценарий, новые формы, новый кабинет, новые статусы задач, новые экраны аналитики, становится ясно, что кто-то снова недооценил интерфейс. Обычно этот кто-то — мы.
Параллельно мы приводим продукты к более цельному виду: объединяем сервисы в одну систему, настраиваем аналитику, смотрим на поведение пользователей, убираем лишние шаги, дорабатываем сценарии. Иногда это скучная работа, но зачастую именно она даёт больше эффекта, чем новая AI-модель.
Наш путь не похож на рост битка или акций Apple. Мы не взлетели свечой в небо. Мы просто много работали, ошибались, переделывали и постепенно росли вместе со своим продуктом.
За последние три года мы выросли от небольшого контент-продакшена до экосистемы ИИ-сервисов: с нами поработали больше 80 000 клиентов, оборот вырос примерно в 8,5 раза, количество тикетов перевалило за 18 000, генераций — за 200 000, а аудитория вокруг проектов выросла до 200 000 подписчиков.
Наш рост — предмет нашей гордости и точка, от которой мы идём дальше. Хотя, если честно, за каждой красивой цифрой лежит слой возвратов, правок, неудачных релизов, ночных обсуждений и решений, которые потом хочется завернуть в архив с названием больше так не делаем.
Почему мы пришли на Хабр
Мы пришли сюда не за разовой публикацией ради галочки. Нам интересен разговор с людьми, которые умеют задавать неудобные вопросы. Хабр в этом смысле прекрасен и беспощаден. Для нас это полезно.
Мы строим AI-сервисы вокруг реальных задач и хотим показывать не только релизы, но и внутреннюю кухню: что пробовали, где ошиблись, какие решения пришлось выкинуть, какие внезапно сработали.
В следующих материалах хочу отдельно разобрать:
как устроен ERA2 Voice;
где ломается нейроозвучка на русском языке;
что оказалось сложным в генерации музыки;
почему пустое поле промта плохо работает для массового пользователя;
какое будущее мы видим у ИИ-сервисов на базе Telegram-ботов;
как мы создаём единую экосистему сервисов.
Главные выводы
Наш первый вывод: найм не всегда решает проблему скорости. Иногда команда растёт, а вместе с ней растёт и сложность управления. Через это приходится пройти, чтобы понять, что дело не только в количестве рабочих рук. Процесс, пайплайн и архитектура работы могут ограничивать сильнее, чем нехватка людей.
Второй вывод: ИИ-инструменты без сценариев быстро создают бардак. Пользователь не обязан понимать модель, API, лимиты, промты, VPN, посредников, оплату зарубежных сервисов и технические ограничения. Если он вынужден во всём этом разбираться, продукт переложил на него свою работу.
Третий вывод: чужой интерфейс может стать дорогой зависимостью. Telegram помог нам быстро стартовать, но ограничения мессенджера показали, что критичный продукт нельзя держать на платформе, которую ты не контролируешь.
Вывод четвёртый: вокруг модели часто важнее всего скучные слои — нормализация, очереди, аналитика, статусы, обработка ошибок, формы, пресеты, кеширование, поддержка. В демо их почти не видно. В реальном продукте без них всё летит в пропасть.
Мы уважаем путь, который прошли: от YouTube-продакшена, ручных AI-костылей и Telegram-ботов до своих AI-сервисов. На старте было много наивности, ручной работы, спорных решений и моментов, когда хотелось закрыть ноутбук и вернуться к задачам попроще — там хотя бы всё понятно.
Но мы хотели идти дальше и верили, что решение найдётся. В итоге этот путь дал нам главное понимание: AI-продукт рождается не из доступа к модели, а из боли, которую команда сама прожила руками, нервами, дедлайнами и ночными правками.
Так, я уже сам почти проникся собственным пафосом — пора закругляться.
Что-то ещё — пишите в комментариях.
