Как развернуть что угодно с ИИ-агентами, даже ComfyUI с жирными моделями / Хабр

Антон

Продакт-менеджер Интелион Облако

Привет 👋 ! Я продакт-менеджер и я кайфую от работы с нейронками. Конкретно, через ComfyUI и вот это вот всё со стрелочками и пайплайнами. Это история о моём пути от RTX 3080 дома до GPU-серверов с ИИ-агентами.

Есть два типа людей, которые арендуют GPU-серверы:

те, кто кайфует от SSH, docker-compose и ночных сборок
те, кто просто хочет запустить штуку и кайфануть от неё

Я — второй тип 😀 И вот честная история о том, как я научился получать нужный мне open-source сервис в развёрнутом виде на виртуалке без гемора. Суть: ИИ-агенты стали для меня чем-то вроде личного DevOps’а за фикс-прайс.

От RTX 3080 до «почему оно опять не помещается в память»

Я люблю исследовать решения и уже около трёх лет гоняю разные open-source нейронки. Когда-то ComfyUI открыл для меня бесплатную генерацию контента, и моя RTX 3080 тогда казалась космосом.

Но «космос» закончился довольно быстро:

модели стали тяжелее
пайплайны - сложнее
желания - наглее
а видеопамять, как назло, не выросла

В какой-то момент я понял простую вещь: видеокарта дома, это не про мощность, а про компромиссы. И логичный шаг — аренда удалённого сервера с GPU.

Проблема: аренда сервера — это ещё не работающий софт

И тут началось самое грустное. Арендовать сервер, это полдела. Дальше нужно:

подключиться
поставить зависимости
развернуть проект
настроить порты/фаервол
понять, почему оно не запускается
и ещё раз понять, почему оно не запускается

А большинство гайдов написаны таким образом, что приходится копировать по одной команде, чувствуя себя биороботом, а не живым человеком. Кроме того, когда начинаются нетривиальные проблемы, приходится много гуглить.

В итоге, когда хочется что-то развернуть, то доходишь до терминала, и руки реально опускаются 😔

Пытался решать это чатами… но всё изменилось, когда появились ИИ-агенты

Я долго общался с разными ИИ, просил подсказать команды, объяснить ошибки, «что означает этот лог». Это помогало, но было медленно. По сути, я сам оставался тем, кто:

копирует ко��анды
ошибается
чинит
снова ошибается

Переломный момент случился, когда я написал первую веб-страницу, познакомившись с ИИ-агентами для программирования. Сначала был Cursor: там я понял, что у Anthropic для кода реально есть «магия», но Google и OpenAI тоже очень сильные. Позже друзья подсадили меня на Claude Code CLI, и за ~$100/месяц я получил ощущение, что у меня появился второй мозг, который не боится терминала.

Самое важное: я не просто «получаю результат», а смотрю, что делает агент, и учусь. Даже мой опыт подрос через наблюдение, выводы и практику.

Главный инсайт: чтобы развернуть open-source решение, мне не нужен «я-DevOps», мне нужен «агент-DevOps»

Когда я снова вернулся к серверам, оказалось, что боль снимается почти полностью.

Схема стала смешно простой:

я даю агенту доступ к серверу
даю ссылку на GitHub
объясняю цель (что хочу получить на выходе)
и через несколько минут у меня есть ссылка на работающий сервис, который можно тестировать

Это ощущается как чит-код: ты остаёшься «продуктовым человеком», а агент берёт на себя «технарскую часть», причём не в формате советов, а в формате делания.

Пример из жизни: ComfyUI и «жирные» модели

Одна из частых причин, почему я иду на сервер, это требовательные модели.

Иногда нужна реально жирная видеокарта: условные 48 ГБ VRAM и выше. Но многие не знают, что есть квантезированные (ужатые) версии моделей, которые дают приемлемое качество и влезают в более скромное железо.

Разбираться самому можно. Но это время.

А можно сделать иначе: попросить агента:

оценить железо на сервере
подобрать совместимые модели
скачать
разложить по папкам
настроить запуск
проверить, что интерфейс открывается

И вот здесь у меня случился второй инсайт:

агент полезен не только как «запусти», но и как «подбери оптимально».

Мой текущий процесс

Арендую сервер с подходящей видеокартой (например, в intelion.cloud, потому что я там работаю)
Получаю креды для подключения
Отдаю креды + ссылку на GitHub агенту и прошу развернуть проект
Тестирую, даю фидбек. Если ошибки, то агент чинит. (как раз отличный пример, изначально у меня не подцепилась видеокарта, и я напомнил агенту о её существовании) 🙈

Что именно я пишу агенту

Вот примерно так, человеческим языком:

что это за проект
где он лежит (GitHub)
как я хочу его запустить (например, через docker)
како�� результат мне нужен (ссылка/порт/веб-интерфейс)
и что важно по безопасности

Пример «скелета»:

Задача: развернуть проект X на моём сервере так, чтобы он открывался в браузере.

Дано: SSH доступ, Ubuntu, GPU.

Нужно на выходе: ссылка или IP:PORT, автозапуск, короткая инструкция «как остановить/обновить».

Если агент просит уточнения, то он обычно задаёт правильные вопросы сам. Но чаще всего достаточно просто нормально описать «что считаем успехом».

Почему это продуктово выгодно?

Технически это выглядит как «ну развернул и развернул».

Но в реальности это меняет скорость:

раньше «посмотреть новую open-source штуку» = несколько часов / день / сдаться
теперь «посмотреть новую open-source штуку» = минуты до первого результата

1) Быстрее проверяешь гипотезы

Не надо ждать разработчика «когда будет окно». Ты просто тестируешь идею, смотришь, есть ли ценность, и решаешь: развивать или выкидывать.

2) Меньше зависишь от узких специалистов

Это не отменяет инженеров. Но снимает слой задач типа:

«поставь», «подними», «проверь», «сделай демо».

3) Можно делать прототипы «в одно лицо»

Я показывал другу-юристу, как я работаю с агентами - и он в тот же день собрал iOS-приложение. Да, сыровато. Да, впереди опыт. Но как первое приближение - это совершенно другой мир.

4) Маркетинг и операционка ускоряются в разы

Бот, лендинг, парсер, простая интеграция, авто-отчёт - раньше это либо конструкторы (медленно/ограниченно), либо разработка (дорого/очередь). Теперь это часто «за в��чер», если правильно ставить задачу.

Важный момент про безопасность

Да, я написал «даю агенту креды». И это звучит страшно.

Что я для себя считаю здравым минимумом:

временный ключ/пароль, который можно быстро заменить
отдельный пользователь на сервере с ограниченными правами
не хранить «главные доступы» в вечном виде
после развёртывания - сменить креды, если тревожно
по возможности держать такие эксперименты на отдельном сервере/проекте

Если вы воспринимаете сервер как «одноразовый стенд для теста» - становится легче: поднял → потестил → выключил → забыл.

Как это выглядит по ощущениям

Раньше:

«Хочу протестировать X… но там настройка… ладно, потом».

Сейчас:

«Хочу протестировать X» → через короткое время уже кликаю в браузере.

И вот это «кликать вместо страдать» - для меня главный результат.

Итог

ИИ-агенты не делают меня мгновенно инженером. Но они делают кое-что важнее: они снимают барьер входа в сложные штуки, которые раньше требовали либо опыта, либо команды.

Если вы работаете с продуктом, гипотезами, контентом, автоматизацией, то начать использовать агентов сейчас (даже на простых задачах) кажется мне лучшей инвестицией в скорость.

Сегодня это «первое касание».

А завтра вы делаете сами то, что раньше требовало эксперта и недели переписок.

Желаю удачи и новых открытий! 🫶