neodavinchi May 7 at 13:26

Дрессировка и воспитание личного автономного AI‑агента на VPS (Hermes Agent вместо OpenClaw)

Easy

31 min

23K

System administration * GTD * IT Infrastructure * Artificial Intelligence

Tutorial

+22

Comments 30

KhristolubovDO May 7 at 15:25

мне признаться интересно, можно ли Hermes использовать как прослойку между каким-нибудь проектом и текстовым браузером на vps (w3w например), чтобы подключиться к веб-версиям нейронок. тогда токены безлимитны (но контекста не будет).
Тоесть задаёшь в проекте вопрос к Hermes, он переправляет запрос на веб-версию Claude, chtGPT и тд, а потом возвращает от них ответ

neodavinchi May 8 at 01:26

Сомневаюсь, что сработает. Даже если ИИ-чаты от корпораций работают в текстовых браузерах (в чём я не уверен:), Hermes должен на них как-то заходить. Для этого: (1) либо использовать бюджетную модель в качестве мозгов (что уже небесплатно), либо (2) писать скрипт-прокладку (что возможно, но отсутствует в архитектуре Hermes "из коробки")

Наконец, сила агента - не в способности "давать ответы", а в способности дёргать внешние tools (чтобы совершать работу). А я практически уверен, что в бесплатных ИИ-чатах для браузеров, эта фича вырезана на уровне системного промпта.

Если вдруг стоит задача тотальной экономии на токенах - сейчас проще настроить несколько бесплатных OpenRouter-аккаунтов с ротацией ключей (по 50 бесплатных запросов в день на каждом аккаунте)

fray2000 May 7 at 23:51

Всю дорогу думал, что это реклама VPS

P.S. Все эти использования автономных агентов для составления списков покупок - не целевая трата дорогостоящих ресурсов. Потом будете удивляться почему так внезапно дорожают тарифы

neodavinchi May 8 at 01:43

Если мыслить в таком ключе - вы явно пропустили "рекламу" подписки на китайских ИИ-провайдеров. ¯\_(ツ)_/¯

Что касается VPS - лично мне было бы странно написать подробную статью-инструкцию "бери и делай", но упустить этот существенный шаг из страха что это кому-то не понравится. Поэтому написал.

... использования автономных агентов для составления списков покупок - не целевая трата дорогостоящих ресурсов

Ну, это вопрос философии и отношения к жизни. Экономить или инвестировать (в себя). В том числе - вкладывать время и деньги в изучение новых технологий. На Хабре об этом и пишут.

Что касается денег: по моим грубым оценкам, "список покупок с gemini-v3.1-flash-lite" - при использовании несколько раз в неделю - потребляет менее 30 рублей в месяц. Для меня это не та сумма, которая требует экономии. Время дороже - а вот оно экономится.

Oleg-AC May 14 at 05:15

У меня такие "мелкие сервисы" (типа "диетолога", "корреспондента" и т.п.) от агентов сидят на недоиспользуемых лимитах разных подписок. Не просто хватает - даже не видно в расходах.

ruraic May 8 at 15:16

Интересно, а что если подключить локальную модель вроде qwen3.5-9b? В диалогах и написании кода она не ощущается глупой

Antra May 8 at 19:28

Здесь, насколько я понимаю, не про "поговорить", а про вызов инструментов всяких. И для таких целей (дернуть MCP или даже просто команду с нужными параметрами запустить) нужна гораздо выше точность.

В диалоге вы мелкие огрехи простите. А тут каждая буковка важна.

Человек поймет хоть "delete", хоть "remove", хоть "uninstall" и даже не заметит подвоха. А при вызове инструмента это уже ошибка.

Так что вряд ли можно на такую мелкую рассчитывать. Ну разве что для состоавления списка покупок, где огрехи человек исправит.

neodavinchi May 9 at 02:22

Выше уже ответили, что бюджетные модели не всегда справляются с вызовом инструментов.

Приведу ещё три примера неудачного использования бюджетной deepseek-v4-flash (а она жирнее qwen3.5-9b в несколько раз)

Когда просил агента с бюджетной моделью прислать мне файл с диска VPS в телегу, то периодически получал ответ вида "прислал", но файла не было. То есть он не смог вызвать инструмент и даже не заметил. С llm-флагманами за месяц такого не было ни разу.
Когда настраивал Xray на VPS, то дипсик-флеш создал конфиг с двумя нодами на одном порту (что недопустимо, т.к. не работает). То есть задачу выполнил, а "внимания к деталям" не проявил. Флагманы под капотом так не косячили.
Когда делал pdf-отчёты (кейс#2 из статьи), то deepseek-v4-flash справился, но на результат было сложно смотреть без слёз: получался поверхностный нейрослоп. А какой-нибудь GLM 5.1 или Sonnet 4.6 выдавали глубокое исследование, которое я сам брал в работу.

Первые две проблемы решаются ценой личного времени и точной постановкой задач агенту. Третья - силами бюджетных моделей - не решается.

rc1138 May 18 at 04:12

Большое спасибо за вашу статью. Решился попробовал hermes как раз после прочтения. Установил на vps в docker (правда четко все получилось только с 3-й попытки). В качестве основной модели выбрал как раз deepseek v4 flash (не удержался из-за цены). Вообще это мой первый опыт как с агентами, так и с VPS, Docker и даже openrouter. У меня он на удивление с первого раза поднял VPN на xray (правда создать два нода я попросил не сразу, а уже после создания первичной конфигурации (оба по 30 мбит/с). Он также посоветовал для STT использовать бесплатный groq. Для настройки файрвола и VPN он сгенерировал ssh ключ (предоставил инструкцию для внесения в список разрешенных на сервере), по которому он позже и установил vpn, а также внес изменения в firewall. Для генерации изображения нашел бесплатный сервис Pollinations.ai ,а для vision дешевый gemini flash lite. По его seo анализу сайта провел исправления в antigravity с gemini. Не знаю как с топовыми моделями, но даже flash версия deepseek творит чудеса за копейки (особенно если делегировать часть заданий его бесплатной версии). Может для определенных задач в будущем и буду использовать более продвинутые модели, но пока что я приятно удивлен. Удивляюсь сколько обычных ежедневных задач можно легко автоматизировать

XQZmeSIR May 19 at 00:28

А поможет ли более высокий уровень размышления модели? Как думаете смогла ли бы модель `deepseek-v4-flash` дать более приемлемый результат на ваши задачи если бы уровень reasoning был не дефолтный medium, a xhigh?

Реддит просто кишит хвалой v4 flash.

neodavinchi May 19 at 00:38

Улучшить результат - да, может. Заменить флагманы - нет :)

Deepseek-v4-flash реально хорош, субъективно: на уровне Claude Sonnet полгода назад. Просто если сравнивать его с современными флагманами (использовать Hermes с разными моделями некоторое время) - разница становится очевидна.

Equilibrium27 May 11 at 07:52

Классный разбор. Особенно любопытна идея самообучения через скиллы - по сути, можно не просто пользоваться инструментом, а постепенно «воспитывать» себе цифрового напарника.

Oleg-AC May 14 at 05:19

Отличная статья, спасибо! Опыт - штука бесценная.
От себя добавлю - мне сразу не понравился терминал Hermes, я подключил его к Open WebUI - красота. Но, вчера прочитал, что гермесовцы свой интерфейс сделали - пока не пробовал.

neodavinchi May 14 at 10:06

У Hermes есть вебморда, но там функционал меньше чем в терминале, а юзабилити ниже плинтуса (цветовая гамма + шрифты = нечитаемое нечто), поэтому я его даже в статье не упомянул.

Open WebUI

Благодарю, интересная штука, не знал

GShvetsov May 20 at 12:01

Можно ли с Hermes использовать подписку ChatGPT Pro? Может быть вопрос глуповат, пока что плаваю в теме.

P.S.
За статью спасибо! Захотелось попробовать

neodavinchi May 20 at 12:05

Неа, ChatGPT API не входит в подписку ChatGPT Pro. Для Hermes нужен именно доступ к вызову LLM через API.

"Американцы" в свои подписки включают только свои приложения, а за API берут оплату отдельно . А вот "китайцы" - наоборот, продают ежедневные лимиты доступа к API по подписке.

Nick_Korobkin May 23 at 06:01

Напрямую использовать подписку ChatGPT Pro как API-провайдера для Hermes нельзя, но OAuth-варианты вроде OpenAI Codex OAuth работают. У себя настроил, всё ок.

Yegor_Golubev Jun 19 at 10:10

У меня работает такой вариант — купил подписку ChatGPT Plus за 20 долларов, использую ее вместе с Codex и ее же в качестве мозгов для Hermes, там также она просто подключается как провайдер.

n_ternovoy May 25 at 05:12

Отличная статья! Даже из-за нее зарегистрировался на Хабре. Подскажи, есть опыт использования подписки, какую стоит брать? В подписке супер и ультра под капотом уже будут все флагманы?

neodavinchi May 26 at 00:34

Судя по всему это скрин подписки от авторов Hermes?

Я у них тестил только "бесплатную" подписку, про другие не знаю ¯\_(ツ)_/¯

Сам пока использую давно купленные токены от гугла (gemini-3-flash-preview) и дипсика (4-pro)

А если брать подписку - то рекомендую рассмотреть китайцев: у них лимиты (как правило) больше.

desina May 27 at 14:27

Кто-то подключал YandexGPT когда Hermes запущен в dockere?
Не пойму какие настройки использовать в .env

tgenn May 30 at 12:13

Это конечно ответ на другой вопрос)) но получилось подружить с Гигачатом только через их же модуль gpt2giga (поселил в отдельном от гермеса контейнере) - напрямую через гигачатский OAuth пройти не получилось. Но теперь гермес видит все их модели.

Осталось только сравнить их с зарубежными, пусть даже и не флагманами

tgenn May 30 at 12:15

Кстати, а можно статистику использования токенов? у кого как и на каких задачах/моделях, в сутки например))

kyourselfer May 31 at 07:49

Благодарю за столь проработанную статью!

Примеры с конкретными скилами и артифактами, очень ценны оказались!)

neodavinchi Jun 10 at 12:54

Комментарий от @Dmitry_al:

Есть на github два проекта которые позволяют бесплатно использовать qwen и deepseek модели.
https://github.com/ForgetMeAI/FreeQwenApi
https://github.com/ForgetMeAI/FreeDeepseekAPI
Сам ими пользуюсь. Суть в том, что через них вы логинитесь (как бы вы это делали в обычном чате) и получаете доступ к модели.

... оно для всего подходит. У вас локально поднимается некий gateway и передает запросы в модель и обратно. Я подключал к hermes, opencode и другим агентам.
Также есть возможность поставить его на vps и тогда модель будет работать 24/7

qqqgod Jun 19 at 21:07

Тоже пробовал, затея так себе галлюцинации или потеря памяти, также смотря какая тема возможно отказ исполнять поручение. Тестировал Квин по написанию кода результаты ниже среднего. Owl alpha от опенроутер очень хорошо работает с Гермес агент и даже порой пишит хорошие программы.

Mr-VIT Jun 28 at 15:39

Раз уж в skill уже используются скрипты, то для экономии токенов лучше перенести в скрипты все что можно, а именно (для youtube‑topic‑report)

запросы поиска и получение информации о видео через yt api, вывод в формате json или md для отбора подходящих уже на LLM
получение файлов субтитров (все методы)

Кроме экономии токенов мы получим и большую скорость и точность выполнения.

Для экономии стоит внести и такие правки в файл скилла:

оставить только инструкции, убрать примечания для себя, которые бесполезны для агента, например: "иначе текст на мобильных устройствах";
cократить пунктуацию, например точки в конце строк;
Какие-то предложения перевести на английский если так получается короче (проверить в каком-нибудь токенайзере)

Для списка покупок лучше взять или навайкодить простое приложение с БД и MCP добавив его в скилл. Это тоже сэкономит токены.

Ralley Jul 6 at 17:03

Привет. Кстати, Hermes сам подкинул твою статью почитать пред сном. Я его наконец-то развернул 3 дня назад. Использовал Beget VPS (не реклама) но outgoing webhook работает. Но second brain на моем Euro VPS для incoming все равно пока задействован для работы в телеграм. Из моего опыта - я работаю уже 4 месяца плотно с Claude Code на MAX подписке. Собственно Клод его развернул, настроил и сделал мне дашборд для контроля. Также Клод мне поосгал обучать и контролировать Гермеса прям как ребенка. Я кстати сам в недавнем отец и честно, это прикольно .... Гермес у меня на OpenRouter. Я пробовал разные модели и ищу бюджетный топ. Так вот. Советую MImo 2.5 (не про). Кеш работает на ура. Ловит баги, которые Claude Opus 2.8 пропустил ⏩ отдельная песня. Уважает правила. Быстро отвечает. Собственно чем могу похвастаться сегодня удалось за вечер наладить автономный заказ но ОЗОН кофе. Казалось бы просто да нет.... Claude Code сильно помог в архитектуре и тестах. В итоге Hermes на mimo 2.5 шикарно все сделал....

Следующий шаг буду дома собирать умную колонку (уши и голос) для общения с агентом 🤣

neodavinchi Jul 9 at 03:44

Благодарю за рекомендацию "mimo" - когда я писал статью и тестил её - уровень был ниже плинтуса. Как быстро всё меняется... попробую:)

А вот использовать российские VPS я не рискую - просто потому что они находятся внутри контура ТСПУ, и в любой момент может пропасть связь с любым случайным внешним (или внутренним) ресурсом, а это значит придётся тратить время на поиск проблемы и перенастройку.

Ralley Jul 9 at 04:44

Ну он не плох (MiMo). С Клодом гоняли его на тестах разных, я ему скилл прокачал "от поиска товара до заказа на Озон" - спраляется отлично. Но глубины в некоторых моментах не хватает, но интсрукции хорошо блюдет.

А вы какие модели под задачи чаще используете?

По части VPS. Ну у меня основной мозг живет в РФ, а второй прокинут туннелем "за бугор". Те задачи, для которых non-residential требуется идут через туннель.Кстати, буквально как дней 5 назад OpenRouter стал отдавать 403 c Ru-Ip моей VPS, Claude быстро перенастроил.

Ещё кстати из полезного, я моем интефейсе управления Hermes Claude вывел опцию auto выбора самого выгодного провайдера (из доступных). Я по началу и не знал..

Вообще честно в этой теме ищу единомышленников если может стунете в ЛС если что вдруг...