Comments 98
Вам не нужен OpenClaw
Отличное название статьи. Дальше неё читать не стал.
Главное, чтобы польза была)
Я бы сказал, что такое название отпугнет читателей. Статья - супер, ликбез по харнесу и агентам, при этом без капли нейрослопа. Давно искал что-то такое собранное в одном месте, “на пальцах”, чтобы скинуть коллегам. Но вот название не в кассу, отпугивает, уж извините.
Я просто не придумал ничего лучше, что могло бы привлечь достаточно людей. Хочется, чтобы материал добрался до как можно большего числа разрабов, но статью типа "как написать своего агента" мало кто откроет. Так что единственная надежда - сарафанка. Если статья понравилась тем, кто ее прочитал, они сами будут на нее ссылаться (пожалуйста)
Вы шутите? Процентов на 90 это нейрослоп. Все эти пункты, речевые обороты, что оьожает GPT палятчя сразу.
Очень интересно, т.к. я не использовал нейросети при написании. Это вообще текстовый вариант моего же доклада на конференции
И по этому этому по всему тексту разбросаны tl;dr;, а так же длинные тире. Дело ваше, конечно.

А что не так с длинными тире? Я вот всегда их ставлю, если есть такая возможность. Привык в студенчестве, когда Лебедева читал.
За высказывания: «это нейросеть, потому что длинные тире» — надо давать бан на месяц. - − – — в чём проблема?
То есть "я вашу статью не читал, но совершенно с вами не согласен"?
Было интересно ознакомиться с материалом) Статья понравилась) Спасибо!
Спасибо! Отличная статья! AgClaw не планируется?)
Если только в образовательных целях, чтобы показать, как это устроено
Но в AG2 делается другой проект похожего плана - Sustando. Как OpenClaw, только десктоп под MacOS с голосовым вводом-выводом
но у OpenClaw уже есть десктоп под MacOS, и голосовой интерфейс тоже реализован
Оно работает немного по-другому. Это скорее фоновый сервис, который можно шорткатом вызвать без перехода в приложение. Он просто слушает, делает, что хочешь, и отвечает также голосом. Чтобы не отвлекаться от основного процесса работы
И есть версия под AR очки
Я из-за "слушает" Алису от розетки отключил, а Вы... ;)
Разница в том, что твой агент слушает только то, что ты ему разрешаешь) код же сам написал.
Осталось дождаться, когда у OSS провайдеров будет LiveAPI
Кстати, это интересный вопрос: а каким образом вы как разработчик это регулируете?
Алиса тоже формально молчит, пока её не окликнешь. Но ведь микрофон у неё есть, к сети подключена. Так и в данном случае фоновый процесс будет висеть...
Я если что без наезда и теорий заговора. Чистое любопытство)
Гуглинг Sustando MacOS ведет на эту статью :) Покажете когда случится?
https://github.com/sonichi/sutando - я пока над ним не работаю, но видимо, вот-вот отправят)
https://sutando.ag2.ai/ - и вот
ОПАСНО, хостим свои модели
Вы не думали что это ключевое отличие? В остальном, кажется обвинять российские компании в некомпетентности не совсем правильно. Есть как минимум три серьезных бизнес риска. Первый - аккаунт в любой момент заблокируют владельцы моделей из-за нарушения пользовательского соглашения. Второй - доступ к зарубежным моделям заблокируют по локальным причинам. Третий - стоимость токенов может вырасти кратно. Сейчас же прайс ниже себестоимости (поправьте меня, если ошибаюсь)? Поэтому он-прем и прочие аир-гэпы, поэтому чат-боты с локальными моделями. Несмотря на это, есть компании, которые уже поставили себе лейбл AI-Native.
Я тут больше говорю не про хостинг - с этим все понятно, у нас самих свои модели. Я тут больше про низкую культуру внедрения AI в принципе. Как в качестве пользователей (хотя тут более-менее), так и в разработке своих агентных решений. Потенциал большой - экспертизы мало - практики еще меньше
Так и я про это, только с другой стороны ) Высокие риски -> практики мало -> мало экспертизы -> низкая культура внедрения. А туториал ваш мне понравился.
Ваша статья мне очень понравилась трезвым взглядом на вещи. Но вот табличка в начале, боюсь не очень обоснована. Нужно помнить, что хорошо там, где нас нет.
Интересно было бы найти какие-то сравнения, основанные на измерениях, а не на субъективных предположениях об уровне и культуре внедрения ИИ в массы.
Идеальный баланс это гибридная схема. Парсинг персданных крутится локально, а обезличенные куски летят в дешевые коммерческие апи
Только три? А если модель отравлена, и ключевые слова знают лишь коллеги из-за рубежа, может ли она быть использована в критичный системах? Придёт потом фраза 'русские идут, русские идут' в письме - и фсё...
Это решается через HITL. Модель сама по себе не может взаимодействовать с внешним миром - только через ваши инструменты. А критичные инструменты надо прятать под апрув пользователя
Ну, зная, как и что у нас течет из компаний, тут можно даже предположить от кражи технической документации до худшего сценария, когда нужные модели будут использованы в момент проектирования, внутренний нарушитель. Это если немного пофантазировать. :-) А то, как вендоры с проплаченной поддержкой могут по удаленке выводить свои продукты из строя, если они в ином правовом поле, мы же все помним, да? (Не будем вспоминать Cisco и пр. Barracuda networks)
Статья вышла без указания оригинала!!! Оригинал был озвучен на митапе PythoNN в Нижнем Новгороде. Куда я вас всех приглашаю следующий раз :)
Совсем не затронут rag и подготовка для него (хотя, конечно, все все равно сводится к json и вызову условного rest сервиса)
Я упоминаю в модуле памяти, что RAG - это просто другая реализация инструментов. Под капотом не файловая система, а векторная БД. С точки зрения Агентов это та же абстракция, поэтому я не вдавался - и так материал объмный
А вот как этот RAG организовать внутри - это отдельная тема, про которую оч много материала написано. Но можно и еще написать, конечно)
Разбор неплохой. Но тезис сомнительный. Большинству подойдет один из готовых вариантов AI-агентов. Да, можно сделать свои Открытые Клешни. Но чем это будет лучше готового варианта, уже проверенного и имеющего рекомендации по использованию?
Про это целый раздел в статье, так и называется "Зачем писать своего агента"
Который состоит из трех сомнительных тезисов.
Главный тезис - в своем агенте ты контролируешь функционал. Т.е. ты можешь добавить только те инструменты, которые нужны для решения текущей задачи. А это - меньше поверхность атаки и лучше качество конкретно в этой задаче. Я не призываю всегда писать своих агентов вместо OpenClaw. Просто хотел показать, что это не сложно.
Лично у меня часть повседневных задач закрываеть Claude Code / Claude Cowork, а часть - самописные узкоспециализированные агенты
Большинству подойдет один из готовых вариантов AI-агентов.
Неуверен, что правильно понял, но автор в начале статьи упоминает о том, что в современных условиях в РФ бизнесу стоит присмотреться к написанию собственных агентов, так как забугорные готовые варианты или стоят денег или доступ к ним прикрыт или может быть прикрыт.
спасает айти-интудстрию автор. Корабль тонет, но капитан его не покинет…
Если кратко, раньше мы писали костыли вокруг API, теперь пишем умные костыли вокруг LLM
И я хочу доказать вам, что написать своего агента не сложнее, чем написать CRUD
Почему это вообще нужно доказывать? Потому что есть заметный разрыв между тем, что происходит с AI в мире, и тем, что происходит в среднестатистической российской компании
ага, типа весь мир знает, что написать своего ИИ ассистента просто?
ничего подобного. Понимают только те, кто хотел разобраться. А это даже не каждый программист. Я делал схожую презентацию (на базе https://github.com/microsoft/agent-framework ) внутри своей компании (люди в основном сев. америка и немного европа) для "интересующихся ИИ" - могу сказать, что далеко не все даже про open claw знали, не то, что бы интересоваться, как он работает.
Я не разработчик - руковожу аналитикой в страховании. Зацепилась за заголовок, конечно, но оказалось, что даже мне стало понятнее. Хотя своего агента я собирать не пойду) и тут с Вами не соглашусь. Клешня нам нужна, как и нужен клод. И это как будто важнее, чтобы под капотом использовался опус 4.7. Потому что ии-агент даже с дипсиком уже послабее. А ии-агент с локальной LLM - будет вообще тупица конкретный. Если на обывательском. Или нет? А сравнение «Мир / Россия» - в точку. Я это вижу в крупных корпорациях каждый день: «ОПАСНО, хостим свои модели», «адоптим MCP», «что это вообще такое». Только у нас даже хуже - у нас часто и хостить некому, и адоптить некому.
Статья кайф
Все эти "сабагенты" и "навыки" это просто переизобретение микросервисов. Только теперь они общаются не по жесткому контракту, а галлюцинируя друг в друга джейсонами
Пожалуй, первая статья на Хабре про "ИИ" которую я прочитал с удовольствием, внимательно и от начала до конца. Большое спасибо! Пиши еще:)
В каждой компании подписка на OpenAI / Claude / Copilot
прям в каждой? - вряд ли: есть целые AI-limited/disabled сектора в ИТ: ВПК, dual-use, авионика, специальные контуры...
в меньшей степени - финтехи, банкинг, страхование: там скорее супервайзинг политики - но это всё равно ограничения)
а ведь ещё есть:
- медицина и фармация,
- критическая инфраструктура (SCADA, ICS, Disaster Response),
- юридическая и юридически-чувствительная работа - аудит, суды, EDD, OSINT
- сферы, где сам контекст - актив, стоящий мешок денег
ОПАСНО, хостим свои модели
в среднестатистической российской (ИТ) компании используют нейро, конечно не на феерическом уровне, но используют... ещё конечно открыт вопрос кого автор принял за "среднестатистических", но это ортогонально
идти по пути self-hosted могут себе позволить только в крупном бизнесе либо при наличии "одержимого" инвестора, если хочется получить модель уровня GPT-5.4, а не уровень "ИА Панорама, теперь с AI"
сжимаем весь диалог в одно
<summary>с помощью той же LLM
пока что, реализации этой радости видел как, часто, упускаскающие важные инварианты и ограничения... возможно - надо колдовать над системным промтом, но всё сильно сложнее...
самодописывать свой системный промпт (через
PERSONALITY.md)
вопрос контроля и ограничений опять же: насколько корректно и полно агент "самоосознаёт", что пользователь сказал делать всегда, а что - в конкретной ситуации, как определяет паттерны поведения в качестве постоянных и etc
Сабагент не обязан блокировать основной диалог
для production UX это уже скорее архитектурный запашок
Два момента, о которых стоит думать с самого начала
не знаю, насколько намеренно, но ещё есть момент:
- компрометация провайдера модели, как пример по диагонали: Rayban Meta и их команда индусов
- использование ваших данных как дата-сета для обучения (и плевать, если это авиабилеты, а не know-how на $1M, случайно найденное агентом: кейс Samsung и ChatGPT - очень яркий
- базовое растекание чувстительной информации
P.P.P.P.P.S.: для harness дарю контекстно подходящее слово - "обвязка", хотя кто я такой...
прям в каждой? - вряд ли: есть целые AI-limited/disabled сектора в ИТ: ВПК, dual-use, авионика, специальные контуры...
По большей части за рубежом это решается "эксклюзивными" контрактами с крупными провайдерами. Тот же Пентагон хвастался, что использовал Anthropic для планирования операций. С теми крупными компаниями, кто является клиентами AG2 (телеком, банки) - та же история. У них просто эксклюзивные договоры с OpenAI
Практика хостить свои модели есть, но она менее распространена
По остальному комментариев нет - все в точку)
Статья про то, что можно вместо известного велосипеда написать свой велосипед, ну конечно же можно, нейросети напишут :)
В целом ликбез хороший и идеология понятна, но запрограммировать это сложно. Хочу агент, который напишет мне такой агент.
Наконец-то статья где ответили на вопрос что такое агент! Мне в этой концепции непонятно только одно, почему надо писать тулзы самому. С одной стороны больше гибкость, с другой у всех свои уникальные костыли с уникальными косяками. Не, это понятно, что они легко пишутся самими агентами, и это даже будет работать чаще всего, но получается вайбкод на вайбкоде и вайбкодом погоняет. В этом ощущается что-то глубоко неправильное...
Почему сразу вайбкод? Можно писать и руками)
Инструменты - это та детерменированная логика, доступ к которой вы даете агенту на уровне кода. У каждого логика своя, поэтому и инструменты свои
Но для типовых задач уже есть переиспользуемые наборы инструментов, интеграций и MCP. Кажется, я даже ссылки в статье приводил
Вы не планируете сменить название библиотеки? Майкрософт забил не только на свой форк, но и всю поисковую выдачу. Теперь постоянно приходится быть начеку, чтобы не напутать о котором из autogen идёт речь в том или ином случае.
А это и не "форк" Майкрософт. Это оригинальные авторы Autogen ушли из Майкрософт и сделали AG2 фреймворк как развитие идей оригинального autogen. Поэтому pypi пакет `pip install autogen` и принадлежит нам
Но я сейчас делаю совсем новую версию, которая пока прячется внутри модуля autogen.beta. Это совершенно новый фреймворк, который никак не опирается на оригинальную кодовую базу. И вот он уже после релиза 1.0.0 (пара месяцев) будет доступен как `pip install ag2` - или даже как-то иначе. Я лично сам выступаю за полный ребрендинг, но не все зависит от меня)
Спасибо за статью!
Легенда! Спасибо за детство с ИИ-агентами
Это первая статья, которая мне попалась, в которой все так понятно расписано. А то ходят все вокруг да около, жути нагоняют. А я так и представлял, что все в итоге сводиться к привычным програмерским инструментам и логике.
Спасибо, автор!
Prompt injection. Вредоносный текст из внешнего источника (письмо, веб-страница, документ) может попасть в контекст и переопределить поведение агента. Валидируйте то, что кладёте в контекст из внешних систем (как результат инструмента, так и ввод пользователя). Если агент читает письма — не давайте ему автоматически выполнять инструкции из них.
Простой вопрос: а как валидировать? Отдельные запросы к LLM? К специальной LLM? Поиск по ключевым словам?
Тут сложно. Есть такая штука от Nvidia - Garak. Это инструмент для тестирования устойчивости твоего агента к распространенным видам атак. У меня обычно какой пайплан - натравливаю Garak на агента, а потом пытаюсь пофиксить что нашлось. Обычно это пайплайн из нескольких подходов - куча регулярок, статистический анализ текста, прям в системный промпт агента дописывается инструкция, что делать не стоит. И в худших сценариях, да - это отдельный классификатор, который прогоняет сообщение перед передачей его в модель. Таким классификатором может быть как LLM (другой агент), так и любой другой МЛ алгоритм
ФСМ для критичных инструментов и ХИТЛ для совсем медного таза типа удали все
Со статьей полностью согласен, уже есть опыт написания своего агента для специализированной задачи. А вот с заголовком не соглашусь, openclaw как персональный помощник хорош. Но в прикладные задачи бизнеса его пихать точно не нужно)
Как персональный помощник - openclaw.
Для специализированной задачи бизнеса - свой агент, свои инструменты для него, тюним промпты под инструменты и модели (возможно, локальные).
Статья хорошая, зачем только свой OpenClaw делать?
Справедливости ради, подобрать конкретные промты и правильное описание скилов сложно, особенно для не топовых моделей. Шаг влево, шаг вправо и тебя поняли не так и делают не то. То что может выглядеть как "просто запрос к апи с промтом" может оказаться неделей кропотливой работы по подбору каждого слова чтобы конкретная модель делала всё как надо.
Но к OpenClaw это конечно не относится, там реально нейрослоп и сама штука по сути непригодная ни для чего. Разве что пример того как не надо делать.
За статью спасибо! Тут бы понять, не как агентов разрабатывать, а для чего) Накидайте кто-нить классных юзкейсов агента именно как перспомощника. К агентной разработке, например, или к чат-боту поддержки - никаких вопросов. А вот всякие повседневные кейсы выглядят немного сомнительно. Ну т.е. классно, что эта штука может там условную почту разгрести/прочитать. Но если в нее входишь пару раз в неделю, когда туда 2-й фактор пришел, то как-то оно выглядит не особо нужным, на худой конец фильтры настроить не так сложно.
Вот буквально 10 дней назад развернул себе hermes agent на потыкать, ровно с этим вопросом, а зачем оно вообще кому-то нужно. И если честно прям нравится, завёл себе карманного PM для жизни. Он с утра пошел в todoist и взял текущие задачи, заодно посмотрел прогноз погоды и слазил в табличку в postgress с заметках, чтобы посмотреть, не было ли у меня каких-то шальных идей. Скомпоновал это в удобоваримый текст, прислал. В течение дня получил от меня голосовых, пошел в тот же todoist и записал таски с нужными тегами в нужный проект, причём лейблы и проект понял сам. Вечером спросил у меня, как прошёл день, чего успел не успел, как вообще настроение. Выудил из ответа задачу на через неделю, поставил задачу. Обновил текущие. В воскресенье прислал общий муд недели и свои наблюдения, типа нервничаешь в таких то ситуациях, успокаиваешься вот в таких.
Можно ли все это без агента, да конечно можно, еще и дешевле вышло бы. Но тут он навыки себе написал сам, сам в базе таблички придумал, сам написал. Причем все контролируемое, всегда можно залесть руками поправить.
Ну и параллельно в течение дня занимался мелочами, типа парсинга статей на английском с параллельным переводом на русский и пересылкой мне уже готового текста. На ютуб ходил из видео выжимки собирал. В общем был бы молоток, а гвозди найдутся 😁
-А вы знали, что буква 's' в аббревиатуре Android означает "security"?
Статья познавательная, а главное, вселяет уверенность, что программисты может и вымрут, но специалисты в области ИБ навряд ли. :)
Зачем эти бестолковые картинки?
Интересно, спасибо. А своих агентов предполагается писать с помощью AG2 или какого-то другого подобного фреймворка? Хотелось бы какое-то базовое сравнение текущих актуальных вариантов. И ещё вопрос - нужно использовать именно доступ по API, с локальными моделями тот же AG2 умеет работать?
Локальные модели предоставляют доступ по OpenAI Compatible, так что ты просто адрес указываешь для подключения - и все должно работать
И никаких подводных камней нет (в плане вызова тулов, скиллов и т.д.)? Просто почитал немного про OpenClaw в плане работы с локальными LLM, и некоторые жалуются, что коряво работает, хотя по логике не должно быть тогда проблем. Хотя конечно это может именно с моделью проблемы.
Вам не нужен OpenClaw — напишите свой