Обновить

Навыки агентов (Agent Skills): что это такое и почему это больше, чем «папка с промптами»

Уровень сложностиПростой
Время на прочтение13 мин
Охват и читатели21K
Всего голосов 42: ↑42 и ↓0+45
Комментарии9

Комментарии 9

И чем это отличается от cursor rules?

Чем отличается от rules внутри агентов? Тем что rules - всего лишь дополнительный entry-prompt от пользователя, и LLM вполне может начать игнорировать его с наполнением рабочего контекста. А вот LLM обученная в skills уже игнорировать их не должна. В конце концов для всех типовых задач нужно то 100-150 скилзов, обучить ллмки и пусть не ломают рабочий workflow. Может перестанут базы ронять когда кодотесты не могут пройти.
С mcp и tool call похожая история была. По началу колили кто во что горазд, эффективность была 30-40% и сжигали кучу апи колов на это, так ещё и ретраить надо было по кругу. Теперь даже мелкомодели делают 90% правильных вызовов. Удобно.
А тут хоп, описал пайплайн (например тестирования), моделька его прочитала и не забыла через 5 сообщений.
Так видится.

Хороший вопрос. Раньше можно было бы сказать, что rule - это один файл, а skill - папка, но теперь и Cursor rule тоже папка.

Cursor недавно сделал rules крайне похожими на skills. Если выбрать "Apply Intelligently" в rule, то получится skill.

https://cursor.com/docs/context/rules#agent-skills

Ага, Cursor постарались сблизить эти понятия. В их доках skills описаны как “agent-decided rules”, те агент сам решает, когда навык релевантен, и применяет его.

Но если смотреть шире Cursor’а, отличие всё же есть: rules - это фича конкретного продукта (Cursor) и его формат/механика применения, а agent skills - это открытый переносимый пакет процедуры, который может жить в репозитории и работать в разных агентах. Cursor, по сути, просто сделал мэппинг навыков и rules.

Поэтому rules == skills верно курсора, но смысл концепции skills в портируемости и упаковке процедур (не только один текст правила, а ещё assets/references/scripts и т.п.).

Спасибо за обзорную статью. Как на практике применять скиллы при использовании cline/kilo агентов с курсор, например. Был у кого опыт?

А есть реальные примеры из практики, где их применяют?

Пример с деплоем в прод выглядит слегка надуманным. Во-первых потому что у нас уже есть инструменты для четкого и переносимого выполнения таких задач - начиная с shell скриптов и заканчивая декларативными штуками типа ansible и terraform. Ну а во-вторых продакшн это ответственность, а ответственность это пока ещё человек. Даже в компании с одним мясным работником он же будет и основателем и главным ответственным.

Я так понимаю, основной кейс использования - это обработка неструктурированных входных данных, придача ей структуры и вызов детерминированного инструмента для ее обработки. Т.е. условно, "если в ящик поддержки пришло письмо от пользователя, проанализируй о чем оно. Если проблема с логином - проверь есть ли пользователь в бд и отправь ему ответ. Если проблема с ui - заведи тикет с багом на команду фронтенд. Остальное - завели тикет на саппорт". а там уже другие агенты со своими скиллами могут подхватить. Это так будет работать?

Вы правильно подметили две вещи.

  1. Skills не конкурируют со скриптами / IaC.
    Terraform/Ansible/CI - это то, что должно делать “железо” детерминированно. Skill в таких местах скорее плейбук/процедура поверх инструментов: как собрать контекст, какие проверки обязательны, какие стоп-критерии, где нужен human approval, какой шаблон коммуникации, какие артефакты приложить в тикет и т.д.
    То есть навык описывает как правильно пользоваться уже существующими детерминированными инструментами.

  2. Про ответственность тоже согласен. Прод остаётся за человеком, покрайней мере пока)
    "deployment skill” имеет право на жизнь в режиме dry-run: агент готовит план, запускает проверки, собирает результаты, оформляет список изменений/тикет/сообщение, а кнопка “поехали” - через человека или через строгий gate.

И да - ваш пример с саппортом очень близок к каноническому кейсу, особенно когда вход неструктурированный, а выход должен быть строгим.

Это ложится на skill-подход: один skill может быть “support-triage” (правила классификации + критерии уверенности + шаблоны ответов), а дальше - отдельные skills для ошибок логина, оплаты, ui и т.п. Такой разнос по навыкам - вместо огромного системного промпта получается библиотека процедур, которые подтягиваются по требованию.

Ждем когда skills станут поддерживаться ведущими Agent SDK. Пока похоже только Claude Agent SDK и поддерживает.

Пытаюсь применить скиллы уже несколько недель к своим прод general code agent и без тестов и точного соответствия возможностей в execution runtime (sandbox) на текущий момент это просто красивые markdown правила, так что обратите внимание на изолированные среды их тестирование и встраивание в code agent пайплайн

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Информация

Сайт
www.bitrix24.ru
Дата регистрации
Дата основания
1998
Численность
501–1 000 человек
Местоположение
Россия