Комментарии 9
И чем это отличается от cursor rules?
Чем отличается от rules внутри агентов? Тем что rules - всего лишь дополнительный entry-prompt от пользователя, и LLM вполне может начать игнорировать его с наполнением рабочего контекста. А вот LLM обученная в skills уже игнорировать их не должна. В конце концов для всех типовых задач нужно то 100-150 скилзов, обучить ллмки и пусть не ломают рабочий workflow. Может перестанут базы ронять когда кодотесты не могут пройти.
С mcp и tool call похожая история была. По началу колили кто во что горазд, эффективность была 30-40% и сжигали кучу апи колов на это, так ещё и ретраить надо было по кругу. Теперь даже мелкомодели делают 90% правильных вызовов. Удобно.
А тут хоп, описал пайплайн (например тестирования), моделька его прочитала и не забыла через 5 сообщений.
Так видится.
Хороший вопрос. Раньше можно было бы сказать, что rule - это один файл, а skill - папка, но теперь и Cursor rule тоже папка.
Cursor недавно сделал rules крайне похожими на skills. Если выбрать "Apply Intelligently" в rule, то получится skill.
Ага, Cursor постарались сблизить эти понятия. В их доках skills описаны как “agent-decided rules”, те агент сам решает, когда навык релевантен, и применяет его.
Но если смотреть шире Cursor’а, отличие всё же есть: rules - это фича конкретного продукта (Cursor) и его формат/механика применения, а agent skills - это открытый переносимый пакет процедуры, который может жить в репозитории и работать в разных агентах. Cursor, по сути, просто сделал мэппинг навыков и rules.
Поэтому rules == skills верно курсора, но смысл концепции skills в портируемости и упаковке процедур (не только один текст правила, а ещё assets/references/scripts и т.п.).
Спасибо за обзорную статью. Как на практике применять скиллы при использовании cline/kilo агентов с курсор, например. Был у кого опыт?
А есть реальные примеры из практики, где их применяют?
Пример с деплоем в прод выглядит слегка надуманным. Во-первых потому что у нас уже есть инструменты для четкого и переносимого выполнения таких задач - начиная с shell скриптов и заканчивая декларативными штуками типа ansible и terraform. Ну а во-вторых продакшн это ответственность, а ответственность это пока ещё человек. Даже в компании с одним мясным работником он же будет и основателем и главным ответственным.
Я так понимаю, основной кейс использования - это обработка неструктурированных входных данных, придача ей структуры и вызов детерминированного инструмента для ее обработки. Т.е. условно, "если в ящик поддержки пришло письмо от пользователя, проанализируй о чем оно. Если проблема с логином - проверь есть ли пользователь в бд и отправь ему ответ. Если проблема с ui - заведи тикет с багом на команду фронтенд. Остальное - завели тикет на саппорт". а там уже другие агенты со своими скиллами могут подхватить. Это так будет работать?
Вы правильно подметили две вещи.
Skills не конкурируют со скриптами / IaC.
Terraform/Ansible/CI - это то, что должно делать “железо” детерминированно. Skill в таких местах скорее плейбук/процедура поверх инструментов: как собрать контекст, какие проверки обязательны, какие стоп-критерии, где нужен human approval, какой шаблон коммуникации, какие артефакты приложить в тикет и т.д.
То есть навык описывает как правильно пользоваться уже существующими детерминированными инструментами.Про ответственность тоже согласен. Прод остаётся за человеком, покрайней мере пока)
"deployment skill” имеет право на жизнь в режиме dry-run: агент готовит план, запускает проверки, собирает результаты, оформляет список изменений/тикет/сообщение, а кнопка “поехали” - через человека или через строгий gate.
И да - ваш пример с саппортом очень близок к каноническому кейсу, особенно когда вход неструктурированный, а выход должен быть строгим.
Это ложится на skill-подход: один skill может быть “support-triage” (правила классификации + критерии уверенности + шаблоны ответов), а дальше - отдельные skills для ошибок логина, оплаты, ui и т.п. Такой разнос по навыкам - вместо огромного системного промпта получается библиотека процедур, которые подтягиваются по требованию.
Ждем когда skills станут поддерживаться ведущими Agent SDK. Пока похоже только Claude Agent SDK и поддерживает.
Пытаюсь применить скиллы уже несколько недель к своим прод general code agent и без тестов и точного соответствия возможностей в execution runtime (sandbox) на текущий момент это просто красивые markdown правила, так что обратите внимание на изолированные среды их тестирование и встраивание в code agent пайплайн
Информация
- Сайт
- www.bitrix24.ru
- Дата регистрации
- Дата основания
- 1998
- Численность
- 501–1 000 человек
- Местоположение
- Россия
Навыки агентов (Agent Skills): что это такое и почему это больше, чем «папка с промптами»