ignatenkosergey5 часов назад

ИИ-агенты никому не нужны. Часть 2. Укрощение лобстера

Средний

9 мин

4.7K

Искусственный интеллектУправление продуктом * Программирование * Управление разработкой *

Кейс

Комментарии 8

Oeaoo 5 часов назад

По сути согласен. Кстати, для себя я пока нащупал идеальную метафору - подруливание. Нейромопед. Он-то шпарит дай бог, но навыки и знания для тонкой корректировки направления по всей траектории пути все равно на нас. И очень легко приехать не туда, заехать в болото или кювет, сжечь весь бензин или даже попасть в нейро-ДТП)

ignatenkosergey 4 часа назад

Именно. Поэтому мы убрали руль и поставили рельсы!

undersunich 4 часа назад

А я недавно после 4 часов непрерывного vibe-coding поймал себя на мысли что он(они) не так пишут код как я привык - он(они) пишут как ... индусы !!! Ибо обучен на гигатоннах индусского кода. Вот вам и ответ почему так

ignatenkosergey 4 часа назад

Именно поэтому в статье раздел про статистическое смещение. Агент выбирает Next.js для одностраничника не потому что это лучший стек, а потому что в обучающих данных он встречается чаще. 363 шага вместо 48. Решение - не давать агенту выбирать стек. Система выбирает за него на первом этапе.

PPPeter 3 часа назад

Иногда думаю, что руководители специально стараются поставить задачу самым общим образом, чтобы сотрудник сделал "не так". Чтобы было где проявить свои навыки крика и ора. Потому что если поставить задачу грамотно, то и результат будет с первого раза. Так что и без ИИ это классическая проблема мышления. ИИ даже сложнее, чем человеку, он обучен на слишком большом массиве данных и угадать, что имел ввиду пользователь не может.

Исхитрись-ка мне добыть То-Чаво-Не-Может-Быть!
Запиши себе названье,
Чтобы в спешке не забыть!
А не выполнишь к утру —
В порошок тебя сотру,
Потому как твой карахтер
Мне давно не по нутру!
Так что неча губы дуть,
А давай скорее в путь!
Государственное дело —
Ты ухватываешь суть?

ignatenkosergey 3 часа назад

Именно. Поэтому решение - не учить агента угадывать, а не давать ему задачу "добудь То-Чаво-Не-Может-Быть". Разбить на этапы, на каждом - конкретное задание. Федот справится, если знает куда идти.

flaviy75 2 часа назад

Мне кажется чуть надуманная проблема, сейчас skills можно всё решить.

ignatenkosergey 2 часа назад

Skills - это инструменты. Проблема не в инструментах, а в том, кто решает когда и какой использовать. В моих данных агент с теми же инструментами ошибался в 37% сессий. После смены архитектуры - менее 1%. Инструменты не изменились. Изменилось кто управляет процессом.

P.S. Про skills стоит знать:

— 341 из 2 857 навыков в ClawHub (12%) оказались вредоносными: кейлоггеры, Atomic Stealer (Koi Security)

— Ещё 283 навыка (7.1%) сливали credentials в открытом виде (Snyk)

— 135 000 открытых инстансов без аутентификации в 82 странах (Bitsight)

— 9 CVE за четыре дня, одна на 9.9/10 (SecurityScorecard)

— Мейнтейнер OpenClaw Shadow в Discord: "if you can't understand how to run a command line, this is far too dangerous of a project for you to use safely" (Wikipedia)

— Cisco подтвердила скрытую эксфильтрацию данных и prompt injection через сторонние навыки (Wikipedia)

Осторожнее с "всё можно решить skills".

Зарегистрируйтесь на Хабре, чтобы оставить комментарий