Kurt23 фев в 18:04

Что день грядущий нам готовит: Агентные системы, платформы, AgentOS или ничего не поменяется?

Простой

2 мин

9.1K

Искусственный интеллектБудущее здесьИсследования и прогнозы в IT * Операционные системы

Мнение

+11

Комментарии 15

flancer 23 фев в 19:47

Агентский кодинг - это когда ты ставишь задачу, а агент сам декомпозирует её, пишет, тестирует, фиксит ошибки, и приходит к тебе с результатом.

Это так не работает. Особенно с "декомпозирует". Агента нужно "загонять в рамки", а иначе он с результатом-то придёт, но результат будет не совсем тот, что ожидался. Творческий будет результат, а не инженерный.

evomed 23 фев в 20:06

Творческий будет результат

В стиле Арт-хаус

Kurt 23 фев в 20:23

От задачи зависит. Если маленькая, все будет сразу. И это же статья не про это, а про агентный кодинг там промеждупрочим. Сам фло именно такой ведь? Тогда все коректно:)
А что там кучу нюансов в т.ч. и рамки, и что это не инструмент (ну по крайней мере пока) для обывателя - факт.

AlexKMK 24 фев в 07:50

чем это отличается от нового человека на проекте? :)

flancer 24 фев в 09:17

Скоростью. Он очень быстрый. Очень. И исполнительностью - будет максимально придерживаться заданных инструкций, несмотря на весь свой "предыдущий опыт".

AlexKMK 24 фев в 09:27

Я неверно выразился )
многие пишут : агент начинает генерить отсебятину. код становится как франкенштейн - где-то ооп, где-то функции, где-то CamelCase где-то snake_case. ну и прочие суеверия.
В этом случае я всегда задаю вопрос - ЧЕМ ЭТО ОТЛИЧАЕТСЯ ОТ НОВОГО ЧЕЛОВЕКА НА ПРОЕКТЕ?
Обычно, начинается - ну ему коллеги расскажут и т.д.
Код и процесс должен быть документирован, если проект уйдет в прод, будет работать и т.д. а через год надо будет поправить - НИКТО УЖЕ НИКОМУ НИЧЕГО НЕ РАССКАЖЕТ.
А если документировать - какая разница, кто будет ему следовать кожмешок или модель?

От себя могу сказать, что благодаря быстрому feedback loop с агентом мы гораздо быстрее обучаемся и сейчас, благодаря опыту с агентами - мои задачи в жире для коллег гораздо более точные и эффективные. Т.к. натренировался на агентах и этих тренировок было на порядок больше и они были более плотные по времени, чем если бы я это делал с людьми.

QtRoS 14 мар в 16:53

Мне изначальный смысл понятия вайбкодинг именно таким и запомнился: когда ты на чиле без особого внимания и усилий чатишься с машиной, и она в итоге что-то даже полезное выдает, похожее на решение задачи. А потом любое программирование с ИИ так стали называть.

kostoms 23 фев в 20:43

Мало ещё кто разобрался, что это и зачем, но все уже эксперты: обзоры ради обзоров

Ну Вас тоже трудно обвинить в отсутствии этого :)

на смену вайбкодингу и программированию с ассистентом в виде LLM приходит именно он - агентский кодинг.

Там сложно разделить. Очень многое среда разработки делает прозрачно для Вас, Вы просто не понимаете что там творится за сценой, возьмите какой-нибудь опенсорсный Theia IDE, например, заточите его на свой локальный LLM и посмотрите в логах что она там срёт ему в контекст. Там всё усложняется очень быстро :(

важнее будет не какой iOS или Android у тебя, а какая у тебя AgentOS. Хотя ещё год назад мне лично представлялось, что люди разделятся на то, какая у них LLM, и кто-то будет плотно сидеть на OpenAI, кто-то на моделях Гугла, и холивары вида Linux vs FreeBSD перейдут в эту плоскость.

Да оно никогда не было сильно важно в плане ОС - GNU-утилиты работают примерно одинаково везде. А вот холивары по теме LLM.. Тут вы хорошо подметили - странно выглядит ситуация. Я виду, что девелоперы вокруг меня реально любят антропиков, и мне нравится с Клодом работать, он думает как я и с ним просто приятно работать... но почему-то все, включая и меня пользуются ГПТ. Просто он там шуршит в бэкграунде делая большу задачу и потребляя токены пока моя контора не разорится, а я занимаюсь ещё какими-то делами. А так да, партитуру на клавиатуре лучше с Клодом раскладывать на двоих.. Короче никто просто не определился окончательно - вот и нет холиваров. Но скоро будут. Я надеюсь :)

dkeiz 24 фев в 02:13

Проблема AgentOS в том что если вы хотите безопасность - то за каждым чихом надо следить занимаясь лютым парсером, при чем как инпут в LLM так и из LLM, потому что любой промпт инжектинг вам вайпает всю систему rm -rf .

Варианты - вторая LLM которая анализирует весь message flow, но тоже до тех пор пока не окажется под ударом но тут нам поможет третья LLM (нет).

Ручной парсер, ага, щас сядем и будем параноидальное все парсить ручками с разговором что только наша agentOS самая безопасная (пока не появится случайное исполнение файла с доступом к терминалу).

Третий вариант - все разрешения активно спрашивать у пользователя. Но тут возникает вопрос - на кой черт такая автоматизация нужна. Ведь рано или поздно пользователь скажет - нормально делай сама, плохо не делай и даст все разрешения, а тут хоп и промпт инжектинг.
Казалось бы решение - суперпесочница с ограниченными возможностями наружу. Но как только вы захотите чего то кроме readonly - вы в беде. Да и readonly с exposed в интернет - вы отдаете все свои файлы любому злоумышленнику.
А значит реальное единственное решение - супербезопасная LLM которая не поддается взлому. Вот только 100% не добиться, и тут возникает паранойя.
А полностью своя агентная система которая подстраивается под вас и имеет память работы только с вами - оно не то что уже есть, оно каким-нибудь современным OPUS'ом пишется за выходные, если понимать что делать. Вот только на слабых моделях она ошибается даже с общеизвестными терминальными командами, а использовать opus чтобы почту проверять - дорогое занятие.

AlexKMK 24 фев в 07:52

Третий вариант - все разрешения активно спрашивать у пользователя.

security-assessor agent?

dkeiz 24 фев в 10:04

это вроде второй вариант. Третий - это встроенный vac на все действия на уровне бэкэнда.

Kurt 24 фев в 11:31

Да, вроде, очевиднно что нужен агент супер вайзер который смотрит за безопасностью, особенно за всем что ставится\используется.
Собственно, у нас в разработке как? Дев -> предпрод -> прод, в процессе код ревью и секьюрити чеки.
И, конечно, железные правила в которых не может быть исклюний а-ля Азимовских трех рбототенхни.
Тут такое же, но построенное на агентах
Мы, просто, сейчас все агентов юзаем по логике все сразу в прод, с теми настройками какие позволила паранойя. А если, даешь свободу, не даешь чувствительные данные просто, что немного ни туда не сюда, но пока из соображений разумности или или
Полноценная AgentOS будет уже в тут на других принципах

AlexKMK 24 фев в 11:52

Я не думаю что будет AgentOS, я скорее верю в AgentSwarm - т.к. MCP это будут новые апишки например.

Kurt 24 фев в 12:18

Вполне может быть, как и не менее вероятно что-то в принципе третье, и не только с точки зрения нейминга
Сча мы все дружно затачиваем привычные человеческие интерфейсы чтобы их испоьзовали агенты.
Агентам, все же, в наших GUI и даже CLI не прям чтобы очень, они могут эффективнее потенциально, просто под них еще нет среды
И так предположу, в том же OpenAI делая устройство с Джони Авом как next gen (ну после смартфонов) они там явно и новую ОС под это пилят, а не только форм фактор.
Но, предположу, что все на том же unix

AlexKMK 24 фев в 14:12

Вот кстати еще немножко бонусов использования агентов : стандартизация.
Сейчас кунг-фу при работе с агентами не только "что-то получить", но и получить это максимально эффективно - минимум токенов и максимально быстро.
А это значит - минимум велосипедов где они не нужны. Минимум отсебятины.

У нас правило, в т.ч. в инфре - агент не должен рыскать и искать кишки. все кишки должны быть там где агент их ожидает (если это не нарушает best practices)

Причем, тут вопрос даже не столько и не только в агенте. В конце концов - вот на примере, берем нового человека, ему надо metrics-server (что бы это ни было) найти/посмотреть в этих ваших кубернетиксах. Что он сделает? Он пойдет в stackoverflow, и поищет - а где эта хрень должна быть. Ну и пойдет искать в kube-system и будет тратить оплачиваемое время на повторные поиски.
В случае с агентом - это опять же гораздо ярче становится - он же под рукой, у него моментальный фидбек-луп. Человек может не сказать, что оно не там, может не сказать, что долго искал. Тут-то в чатике сразу видно - тыкнулся туда, тыкнулся сюда - наконец-то нашел - вывод : нужно сделать, чтоб тыкался по минимуму. Люди так же будут меньше тыкаться если что.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий