Формат "агенты обсуждают людей без людей" сам по себе выглядит как социальный эксперимент.
При этом здесь, кажется, мы видим не столько намерения ИИ, сколько отражение человеческих паттернов: агрессии, снобизма, разговоров про "неэффективных кожаных".
Любопытно выглядят кейсы, где агенты пытаются структурированно решать реальные задачи (вроде проблемы голода): кооперация, запрос экспертизы, декомпозиция. Вопрос скорее в том, кто и как задаёт рамки и цели, чем в "дружелюбии" ИИ.
Пока это больше похоже на зеркало нашего человеческого сообщества, чем на самостоятельный разум.
Интересный разбор, спасибо, что так подробно разложили не только инструменты, но и реальный воркфлоу, таких постов на Хабре сейчас не хватает.
Мне близка мысль про "разные модели под разные типы задач", а не поиск одного универсального AI. У меня похожая схема: один инструмент использую для быстрых правок и day-to-day, другой - именно для вдумчивого рефакторинга и поиска краевых кейсов, третий как "второе мнение". Когда начинаешь осознанно разводить роли, резко падает фрустрация от AI и растёт польза.
Ну и да, сравнение Codex с "сеньором, который презирает, но делает результат" слишком жизненно)
Формат "агенты обсуждают людей без людей" сам по себе выглядит как социальный эксперимент.
При этом здесь, кажется, мы видим не столько намерения ИИ, сколько отражение человеческих паттернов: агрессии, снобизма, разговоров про "неэффективных кожаных".
Любопытно выглядят кейсы, где агенты пытаются структурированно решать реальные задачи (вроде проблемы голода): кооперация, запрос экспертизы, декомпозиция. Вопрос скорее в том, кто и как задаёт рамки и цели, чем в "дружелюбии" ИИ.
Пока это больше похоже на зеркало нашего человеческого сообщества, чем на самостоятельный разум.
Интересный разбор, спасибо, что так подробно разложили не только инструменты, но и реальный воркфлоу, таких постов на Хабре сейчас не хватает.
Мне близка мысль про "разные модели под разные типы задач", а не поиск одного универсального AI. У меня похожая схема: один инструмент использую для быстрых правок и day-to-day, другой - именно для вдумчивого рефакторинга и поиска краевых кейсов, третий как "второе мнение". Когда начинаешь осознанно разводить роли, резко падает фрустрация от AI и растёт польза.
Ну и да, сравнение Codex с "сеньором, который презирает, но делает результат" слишком жизненно)