Pull to refresh

Comments 8

Главное что бы не передрались между собой 🤣

Любой каприз за ваши деньги токены.

Пока ведут себя прилично)

Нет смысла использовать кросс-провайдеров для этого. Гораздо эффективнее, быстрее и проще на одном провайдер создавать динамически агенты с разными характерами и не заставлять пользователя ставить себе кодекс. Сравните мой подход с динамическим создание до 5 агентов из 10 архетипов с предварительным интервью с пользователем: https://github.com/kochetkov-ma/claude-brewcode/tree/main/brewcode/skills/debate Там ещё много лучших практик скиллов типа ведения шагов в jsonl чтобы писать тресы без тулсерча и лишних токенов, е2е тесты. Интерактивная дока https://doc-claude.brewcode.app/brewcode/skills/debate/

У вас интересный проект, и для многих задач он точно полезен. Согласен, что дебаты внутри одной модели и проще в эксплуатации, и дешевле.
Но мой пойнт в другом типе разнообразия.
Когда вы создаете внутри Claude несколько персонажей, это все тот же Claude со своими сильным сторонами, слепыми зонами. Все персонажи делят одни и те же данные для обучения и приоритеты пост-обучения.
В то же время на многих задачах, особенно нетривиальных, по моему опыту, тройка Claude, Codex, Gemini, зачастую по-разному видит сильные и слабые стороны в реешении.
Так что мой тезис в том, что разнообразие типажей одной модели != разнообразию "мышления" разных моделей.
Что касается Codex - это разовая установка, дальше все работает удобно.

В своем проекте для реализации подобного использую файловую шину - удобная коммуникация внутри одной экосистемы (в моем случае - antigravity), по факту - структурированные .MD файлы с end-to-end инструкциями. Для налаживания коммуникации с внешними инструментами вроде codex рекомендую почитать по a2a, в частности ACP. Сегодня провел тесты с распределением рабочих задач, схема работает.

Наконец-то такой инструмент появился, спасибо что подсветили!

Много пишу планов и для ревью как раз таки использую "конкурирующие модели", по моему опыту они несколько по разному смотрят на поставленную задачу и находят пробелы, которые не видят агенты "того же" провайдера.

Сейчас я могу спокойно освободить свое время от пересылки/запросов в чатах разных моделей.

По сути, это даёт хороший встроенный инструмент циклического планирования (по крайней мере я его так хочу использовать).

Клауд пишет план (в режиме собственного планирования) - далее цикл Codex => Клод

Сейчас тестирую примерно такой подход:
//Описание задачи//

Твоя задача создать план. После завершения написания - сразу запускай ревью, передавая в ссылку кодекс файл плана

По завершению - вноси изменения в план и снова отправляй в того же агента. Выполняй цикл до тех пор пока не будет согласованности. Ограничение - 10 циклов максимум (остановись если больше и дай мне расклад)"

Что интересно, когда я Codex предложил вызывать Claude (через вызов claude cli) для проверок результатов стадий исследования, он не то, что не спорил - стал вызывать сам в местах, где нужны проверки. Codex 5.4 high effort - реальный прогресс:)

Sign up to leave a comment.

Articles