Попользуйтесь ботом) если получится как-то его "ломануть", я с радостью разберусь и исправлю это. Я доверяю настройкам безопасности внутри Hermes, которым пользуются миллионы людей.
А так, это я сделал поисковик по чату @ohld_chat при канале, так как там очень много крутых вещей люди присылают про разные AI модели, харнесы или лайфхаки, которые часто теряются под натиском новых сообщений в чате.
я вижу, какие люди работают над gbrain, и решил, что они лучше меня шарят в рагах, чем я. Поэтому не изобретаю велосипед, а использую современные тулы, чтобы самому на практике все понять. That's the way
я, конечно же, хранил все локально в markdown файлах. Просто в какой-то момент их становится слишком много, а выкидывать или выносить части не хотелось -- ради полноты картины.
Я понимаю, что при большом числа документов лучше использовать RAG для поиска. В GBrain поиск объединяет результаты из разных видов поиска (почитай Readme, там хорошо написано).
Также мне нравятся фичи синтеза новых знаний и более умная раскладка файлов в волте (в gbrain терминологии это называется source). Я понимаю, что большие файлы хорошо бы пилить на маленькие, это все тоже делается автоматически.
Судя по моему опыту, ИИ всегда по началу делает ошибки. Но с каждой итерацией результаты становятся лучше, если научить агента запоминать и учиться на ошибках.
А выстраивать ИИ процессы так, чтобы агенты перестали ошибаться, это современный и очень востребованный навык. Как в низкоуровневую разработку непросто влиться без опыта, так и с ИИ: не получится просто закинуть промпт и сразу получить правильное решение, хотя и OpenAI, и Anthopic подходят к решению этой задачи все ближе и ближе.
Значит, что агент почему-то их не читает. Вообще, в современных агентах типа Claude Code или Codex есть нативные инструменты / hooks под такие супер важные штуки. Возможно, вы не донастроили правильно агента. Расскажите ему про эту проблему -- пусть он предложит trusted решения без костылей.
Звучит так, что у вас тратится контекст куда-то не туда. Изучите, какие файлы и каких размеров читает агент каждый раз перед выполнением работы, возможно, там есть файлик на много тясяч строк, который забивает весь контекст, оставляя под полезную деятельность очень мало места.
Тексты, кстати, хорошо каталогизируются внутри gbrain. А файлы, если честно, можно также по эмбеддингам находить. Из всего можно сгенерировать текст описания.
Конкретику пожалуйста)
Попользуйтесь ботом) если получится как-то его "ломануть", я с радостью разберусь и исправлю это. Я доверяю настройкам безопасности внутри Hermes, которым пользуются миллионы людей.
Пользователь не будет видеть секреты - современные сетки уже хорошо их фильтруют. Да и эти секреты не вставляются в промпты даже, только через .env.
Админские команды легко отключаются через настройки Telegram коннектора к Hermes.
Все сильно зависит от кейса, который хотите реализовать.
Можно у этой штуке спросить)
А так, это я сделал поисковик по чату @ohld_chat при канале, так как там очень много крутых вещей люди присылают про разные AI модели, харнесы или лайфхаки, которые часто теряются под натиском новых сообщений в чате.
Ну так читайте, что вы устанавливаете) Или просите своего агента это делать за вас.
вы сами пользуетесь OpenClaw или аналогами?
Спасибо.
Лично для меня главное, что в статье минимум кода: это уже дело агентов разбираться в деталях, а людям важно знать верхнеуровнево, как все устроено.
Я сильно верю в то, что его поделками пользуются и котрибьютят туда много опытных фаундеров из тусовки YC. Если он есть, говнокод будет исправлен.
я вижу, какие люди работают над gbrain, и решил, что они лучше меня шарят в рагах, чем я. Поэтому не изобретаю велосипед, а использую современные тулы, чтобы самому на практике все понять. That's the way
оффтопик: конечно генерация ответов через Claude сильно палится) и я не про длинные тире конечно же
я, конечно же, хранил все локально в markdown файлах. Просто в какой-то момент их становится слишком много, а выкидывать или выносить части не хотелось -- ради полноты картины.
Я понимаю, что при большом числа документов лучше использовать RAG для поиска. В GBrain поиск объединяет результаты из разных видов поиска (почитай Readme, там хорошо написано).
Также мне нравятся фичи синтеза новых знаний и более умная раскладка файлов в волте (в gbrain терминологии это называется source). Я понимаю, что большие файлы хорошо бы пилить на маленькие, это все тоже делается автоматически.
В частности, сейчас это решается цепочкой из агентов, где каждый выполняет свою задачу:
идея -> спека -> план -> разработка через goal -> тестирование локально -> PR -> ревью другими агентами с нуля -> фиксы и деплой.
Но а в конце нужен человек, кто возьмет ответственность за результат. Пока что хе-хе
Судя по моему опыту, ИИ всегда по началу делает ошибки. Но с каждой итерацией результаты становятся лучше, если научить агента запоминать и учиться на ошибках.
А выстраивать ИИ процессы так, чтобы агенты перестали ошибаться, это современный и очень востребованный навык. Как в низкоуровневую разработку непросто влиться без опыта, так и с ИИ: не получится просто закинуть промпт и сразу получить правильное решение, хотя и OpenAI, и Anthopic подходят к решению этой задачи все ближе и ближе.
Круто! Рекоментую изучить проект paperclip - немного напомнило ваш сетап.
По себе могу сказать, что любой подписки за $200 хватает на абсолютно все задачи. Почти никогда не упирался ни в какие лимиты.
Значит, что агент почему-то их не читает. Вообще, в современных агентах типа Claude Code или Codex есть нативные инструменты / hooks под такие супер важные штуки. Возможно, вы не донастроили правильно агента. Расскажите ему про эту проблему -- пусть он предложит trusted решения без костылей.
Звучит так, что у вас тратится контекст куда-то не туда. Изучите, какие файлы и каких размеров читает агент каждый раз перед выполнением работы, возможно, там есть файлик на много тясяч строк, который забивает весь контекст, оставляя под полезную деятельность очень мало места.
Вот этот скилл может помочь в этом:
https://github.com/cursor/plugins/blob/3347cbab5b54136f6fba0994c3a01a56f7fb7fca/cursor-team-kit/skills/thermo-nuclear-code-quality-review/SKILL.md
Очень советую прочитать readme у gbrain. Может, вдохновит
Конечно могут) все заливается венчурными деньгами очень сильно, так что сбросы лимитов и бесплатные токены раздаются направо и налево
Тексты, кстати, хорошо каталогизируются внутри gbrain. А файлы, если честно, можно также по эмбеддингам находить. Из всего можно сгенерировать текст описания.
Я думаю, мы скоро увидим целый рой стартапов и B2B SaaS, решающие и эти проблемы. Ведь у всех компаний одни и те же проблемы наступают.