Обновить
16K+
8
Даниил Охлопков@ohld

CTO, Data Lead, AI-native

13
Рейтинг
78
Подписчики
Хабр КарьераХабр Карьера
Отправить сообщение

я вижу, какие люди работают над gbrain, и решил, что они лучше меня шарят в рагах, чем я. Поэтому не изобретаю велосипед, а использую современные тулы, чтобы самому на практике все понять. That's the way

оффтопик: конечно генерация ответов через Claude сильно палится) и я не про длинные тире конечно же

я, конечно же, хранил все локально в markdown файлах. Просто в какой-то момент их становится слишком много, а выкидывать или выносить части не хотелось -- ради полноты картины.

Я понимаю, что при большом числа документов лучше использовать RAG для поиска. В GBrain поиск объединяет результаты из разных видов поиска (почитай Readme, там хорошо написано).

Также мне нравятся фичи синтеза новых знаний и более умная раскладка файлов в волте (в gbrain терминологии это называется source). Я понимаю, что большие файлы хорошо бы пилить на маленькие, это все тоже делается автоматически.

В частности, сейчас это решается цепочкой из агентов, где каждый выполняет свою задачу:

идея -> спека -> план -> разработка через goal -> тестирование локально -> PR -> ревью другими агентами с нуля -> фиксы и деплой.

Но а в конце нужен человек, кто возьмет ответственность за результат. Пока что хе-хе

Судя по моему опыту, ИИ всегда по началу делает ошибки. Но с каждой итерацией результаты становятся лучше, если научить агента запоминать и учиться на ошибках.

А выстраивать ИИ процессы так, чтобы агенты перестали ошибаться, это современный и очень востребованный навык. Как в низкоуровневую разработку непросто влиться без опыта, так и с ИИ: не получится просто закинуть промпт и сразу получить правильное решение, хотя и OpenAI, и Anthopic подходят к решению этой задачи все ближе и ближе.

Круто! Рекоментую изучить проект paperclip - немного напомнило ваш сетап.

По себе могу сказать, что любой подписки за $200 хватает на абсолютно все задачи. Почти никогда не упирался ни в какие лимиты.

Значит, что агент почему-то их не читает. Вообще, в современных агентах типа Claude Code или Codex есть нативные инструменты / hooks под такие супер важные штуки. Возможно, вы не донастроили правильно агента. Расскажите ему про эту проблему -- пусть он предложит trusted решения без костылей.

Звучит так, что у вас тратится контекст куда-то не туда. Изучите, какие файлы и каких размеров читает агент каждый раз перед выполнением работы, возможно, там есть файлик на много тясяч строк, который забивает весь контекст, оставляя под полезную деятельность очень мало места.

Вот этот скилл может помочь в этом:
https://github.com/cursor/plugins/blob/3347cbab5b54136f6fba0994c3a01a56f7fb7fca/cursor-team-kit/skills/thermo-nuclear-code-quality-review/SKILL.md

Очень советую прочитать readme у gbrain. Может, вдохновит

Конечно могут) все заливается венчурными деньгами очень сильно, так что сбросы лимитов и бесплатные токены раздаются направо и налево

Тексты, кстати, хорошо каталогизируются внутри gbrain. А файлы, если честно, можно также по эмбеддингам находить. Из всего можно сгенерировать текст описания.

Я думаю, мы скоро увидим целый рой стартапов и B2B SaaS, решающие и эти проблемы. Ведь у всех компаний одни и те же проблемы наступают.

что за уроборос?)

Всегда рад! Если интересно подраскрыть еще какую-нибудь тему — напишите какую)

Долго не мог решиться и выбрать какой-нибудь инструмент для "правильной" работы с контекстом. Но увидел gbrain от создателя gstack и мой выбор остановился на нем.

Это также стало поводом для установки Hermes Agent -- имхо как личный ассистент работает в разы круче чем Claude или Codex, хотя под капотом у меня используется Codex. Все-таки очень крутой харнесс они сделали, всем советуют проинвестировать свое время и разобраться.

Я думаю, что цены на AI сильно вырастут за год. Сейчас венчурные деньги инвеструются в рост, как, например, было с Uber. Но за это время вся индустрия вырастет, в том числе self-host и open-source. Так что, как обычно, все в плюсе. А текущими маленькими ценами имеет смысл пользоваться для собственного образования

Аудитория Хабр настолько консервативна, что готова тратить время на комментарии "против" вместо того, чтобы потратить час на разобраться, а почему же про это говорят сейчас из каждого утюга?

В телеграмме очень популярны сейчас обертки поверх ChatGPT и других текстовых моделей, так как интерфейс Телеграма (чат) очень подходит под диалог с AI. К тому же у многих пользователей из СНГ есть проблемы с доступом на такие сервисы -- а тут удобно: за рубли и в телеге. Это уже достаточно насыщенный бизнес суммарно на 50M+ MAU.

в репозитории есть примеры SQL и описания таблиц :) Если запрос почему-то работает не ожидаемо долго, агент сам догадывается переписать его по-другому.

Информация

В рейтинге
585-й
Зарегистрирован
Активность

Специализация

Технический директор, Ученый по данным
Ведущий