Alibaba опубликовала Open Code Review с реализацией гибридной архитектуры рецензирования / Comments / Habr

Я поревьювил их систему: они просто собирают дифф из гита и делают его ревью с помощью скилов и прочего. Фактически это интеграция ллм агента и гита, что не совсем верно.

Несколько последовательных версий файла в гите могут быть одинаково хороши. Это значит, что ревью диффа вперед и назад будет показывать отличные результаты. Я уже сам много раз встречал такую ситуацию. Это означает что современный гит не подходит для интеграции с агентами. По факту для каждого файла нужно хранить не одну последнюю версию, а несколько версий, которые считаются хороши с точки зрения ллм. Иначе ллм ревью зациклится и никогда не оставновится либо будет просто бессмысленный расход ресурсов.

Все хорошие версии файла должны быть предоставлены агенту во время рефакторинга и ревью сразу, прятать их нельзя. Текущий агент просто не имеет такой ф-ости и даже в теории не сможет собрать такие лучшие версии воедино.

Далее: сборка контекста осуществляется промптом в виде скила. Они просят агентов собрать некий бизнес контекст по проекту. А почему не собрать мануально ту часть контекста в которой ты уверен? Например есть ts файл, и ты за секунду может собрать основу его контекста в виде спеки, юзов и зависимостей (его, юзов и спеки). Зачем абстрагироваться в таком случае и вешать сборку контекста чисто на агентов? Глупый перерасход токенов.

Надо собирать базовый контекст готовым неабстрактным скриптом а затем еще дополнительно сверху добавлять сборку контекста агентом.

Alibaba опубликовала Open Code Review с реализацией гибридной архитектуры рецензирования

Comments 2

Other news