Comments 1
Но вот в чём штука — проверяют его перед каждым коммитом меньше половины.
Это имеет отношение к human in the loop примерно такое же как люди, которые аппрувают чужие пулл-реквесты без проверки. То есть нулевое. И даже имеет модное название - вайбкодинг.
Я задаю два вопроса. Первый: сколько у этого человека реальной власти — не отклонить один кейс, а остановить систему целиком?
В смысле? Система уже остановлена и ожидает пока человек ответит. В этом весь смысл human in the loop. До тех пор пока не ответит: через минуту, час, или год, никакого движения не будет.
Второй: что именно система объясняет ему перед тем, как он жмёт «одобрить» — сухой score без контекста или полноценный разбор того, откуда взялось это решение?
Что за score? Показывается конкретная команда со всеми параметрами, которую агент хочет выполнить. Если «human in the loop» ее не понимает, то увольте нахер этого кретина и наймите того, кто понимает.
Вы уверены, что знаете, что такое «human-in-the-loop»? Я тоже был уверен. Пока не полез проверять