годный разбор. больше всего зацепило про пайплайн - то что модель сама пишет и запускает тесткейсы для проверки своих же гипотез. по сути святой грааль. нажал кнопку и ждешь, пока тебе прилетит готовый эксплойт с описанием. интересно кстати, сколько токенов сгорает на один найденный баг? небось по деньгам выходит прилично, если Claude Opus гонять пачками на эфемерных виртуалках.
статья интересная, но имхо это всё равно гонка вооружений. сегодня мы их ловим по низкой энтропии и нехватке глаголов, а завтра выйдет условная gpt-5, которой в промпте пропишут "пиши как живой человек с синтаксическими косяками и кучей наречий", и вся эта математика поплывет. но за наводку на методику респект, цифры про естественную непоследовательность это прям в точку. именно эти шероховатости в коде и в текстах обычно и выдают автора
хахахаха согласен, ну а что поделать в нынешнем мире, состоящем только из слопа..
годный разбор. больше всего зацепило про пайплайн - то что модель сама пишет и запускает тесткейсы для проверки своих же гипотез. по сути святой грааль. нажал кнопку и ждешь, пока тебе прилетит готовый эксплойт с описанием. интересно кстати, сколько токенов сгорает на один найденный баг? небось по деньгам выходит прилично, если Claude Opus гонять пачками на эфемерных виртуалках.
статья интересная, но имхо это всё равно гонка вооружений. сегодня мы их ловим по низкой энтропии и нехватке глаголов, а завтра выйдет условная gpt-5, которой в промпте пропишут "пиши как живой человек с синтаксическими косяками и кучей наречий", и вся эта математика поплывет. но за наводку на методику респект, цифры про естественную непоследовательность это прям в точку. именно эти шероховатости в коде и в текстах обычно и выдают автора