Pull to refresh

Comments 3

UFO landed and left these words here

Похожий опыт на разработке компилятора (с эффектами + GC, не Rust). Catalog’ил 4 категории сбоев: hallucinated facts (агент утверждает что фича работает — тесты PASS в одном пайплайне, FAIL в другом), defending past positions (защищает свой же дизайн недельной давности под новыми данными), off-distribution (стандартный паттерн на нестандартный nuance), echo chamber (множество reviewer-агентов с одинаковым системным промптом валидируют друг друга).

Твои aliasing violations попадают в #3 — стандартный borrowing паттерн в unsafe-контексте, где он invalid. У меня митигация — отдельный audit-агент с adversarial framing’ом, проверяет assumption holes, не код. Miri в твоём случае внешний механизм с той же ролью.

Какие из patterns 1, 2, 4 ты у себя видел на unsafe Rust?

Похожий опыт на компиляторе (эффекты + GC, не Rust). Сильнее всего бьёт не код сам по себе, а уверенность агента: настаивает что работает, а тесты в одном прогоне проходят, в другом падают.

Твои нарушения алиасинга — типовое заимствование там, где оно запрещено. У меня защита — отдельный агент-критик: проверяет допущения, а не код. Miri у тебя играет ту же роль, только снаружи.

А на unsafe Rust ловил случаи когда модель упирается в своё решение недельной давности, хотя новые данные говорят против?

Sign up to leave a comment.

Articles