Articles / Profile of aveml / Habr

aveml Jun 23 at 07:03

Иллюзия контроля: почему промпты не защищают ИИ‑агентов

Medium

13 min

7.1K

Information Security * Systems engineering * Artificial Intelligence

Opinion

From sandbox

Почему указание вида «не отправляй конфиденциальные данные наружу» не работает?

Разбираем уязвимость Permission Boundary Bypass, а также техники scope creep и capability chaining, позволяющие злоумышленникам обходить ограничения через цепочки легитимных действий. В статье приводятся аргументы, почему prompt‑level enforcement проигрывает, зачем математическая строгость (язык Дика) нужна в конфигах политик, и как выстроить безопасную архитектуру, где проверки живут в runtime. В конец статье вы найдете 7 принципов защиты агентов и таблицу‑чеклист для аудита вашей системы.