Pull to refresh
4K+
3
Aleksey@aveml

User

6
Rating
Send message

Иллюзия контроля: почему промпты не защищают ИИ‑агентов

Level of difficultyMedium
Reading time13 min
Reach and readers6.4K

Почему указание вида «не отправляй конфиденциальные данные наружу» не работает?

Разбираем уязвимость Permission Boundary Bypass, а также техники scope creep и capability chaining, позволяющие злоумышленникам обходить ограничения через цепочки легитимных действий. В статье приводятся аргументы, почему prompt‑level enforcement проигрывает, зачем математическая строгость (язык Дика) нужна в конфигах политик, и как выстроить безопасную архитектуру, где проверки живут в runtime. В конец статье вы найдете 7 принципов защиты агентов и таблицу‑чеклист для аудита вашей системы.

Читать далее

Information

Rating
1,257-th
Registered
Activity