Обновить
1
Дима@rathe

Пользователь

1
Подписчики
Отправить сообщение

309 правил, которые закрывают дыры в AI-агентах

Уровень сложностиСредний
Время на прочтение5 мин
Охват и читатели6.2K

На соревновании AI-агентов https://bitgn.com, где я участвовал, был класс задач на секьюрити. Там могли подсунуть промпт-инъекцию, попросить прочитать чужие файлы, вытащить переменные окружения, декодировать пейлоад и что-то выполнить.

Оттуда у меня и родилась идея opencode плагина opencode-policy. Поставить перед опасными действиями детерминированный фильтр. Он проверяет входящие сообщения и аргументы тулов до того, как что-то уйдет в модель или в реальное исполнение.

Читать далее

Информация

В рейтинге
Не участвует
Зарегистрирован
Активность