PatientZero May 19 2023 at 13:06

Можно ли решить проблему prompt injection?

Easy

8 min

4.8K

Information Security*Artificial Intelligence

Review

Translation

Comments 4

Kergan88 May 19 2023 at 13:51

Проблема решена уже десятилетия назад - любое потенциально опасное действие требует подтверждение от человека со стороны непосредственно системы, которая это действие будет выполнять (т.е. получит команду от сети).

xxNpCxx May 19 2023 at 14:04

Да. Но в таком случае обучаемость ии напрямую зависит от модераторов. Они в свою очередь тоже могут использовать свое положение в корыстных целях. Я уже молчу про ограничения в скорости .

Kergan88 May 23 2023 at 13:17

Дык проблема в любом случае есть и она не в инъекциях.

Автор даже сам к этому подходит но вывод не делает. Почему мы не можем самой сетью тестировать наличие инъекции? А потому что хз что эта сеть вернет, но она ведь и на изначальный запрос возвращает хз что! Т.е. вы даете своей сети задение "сгенери и отправь мое резюме тем и тем компаниям", и она 1 раз из 100 к письму прилагает вашу коллекцию дикпиков. И нет ни какого способа от этого застраховаться кроме как валидировать все ответы сети.

vassabi May 20 2023 at 18:03

социальная инженерия - теперь и для нейронок!