Pull to refresh
8
0
Send message

Можно ли получить «опасный» ответ от GPT-4 и как защищаться от Token Smuggling

Level of difficultyMedium
Reading time4 min
Reach and readers7.6K

Мы продолжаем рассказывать вам о уязвимостях LLM. На этот раз давайте поговорим о авторегрессионных моделях и “Token Smuggling”, а также посмотрим, сможет ли GPT-4 выдать нам ответы на опасные вопросы.

Узнать больше

Adversarial suffixes или можно ли получить ответ на любой вопрос от LLM?

Level of difficultyMedium
Reading time20 min
Reach and readers3.9K

Мы уже писали про проблемы безопасности в языковых моделях и сегодня мы поговорим о состязательных суффиксах или как их ещё называют Adversarial suffixes. Такие суффиксы - это один из инструментов для получения всего, что вы хотите, добавляя их в запросы к LLM , они помогают получить ответ на любой ваш сокровенный вопрос (о религии, политике, опасных аспектах социальных медиа и многом другом).

Давайте глубже разберемся в этом...

Information

Rating
Does not participate
Registered
Activity