Поток Информационная безопасность доступен 24/7 благодаря поддержке друзей Хабра

Комментарии 4
"LLM раскусил ROT13-джейлбрейк." Это хорошая новость. Плохая: значит, LLM читает смысл, а не буквы – и однажды найдётся джейлбрейк, который смысл скрывает, но токены пропускает. Безопасность через непонимание – не защита, а гонка вооружений, в которой у атакующего неограниченное время на эксперименты.
согл, мне кажется за смыслами это к Лекуновской JEPA, я правда думал H-JEPA для архитектуры БД попробовать поюзать, но видимо можно и в ту сторону посмотреть
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Дешёвая модерация анонимной стены: 3-слойный каскад и ROT13-джейлбрейк в проде