SmartEngines 21 дек 2023 в 10:15

Градиенты наносят ответный удар: атакуем распознавание паспорта

Средний

7 мин

4.3K

Блог компании Smart EnginesМатематика*Машинное обучение*Искусственный интеллект

Обзор

Комментарии 4

lexxpavlov 7 янв 2024 в 00:06

Это значит, что если я должен кому-то отдать скан паспорта, то лучше обработать эту картинку blackbox-вредоносом?

Даже если предположить, что сам получатель не будет использовать полученную фотку неправомерным способом (в идеале, фотка паспорта должна просто лежать в архиве, на всякий случай и ради исполнения законов), но от него картинку можно получить третье лицо, и вот ему (с некоторой долей вероятности) это помешает использовать скан против меня.

imageman 10 янв 2024 в 01:00

Подобные атаки работают против конкретных нейросетей. Стоит немного дообучить нейросеть, а тем более обучить заново и эффективность атаки падает.

Поэтому просьба к автору сделать следующий эксперимент: на той же архитектуре ResNet-18 проводим повторное обучение (возможно на другом обучающем наборе). Получаем похожую нейросеть (с точностью 99%). И пробуем прогнать все картинки из экспериментов на первой нейросети. Почти уверен, что там, где первая нейросеть просела до 80% вторая нейросеть просядет только до 95%. Всё потому, что мы атакуем первую нейросеть.

Можно ли атаковать сразу две нейросети? Можно, но чуть сложнее.

lexxpavlov 12 янв 2024 в 17:46

А это относится разве не к атакам белого ящика?

imageman 12 янв 2024 в 18:02

Черный ящик - конкретная нейросеть, но нет доступа к весам.

Ведь понятно, что сделать универсальную картинку, которая сразу всеми нейросетями будет ошибочно распознаваться не получится.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий