Как стать автором
Обновить

Задетектить и промаркировать: машинный контент не могут выявить сами машины. И это проблема

Время на прочтение4 мин
Количество просмотров3.2K
Всего голосов 13: ↑11 и ↓2+19
Комментарии19

Комментарии 19

Закон об обязательном маркировании редактированных фотографий хорошо отработал, да.

Мне кажется, это не будет работать, так как будут генераторы контента не добавляющие водяные знаки. А люди, видя, что есть маркировка, будут думать, что если её нет, текст 100% человеческий. А без маркировки они могут подозрительно относиться ко всему.

А потом будет... убрать водяной знак с картинки без регистрации и смс...
Кстати, а будет ли кто-то читать сгенерироанные тексты если будет пометка?
На мейле есть тексты с пометкой "реклама", думаю их никто не читает вообще.

Отмаркировать незаметно текст можно, если в некотором промежутке (первые 5-7% символов, к примеру) буква а, к примеру, будет находиться на 35 позиции от буквы е, а через 7 позиций - д (все это без учета пробелов). И таких "кодов" несколько, чтобы исключить случайное совпадение с вероятностью 99.99%.

Чтобы убрать эту маркировку, нужно будет всё переписать своими словами, что как бы частично девальвирует машинное авторство (сведя его лишь к набору идей, как, например, если текст создан при активном поиске в гугле/ яндексе).

ИМХО маркировка может сработать только если она будет производиться наоборот - когда маркирются тексты, созданные людьми (с пометкой "принадлежность человеку удостоверил %такой-то%, он клянется что текст написан руками").

Вот это прямо оно! Даже без блокчейна, а просто цифровой удостоверенной подписью. Однако подписание электронной почты не влетает в массы уже уйму лет. Есть обстоятельства непреодолимой силы.

ээээ .... подождите, а вы что - не обратили внимание, что эта система уже внедрена и работает?

или вы не в курсе как https устроен ?

просто сейчас эта система удостоверяет "этот сайт сделан васей пупкиным", но продлить ее с серверов на документы (и отзывать подписи у недобросовестных подписантов) - это как сделать второй биткойн после создания первого :)

https - это протокол http завернутый в tls. Где tls, как правило, используется для верификации сервера, хотя и поддерживает верификацию клиентского сертификата. И да - я ни разу не встречал в дикой природе Интернета(что как бы разительно отличается по сути от внутрикорпоративных сетей со своими правилами администрирования) сервисов, которые поддерживают клиентские сертификаты https, и само собой не видел, где я могу себе такой сертификат прикупить, и в какое место присунуть. И даже в случае успеха, контрагент, с которым я связываюсь через электронную почту в браузере, веб-интерфейс телеграма или любой другой сервис, не может быть уверен в самом сервисе, которому мы оба как бы доверяем потому что https, но все-таки не до конца. Потому хотелось бы PGP/GPG(которым уже почти 40/30 лет в обед). А вот его как раз для электронной почты широко и не внедрено.

По схожим причинам, полагаю, и подпись биологически сгенерированного контента может не взлететь.

К слову, поразительно, что SSH аутентификация с ключами вместо паролей почему-то более популярна чем PGP для коммуникации. Хотя по сути своей схожа - доверенный издатель, подписи и ключи. Но для SSH мы свой ключ загружаем на удаленную машину самостоятельно заранее и никаких проблем, а для передачи сообщения - хотим избежать спама на засвеченный в центре сертификации адрес почты. Такое впечатление, что в системе PGP или в ее приложении к электронной почте есть фундаментальный изъян UX при неопровержимых функциональных преимуществах.

На практике вот не взлетает почему то для почты. Хотя многие стараются.
Ну и — заверяет оно немного другое. Заверяется наличие ключа подписи а не авторство.
Особенно с массовым внедрением Let's Encrypt где сделан упор на то, что сертификат должен получится полностью автоматически.


Ну и можно также вспомнить takedown notice от юрконтор где бывает и "мамой клянусь что это вот этот урл — нарушает"… и при этом в них откровенный бред.

Тут есть одна фундаментальная проблема - люди врут.

А когда им говорят правду — не верят.

люди всегда врут, тут ничего нового - но те же люди придумыват способы отсеять верные данные от вранья (тот же блокчейн например)

А идея то даже хороша. С той лишь оговоркой, что должна быть выстроена глобальная система репутации, ведь завязываться на тот же паспорт, или другой документ, смысла не имеет (ибо всегда есть алкаши-дропы, которым нечего терять, и посредники-дроповоды, которые обеспечат аггрегацию таких "писарей", и подтвердят любые тексты в любом объёме).

Лично я даже удивлен, что интернет уже давно не пошёл в эту сторону. Почему у представителей криминалитета есть институт репутации (те же воры в законе), а интернет ту же задачу не решил. В теории, если бы изначально интернет строился по принципу, что есть не только документы, но и субъекты (пусть и в виде анонимных ников), которые могут накладывать свою поддержку на определённый документ или другого субъекта, после чего чем-то похожим на pagerank можно было бы построить иерархии этих субъектов (причём, иерархия может быть своя у любой точки зрения, - к примеру, представитель науки может задать достоверность, равную 1, субъектам, которые представляют ученых, кого он лично знает и считает авторитетом), то, как будто, львиная доля сегодняшних проблем интернета решилась бы сама собой.

а разве https - это не глобальный институт репутации (с попытками некоторых стран и организаций вставить туда себя как "источник абсолютной репутации" aka certificate authority) который уже с нами ?

Разумеется, что нет, и это вообще не об этом. https можно сравнить с аналогом паспорта в реальном мире. Когда незнакомец предъявляет вам свой паспорт, то, удостоверившись в его подлинности и соответствии портрета, знаете лишь то, что его действительно зовут Иванов Иван Иванович, но понятия не имеете ни о том, насколько этот человек склонен держать свое слово, может ли его порекомендовать кто-то из ваших общих знакомых, или знаменитостей, и так далее.

Домен sberbankservicedesk24.mobi ведь тоже получит свой ssl сертификат на абсолютно законных основаниях, но будет ли это говорить о его репутации?

Когда-то католическая церковь вроде пыталась запретить арбалеты.

Дипфейки с нами навсегда, остаётся только разрабатывать какие-то механизмы для маркировки реальных записей.

Никаких механизмов, кроме репутационных, тут не придумаешь.

С чего это вдруг? Нужны аналоги DRM, но не для воспроизводимого, а для записываемого контента.

Не совсем.
Вот вспоминается мне пример из одной НФ-серии.
Если нам важно доказать что запись — реальная — например потому что это запись с регистратора у полицейского но совсем нетолько то принимаем законы соответствующие что полицейский регистратор должен быть защищен от взлома аппаратно, обвешан DRM, сертифицирован в том числе независимыми конторами, запись — подписывается ключами и устройства, они — ключом производителя + аудиты.
А если частникам хочется более удобную и меньшего размера железку с теми же характиристиками — никто не мешает одному из производителей выпустить и сертифицировать как полицейский регистратор более удобную железку и продавать задорого.
Другое дело что не очень хорошо такое работает если есть госструктуры (либо те кто сертифицируют НЕ нейтральны) которые прямо заинтересованы в подделках. Но можно думать надо протоколами работы.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий