daniilshat 22 апр в 17:04

Новые языковые модели от OpenAI оставляют скрытые водяные знаки в сгенерированном тексте

1 мин

17K

Искусственный интеллектМашинное обучение*

Разработчики платформы для управления политикой использования нейросетей в учебных заведениях рассказали в блоге, что новые модели OpenAI оставляют в сгенерированном тексте водяные знаки. Популярные редакторы документов не показывают их.

Разработчики заметили, что языковые модели GPT o4-mini, o4-mini-high и o3 оставляют в тексте коды неразрывного пробела в формате Unicode. Важно отметить, что символы находятся в случайных местах текста. В окне браузера, популярных онлайн-редакторах документов и Microsoft Word эти символы по умолчанию не видно. Символы можно увидеть в редакторах Sublime Text, VS Code и других похожих.

Пользователи заметили, что в примерах GPT оставляет неразрывные пробелы рядом с датами и сокращениями, но это не всегда так. Нейросеть использует их и между случайными словами в тексте.

Также исследователи отмечают, что невидимые символы пробелов появляются только в длинных сгенерированных текстах. Если ответ нейросети умещается в пару предложений, то подвоха не будет. Это, по мнению разработчиков, намекает на то, что OpenAI начала тестировать водяные знаки для проверки студенческих работ. Это объясняется тем, что компания предоставила бесплатный пробный период для студентов, который продлится до конца учебного года.

Также разработчики считают, что невидимые метки в тексте позволят какое-то время легко распознавать сгенерированный текст, но продлится этот период недолго. Сами же студент могут быстро написать утилиту, которая будет удалять скрытые символы в коде.

Хабы:

Новые языковые модели от OpenAI оставляют скрытые водяные знаки в сгенерированном тексте

Другие новости

Ближайшие события