LizzieSimpson 23 июл 2024 в 16:18

В НИУ ВШЭ разрабатывают технологию идентификации текстов, сгенерированных ИИ любого типа

2 мин

1.6K

Искусственный интеллектМашинное обучение*Научно-популярное

Комментарии 19

acc0unt 23 июл 2024 в 16:48

Задача распознавания текста, сделанного ИИ, не имеет общего решения практически по определению.

Эти порывы "сделать волшебный инструмент против ИИ чтобы можно было работать как раньше" понятны конечно, но они тупиковые по натуре своей.

PeeWeee 23 июл 2024 в 17:11

Молодой адвокат прибегает к своему отцу - старому адвокату и радостно говорит:
-Папа, я выиграл дело, которое ты вел 20 лет!
-Дурак ты, сынок! Благодаря этому делу я вас 20 лет кормил.

FanatPHP 23 июл 2024 в 17:14

Новости вида "учоные собираются разработать", "автостроители собираются выпустить", "инженеры собираются запустить" по определению не имеют смысла. Потому что или Ходжа, или падишах или скорее всего ишак. И интересны только для самих учоных, автостроителей и инженеров, потому что гранты и госзаказ. Но эти новости составляют львиную долю контента информационной службы Хабра. Потому что вы прокомментировали очевидную вещь, я прокомментировал очевидную вещь, и уже можно рекламодателям предъявлять статистику: контент - во! аудитория - во! поведенческий фактор - во!

Antania 23 июл 2024 в 16:53

>оторое позволяет установить, написан текст человеком или сгенерирован искусственным интеллектом

Предвижу.что новости о всяком "нехорошем" ,расследования и тд будут определяться как сгенерированные вражеским ИИ=))

pes_loxmaty 23 июл 2024 в 17:04

Одни нейросети генерируют уйму мусора, другие - этот мусор выявляют. Весь этот цирк потребляет электричество и видеокарты вагонами.

Прогресс который мы заслужили 😄

g42alaxy 23 июл 2024 в 17:06

Ну хорошо, предположим у текста сгенерированного ChatGPT есть повторяющиеся паттерны, устойчивые выражения с высокой температурой, и всякие штуки, которые по идее можно отловить даже частотным анализом. Группа математиков собралась и научилась их отличать. Это лишь решение технической задачи, а не социальной.

Что делать с текстом, к примеру, отредактированным нейросетью? DeepL сейчас пользуется огромной популярностью в том числе и в академической среде. Будет ли их отличать "Поймай бота"? А какие санкции можно применить к диплому студента Вышки, в котором лишь поправили орфографию и стилистику, сочинив текст с 0?

PanDubls 23 июл 2024 в 17:15

У Вышки ещё забавная система антиплагиата. Туда загружаешь работу, и она подсвечивает куски, которые по её мнению являются заимствованиями. В частности, стабильно в заимствования попадают номера страниц, титульный лист и вводные конструкции в товарных количествах. Потом с этим надо идти к научному руководителю, который должен написать бумажку, что "мамой клянусь, ориджинал контент".
Думаю, идентификатор ИИ будет работать как-то так же.

g42alaxy 23 июл 2024 в 17:22

Забавно что на Физтехе такие же фокусы антиплагиат выдает. Особенно смешно, если он считает, что название диплом это плагиат, и потом стабильно подчерикавает колонтитул на каждой странице.
Но все же если набрал 75% уникальности ничего сверху доносить не приходиться. (не считая, конечно, в целом резенции от научника, где он поясняет "почему не все поймут, что работа такая уникальная и неповторимая")

Fahrain 23 июл 2024 в 18:17

Интересно, что будет лет через 50, когда плагиатом станет вообще любой вариант формулировки предложения - ну просто потому что такую формулировку тоже уже кто-то раньше использовал. Комбинаций слов-то в языке всё же ограниченное количество, если мы их комбинируем для того, чтобы что-то осмысленное передать...

MountainGoat 23 июл 2024 в 18:23

Я думаю, там уникальность не уникальна. Я думаю там динамически поддерживается коэффициент такой, чтобы в среднем выходило "уникальности" 75%. Такая система будет всегда работать как сейчас.

exTvr 23 июл 2024 в 23:30

Комбинаций слов-то в языке всё же ограниченное количество,

А что уж говорить про комбинации букв. Давно пора уже всё плагиатом пометить./s

Aniro 23 июл 2024 в 17:17

Никаких. Применение генеративной сети в общем случае недоказуемо - человек может точно также поставить теже самые буквы в том же самом порядке. Да, на больших сгенерированых тесктах можно выявить статистические закономерности (но на редактируемых уже нет), но достаточно варьировать параметры сэмплера по мере генерации или поправить чуть текст вручную и этот метод детекции развалится.

RichardMerlock 23 июл 2024 в 17:51

А зачем вообще это нужно? Если работа - говно, то какая разница, генерировал её студент-оболтус самостоятельно или ИИ помогал? Ставить трояк и гуляй Вася.

MountainGoat 23 июл 2024 в 18:24

А если работа отличная, но на лапу студент не занёс или в квоту на отличников не попадает? Как его зарезать?

RichardMerlock 24 июл 2024 в 02:07

Чтобы студента зарезать антиплагиат не нужен. Но режте, режте, стране нужны революционеры. Красный диплом даёт ложное чувство успеха, как и карьера и другие морковки спереди. Студентам нужен этот опыт.

iliadenisovrewg35g 23 июл 2024 в 22:30

А если сбивать настройки генерации в обычно текстовом редакторе, они тоже будут это различать?

Rubiorif 24 июл 2024 в 07:10

А зачем его распознавать? Если текст написан хорошо, то хоть ИИ, хоть человек написал его - не так уж и важно. А если текст написан плохо и со стандартными ошибками ИИ, то это видно и без всяких технологий.

BlackMokona 24 июл 2024 в 10:43

Например обнаружить армии политических ботов которые толкают повестку свою. Или рекламных ботов что товар в топ выводят и тд

maxbrown 25 июл 2024 в 06:14

Бывают глаголы будущего времени, а бывают - светлого будующего времени. Отличаются наличием какого-либо производного или синонима слова "Россия" в контексте.
Но речь не об этом, а о том, что будут ли в 2025 году вообще какие-либо тексты, написанные человеком, а не ИИ?
Возьмите почти любого современного руководителя уровнем выше плинтуса. Вы думаете, он сам пишет тексты, публикуемые от его имени? Разумеется, нет. У него на то пресс-служба есть, если не собственная, то его начальства.
Ну а обычные люди чем хуже?

Зарегистрируйтесь на Хабре, чтобы оставить комментарий