Как стать автором
Обновить

Комментарии 19

Задача распознавания текста, сделанного ИИ, не имеет общего решения практически по определению.

Эти порывы "сделать волшебный инструмент против ИИ чтобы можно было работать как раньше" понятны конечно, но они тупиковые по натуре своей.

Молодой адвокат прибегает к своему отцу - старому адвокату и радостно говорит:
-Папа, я выиграл дело, которое ты вел 20 лет!
-Дурак ты, сынок! Благодаря этому делу я вас 20 лет кормил.

Новости вида "учоные собираются разработать", "автостроители собираются выпустить", "инженеры собираются запустить" по определению не имеют смысла. Потому что или Ходжа, или падишах или скорее всего ишак. И интересны только для самих учоных, автостроителей и инженеров, потому что гранты и госзаказ. Но эти новости составляют львиную долю контента информационной службы Хабра. Потому что вы прокомментировали очевидную вещь, я прокомментировал очевидную вещь, и уже можно рекламодателям предъявлять статистику: контент - во! аудитория - во! поведенческий фактор - во!

>оторое позволяет установить, написан текст человеком или сгенерирован искусственным интеллектом

Предвижу.что новости о всяком "нехорошем" ,расследования и тд будут определяться как сгенерированные вражеским ИИ=))

Одни нейросети генерируют уйму мусора, другие - этот мусор выявляют. Весь этот цирк потребляет электричество и видеокарты вагонами.

Прогресс который мы заслужили 😄

Ну хорошо, предположим у текста сгенерированного ChatGPT есть повторяющиеся паттерны, устойчивые выражения с высокой температурой, и всякие штуки, которые по идее можно отловить даже частотным анализом. Группа математиков собралась и научилась их отличать. Это лишь решение технической задачи, а не социальной.

Что делать с текстом, к примеру, отредактированным нейросетью? DeepL сейчас пользуется огромной популярностью в том числе и в академической среде. Будет ли их отличать "Поймай бота"? А какие санкции можно применить к диплому студента Вышки, в котором лишь поправили орфографию и стилистику, сочинив текст с 0?

У Вышки ещё забавная система антиплагиата. Туда загружаешь работу, и она подсвечивает куски, которые по её мнению являются заимствованиями. В частности, стабильно в заимствования попадают номера страниц, титульный лист и вводные конструкции в товарных количествах. Потом с этим надо идти к научному руководителю, который должен написать бумажку, что "мамой клянусь, ориджинал контент".
Думаю, идентификатор ИИ будет работать как-то так же.

Забавно что на Физтехе такие же фокусы антиплагиат выдает. Особенно смешно, если он считает, что название диплом это плагиат, и потом стабильно подчерикавает колонтитул на каждой странице.
Но все же если набрал 75% уникальности ничего сверху доносить не приходиться. (не считая, конечно, в целом резенции от научника, где он поясняет "почему не все поймут, что работа такая уникальная и неповторимая")

Интересно, что будет лет через 50, когда плагиатом станет вообще любой вариант формулировки предложения - ну просто потому что такую формулировку тоже уже кто-то раньше использовал. Комбинаций слов-то в языке всё же ограниченное количество, если мы их комбинируем для того, чтобы что-то осмысленное передать...

Я думаю, там уникальность не уникальна. Я думаю там динамически поддерживается коэффициент такой, чтобы в среднем выходило "уникальности" 75%. Такая система будет всегда работать как сейчас.

Комбинаций слов-то в языке всё же ограниченное количество,

А что уж говорить про комбинации букв. Давно пора уже всё плагиатом пометить./s

Никаких. Применение генеративной сети в общем случае недоказуемо - человек может точно также поставить теже самые буквы в том же самом порядке. Да, на больших сгенерированых тесктах можно выявить статистические закономерности (но на редактируемых уже нет), но достаточно варьировать параметры сэмплера по мере генерации или поправить чуть текст вручную и этот метод детекции развалится.

А зачем вообще это нужно? Если работа - говно, то какая разница, генерировал её студент-оболтус самостоятельно или ИИ помогал? Ставить трояк и гуляй Вася.

А если работа отличная, но на лапу студент не занёс или в квоту на отличников не попадает? Как его зарезать?

Чтобы студента зарезать антиплагиат не нужен. Но режте, режте, стране нужны революционеры. Красный диплом даёт ложное чувство успеха, как и карьера и другие морковки спереди. Студентам нужен этот опыт.

А если сбивать настройки генерации в обычно текстовом редакторе, они тоже будут это различать?

А зачем его распознавать? Если текст написан хорошо, то хоть ИИ, хоть человек написал его - не так уж и важно. А если текст написан плохо и со стандартными ошибками ИИ, то это видно и без всяких технологий.

Например обнаружить армии политических ботов которые толкают повестку свою. Или рекламных ботов что товар в топ выводят и тд

Бывают глаголы будущего времени, а бывают - светлого будующего времени. Отличаются наличием какого-либо производного или синонима слова "Россия" в контексте.
Но речь не об этом, а о том, что будут ли в 2025 году вообще какие-либо тексты, написанные человеком, а не ИИ?
Возьмите почти любого современного руководителя уровнем выше плинтуса. Вы думаете, он сам пишет тексты, публикуемые от его имени? Разумеется, нет. У него на то пресс-служба есть, если не собственная, то его начальства.
Ну а обычные люди чем хуже?

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Другие новости

Истории