ArXiv на год заблокирует исследователей за публикацию статей с участием ИИ / Хабр

Платформа с препринтами научных работ ArXiv заявляет, что будет блокировать авторов на один год, если они представят статьи, содержащие сгенерированный ИИ контент, такой как вымышленные цитаты, текстовые филлеры или метакомментарии.

«Если инструменты генеративного ИИ генерируют неподобающий язык, плагиат, предвзятый контент, ошибки, неточности, некорректные ссылки или вводящий в заблуждение контент, и этот результат включается в научные работы, ответственность за это несёт автор. Мы недавно уточнили наши санкции за это. Если в представленной работе содержатся неопровержимые доказательства того, что авторы не проверили результаты генерации LLM, это означает, что мы не можем доверять ничему в статье», — заявил Томас Дитерих, председатель секции компьютерных наук ArXiv.

Доказательствами злоупотребления помощью ИИ станут «галлюцинаторные ссылки, метакомментарии от LLM («вот краткое изложение на 200 слов; хотите, чтобы я внёс какие-либо изменения?»; «данные в этой таблице носят иллюстративный характер, заполните ее реальными цифрами из ваших экспериментов»»).

Авторов будут блокировать на год и требовать, чтобы последующие публикации на arXiv сначала были приняты авторитетным рецензируемым изданием.

Дитерих сообщил также, что это правило «одного нарушения» — то есть, авторы, уличённые в использовании ИИ в своих публикациях один раз, будут забанены, — но решения можно обжаловать. «Я хочу подчеркнуть, что мы применяем это только к случаям неопровержимых доказательств. Я также должен добавить, что наш внутренний процесс требует, чтобы сначала модератор задокументировал проблему, а затем председатель секции подтвердил её, прежде чем налагать наказание», — заключил он.

Осенью в ArXiv объявили, что больше не будут принимать обзорные статьи и аналитические доклады по информатике, которые не были рецензированы и приняты академическим журналом или конференцией. Изменение правил обусловлено наводнением этой категории низкопробными статьями, созданными при помощи искусственного интеллекта.

В марте сообщалось, что с 2022 года большинство статей на сервисе в области программной инженерии были посвящены теме LLM. На них приходится 70% новых материалов.