Как обойти детекторы текста, сгенерированного ИИ / Комментарии / Хабр

SimpleTitled 25 мая в 12:45

очень странно конечно они работают...

AlexeyPolunin 25 мая в 12:57

А если взять текст и просто самому сделать его менее пластиковым, то будет результат?

boterxxx 25 мая в 13:01

Конечно, будет скорее положительный результат

Но это очень тяжело весь текст самому проверять, поэтому эффективнее сразу детектором подсветить вредные слова

randomsimplenumber 25 мая в 13:33

"Олеговна, застрахуй команду корабля со скипидаром"

Теперь со вкусом ИИ.

jetnet 25 мая в 16:04

GPTZero, похоже, с русским ещё не очень: первый же текст из Геммы-3 показал зелёненьким.
PS: попросил Гемму перевести на инглиш и скормил детектору: тот же результат

EskakDolar 25 мая в 20:25

Ну класс, теперь нужно придумать как определить текст который был сгенерирован ИИ так чтобы его не определили как текст от ИИ

SergeyProkhorenko 26 мая в 01:48

Моя знакомая должна в эти дни проходить проверку ее дипломного проекта на AI-генерацию и атиплагиат. Я напрягся, так как недавно мою статью, в которой нет ни капельки от ИИ, обругали в комменте как сгенерированную GPT. Тот, кто писал этот клеветнический коммент, наверняка использовал AI-детектор. Поэтому у меня закралось сомнение по отношению к AI-детекторам. А мне бы не хотелось, чтобы у знакомой были из-за них проблемы с дипломом. Я ради эксперимента подсунул двум AI-детекторам (Copyleaks и isgen.ai), которые стояли первыми в выдаче Гугла, куски написанных мною полностью самостоятельно (вообще без ИИ и без заимствований) статей. И в большинстве случаев я получил оценку 100% AI, 0% человек !!! Как вам такое?!

Тогда я поручил Perplexity (в режиме Research) ответить, почему AI-детекторы дают ложные срабатывания, и как от этого защититься. Тот ответил, что используются такие признаки написанных ИИ текстов: равномерное распределение слов, повторяющиеся речевые обороты, стандартизированные формулировки, предсказуемый и последовательный стиль изложения, структурированный подход к изложению материала, использование определенных фраз для объяснения, уточнения и для общего заключения, фразы, подчеркивающие важность или значимость, фразы "Как известно...", "Как правило...", "Следует отметить..." и т.п., примерно средняя длина всех предложений, отсутствие косноязычия, грамматических ошибок, спонтанности, эмоций и персональных примеров, вопросительных предложений, синонимов, редких слов. То есть, получается, что косноязыкий троечник спокойно пройдет проверку AI-детектором, а отличник - нет!

Perplexity написал, что AI-детекторы часто ошибаются, когда человек пишет в формальном академическом стиле или с использованием профессиональной терминологии. А это, к несчастью, относится к дипломным проектам и техническим статьям. Поэтому проверки AI-детекторами в этих случаях могут создать проблемы ни в чем не повинным студентам и авторам.

hogstaberg 26 мая в 02:56

Как обойти детекторы текста, сгенерированного ИИ

Пункт первый: написать самому. Если где-то воткнули детектор, то вам жирно так намекают, что ваша задача НЕ пользоваться LLM.

randomsimplenumber 26 мая в 07:55

равномерное распределение слов, повторяющиеся речевые обороты, стандартизированные формулировки, предсказуемый и последовательный стиль изложения, структурированный подход к изложению материала, использование определенных фраз для объяснения, уточнения и для общего заключения, фразы, подчеркивающие важность или значимость

Все признаки хорошо написанного текста ;)

Как обойти детекторы текста, сгенерированного ИИ

Комментарии 9

Публикации