Как стать автором
Обновить

Комментарии 9

очень странно конечно они работают...

А если взять текст и просто самому сделать его менее пластиковым, то будет результат?

Конечно, будет скорее положительный результат

Но это очень тяжело весь текст самому проверять, поэтому эффективнее сразу детектором подсветить вредные слова

"Олеговна, застрахуй команду корабля со скипидаром"

Теперь со вкусом ИИ.

GPTZero, похоже, с русским ещё не очень: первый же текст из Геммы-3 показал зелёненьким.
PS: попросил Гемму перевести на инглиш и скормил детектору: тот же результат

Ну класс, теперь нужно придумать как определить текст который был сгенерирован ИИ так чтобы его не определили как текст от ИИ

Моя знакомая должна в эти дни проходить проверку ее дипломного проекта на AI-генерацию и атиплагиат. Я напрягся, так как недавно мою статью, в которой нет ни капельки от ИИ, обругали в комменте как сгенерированную GPT. Тот, кто писал этот клеветнический коммент, наверняка использовал AI-детектор. Поэтому у меня закралось сомнение по отношению к AI-детекторам. А мне бы не хотелось, чтобы у знакомой были из-за них проблемы с дипломом. Я ради эксперимента подсунул двум AI-детекторам (Copyleaks и isgen.ai), которые стояли первыми в выдаче Гугла, куски написанных мною полностью самостоятельно (вообще без ИИ и без заимствований) статей. И в большинстве случаев я получил оценку 100% AI, 0% человек !!! Как вам такое?!

Тогда я поручил Perplexity (в режиме Research) ответить, почему AI-детекторы дают ложные срабатывания, и как от этого защититься. Тот ответил, что используются такие признаки написанных ИИ текстов: равномерное распределение слов, повторяющиеся речевые обороты, стандартизированные формулировки, предсказуемый и последовательный стиль изложения, структурированный подход к изложению материала, использование определенных фраз для объяснения, уточнения и для общего заключения, фразы, подчеркивающие важность или значимость, фразы "Как известно...", "Как правило...", "Следует отметить..." и т.п., примерно средняя длина всех предложений, отсутствие косноязычия, грамматических ошибок, спонтанности, эмоций и персональных примеров, вопросительных предложений, синонимов, редких слов. То есть, получается, что косноязыкий троечник спокойно пройдет проверку AI-детектором, а отличник - нет!

Perplexity написал, что AI-детекторы часто ошибаются, когда человек пишет в формальном академическом стиле или с использованием профессиональной терминологии. А это, к несчастью, относится к дипломным проектам и техническим статьям. Поэтому проверки AI-детекторами в этих случаях могут создать проблемы ни в чем не повинным студентам и авторам.

Как обойти детекторы текста, сгенерированного ИИ

Пункт первый: написать самому. Если где-то воткнули детектор, то вам жирно так намекают, что ваша задача НЕ пользоваться LLM.

равномерное распределение слов, повторяющиеся речевые обороты, стандартизированные формулировки, предсказуемый и последовательный стиль изложения, структурированный подход к изложению материала, использование определенных фраз для объяснения, уточнения и для общего заключения, фразы, подчеркивающие важность или значимость

Все признаки хорошо написанного текста ;)

Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации