Комментарии 9
очень странно конечно они работают...
А если взять текст и просто самому сделать его менее пластиковым, то будет результат?
GPTZero, похоже, с русским ещё не очень: первый же текст из Геммы-3 показал зелёненьким.
PS: попросил Гемму перевести на инглиш и скормил детектору: тот же результат
Ну класс, теперь нужно придумать как определить текст который был сгенерирован ИИ так чтобы его не определили как текст от ИИ
Моя знакомая должна в эти дни проходить проверку ее дипломного проекта на AI-генерацию и атиплагиат. Я напрягся, так как недавно мою статью, в которой нет ни капельки от ИИ, обругали в комменте как сгенерированную GPT. Тот, кто писал этот клеветнический коммент, наверняка использовал AI-детектор. Поэтому у меня закралось сомнение по отношению к AI-детекторам. А мне бы не хотелось, чтобы у знакомой были из-за них проблемы с дипломом. Я ради эксперимента подсунул двум AI-детекторам (Copyleaks и isgen.ai), которые стояли первыми в выдаче Гугла, куски написанных мною полностью самостоятельно (вообще без ИИ и без заимствований) статей. И в большинстве случаев я получил оценку 100% AI, 0% человек !!! Как вам такое?!
Тогда я поручил Perplexity (в режиме Research) ответить, почему AI-детекторы дают ложные срабатывания, и как от этого защититься. Тот ответил, что используются такие признаки написанных ИИ текстов: равномерное распределение слов, повторяющиеся речевые обороты, стандартизированные формулировки, предсказуемый и последовательный стиль изложения, структурированный подход к изложению материала, использование определенных фраз для объяснения, уточнения и для общего заключения, фразы, подчеркивающие важность или значимость, фразы "Как известно...", "Как правило...", "Следует отметить..." и т.п., примерно средняя длина всех предложений, отсутствие косноязычия, грамматических ошибок, спонтанности, эмоций и персональных примеров, вопросительных предложений, синонимов, редких слов. То есть, получается, что косноязыкий троечник спокойно пройдет проверку AI-детектором, а отличник - нет!
Perplexity написал, что AI-детекторы часто ошибаются, когда человек пишет в формальном академическом стиле или с использованием профессиональной терминологии. А это, к несчастью, относится к дипломным проектам и техническим статьям. Поэтому проверки AI-детекторами в этих случаях могут создать проблемы ни в чем не повинным студентам и авторам.
Как обойти детекторы текста, сгенерированного ИИ
Пункт первый: написать самому. Если где-то воткнули детектор, то вам жирно так намекают, что ваша задача НЕ пользоваться LLM.
равномерное распределение слов, повторяющиеся речевые обороты, стандартизированные формулировки, предсказуемый и последовательный стиль изложения, структурированный подход к изложению материала, использование определенных фраз для объяснения, уточнения и для общего заключения, фразы, подчеркивающие важность или значимость
Все признаки хорошо написанного текста ;)
Как обойти детекторы текста, сгенерированного ИИ