Pull to refresh
7
0

Разработчик

Send message
Да, было аж два комментария в тему :)
Вы передергиваете и необоснованно обобщаете.

Свои мысли я подробно написал ниже.

С учетом написанного по ссылке, какие у вас есть конструктивные предложения?
Давайте зафиксируем следующее:
— Проверка на плагиат нужна. Иначе большинство работ будут профанацией, а не научной деятельностью;
— Лично я не занимаюсь модулем нашей системы, ответственным за поиск заимствований и определение оригинальности, так что могу ошибаться в некоторых деталях;
— Идеальная проверка текста на заимствования должна основываться на смысловом анализе текста и его пересечений с источниками, но это на сегодняшний день нерешаемая задача; Тут нужен экспертный анализ;
— Исходя из первого пункта — нам нужно решение; Всякое решение неидельно, у нас — лучшее как минимум в РФ. Да, мы продолжаем его улучшать.
— Максимально упросить работу эксперта можно найдя и показав ему все существенные пересечения документа с источниками (давайте больше не возвращаться к теме того, что эксперты порой плохо работают);
— Пересечения с источниками можно найти, определив совпадающие последовательности слов; На сегодняшний день это наиболее удачный подход;
— Нужно определить оптимальную минимальную длину совпавшей последовательности слов, которую будем считать заимствованием (легальным или нелегальным);

Сейчас у нас заимствованием (легальным или нелегальным) считается последовательность не короче 5 слов, совпавшая в документе и источнике. Вероятность, что в двух документах 5 подряд идущих слов случайно совпадут, достаточно мала, скорее всего это признак заимствования. Есть часто используемые выражения. Как уже писал, мы их исключаем из заимствований. В итоге — найденное пересечение между двумя документами почти точно является заимствованием. Редкие, случайные совпадения не сильно влияют на показатели оригинальности текста.

Химические термины и сложные названия веществ обычно короче 5 слов, они не определятся как заимствования. Более того, их можно исключать так же, как исключаются названия и тексты законов. Тем не менее, считать их оригинальным текстом также нельзя. Ведь нельзя считать оригинальным текст, полностью состоящий из цитат уголовного кодекса или учебника по физике. Бесспорно, помимо анализа эксперта, надо понимать, что ориентир в виде ожидаемого процента оригинальности качественной работы разный для разных областей науки.

Согласен с вами, что список исключений, терминов можно и нужно пополнять.
«Ню-ню»? Надеюсь, вы понимаете, что никто тут не отчитывается перед вами.

Короткий ответ — не парализуете. Добавление азбуки в белый список вообще никак не повлияет на проверку документов.

Учитывая уровень, к которому скатилось общение после вашего «ню-ню», не вижу смысла вдаваться в дальнейшие детали.
Нет, в той части, где у вас рука-лицо, вы ошибаетесь. Если один и тот же кусок проверяемого текста нашелся в каком-то реферате и в документе из «белого списка», то этот кусок не будет считаться плагиатом.

P.S. Дарю идею — не будьте настолько категоричны в том, в чем вы досконально не разобрались.
На гифке видно то, о чем спрашивал Amoralist.

По поводу фраз — у нас есть список (общий для всех) общеупотребительных выражений, который пополняется. Примеры фраз из списка:
  • более чем в пять раз
  • в соответствии с одним из вариантов
  • количественный и качественный анализ полученных

Использование фраз из данного списка, естественно, не считается плагиатом. Не уверен, что целесообразно, чтобы у каждой организации был свой собственный список фраз.

Как уже писали, у организаций есть возможность формировать собственные наборы «белых» документов, цитаты из которых не будут считаться плагиатом.
Возможно :) Тут вопрос в том, как много на хабре представителей целевой аудитории данной темы. Данная информация сейчас распространяется нами более таргетированно — на тематических семинарах, вебинарах и конференциях. Спасибо за идею!
Как раз в 17:34 (видно на гифке) возникла идея показать процесс в действии :)

image
Да. Ссылка на ответ на аналогичный вопрос :)
А почему вы решили, что АП не позволяет эксперту править результаты проверки документа?

Эксперт может убрать из отчета любое обнаруженное заимствование, если посчитает, что обнаружение некорректно. После анализа и проведения корректировок он формирует финальный отчет о проверке, в котором все проценты (включая оригинальность) пересчитаны с учетом его правок (т.е. у эксперта есть возможность под свою ответственность привести к 100% оригинальность в отчете любого проверяемого им документа).
1. Работает? Кажется, не совсем.
2. Мы же о налогах, налоги вы все равно платите. Плюс, вы же понимаете, что цепочка чуть длиннее. По вашей логике и пластик не надо производить, и в транспорт не надо пускать сотрудников предприятий, производящих дубинки.

Одним словом, надо обращать внимание на корень проблемы, а не пытаться перекладывать вину на всех и вся, кто опосредованно, очень слабо с ней связан.
На ваши налоги полиция закупает дубинки и порой использует их не так, как нам хотелось бы.
И сейчас вы рассказываете тем, кто под них попал, что виноваты полицейские, которые ими размахивали, а не вы, профинансировавший эти покупки.

Я бы согласился с вами, что вы не хотите, чтобы ваши налоги тратились на подобные цели, но ведь вы при этом с каждым годом получаете все большую ЗП и платите все больше налогов, позволяя закупать все больше и больше дубинок. Что вы делаете, чтобы ваши налоги не шли на закупку дубинок?

Это я к тому, что всегда легко других обвинять, не вдаваясь в детали. В реальности всегда все намного сложнее.
У меня вчера нужное письмо попало в спам. Gmail. В письме купленные билеты на концерт. Значит, все-таки, не все так просто.
Как часто у вас нормальные письма попадают в спам?
Наверняка, бывало и так, что совершенно безвредные и необходимые для решения ваших задач утилиты и программы определялись антивирусным ПО как вредоносные, так ведь?

Хотя, казалось бы, задача антиспама — находить спам, а не то, что спамом не является. То же и с антивирусным ПО.

Есть задачи, которые решить идеально невозможно. Антиплагиат не выносит вердикт о качестве научной работы, он значительно упрощает работу эксперта.
Вы опять возвращаетесь к проблемам в системе образования. Вузы должны быть очень сильно заинтересованы в поддержании своего имиджа, который, кроме всего прочего, должен быть обусловлен качеством образования и хорошо выстроенными процессами. Сам не раз сталкивался с бардаком, бессмысленными процедурами и откровенным раздолбайством за время обучения в одном из «ведущих» вузов РФ. Бездарное применение АП — лишь очередное проявление существующих проблем в системе образования.
Вы слегка не о том. Ваша формула не была определена как попытка технического обхода.

О том, что преподаватель должен адекватно оценивать характер обнаруженных пересечений с другими документами, в комментариях уже не раз писали :)
Так и есть. Основное, что мы делаем с формулами — гарантируем, что они не потеряются после конвертации в pdf и их текст вместе с остальным текстом документа будет проверен на заимствования.

Вы верно обратили внимание на то, что обнаруживаемые «особенности» не всегда являются обходами. Для некоторых типов «особенностей» достаточно нескольких появлений в документе, чтобы мы пометили документ подозрительным, а найденное посчитали потенциальными обходами. Для других типов — даже при большом их количестве в документе мы можем не посчитать документ подозрительным, т.к. нет оснований полагать, что имеем дело с попыткой обхода.

Подозрительным документ из-за наличия в нем большого количества формул может быть помечен только в отдельных, очень редких случаях.
Ваш последний вопрос должен быть адресован вузу. Требования и критерии вуза должны быть максимально прозрачными.

Вообще говоря, человеком выносится намного более сложное решение — определяется оценка той же дипломной работы, где, согласитесь, формальных критериев значительно меньше, чем при определении оригинальности работы. И, если комиссия/преподаватель затрудняются просмотреть отчет о заимствованиях для определения оригинальности работы, как думаете, насколько «качественно» они определяют оценку за диплом?
Конкретные требования определяются вузами. Если интересно, можете почитать наши рекомендации по регламентам проверки документов на заимствования.
1

Information

Rating
Does not participate
Works in
Registered
Activity