Comments 4
А в принципе, плагиат проверяется только на языке оригинала, или и на иных языках?
Столкнулся с тем, что некоторые научные журналы начали пользоватся подобными системами.
Допустим, есть научная статья [1], в которой вся суть заключена в 3-4 предложениях (Выводы/Заключение). Есть ряд следующих статей, в количестве 500, которые опираются на выводы статьи [1]. Риторический вопрос: Можно ли перефразировать 500 раз, ни разу не повторившись и не искажая смысл написаного? Нужно чётко различать понятия цитирования с указанием источника и плагиат.
А вашу программу можно дописать, чтобы можно было отличать плагиат от цитирования?
"метод query_pinecone
принимает вводимое пользователем содержимое статьи, преобразует его в сопоставления векторов, а затем запрашивает индекс Pinecone, чтобы найти похожие статьи." - хотелось бы узнать, как происходит само преобразование и поиск.
Создайте средство проверки на плагиат с помощью машинного обучения