Обновить
6
0
Павел@supcry

Разработчик

Отправить сообщение
К сожалению, далеко не все вузы в действительности заботятся о своим имидже через выстраивание процессов. И это общая беда. :(
Антиплагиат в отчёте показывает уже сконвертированную pdf-версию. Весь мусор будет там виден как на ладони. Сработает обнаружение обходов конвертаций. Будут вопить метрики. Спасибо. Следующий.
100% — никак. Но это намного лучше чем все остальные форматы (кроме plain text'а, конечно).
Конкретику, пжлста.

И может вместо того чтобы воровать или бороться с АП, следовало поступать в вуз, который требует качественной работы, а не «75% оригинальности по АП»?

В комментариях уже много раз отвечено, что АП — инструмент. Проблема в том, что многие вузы пользуются им неправильно, несмотря на все наши усилия. А мы тратим на них очень много ресурсов.
Не может быть такого, что выделяются отдельный слова, а слева/справа ничего нет. Прилагайте ссылку на отчёт или хотя бы скриншот.
Дайте, пожалуйста, источник. Передам его в методический отдел.
Антиплагиат находит совпадения о чём подробно сообщает в отчёте. В некоторых кейсах эти совпадения мы сами пытаемся классифицировать, но не во всех. Считать из некорректными заимствованиями (плагиатом) или нет — решает пользователь. Если в конкретном вузе этим пользователем является некомпетентный «мальчик»/«девочка» — это повод поставить под сомнение компетентность всего вуза и всего образовательного процесса в нём.

Требований нет и вряд ли такие появятся. Есть рекомендации, которые постоянно даются на вебинарах, а также выездных семинарах сотрудникам вузов. Даю ссылку: www.antiplagiat.ru/training
Охват статей на других языках у нас пока уже, чем русскоязычных. Но это дело времени. Растём. Кроме того, не могу отвечать за то, шла ли проверка вашего диплома с поддержкой переводных заимствований или нет.

Технических требований нет. Есть регламенты конкретных вузов. И здравый смысл. В т.ч. опыт экспертов. Конкретные ссылки, думаю, позже накидают мои коллеги.
Во-первых, мы (в Антиплагиате) двигаем алгоритмы в сторону автоматического определения корректности цитирований вплоть до построения сетей цитирования. Но этот процесс не быстрый из-за… см ниже.

Во-вторых, не будь «девочки», будет «мальчик», а проблема останется. Отчёт о проверке должен просматривать компетентный человек. Для устранения этой проблемы мы постоянно проводим бесплатные вебинары для преподавателей и вузовских работников. Увы, человеческий фактор здесь намного важнее всяких изощрённых алгоритмов.
А что с ними? Уже который год переводные есть. Список языков постоянно расширяется.

Что касается «полный список технических требований к оригинальности работы», то это изъезженная тема, на которую целые конференции по всему миру проводятся. Статья была несколько на другую тему.
PDF — рекомендуемый (основной) формат документов для загрузки в Антиплагиат. Возможно, только он и останется. Требование DOCX'а — это отсебятина вашего вуза.
Немного за рамки настоящей статьи, но коротко отвечу.

В каждом случае по-разному. Это уже определяет команда разработки. Либо зашивается в переменных билд-системы, либо берётся из отдельного репозитория с настройками.
> GRPS: вариант для питона

GRPC, исправьте, пожалуйста.
Саша крутой. Будь как Саша!
А в этой области только веб-сервисы дают возможность сформировать машиночитаемую спецификацию (wsdl) и сгенерировать по ней клиент автоматически.


gRPC также может генерировать «машиночитаемую спецификацию» через reflection для генерации клиента. Правда это не будет wsdl, но суть та же. Вообще, это не прерогатива одних только вёб-сервисов. И при желании можно экспозить gRCP как REST через автоматическую проксю.
Серверной части WCF в осязаемых планах у MSFT нет. Смотрите в сторону WebApi или gRPC (зависит от умения готовить и окружения).
Linq2Sql разве жив? Простите, но чем вам EF не угодил? (сами мигрировали с первого на второе лет эдак пять назад).
Вы верно подметили масштаб проблемы.
Вы нас озадачили. :)
Сейчас да, 40 бит будет достаточно. 48 — с лихвой. Но при росте объёма хотя бы на пару порядков упрёмся уже в этот новый потолок.

Про уникальные слова. Шингл — это хэш нескольких слов. У нас есть списки стоп-шинглов и «тяжёлых» шинглов, о чём написано выше в статье. Про алгоритм генерации шинглов в общих чертах есть здесь.
Универсальная и популярная схема, но не очень гибкая. Кроме того, рашдинг по шинглам имеет свои проблемы именно на больших индексах.

Когда допилим, обязательно будет отдельная статья на эту тему.

Информация

В рейтинге
Не участвует
Откуда
Москва, Москва и Московская обл., Россия
Дата рождения
Зарегистрирован
Активность

Специализация

Бэкенд разработчик, Архитектор программного обеспечения
Ведущий
От 450 000 ₽
Linux
Docker
MongoDB
C#
.NET Core
.NET
Git