Академики начали использовать ИИ для определения признаков подделки иллюстраций в научных статьях. Учёные подозревают, что подобные случаи мошенничества уже могли пустить по ложному пути лечение таких недугов, как болезнь Альцгеймера, сообщает The Register.

Оказывается, подделка иллюстраций в научных работах встречается довольно часто. Например, автор может скопировать и перевернуть, обрезать или ещё как-нибудь изменить фото кластера клеток, чтобы создать впечатление, что у него больше данных, подтверждающих теорию, и что он провёл больше экспериментов, чем на самом деле. 

Подделка фото стала основной причиной отзыва статей Американской ассоциации по изучению рака (AACR) с 2016 по 2021 год. В попытке решить проблему AACR в 2021 году начала тестировать ИИ Proofig, разработанный одноимённым израильским стартапом. С января 2021 года по май 2022 года руководство AACR пропустило через Proofig 1367 рукописей, предварительно принятых к публикации. В 208 случаев ИИ отметил иллюстрации как подозрительные, в четырёх случаях его подозрения подтвердились, и статьи были отозваны.

Академическое мошенничество может привести к серьёзным последствиям, особенно когда речь идёт о медицинских научных статьях. В 2021 году профессор неврологии из Университета Вандербильта Мэттью Шрэг обнаружил подозрительные изображения в масштабном исследовании биолога Сильвена Лесне из Университета Миннесоты, опубликованном в Nature. Исследование было посвящено болезни Альцгеймера, а иллюстрации связаны с вестерн-блотом, методом выявления в образце белков определённого типа. Иллюстрации метода представляют собой полосы разной ширины, различия в которых свидетельствуют о разных результатах анализа.

Работа Лесне поддерживала ключевой элемент амилоидной гипотезы болезни Альцгеймера, согласно которой скопления бета-амилоидов в тканях головного мозга являются основной причиной болезни. Мэттью Шрэг, исследовав его работу, в том числе с помощью ПО, заявил, что имеются признаки подделки иллюстраций: некоторые их части были совершенно одинаковыми, а значит, скопированными. Исследования болезни Альцгеймера, обошедшиеся в миллионы долларов только в США, могли 16 лет идти по ложному пути. 

Любопытно, что благодаря работам Лесне на рынке США появился препарат «Симуфилам», который выпускает фармацевтическая компания CassavaSciences. Национальный институт здравоохранения США выделил на разработку препарата миллионы долларов, и в исследованиях, которые CassavaSciences предоставляла для обоснования получения средств, Шрэг тоже нашёл признаки подлога.

Одинаковые элементы в иллюстрациях Лесне, обнаруженные профессором Шрэгом
Одинаковые элементы в иллюстрациях Лесне, обнаруженные профессором Шрэгом

Полные дубликаты иллюстраций или их частей очень трудно заметить неподготовленному глазу, но эта задача хорошо подходит для компьютеров, заявляет соучредитель Proofig Дрор Колодкин-Гал. Тем не менее, результаты поиска ИИ должен перепроверять специалист со знаниями и опытом в нужной дисциплине. Кроме того, обработка изображений требует больших объёмов вычислительных ресурсов, а следовательно, и средств. Например, анализ 120 изображений с помощью Proofig будет стоить $99, что с учётом всего объёма иллюстраций в научной статье может обойтись недёшево. Чтобы снизить затраты, научное издательство SAGE Publishing, например, использует ИИ для проверки рукописей, находящихся на более продвинутой стадии рецензирования, а не при первоначальной подаче. 

Наконец, ИИ пока не может выявить плагиат в разных журналах. Для этого необходимо создать базу данных изображений из опубликованных статей для сравнения.

«Основной вызов для сообщества сегодня — это большие объёмы данных, — заявляет Колодкин-Гал. — Если издатели не начнут работать вместе над созданием базы данных иллюстраций, фальсификация фото останется проблемой».