alizar Feb 25 2014 at 22:15

Научные издательства удалили более 120 статей, сгенерированных на компьютере

2 min

39K

Вот уже два года учёный Сирил Лаббе (Cyril Labbé) из университета Гренобля (Франция) исследует сборники публикаций крупнейших научных издательств и составляет список «фальшивых» научных статей, составленных при помощи генераторов научных текстов.

Как оказалось, троллинг научной прессы — явление более массовое, чем можно было предполагать. На его работу уже обратили внимание сами издательства — и начали постепенно удалять «фейковые» статьи из архивов и сборников по результатам научных конференций. Так, немецкий Springer и американская IEEE к настоящему моменту удалили более 120 научных статей за 2008-2013 годы.

В том числе Springer удалил 16 статей, а IEEE — более 100. Среди этих работ, например, статья из итогового сборника Международной конференции по качеству, надёжности, риску, поддержке и безопасной разработке, которая прошла в 2013 году в Шанхае. Авторы научной работы «TIC: методология построения электронной коммерции» (“TIC: a methodology for the construction of e-commerce”, частичная копия) рассуждают о «текущем статусе эффективных архетипов и разработках в области эмуляции контроля перегруженности», но при этом в данном исследовании они «сконцентрировали усилия на опровержении того факта, что электронные таблицы могут быть основаны на знаниях, при этом быть эмпатичными и компактными».

Журнал Nature связался с указанными авторами научной работы. Один из них сказал, что впервые услышал о публикации в декабре 2013 года и не знал, что он указан в соавторах.

Однако же, подобные работы эффективно повышают рейтинг цитирования отдельных научных заведений и количество публикаций у отдельных учёных.

Пожалуй, первый в интернете генератор наукообразных текстов SCIgen был разработан в 2005 году. Программу свободно может использовать любой желающий. На русском языке похожую разработку ведёт «Яндекс» со своим генератором рефератов.

Сирил Лаббе признаётся, что понятия не имеет, каким образом такие научные статьи попадают в прессу. Он говорит, что большинство подозрительных конференций проходит в Китае. Сгенерированные статьи достаточно легко обнаружить: Лаббе разработал автоматический сканер документов.

Французский учёный начал работу с фальшивыми статьями в 2010 году. Например, в апреле 2010 года он с помощью SCIgen сгенерировал 102 фальшивые статьи и опубликовал их от имени вымышленного автора Айка Анткаре (Ike Antkare). Публикации попали в базу Google Scholar, а индекс цитирования h-index для Анткаре вскоре вырос до 94 баллов, что сделало виртуального персонажа на тот момент 21-м по цитируемости учёным в мире.

Tags:

Hubs:

Spamming and anti-spamming