Научные издательства удалили более 120 статей, сгенерированных на компьютере

    Вот уже два года учёный Сирил Лаббе (Cyril Labbé) из университета Гренобля (Франция) исследует сборники публикаций крупнейших научных издательств и составляет список «фальшивых» научных статей, составленных при помощи генераторов научных текстов.

    Как оказалось, троллинг научной прессы — явление более массовое, чем можно было предполагать. На его работу уже обратили внимание сами издательства — и начали постепенно удалять «фейковые» статьи из архивов и сборников по результатам научных конференций. Так, немецкий Springer и американская IEEE к настоящему моменту удалили более 120 научных статей за 2008-2013 годы.

    В том числе Springer удалил 16 статей, а IEEE — более 100. Среди этих работ, например, статья из итогового сборника Международной конференции по качеству, надёжности, риску, поддержке и безопасной разработке, которая прошла в 2013 году в Шанхае. Авторы научной работы «TIC: методология построения электронной коммерции» (“TIC: a methodology for the construction of e-commerce”, частичная копия) рассуждают о «текущем статусе эффективных архетипов и разработках в области эмуляции контроля перегруженности», но при этом в данном исследовании они «сконцентрировали усилия на опровержении того факта, что электронные таблицы могут быть основаны на знаниях, при этом быть эмпатичными и компактными».

    Журнал Nature связался с указанными авторами научной работы. Один из них сказал, что впервые услышал о публикации в декабре 2013 года и не знал, что он указан в соавторах.

    Однако же, подобные работы эффективно повышают рейтинг цитирования отдельных научных заведений и количество публикаций у отдельных учёных.

    Пожалуй, первый в интернете генератор наукообразных текстов SCIgen был разработан в 2005 году. Программу свободно может использовать любой желающий. На русском языке похожую разработку ведёт «Яндекс» со своим генератором рефератов.

    Сирил Лаббе признаётся, что понятия не имеет, каким образом такие научные статьи попадают в прессу. Он говорит, что большинство подозрительных конференций проходит в Китае. Сгенерированные статьи достаточно легко обнаружить: Лаббе разработал автоматический сканер документов.

    Французский учёный начал работу с фальшивыми статьями в 2010 году. Например, в апреле 2010 года он с помощью SCIgen сгенерировал 102 фальшивые статьи и опубликовал их от имени вымышленного автора Айка Анткаре (Ike Antkare). Публикации попали в базу Google Scholar, а индекс цитирования h-index для Анткаре вскоре вырос до 94 баллов, что сделало виртуального персонажа на тот момент 21-м по цитируемости учёным в мире.
    Поделиться публикацией
    Комментарии 38
      +55
      Автоматизированный сканер автоматически сгенерированных статей? Да по этой теме можно написать несколько работ.
        +68
        … сгенерировать несколько работ… )
          0
          … и даже отнюдь не несколько!

          (я уже не говорю, что несколько депутатов и губернаторов могли бы докторские степени защитить)
          +7
          Ждем появления автоматического генератора статей с возможностью обхода автоматического сканера автоматически сгенерированных статей.
            +2
            Ожидаемая картинка
              +2
              Самое грустное — это вполне возможно, вопрос только в ресурсах.
              Запустить какой-нибудь генетический (или иной) алгоритм подбора параметров генерации документов на базе автоматической их же проверки, скрипт 'из трех строчек'.
                0
                Это уже похоже на ИИ.
                  0
                  Я думаю можно утверждать, что подобный «генератор с функцией обхода детектора» обладает некоей альтернативной формой самосознания.

                  Судите сами:
                  Есть ли у такого генератора «модель себя»? Да. Собственно у него есть доступ к собственным настройкам генерации, которые надо «твикать» чтобы статьи получались «кошерными»
                  Есть ли у него органы чувств? Да. В качестве таковых выступает собственно «детектор статей».
                  Есть ли обратная связь между детекторам статей и внутренней моделью? Да, в этом вся соль.
                  Влияет ли модель на поведение (собственно на вид статьи «на выходе» )? Да.

                  Чем не самоосознающая сущность?
                +3
                А я почему-то вспомнил вот это
                image
              +10
              Где доказательсва, что этот пост написан реальным человеком?
              +14
              Представляю печаль какого-нибудь м.н.с., который писал, ночей не спал, а его труд попал под категорию «сгенерировано»
                +6
                Представляю печаль какого-нибудь м.н.с., который копипастил, ночей не спал, а его труд попал под категорию «сгенерировано»

                fixed
                  +2
                  Я не в курсе, так что поясните пожалуйста.
                  Юмор в том, что работы начального уровня всегда являются по сути компиляцией других работ без привнесения собственного? Или в чем то ещё? Просто даже среднестатистический дипломный проект в институте предполагает какой-то собственной работы. Хотя воды, необходимой по стандарту там конечно будет изрядно, но одного исследования источников (по хорошему) не достаточно.
                    +1
                    Юмор в том, что и при копипасте надо хотя бы самому понимать смысл написанного. Можно бездумно скопипастить с сгенерированного текста, и будет ещё больший конфуз.
                +15
                Нельзя сбрасывать со счетов возможные проблемы китайцев с переводом работ на английский язык. По своему опыту знаю: видела тезисы, похожие на генерированный бред, при этом на конференции доклад звучал стройно, пусть и с иногда странной лексикой, и было видно, что докладчик в теме шарит
                  +7
                  Да не только у китайцев такие проблемы. У многих. Сейчас вот по ведущим ВУЗам РФ пошла установка: РИНЦ засуньте теперь себе куда подальше, только Scopus и WoS. А там опубликоваться не так просто. Поэтому централизованно ищут пути и сообщают по университету, что вот там-то такая конференция с публикацией статей в Scopus, а срок оставшийся 2 недели. Вот и бросаются все вылизывать свои материалы с научной точки зрения на сколько можно, а на перевод времени не остается и далеко не все владеют им на уровне хотя бы so-so. Сам сейчас этим занят. Статья принята — надо по максимуму причесать язык. Проф. переводчика мне никто не оплатит, поэтому вылизываю сам как могу, консультируясь у друзей, владеющих языком лучше меня.
                    0
                    А мы для серьёзных публикаций просто скидываемся всеми соавторами и нанимаем переводчика на свои деньги. В расчёте на 3-5 человек цена приемлемая. Благо у нас в КНЦ всё ещё есть отдельное подразделение переводчиков. Бесплатно они уже не работают, но зато качество на высоте.
                    Что поделать, понты публикации дороже денег.
                    0
                    Вопрос же не в том, как статья написана, а в том, есть ли в ней научная составляющая. Я читал достаточно много китайских статей, написанных ужасным языком, да ещё и без логики изложения, но всегда удавалось понять, что авторы хотели сказать (то, что там обычно нет никакой научной новизны это уже другой вопрос)
                  • НЛО прилетело и опубликовало эту надпись здесь
                      0
                      Сгенерированные статьи достаточно легко обнаружить

                      Только сгенерированные SCIgen. Наверняка сумрачный гений уже состряпал что-то более хитроумное, ведь SCIgen — это всего лишь небольшой перловый скрипт…
                        0
                        Как Айку Анткаре удалось достичь столь высокого индекса Хирша?
                        Он в каждой статье ссылался на все свои работы, в том числе еще не опубликованные?
                          0
                          Так и есть, в pdf-ке по последней ссылке об этом рассказывается: генерируется n статей, каждая из которых ссылается на все n, включая саму себя.
                            +2
                            Думаю это как раз был целенаправленный троллинг «системы». Если эти статьи проторчали в индексах пять лет — это о чём-то да говорит.
                          +9
                          А в России был «Корчеватель». Полностью — «Корчеватель: Алгоритм типичной унификации точек доступа и избыточности». Это статья, написанная SCIgen'ом и переведённая Этапом-3. Её журналисты из «Троицкого варианта» смогли протолкнуть в рецензируемый научный журнал.
                            +26
                            Зато в России действует автоматический генератор законов.
                              0
                              Угу. И на его разработку наверняка потрачено много попиллиардов государственных рублей.
                              +4
                              выбираем деревянный сердечник, т.к. преподаватель читать это всё равно не будет.
                                +5
                                Это пример демонстрирует сложность проблемы распознавания фуфла, ведь бывают резисторы из дерева.
                                  0
                                  Откуда?
                                    0
                                    Старая байка про студенческие дипломные работы. Существует во множестве вариаций, но для мелких вузов вполне осуществимая. В нашем филиале петрозаводского вуза в своё время нашли подобную работу. Кто-то из одногрупников делал диплом на тему, которая уже была несколько лет назад. Преподы подняли старый диплом для проверки на плагиат, а там написана подобная фигня, да не одна. Причём тот диплом был защищён на «отлично». Скандал был, диплом хотели отозвать, но чем дело закончилось не знаю — универ закончил.
                                  +5
                                  И при все этом издательства дерут огромные деньги с покупателей, заявляя что все эти большие сборы уходят на рецензирование статей. А по факту просто верят на слово автору и стрегут деньги.
                                    +2
                                    Мне кажется, журнал журналу рознь. Не так давно месяца 2-3 бодались с рецензентами по поводу того, достаточно ли нашего моделирования для выводов. Даже после приведения ссылок на работы нобелевского лауреата с доказательством нашей правоты споры не прекратились =) (журнал российский).
                                      +1
                                      Бесспорно, есть журналы, которые легко и просто напечатают, что угодно, но есть также и те, которые следят за качеством статей от формального подхода до очень серьезного. При этом всегда есть шанс нарваться на невменяемых рецензентов.

                                      Мы вот с другой проблемой столкнулись. Отправляем статью в приличный журнал. (Если интересно, то «Известия РАН», а не какой-то непонятный журнал). Присылают версию на проверку. Волосы встают дыбом. Переврали обозначения на графиках, наделали кучу ошибок в тексте. Непосредственным набором статьи занимался я, поэтому изначально получил нагоняй, ибо подумали, что это я такую фигню в журнал отослал. Сравнили внимательно с тем, что отправляли. Ошибок нет. При этом видно, что правкой статьи занимался человек, который совершенно не в теме и не знает терминов в этой области, считая их ошибками и исправляя на похожие знакомые ему слова. Отписываемся в редакцию с подробным указанием всех ошибок, которые они создали и указанием того, что в оригинале все ок. Статья вышла все равно с мелкими ошибками, но хоть уже не по существу, а в русском языке.
                                        +1
                                        мы туда же отправляли =)
                                      0
                                      Впервые слышу о практике выплат рецензентам. Но вообще да, такие просочившиеся статьи — удар по репутации журнала (если есть по чему ударять). Ситуация может усугубляться тем, что от откровенно плохих статей отказываются хорошие рецензенты, и самые худшие статьи в итоге могут попасть на рецензирование даже аспирантам (чего, по хорошему, случаться не должно). Но это случается только в самых низкоуровневых журналах.
                                      +1
                                      У нас в стране и сгенерированные дипломные работы защищают, и диссертации. Вот где Сирил бы развернулся!
                                        +5
                                        Удаление сгенерированных компьютером статей — это дискриминация сильного ИИ!
                                          0
                                          Математический версификатор, забавно.

                                          Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                                          Самое читаемое