Исследование обнаружило, что фразы из статей Википедии, касающихся активно развивающихся научных областей, попадают в научные работы




Википедия решает застольные споры и спасает тех, кто пытается схитрить на вечере эрудиции. Быстро: в какой стране берёт начало Нил? В каком году Гершвин написал "Рапсодию в стиле блюз"? В Википедии можно найти ответы на все подобные вопросы – включая и научные.

В Википедии содержатся сотни тысяч научных статей, и она предоставляет способ быстро сослаться на молекулярную формулу "Золофта", изобретателя 3D-принтера и то, что теории тектонических плит всего около 100 лет. Этот сайт – золотая жила для любителей науки, научных блогеров и самих учёных. Но хотя учёные и используют Вики, они не спешат в этом признаваться. Сайт редко попадает в список цитат, как источник, допустим, истории изучения оси мозг-кишечник или химической формулы поливинилхлорида.

Но учёные роются в Вики точно так же, как и все остальные люди. Недавний анализ обнаружил, что актуальность Вики не отстаёт от новейших исследований – и что слова из её статей попадают в научные работы. Эти результаты не только указывают на привычку использовать Вики, укоренившуюся в башне из слоновой кости. Они также говорят о том, что свободный и доступный всем источник информации играет свою роль в прогрессе исследований, особенно в более бедных странах.

Учителя в средней школе, старших классах и колледжах наставляют учеников: Вики – недостоверный источник. Её может редактировать каждый, и статьи меняются день ото дня – иногда на одну запятую, а иногда полностью переписываются за одну ночь. «У Вики репутация ненадёжного источника», — говорит Томас Шафи, биохимик из Университета Ла Троуб в Мельбурне.

Но те же самые учителя – д��же преподаватели колледжа – предостерегая студентов от использования Вики, сами её используют. «Учёные постоянно используют Вики, потому что они тоже люди. Это то, что делают все», — говорит Даг Хэнли, специалист по макроэкономике из Питтсбургского университета.

И, возможно, репутация сайта как ненадёжного неоправданна. Вики не менее непротиворечива, чем Британская Энциклопедия – так показало исследование 2005 года, опубликованное в Nature (сама энциклопедия яростно возражала против такого заключения). Но цитировать её в качестве источника никто не решается. «Её не уважают так, как академические источники», — отмечает Шафи.

Академическая наука может не уважать Вики, но сама Вики однозначно любит науку. Из порядка 5,5 млн статей от полумиллиона до миллиона касается научных тем. И постоянное дополнение материала сотнями и тысячами редакторов гарантирует актуальность статей вровень с самыми последними научными работами.

Легко отследить, как новейшие публикации влияют на Вики. Их ведь упоминают в энциклопедии. Но работает ли эта связь в другую сторону? Просачиваются ли научные статьи из Вики в академическую литературу, пусть их даже и не цитируют? Хэнли с коллегой Нилом Томпсоном, изучающим в MIT инновации, решили подойти к этому вопросу с двух фронтов.

Сначала они определили 1,1 млн самых распространённых научных слов в опубликованных в научном гиганте Elsevier статьях. Затем Хэнли и Томпсон изучили, насколько часто эти слова добавляются или удаляются из Вики со временем, и цитируются в исследовательской литературе. Они сфокусировались на двух областях, химии и эконометрике – новой области, разрабатывающей статистические проверки для экономики.

Между языком научных работ и языком Вики прослеживалась чёткая связь. «Если появляется какая-то новая захватывающая тема, она приводит к созданию новой страницы в Вики», — отмечает Томпсон. Затем язык этой страницы связывается с более поздней научной работой. Хэнли и Томпсон продемонстрировали, что после появления новой статьи в Вики более поздние научные работы содержат больше языка, схожего с Вики, чем с языком научных работ в этой области, опубликованных до появления статьи в Вики. Существовала определённая связь между языком статьи в Вики и последующими научными работами.

Но была ли сама Вики источником этого языка? На этот вопрос исследование не отвечало. Оно только наблюдало, как увеличивается частота появлений слов в различных текстах. Оно не могло доказать, что учёные читали Вики и использовали прочитанное в работе.

Поэтому исследователи создали в Вики новых статей с нуля, чтобы выяснить, повлияет ли их язык на научную литературу. Хэнли и Томпсон поручили аспирантам по химии и эконометрике написать новых статей в Вики по темам, которых на сайте ещё не было. Студенты написали 43 статьи по химии и 45 статей по эконометрике. Затем по половине этих статей из каждой области опубликовали в Вики в январе 2015, а другую половину придержали как контрольную. Исследователи дали статьям три месяца на проникновение в интернет. Затем они изучили опубликованные научные статьи за последовавшие шесть месяцев в двух этих областях на предмет поиска определённых слов, использовавшихся в Вики, и сравнили их с языком статей, которые не были опубликованы.

По крайней мере, в химии новые статьи оказались популярными. Опубликованные в Вики и контрольные статьи были написаны на темы, до того не освещённые на сайте. Туда входили записи по синтезу гидрастина (прекурсору гидрастинина – препарата, останавливающего кровотечение). Люди заинтересовались статьями достаточно для того, чтобы просматривать их по 4400 раз в месяц.

Слова из статей просочились в научную литературу. За шесть месяцев после публикации статьи из Вики повлияли примерно на одно слово из 300 в новых научных работах по хим��и. А научные работы по темам, описанным в Вики, со временем стали больше походить на статьи в Вики. К примеру, если химики писали о синтезе гидрастина – на тему одной из новых статей в Вики – в опубликованных научных работах всё чаще встречалась фраза «реакция Пассарини», термин, использовавшийся в статье в Вики. Но если статью в Вики не публиковали, то научные работы не становились похожими на такую статью (а это могло бы произойти просто потому, что эта тема набирала популярность). Хэнли и Томпсон опубликовали препринт своей работы в журнале Social Science Research Network 26 сентября.

К сожалению, статьи по эконометрике в Вики не запустили реакцию. «Мы хотели выбрать что-то на грани науки», — говорит Томпсон. Но грань получилась слишком тонкой. Новые статьи по эконометрике в Вики просматривали в тридцать раз меньше, чем статьи по химии. Томпсон и Хэнли не смогли набрать достаточно данных из статей, чтобы сделать обоснованные выводы. Ну что ж, пожелаем эконометрике удачи в следующий раз.

Связь статей в Вики и научной литературы отличалась в разных регионах. Когда Хэнли и Томпсон отсортировали опубликованные научные статьи по ВВП стран, из которых они происходили, они обнаружили, что статьи в Вики сильнее влияли на язык научных работ учёных из стран с более слабой экономикой. «Если задуматься, то в относительно богатой стране у человека должен быть доступ к большому количеству журналов и научной литературы», — отмечает Хэнли. А организации в бедных странах не могут позволить себе дорогие подписки на научные журналы, поэтому учёным из этих стран приходится бо��ьше полагаться на публично доступные источники, такие, как Вики.

Это исследование Вики отличает «отлично разработанная схема работы и надёжный анализ», — говорит Хезер Форд, изучающая цифровые политики в Лидском университете Англии. «Насколько мне известно, это первая работа, указывающая на прочную связь статей из Вики и развития науки». Но, как она отмечает, всё это касается только химии. В разных областях и влияние может отличаться.

«Она обращается к вопросу, давно интересующему людей, который достаточно сложно доказать», — говорит Шэфи. Связь явно есть, но, по его словам, отслеживать язык – это не то же самое, что отслеживать, как новые идеи и концепции мигрируют с Вики в башню из слоновой кости. «Говорить, что по этой теме требуется больше исследований, конечно, будет клише, но на самом деле так оно и есть».

Хэнли и Томпсон согласились бы первыми. «Я считаю, что это первый шаг, — говорит Хэнли. – Показано, что Вики – не просто пассивный ресурс, она влияет на передовой край знаний».

Это отличная причина для того, чтобы учёные подключались к работе и редактировали статьи, — отмечает Томпсон. «Это крупный научный ресурс, и мне кажется, что мы должны признать это, — говорит Томпсон. – Есть польза в том, чтобы убедиться, что наука в Вики хорошо и достаточно полно описана». Хорошие научные статьи в Вики могут не только решать застольные споры. Они могут помочь продвигать науку. Ведь, в конце концов, учёные следят за ней, пусть даже и не признаваясь в этом.