Как стать автором
Обновить

Исследование показало, что Википедия влияет на науку

Время на прочтение3 мин
Количество просмотров14K
У человечества ограничен доступ к наиболее полным источникам научного знания — научным журналам. Во многом такая печальная картина сложилась из-за коммерческой политики издательств и платных подписок, а также предположения, что факт публикации в «платном» журнале является доказательством научной значимости открытия.

В отличие от издательств, большинству людей понятно, что свободные научные знания — это благо для всех (и это благо больше, чем «фильтрация» качественных статей в авторитетных изданиях, см. информационный парадокс Эрроу). Существует ряд научных проектов, которые финансируются в основном из государственных субсидий, при этом открыты бесплатно. Это, например, банки физических объектов, такие как банки семян и репозитории модельных организмов — ряд исследований показывает, что создание таких открытых банков способствовало научной активности в данном направлении. Есть и бесплатные открытые для всех информационные репозитории, как проект «Геном Человека» или StackOverflow.com (источник знаний в области компьютерного программирования).

Википедия — крупнейший в мире источник научной информации для широкой публики. Это вообще 5-й по популярности сайт в интернете. Сейчас пара учёных из Массачусетского технологического института и Питтсбургского университета опубликовали научную статью в пользу того, что Википедия способствует распространению научных знаний, её читают и используют учёные, ставят на неё ссылки в своих научных работах, и Википедия во многом формирует направление научных исследований в принципе.

В своей статье авторы цитируют Чарльза Дарвина из его письма к коллеге-биологу Томасу Генри Хаксли в 1865 году: «Я иногда думаю, что общие и популярные трактаты почти так же важны для прогресса науки, как оригинальное произведение». В конце концов, его «Происхождение видов» было одновременно и выдающейся научной работой, и бестселлером.

Количество научных статей в англоязычной Википедии, в зависимости от определения и методов подсчёта, от 500 тыс. до 1 млн. Авторы говорят, что в области химии, которую проверили для эксперимента, 93% научных статей объясняют тему на уровне начальных курсов специализированных вузов, а 47% статей объясняют тему на уровне старших курсов.



На таком уровне совершенно очевидно, что Википедия объективно отражает науку. Но вопрос в том, как она влияет на науку, насколько учёные читают Википедию, и может ли Википедия повлиять на активность научных исследований?

В данном случае тема изучалась с помощью двух подходов. Во-первых, вычисление встречаемости научных терминов на страницах Википедии и на страницах научных журналов. Авторы обработали полную историю правок всех статей (20 терабайт данных) и все полные версии статей двух тысяч научных журналов Elsevier с 1995 года (0,6 терабайт).

Разумеется, эти словарные базы во многом пересекаются. Так, 61% слов из научной литературы встречается в Википедии, а 63% слов из последней встречается в научной литературе. Однако относительная частотность слов в некоторых случаях заметно отличается.
Слово Место в научной литературе Место в Википедии
Acid 59 65
Reaction 32 132
Graphene 2143 3099
Photovoltaic 5764 7651
Gravity 6139 2375
Pokemon 745 676 14 485

В своих измерениях учёные, естественно, сделали поправку на языковой дрифт, то есть изменение частотности терминов со временем.


Изменение частотности во времени некоторых терминов по химии

Второй подход — экспериментальный. Экспертам по определённым темам предложили написать ряд статей для Википедии. Затем случайная половина этих статей реально публиковалась на сайте, а вторая половина сохранялась в качестве контрольной выборки. Впоследствии учёные изучали, насколько в научной литературе повысилась частотность слов из опубликованных статей и из статей контрольной группы. Результаты эксперимента подтвердили догадку: слов из статей Википедии в литературе оказалось больше. Это доказывает, что Википедия действительно оказывает влияние на текущие научные исследования.



Внедрение определённой информации в Википедию влияет на будущие научные исследования. Это означает не только большую значимость самой Википедии, но и большое значение открытых научных знаний в принципе. У статьи за платным файрволом гораздо меньше шансов оказать влияние на научное сообщество и на всё общество в целом, чем у статьи в открытом доступе. Получается, что открытая публикация статей — это очень экономически выгодный способ развивать науку. Эта выгода гораздо больше, чем выгода от «фильтрации» статей в платных журналах.

Авторы научной работы уверены, что теперь никак неуместно говорить, что Википедия — это просто источник общеизвестных знаний.
Теги:
Хабы:
Всего голосов 26: ↑24 и ↓2+22
Комментарии36

Публикации

Истории

Ближайшие события

7 – 8 ноября
Конференция byteoilgas_conf 2024
МоскваОнлайн
7 – 8 ноября
Конференция «Матемаркетинг»
МоскваОнлайн
15 – 16 ноября
IT-конференция Merge Skolkovo
Москва
22 – 24 ноября
Хакатон «AgroCode Hack Genetics'24»
Онлайн
28 ноября
Конференция «TechRec: ITHR CAMPUS»
МоскваОнлайн
25 – 26 апреля
IT-конференция Merge Tatarstan 2025
Казань