Comments 41
Другими словами, кто выберет для публикаций новый журнал с малым impact factor, да еще и со странными требованиями, если есть Nature, которые опубликуют статью, и ты будешь в шоколаде. С другой стороны, кто будет создавать журнал, в котором совершенно отличные требования, если в нем никто не будет публиковаться. Наконец, сам процесс воспроизводства никому не интересен, т.к. повторение эксперимента нельзя опубликовать в крутом журнале. Получается такой замкнутый круг, что ситуация плохая, но выхода из нее не видно.
У открытой науки есть один мало афишируемый недостаток. А именно — полтора-два килобакса за честь хостить свою PDF-ку на plos.org/biomedcentral.org. Это всё ещё лучше, чем платить эльзевиру/шпрингеру/NPG по тридцать баксов за статью (хотя против них помогает сай-хаб), но ощутимо бьёт по независимым исследователям и мелким сайд-проектам. Даже учитывая это, открытая наука уже случилась, продолжает развиваться и храни её Господь; с байесовщиной, p<0.005 или чем там ещё ей конкурировать незачем. Можно параллельно менять финансовую модель публикации и статистическую парадигму: не конкурировало же внедрение открытого доступа со случившимся примерно тогда же широким распространением методов NGS, всяких *omics и прочей современной молекулярной генетики.
Я не имел ввиду конкуренцию напрямую, но скорее то, что пока большие печатные дома доминируют, введение новых подходов будет затруднено. И не очень даже понятно, как к этому подойти. А вот когда они будут побеждены, то и равновесие поменяется, и может станет проще выходить с новыми принципами.
Я-то в Россиях, вот в чём дело. За чтение статей у нас как не платили — так и не платят, а не платить за публикацию как-то не получается.
Насчёт печатных домов — в такой формулировке не берусь спорить. Им, скорее всего, особо нет дела до стандартов редакций, лишь бы бренд журнала совсем не скатывался.
А что если в Nature и подобных журналах попробовать печатать разгромные статьи про то, как глупо доверять p-value и про то, насколько полезны и удобны правдоподобия?
Впрочем, это слово в этих двух статьях не упоминается вовсе))
Собственно, описанное равновесие можно сломать силами авторов, если они будут взаимодействовать не как обезличенные профессионалы, а социально, как знакомые. На самом деле, тусовки по узким отраслям довольно тесные, и ныне живущих людей, чьи статьи читают в тусовке по мере выхода, примерно 10. Т.е. после конференции должны с пивом сесть 10 человек, договориться, а потом написать в мейлинг-лист или выступить совместно на конфе. Получится как с agile manifesto: на него обратили внимание не потому, что там что-то новое или ранее недоступное, а потому, что его подписали очень уважаемые программисты.
Я не знаю насчет всех наук, в физике, где я работаю, очень сложно представить такой сценарий. Хотя было бы круто, конечно.
— Есть официальные объединения и почти совпадающие с ними неофициальные. Например, в Бостоне на посиделках пьют пиво (один из маститых местных цитометристов пивовар-любитель).
— Есть мейлинг-листы и форумы, немного, значимых порядка 5, где задают как конкретные вопросы, от нубовых до cutting-edge, так и вопросы, которые не задают в публикациях (например, «я сделал всё по ману, а картинка фиговая. Почему?») и получают ответы, которые не публикуют («Производитель врёт», или «У новейшего метода очень ограниченная применимость», или «Выкинь, данные не подтверждены, хотя матмодель красивая»).
— Общаться, в том числе трансгранично, полезно, так проще отловить тренды и получить срез философии науки. Обычно это доходит до людей на дипломе, если не раньше.
Знакомые (хроматографист, молбиолог и анхимик) рассказывают сходные вещи о своих узких областях.
До тех пор, пока качество исследования определяется «крутостью» журнала, где оно опубликовано, ничего не может поменяться. Ну и дальше мой коммент выше.
Я, например, сейчас делаю PhD, и, несмотря на всю поддержку «открытой» науки и прочих светлых принципов, вынужден пытаться опубликоваться в «крутых» закрытых журналах. Потому что иначе я никогда не получу постоянную позицию.
2) Ни малейшего понятия… Особенно, как это сделать реалистично. Я выше писал, что в настоящий момент ни одной стороне не выгодно что-либо менять в одностороннем порядке.
А так, если фантазировать, может быть, возможна система, где есть две раздельных категории научных групп: одни занимаются авангардными исследованиями, а другие — проверкой результатов. Эти категории могут не пересекаться ни по финансированию, ни по постоянным позициям: условно, для второй категории критерии получения грантов могут быть фундаментально другими, но и требования и возможности тоже. Тогда и правила для «авангарда» можно будет тоже менять в какой-то степени, по крайней мере всегда будет вариант перехода в категорию верификаторов.
Не то чтоб исключительно, но в целом без давления publish or perish лучше, чем с ним. Приводить самого Юдковского в пример не очень корректно, потому что он едва ли стал бы громогласно восхвалять идеи, которым сам не склонен следовать (see what I did here?), но обвинений его MIRI в плохой статистике я не видел. Или есть такой биоинформатик Robert Edgar, который в своих аффилиациях гордо пишет "independent researcher". Так вот он весьма склонен писать про то, что не так в разных подходах к анализу ампликонов (спойлер: чуть ли не всё). А финансируемые грантами группы биологов не очень любят обсуждать, почему тот анализ, которым они пользуются, показывает то нужные вещи, то погоду на Марсе. Хотя тут может быть и другая история: биоинформатик хочет придумать самый лучший на свете алгоритм или датасет, а биолог боится математики и хочет просто посмотреть, какие у него там в пробе бактерии.
В том-то и беда, что никакой из ныне известных. В принципе можно публиковать препринты на arxiv/хабре/собственном блоге, но с точки зрения неспециалиста хороший и плохой препринт ничем не отличаются. Журналы ставят свою репутацию на то, что всё опубликованное в них соответствует каким-то стандартам. Выводы могут быть ошибочными, но по крайней мере статья в Nature не высосана из пальца и не аргументирована наукообразной бессмыслицей.
Лично для меня основная сложность в том, чтоб формализовать гипотезы типа "Эта пригоршня векторов относится к одному кластеру, а вот та — к другому" в виде функций правдоподобия. Как ни крути, тестов p-value напридумывали примерно на все случаи жизни и гуглятся они в три клика.
Однако, вопрос корректного рассчёта всех членов формулы может быть весьма не очевидным в конкретных случаях, тем более для людей не сильно знающих теорию вероятностей.
Например есть у нас выборка человеков и данные — результаты теста на логическое/аналитическое мышление и теста на веру в сверхестественное.
Мы предполагаем, что проблемы с мышлением взаимосвязаны с верой, нам как-то надо рассчитать вероятность того, что такая выборка получится при истинности гипотезы, я вот сходу не скажу как это сделать, возможно коэффициент корреляции как-то связан с этой вероятностью, но боюсь если я сам начну изобретать формулы, то получиться дичь.
Не требуется менять стимулы, что бы в физике не было кризиса воспроизводимости. Потому что там методика другая. Если вы хотите решать проблему сменой стимулов, поиском правильных людей, которые в правительстве будут финансировать правильные исследования — вы идёте по сложному пути. Смена методики в сто раз надёжнее и, при всех сложностях, проще, чем смена правительства на правильных умных людей.
Ну то есть науку я тоже люблю, это так, для перспективы.
«Кризис воспроизводимости» имеет отношение исключительно к стимулам
Это не верно и не обосновано.
сколько налогов я плачу государству
Это всё к теме статьи напрямую не относится. А косвенно решается развитием социальных наук. Текущая основная проблема которых озвучена в статье. Вы можете надеяться, что эти проблемы будут решены БЕЗ развития социальных наук, но это вряд ли. Если только дед мороз.
Доказать я тут ничего к сожалению не могу, да и область не моя, но вот в какую бы сторону я начал копать:
1. Сравнить источники жалоб на невоспроизводимость или любую доступную информацию по воспроизводимости. Каким образом финансируются исследования в каждом случае? Есть ли корреляция между воспроизводимостью и финансированием через насилие, через пожертвования и в виде инвестиций?
2. Мы знаем что большие организации постоянно ведут исследования, в том числе очень «мягких» вещей (поведения и предпочтений клиентов). В каком-нибудь Амазоне одновременно ведутся сотни, если не тысячи экспериментов, некоторые из них имеют значительные финансы завязанные на результат. Мы также знаем что инраструктуру для таких экспериментов поддерживают и развивают исключительно умные и высокооплачиваемые сотрудники (https://www.payscale.com/research/US/Job=Principal_Data_Scientist%2c_IT/Salary указывает $150k по Штатам). Насколько мне известно повсеместно используется p-нотация. Если есть способ более точной оценки результатов и более верного (или даже простого) способа принятия решений на основе такой оценки, я уверен что есть с кем поговорить.
Я кстати не пытаюсь какашками кидаться, спасибо за статью.
Можно решать это улучшением стимула — отбором лучших сотрудников, повышения зарплаты, ответственности. Многие так и поступали. А можно изменить метод — сделать новый язык со сборкой мусора, или тем кто хочет остаться на с++ сделать умные указатели.
Если можно изменить методику так, чтобы человеческий фактор вообще выпал из рассмотрения (ну по крайней мере стал значительно меньше) — то это практически всегда более правильный путь.
Так это, извините, не баг, а фича. Ежели будет легко накопить на безбедную старость, то все так сделают, будут сидеть на мешке с деньгами и тратить их понемногу. Только вот внезапно окажется, что товаров за эти деньги вам никто не продаст, ибо не только вы такие умные, но и все остальные — нафик работать и производить что-либо полезное, когда денег и так до конца жизни хватит? А конец жизни при таком раскладе наступит очень быстро.
Это, конечно, идеальный мысленный эксперимент, а в реальности такого никогда не произойдёт, ибо как только люди заметят, что у всех стало много денег, а работать никто не хочет — те, кто ещё не бросил работать, начнут продавать результаты своего труда за ещё большую цену, а те, кто уже бросил работать, станут задумываться об возобновлении работы. Так что никакого рая или ада на земле не выйдет, а попросту инфляция сама собой зародится.
Правдоподобия, P-значения и кризис воспроизводимости