Как стать автором
Обновить

Эффект обратного действия

Уровень сложностиПростой
Время на прочтение2 мин
Количество просмотров2.4K

Я однажды упоминал в статье на Хабре так называемый "эффект обратного действия". Это когда люди, получая достоверные аргументы, противоречащие их убеждениям, не меняют мнение, а укрепляются в правоте.

Эффект впервые обнаружен исследователями Найханом и Райфлером. И в СМИ он сразу приобрёл статус аргумента против популяризации науки и развенчания всяких-разных мифов. И это было бы хорошим аргументом, если бы эффект существовал. Однако независимые исследователи Портер и Вуд не смогли воспроизвести эффект несколькими годами позднее. Вот только на этом всё не заканчивается, а начинается самое интересное.

Проявить любопытство
Всего голосов 12: ↑11 и ↓1+10
Комментарии4

Воспроизводимость экспериментов Big Data

Время на прочтение8 мин
Количество просмотров3K

Вы не задумываетесь над процессами, а фокусируетесь на решении задач в сжатые сроки, только когда вы аналитик в стартапе или маленькой команде. Но после первых успехов хочется оглянуться назад и наладить процессы, почистить библиотеку артефактов и подтянуть качество. Особенно когда команда стремительно растет. Непрозрачная структура тяжело поддается управлению и не позволяет быстро обучать сотрудников.

Меня зовут Елдос, я Big Data аналитик, и сегодня я расскажу о том, как команда Fintech из службы Big Data аналитики и машинного обучения Beeline Казахстан создала среду для совместной работы, связала используемые инструменты одним ключом, обеспечила централизованное хранение кода в Git и подсчетов в HDFS, и тем самым обеспечила воспроизводимость экспериментов.

Читать далее
Всего голосов 7: ↑7 и ↓0+7
Комментарии0

Nature задаётся вопросом, воспроизводимы ли современные научные эксперименты?

Время на прочтение6 мин
Количество просмотров33K


Случайно в потоке новостей и информации наткнулся на статью в Nature Scientific Reports. В ней представлены данные опроса 1500 учёных, посвящённого воспроизводимости результатов научных исследований. Если ранее данная проблема поднималась для биологических и медицинских исследований, где она с одной стороны объяснима (ложные корреляции, общая сложность исследуемых систем, иногда даже научный софт обвиняют), с другой стороны имеет феноменологический характер (например, мыши склонны вести себя по разному с учёными разных полов (1 и 2)).

Однако не всё гладко и с более естественнонаучными дисциплинами, такими как физика и инженерные науки, химия, экология. Казалось бы, именно эти дисциплины зиждутся на «абсолютно» воспроизводимых экспериментах, проведённых в максимально контролируемых условиях, увы, потрясающий – во всех смыслах этого слова – результат опроса: до 70% исследователей сталкивались с НЕвоспроизводимыми экспериментами и результатми, полученными не только другими группами учёных, НО и самим авторами/соавторами опубликованных научных работ!
Вот это поворот! Попробуем разобраться
Всего голосов 33: ↑31 и ↓2+29
Комментарии141

Пять эгоистичных причин работать воспроизводимо

Время на прочтение10 мин
Количество просмотров8.7K

Аннотация


Итак, мои коллеги-ученые, не спрашивайте, что вы можете сделать для воспроизводимости — спросите, что воспроизводимость может сделать для вас!


Здесь я перечислю пять причин, по которым возможность воспроизводимости данных окупается в долгосрочной перспективе и представляет личный интерес для каждого амбициозного, ориентированного на карьеру ученого.




Сложное уравнение в левой половине черной доски, еще более сложное уравнение — в правой. Краткое предложение связывает два уравнения: «Здесь происходит чудо». Два математика, в глубоких раздумьях. «Я думаю, Вы должны быть более конкретны на втором шаге», — говорит один другому.
image


Примерно так выглядит ситуация, когда вы пытаетесь понять, как автор перешел от большого и сложного набора данных к плотной статье с множеством сложных графиков. Без доступа к данным и аналитическому коду такой переход можно объяснить разве что чудом. А в науке не должно быть чудес.


Читать дальше →
Всего голосов 16: ↑14 и ↓2+12
Комментарии6

Плохой софт портит научные исследования

Время на прочтение2 мин
Количество просмотров12K
Научные исследования невозможны без использования компьютеров и программного обеспечения. Такое мнение высказали 69% учёных, принявших участие в опросе Software Sustainability Institute (SSI). При этом в реальности софт используют 92% всех исследователей.

Результаты этого опроса показались бы совершенно банальными, если бы не одна деталь: 56% учёных сказали, что разрабатывают собственное ПО (интересно, что это делают 70% мужчин и 30% женщин, то есть наблюдается определённое гендерное неравенство).

Так вот, каждый пятый учёный из тех, кто создаёт собственное ПО, не имеет никакого образования в области разработки программного обеспечения.
Читать дальше →
Всего голосов 24: ↑21 и ↓3+18
Комментарии40

Кризис воспроизводимости исследований в области искусственного интеллекта

Время на прочтение10 мин
Количество просмотров4.2K

В исследованиях ИИ доминируют технологические гиганты, однако грань между реальными прорывами и рекламой коммерческого продукта постепенно размывается. Некоторые учёные считают, что пора это прекратить.




В прошлом месяце в журнале Nature опубликовали ругательный отзыв, подписанный 31 учёным. Им не понравилось исследование Google Health, ранее появившееся в этом же журнале. В нём компания Google описывала успешные результаты испытаний искусственного интеллекта (ИИ), искавшего признаки рака груди на медицинских фотоснимках. Критики утверждают, что команда Google предоставила так мало информации о коде и ходе испытаний, что исследование оказалось больше похожим на рекламное описание закрытой частной технологии.

«Мы не могли это больше выносить, — говорит Бенджамин Хайбе-Каинс, ведущий автор отзыва, изучающий вычислительную геномику в Торонтском университете. – И дело не в этом конкретном исследовании – мы уже много лет подряд наблюдаем подобную тенденцию, и это нас уже реально раздражает».
Всего голосов 10: ↑10 и ↓0+10
Комментарии2

Проблемы научных публикаций

Время на прочтение16 мин
Количество просмотров43K
Для людей, не знакомых близко с научным процессом, может быть не очень понятна важность научных статей. Публикация — это не только распространение информации, но и верификация результатов исследований, а еще самая главная мера эффективности научной работы.

Важность публикаций для ученых описывается выражением «Publish or perish» — «Публикуйся или сдохни». Именно всевозможные библиометрические показатели являются основой для получения грантов, подъема по карьерной лестнице и, в конечном итоге, научного успеха. И поэтому проблемы научных публикаций негативно влияют на всю науку в целом.


Читать дальше →
Всего голосов 118: ↑118 и ↓0+118
Комментарии309

Как решать проблемы научных публикаций?

Время на прочтение27 мин
Количество просмотров12K
В первой части статьи мы рассмотрели проблемы системы научных публикаций, которые затрудняют исследования и распространение данных. Я очень рад, что эта тема оказалась интересной и привлекла множество интересных идей и комментариев.

В этот раз обсудим, какие решения уже придуманы, внедряются и разрабатываются. А в конце я опишу свое видение оптимальной системы обмена научной информацией.


Читать дальше →
Всего голосов 46: ↑45 и ↓1+44
Комментарии125

Лучшие экспериментальные протоколы для исследования реального мира

Время на прочтение10 мин
Количество просмотров4.1K

Золотым стандартом исследований в области машинного обучения служит «последовательная» модель эксперимента: у вас есть базовый уровень, ваш эксперимент и фиксированный, заранее определённый набор тестов. Вы оцениваете свой базовый уровень на наборе тестов, получаете базовое значение. Затем вы выполняете свой эксперимент на наборе тестов и получаете другое значение. Затем вы сравниваете эти два результата. Допустим, вы публикуете все эти артефакты и предположительно любой может воспроизвести данные результаты. Это пример хорошей науки. Но я люблю невоспроизводимые исследования.

И вот почему
Всего голосов 13: ↑12 и ↓1+11
Комментарии0

Kedro — ключ к модульной Data Science

Время на прочтение8 мин
Количество просмотров5.6K

Kedro — фреймворк модульного кода в Data Science. С его помощью вы можете создавать проекты по шаблону, настраивать конвейер в YAML, делить его на части, документировать проект — и это далеко не всё. Материалом о работе с Kedro делимся к старту курса по Data Science.

Читать далее
Всего голосов 9: ↑9 и ↓0+9
Комментарии1