Как стать автором
Обновить
5
0

Software Engineering in Machine Learning

Чего хотят конференции: воспроизводимость экспериментов в data science

Время на прочтение 8 мин
Количество просмотров 4K

Топовые научные конференции просят воспроизводимости экспериментов в науках о данных. И это нужно для повышения доверия к работам, для извлечения пользы (повторной используемости и цитируемости), ну и «тренд» (согласно опросу журнала Nature).

Ожидания растут, в 2021 уже 9 из 10 конференций предлагают авторам провериться на воспроизводимость. Сдать тест, заполнить опросник, привести свидетеля и т. д. 

О чем речь и зачем нужна воспроизводимость, какие проблемы нужно решать, обсудим в этой статье. 

Читать далее
Всего голосов 7: ↑7 и ↓0 +7
Комментарии 8

Зачем тестировать код к статье в машинном обучении. Разбираем пример

Время на прочтение 7 мин
Количество просмотров 1.9K

В этой статье я расскажу на примере, как невнимание к коду может привести к неверному результату в исследовании данных. 

При работе над одним проектом по автоматизации экспериментов, у нас возникла задача подготовить шаблон репозитория для курсовых работ по машинному обучению. Такая курсовая работа, по сути, уже почти полноценная статья с проведенным экспериментом. Работы выкладываются на Github вместе с исходным кодом и предполагают возможность повторения проведенных исследований.

В одной из работ я заметил интересную аномалию в представленных результатах и решил воспроизвести результаты. Тем более, что это пригодится для проектной задачи.

Как оказалось, даже на примере отдельной работы можно показать важность внимания к коду и полезность автоматизированного тестирования в проектах машинного обучения.

Читать далее
Всего голосов 10: ↑9 и ↓1 +8
Комментарии 0

Информация

В рейтинге
Не участвует
Откуда
Россия
Зарегистрирован
Активность