Search
Write a publication
Pull to refresh
6
0
Кирилл Захаров @kirillzx

Научный сотрудник в ИТМО

Send message

MLflow для исследований: как систематизировать ML-эксперименты

Level of difficultyEasy
Reading time10 min
Views1.6K

Когда речь заходит о таких инструментах, как Airflow, MLflow или Docker, многие сразу представляют себе продакшен-среду, и новичков это может пугать. Однако на самом деле эти инструменты полезны не только в проде или крупных компаниях.

Сегодня я хочу рассказать об MLflow. Эта статья рассчитана на тех, кто только начинает свой путь в машинном обучении и обладает базовыми знаниями, а также на практикующих ученых в области ИИ, которые пока не знакомы с этим инструментом или сознательно им не пользуются. 

Читать далее

Эконофизика и физически-обоснованные нейронные сети

Level of difficultyMedium
Reading time8 min
Views1.8K

Эконофизика — область науки, которая объединила в себе экономическую теорию и физические методы. По случаю выхода нашей с коллегами научной статьи, решил рассказать об этой концепции. И про то, как современные подходы машинного обучения могут способствовать построению эконофизических и социофизических моделей.

Читать далее

Related Works в научной статье и диссертации. Зачем и как искать материалы

Level of difficultyEasy
Reading time9 min
Views3.5K

В этой статье моей целью было дать краткий обзор интернет-ресурсов, которые могут помочь вам в поиске научных публикаций и их анализе. Перед обзором самих методов я также кратко излагаю, зачем нужен раздел Related Works и в чем его особенность в научных публикациях и диссертациях.

Читать далее

Physics-based и data-driven моделирование

Level of difficultyEasy
Reading time4 min
Views2.2K

В этом посту поговорим про различия в двух подходах моделирования, а именно, чем отличаются физически обоснованные модели от моделей, основанных на данных. На самом деле между этими двумя понятиями есть и кое-что среднее, что становится актуальнее в решение научных задач. Но об этом позже. 

Итак, начнем с моделей, основанных на данных. Такого рода модели встречаются почти на каждом шагу. Любая задача машинного обучения, будь то регрессия (например, предсказание цен на товары), классификация (определение маркера болезни по данным об анализах пациента), рекомендация (определение более подходящего видео в вашей ленте), сегментация (определение объектов на фото или видео) и т. д. Задач машинного обучения достаточно много, но все они требуют одного - данных.

В этом классе моделей требуется собрать подходящий набор данных, обработать его (например, убрать различные аномалии или трансформировать переменные), определиться с типом задачи, выбрать модель для этого типа задачи и подать данные на вход. И, наконец, обучить модель, подбирая оптимальным образом весовые коэффициенты. 

Модели, основанные на данных, по факту являются статистическими моделями, которые наилучшим образом аппроксимируют неизвестную зависимость. Во многих задачах неизвестны закономерности между независимыми переменными и результирующим признаком или признаками. Они либо сложны для описания, либо у нас нет четкой формулы для получения ответа. Именно здесь такие статистические модели приходят на помощь.

Читать далее

Information

Rating
2,773-rd
Registered
Activity

Specialization

Научный сотрудник
Maths
Machine learning
Math modeling
Neural networks