Pull to refresh

Comments 3

Область MLOps является еще достаточно молодой, и в ней до сих пор не существует единого золотого стандарта.

Я бы сказал что существует пара-тройка, airflow/kubeflow/или любое CI с графами задач, mlflow/wandb/свой велосипед, + dvc по вкусу, либо фуллстек решения databricks/azure?/AWS sagemaker. Но главное конечно - выстроенные процессы, политики, регламенты, и стайлгайды вокруг всего этого, и в статье неплохо описано что они должны покрывать. Но все равно стоит поизучайть доклады по жизненному циклу моделей с Data fest'ов ODS (кажется по ним уже можно сказать что общее понимание как жить mlops инженеру, "золотой стандарт", уже сложилось), да и в целом много информации на Хабре и в интернете на эту тему. А из "300 инструментов интеграции" надо определиться для чего инструменты нужны, ну и, скажем, если включать библиотеки как в посте на картинке, то штук 200 нужных инструментов освоить не такая уж проблема.

Да все так, но всеже хочется, чтобы было бы нечто покрывающее весь процесс от А до Я. Это я и понимают под "золотым стандартом". А так везде чего то не хватает :)

Ещё надо сказать что ML-проекты бывают разные, и например бразильцев из Federal University of Rio Grande волнует что у onnxruntime пайплайн в Github Actions занимает полтора часа, а не вот это всё :-).

(прислали гугл-форму с вопросами в рамках опроса контрибьюторов для исследования)

Sign up to leave a comment.