Как стать автором
Обновить

Комментарии 3

Современные платформы анализа больших данных не заменяют, а дополняют известные дата сайентистам open source-инструменты. Они по-прежнему могут разрабатывать модели с помощью привычных фреймворков и библиотек, а платформы предоставляют необходимый технический функционал для продуктивной работы и реализации полного цикла data science проектов. Такой подход позволяет специалистам не переучиваться и быстрее разрабатывать аналитические продукты для бизнеса.

Но ведь есть Open Source платформы для реализации полного цикла data science проектов... Например, MLFlow и многие другие. Они специально созданы для решения всех описанных инженерных вопросов - контроль экспериментов, разработка, версионирование, деплой в k8s/spark/etc., мониторинг. Почему в статье акцент на том, что современные open source инструменты типа не позволяют организовать полный цикл проекта?

Как-то не хватает конкретики. Я рассчитывал увидеть конкретные примеры, сравнения. Большинство утверждений без доказательств. Похоже на рекламу коммерческой платформы, но забыли указать какой именно.

Спасибо за прочтение!

Это первая, своего рода обзорная, статья из цикла материалов о платформах анализа данных. В следующих планируем подробно разбирать каждый из пунктов.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий