Комментарии 3
Современные платформы анализа больших данных не заменяют, а дополняют известные дата сайентистам open source-инструменты. Они по-прежнему могут разрабатывать модели с помощью привычных фреймворков и библиотек, а платформы предоставляют необходимый технический функционал для продуктивной работы и реализации полного цикла data science проектов. Такой подход позволяет специалистам не переучиваться и быстрее разрабатывать аналитические продукты для бизнеса.
Но ведь есть Open Source платформы для реализации полного цикла data science проектов... Например, MLFlow и многие другие. Они специально созданы для решения всех описанных инженерных вопросов - контроль экспериментов, разработка, версионирование, деплой в k8s/spark/etc., мониторинг. Почему в статье акцент на том, что современные open source инструменты типа не позволяют организовать полный цикл проекта?
Как-то не хватает конкретики. Я рассчитывал увидеть конкретные примеры, сравнения. Большинство утверждений без доказательств. Похоже на рекламу коммерческой платформы, но забыли указать какой именно.
Платформы анализа данных: что они умеют и как понять, нужны ли они вашему бизнесу