Комментарии 5
Почему для Apache Spark выбирают K8s
Вообще-то, разумно ожидать, что если человек уже знает, что такое спарк, и ему это интересно, то он заходил на spark.apache.org, и там на первой же странице написано:
Spark runs on Hadoop, Apache Mesos, Kubernetes, standalone, or in the cloud.
Ну т.е. это мы и так знаем. Да, умеет работать на k8s. И еще на паре других платформ. При этом во всем этом достаточно длинном тексте я не нашел ни одной попытки сравнить, чем же запуск на k8s лучше, чем в Hadoop. Ну или в мезосе. Чем планировщик лучше Yarn? Где в кластере k8s вы собираетесь хранить данные, вместо HDFS? Ну и ряд других вопросов, которые стоило бы рассмотреть в рекламе нового продукта, чтобы она не была просто рекламой.
0
Привет, это текст только про open source проект YniKorn — планировщик задач Спарка на К8с, а не среду инсталляции или хранение данных. В случае платформы CDP все зависит от среды — в частном облаке это Ozone или HDFS, в публичных облаках это S3/ADLS/GCS
0
да, тоже интересно куда предлагается писать спарку в клоудеровской k8s? на hdfs?
0
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Apache Spark на Kubernetes: чем полезен Apache YuniKorn