entony28 сен 2017 в 19:45

Запуск регулярных задач на кластере или как подружить Apache Spark и Oozie

7 мин

16K

Big Data *

Комментарии 3

paveltro 29 сен 2017 в 08:10

Класс!

Yo1 29 сен 2017 в 08:11

все хорошо, но что за задача то? зачем читаются эти файлы?
как я понимаю Oozie будет запускать каждый джоб через spark-submit скрипт, т.е. стартовать на каждый джоб отдельный jvm, соответственно каждый джоб будет иметь свой sparkSession. многим задачам такое не подойдет…

entony 29 сен 2017 в 08:33

В данном случае описана часть задачи для сбора статистики по приходящим данным. Основной упор я делал на описание запуска. Да у каждой задачи будет свой sparkSession.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий