Реал-тайм процессинг данных в AWS Cloud. Часть 1 / Comments / Habr

armiol Jul 9 2015 at 12:20

Да. Лично мне вообще очень нравится Apache Spark. Но алгоритм по обработке задачи содежит вызовы проприетарных библиотек заказчика, и потому плохо адаптируется под Spark.

Spark хорошо подходит для создания классификаторов данных; его мы начинаем использовать для других задач в пределах этого же проекта.

А Docker переживал свое раннее детство в момент имплементации решения (этот модуль появился два с небольшим года назад). Кроме того, EC2 и в данный момент немного легче с точки зрения maintenance, если остальная часть решения хостается на EC2.

Реал-тайм процессинг данных в AWS Cloud. Часть 1

Comments 2

Articles