Комментарии 6
Скажите, у flink есть какие-либо преимущества по сравнению со spark streaming?
Я немного читал по теме — теоретически, Flink должен быть намного более производительным. Spark работает либо в режиме микробатчинга, где он медленный (большая latency), либо микробатчинг можно отключить — тогда потеряются всякие полезные свойства по гарантии доставки сообщений, какие-то методы API будут недоступны. На практике мне их не доводилось сравнивать.
2) тот же вопрос про кафку
По поводу перевода термина watermark есть сложности. Переводить «водяной знак» не совсем корректно, так как в русском это означает средство для защиты от подделки. Есть другой перевод: «отметка уровня воды». Длиннее, но отражает реальную суть термина в этом контексте: это метка времени, по «заполнении» которой события обрабатываются.
Как создать приложение для потоковой обработки данных при помощи Apache Flink