1) не ясно зачем нужна прослойка в виде спарка если кафка конект это умеет из коробки.
2) что такое триггер? накапливаются пакеты за 10 секунд потом идет bulk update\insert ? если мы говорим о больших данных , то вкурсе что у монго есть лимиты на bulk ?
Потоковая передача данных с помощью Apache Spark и MongoDB