>произведем установку ..., Apache Spark, Spark-shell
Насколько я понимаю, Spark-shell не более чем один скрипт в составе спарка. И его никто не устанавливает отдельно. Или вы о чем?
Это все здорово в плане потренероваться, но почему просто не запустить EMR одной кнопкой? Если же нужно что-то на Spark сделать разовое (типа ETL раз в сутки) — то Glue в помощь или EMR Steps.
Домашняя BigData. Часть 1. Практика Spark Streaming на кластере AWS