val6789 Apr 15 2024 at 06:12Spark. План запросов на примерахLevel of difficultyMediumReading time7 minViews7.8KSQL*Apache*Big Data*Data storage*Data Engineering*FAQTotal votes 7: ↑7 and ↓0+8Add to bookmarks62Comments4
Sanek_new Apr 16 2024 at 10:16Вот почему я не понимаю планы... И не знаю что сделать чтобы начать понимать.
miksoft Apr 17 2024 at 20:03Comment has been editedShow previous commentчто сделать чтобы начать Можно начать с планов в картинках. SparkUI довольно сносно их отображает, если, конечно, запрос не слишком сложный.
miksoft Apr 17 2024 at 20:08BroadcastExchange – это копирование правого датафрейма на каждый экзекьютор. Дополню, что предварительно этот датафрейм собирается на драйвере. Соответственно, driver.memory (емнип) должен быть достаточен.
Spark. План запросов на примерах