mongohtotech Jan 29 2020 at 17:54Impala vs Hive vs Spark SQL: Выбор правильного SQL движка для правильной работы в Cloudera Data WarehouseReading time7 minViews17KApache*Big Data*Data Engineering*Hadoop*SQL*TranslationTotal votes 7: ↑7 and ↓0+7Add to bookmarks37Comments3
Yo1 Jan 30 2020 at 15:07Comment has been editedImpala быстро, но не надежно. чуть больше польpователей и привед out of memory. чуть крупней датасет и привед out of memory. зато да, заметно быстрее spark sql
facha Feb 2 2020 at 17:20Show previous commentМы у себя включили Admission control и установили пулы с ограничениями по памяти + MEM_LIMIT на каждый запрос. После этого ООМов не наблюдали.
Impala vs Hive vs Spark SQL: Выбор правильного SQL движка для правильной работы в Cloudera Data Warehouse