@mongohtotech29 янв 2020 в 14:54Impala vs Hive vs Spark SQL: Выбор правильного SQL движка для правильной работы в Cloudera Data WarehouseВремя на прочтение7 минОхват и читатели22KApache * Big Data * Data Engineering * Hadoop * SQL * ПереводВсего голосов 6: ↑6 и ↓0+4Добавить в закладки40Комментарии3
@Yo130 янв 2020 в 12:07Комментарий был измененImpala быстро, но не надежно. чуть больше польpователей и привед out of memory. чуть крупней датасет и привед out of memory. зато да, заметно быстрее spark sql
@facha2 фев 2020 в 14:20Показать предыдущий комментарийМы у себя включили Admission control и установили пулы с ограничениями по памяти + MEM_LIMIT на каждый запрос. После этого ООМов не наблюдали.
Impala vs Hive vs Spark SQL: Выбор правильного SQL движка для правильной работы в Cloudera Data Warehouse