Обновить
2
0

Пользователь

Отправить сообщение

Hive 3.1.0, через микросервисы

Учитывая множество таблиц в одном бакете, хорошая наводка, проверим

В части Maintainance, я бы ещё выделил Expire Snapshots на случай интенсивных операций UPDATE или DELETE, так как со временем может накопиться множество неактуальных файлов, влияющих на производительность, а эта настройка позволяет от них избавиться

Пробовали Trino, Clickhouse - нет

Мы начинали работу с Iceberg в 2022, на тот момент актуальные версии Spark и Iceberg. Возвращая фокус на возможную полноценную миграцию шаг с тестированием на обновлённых версиях впереди)

Информация

В рейтинге
Не участвует
Работает в
Зарегистрирован
Активность

Специализация

Инженер по данным