Pull to refresh
2
0
Send message

Как мы попробовали Apache Iceberg в связке со Spark и что из этого вышло

Level of difficultyMedium
Reading time5 min
Reach and readers3.4K

Тема преимуществ открытых табличных форматов при работе с озерами данных всё чаще поднимается в среде дата-инженеров. Предполагается, что их использование способно устранить недостатки популярного Apache Hive. Но так ли это на практике?

Меня зовут Иван Биленко, я инженер данных в команде дата-платформы Циан. В этой статье я хочу немного познакомить вас с процессами и стеком внутри нашей платформы, рассказать, почему мы решили попробовать Iceberg, с какими проблемами столкнулись при тестировании и какие преимущества Iceberg может дать тем, кто еще только задумывается о переходе. Дисклеймер: статья носит обзорный характер.

Читать далее

Information

Rating
Does not participate
Works in
Registered
Activity

Specialization

Инженер по данным