Как стать автором
Обновить
4
0
Михаил Румянцев @Zlodeykin

Пользователь

Отправить сообщение

"Один из плюсов Data Lake в том, что они базируются на Open Source решениях и, как следствие, не требуют существенных инвестиций в ПО. Кроме того, «озёра данных» предполагают идею почти бесконечного горизонтального масштабирования, а значит, не надо вкладываться в дорогие серверные мощности."

1) После того, как Cloudera купила Hortonworks и сделала свой дистрибутив платным, бесплатных осталось не очень много, например Arenadata. Также следует понимать, что любое бесплатное ПО в продукционной среде требует достаточно дорогих программистов и администраторов, которые будут его поддерживать (это могут быть очень серьезные инвестиции).

2) Современные DWH строятся на MPP реляционных базах данных, типа Vertica или Greenplum, которые также горизонтально масштабируются, как Hadoop.

Я думаю, имелось в виду, что продукт овнер должен принимать решения в том числе исходя из того, как каждая конкретная фича, которую он планирует выкатить на прод, скажется на его (прода) состоянии, чтобы избежать ситуации, когда бизнесу все равно, что творится с инфраструктурой, свои фичи они запушили, а дальше «не их проблемы».

Информация

В рейтинге
Не участвует
Откуда
Балашиха, Москва и Московская обл., Россия
Зарегистрирован
Активность