Pull to refresh

Comments 9

Спасибо за обзор. Очень полезен, чтобы понять, что, как и кем создавались те или иные инструменты или фраймворки.

Естественно, компании, которые по-прежнему предпочитают развёртывать свои проекты локально, продолжают использовать Hadoop и другие открытые проекты, такие как Spark и Presto. Но с каждым годом доля переезжающих в облако данных увеличивается, и я не вижу причин для изменения этой тенденции.

А можете объяснить, как одно мешает другому? В облаке hadoop не нужен разве?

в облаке хадуп не нужен от слова совсем. Файл стораджи там s3, adsl, а процессинг databricks, synapse или snowflake. "Скрипач не нужен"

Спасибо за инфу. А у вас есть какие линки, где по-больше об этом можно было-бы почитать? Спасибо.

программа IBM Deep Blue превзошла чемпиона по шахматам, Юрия Каспарова.

Кого, простите?

Пардон, речь о Гарри Каспарове, конечно же.

Сначала думал что статья переводная потому что встретился термин "столбцовое хранилище" :) Мне кажется что лучше заменить на термин "колоночное".

В статье HBase указано как столбцовое (колоночное) хранилище. Вы уверены что это правильный термин применительно к HBase?

В целом по материалу посвящённым людям бесспорно абсолютно очевидно что в public cloud единственно верным решением может быть только S3 storage + Compute services по потребностям (SQL, Spark и тд).

Вопрос что ждет enterprise on-premise?

А ждет то что public cloud подход будет натягиваться на on-prem. По этому пути идет и Cloudera как с k8s подходом так и virtual private cluster. Все это уже заворачивается в продукт CDP Private Cloud.

Так же на рынок придукт решения и продукты которые будут предлагать стандартный набор Hadoop data service без самого "толстого" Hadoop и без HDFS.

Sign up to leave a comment.