Comments 9
Спасибо за обзор. Очень полезен, чтобы понять, что, как и кем создавались те или иные инструменты или фраймворки.
Естественно, компании, которые по-прежнему предпочитают развёртывать свои проекты локально, продолжают использовать Hadoop и другие открытые проекты, такие как Spark и Presto. Но с каждым годом доля переезжающих в облако данных увеличивается, и я не вижу причин для изменения этой тенденции.
А можете объяснить, как одно мешает другому? В облаке hadoop не нужен разве?
начало 'Big Data' было гораздо раньше
Сноски? Зачем?
программа IBM Deep Blue превзошла чемпиона по шахматам, Юрия Каспарова.
Кого, простите?
Сначала думал что статья переводная потому что встретился термин "столбцовое хранилище" :) Мне кажется что лучше заменить на термин "колоночное".
В статье HBase указано как столбцовое (колоночное) хранилище. Вы уверены что это правильный термин применительно к HBase?
В целом по материалу посвящённым людям бесспорно абсолютно очевидно что в public cloud единственно верным решением может быть только S3 storage + Compute services по потребностям (SQL, Spark и тд).
Вопрос что ждет enterprise on-premise?
А ждет то что public cloud подход будет натягиваться на on-prem. По этому пути идет и Cloudera как с k8s подходом так и virtual private cluster. Все это уже заворачивается в продукт CDP Private Cloud.
Так же на рынок придукт решения и продукты которые будут предлагать стандартный набор Hadoop data service без самого "толстого" Hadoop и без HDFS.
2003–2023: Краткая история Big Data