Bright_Translate Dec 4 2022 at 13:00

2003–2023: Краткая история Big Data

17 min

15K

RUVDS.com corporate blogBig Data*Data storages*History of ITData Engineering*

Translation

+60

Comments 9

Myclass Dec 4 2022 at 15:59

Спасибо за обзор. Очень полезен, чтобы понять, что, как и кем создавались те или иные инструменты или фраймворки.

Естественно, компании, которые по-прежнему предпочитают развёртывать свои проекты локально, продолжают использовать Hadoop и другие открытые проекты, такие как Spark и Presto. Но с каждым годом доля переезжающих в облако данных увеличивается, и я не вижу причин для изменения этой тенденции.

А можете объяснить, как одно мешает другому? В облаке hadoop не нужен разве?

Ivan22 Dec 4 2022 at 21:13

в облаке хадуп не нужен от слова совсем. Файл стораджи там s3, adsl, а процессинг databricks, synapse или snowflake. "Скрипач не нужен"

Myclass Dec 6 2022 at 01:06

Спасибо за инфу. А у вас есть какие линки, где по-больше об этом можно было-бы почитать? Спасибо.

Ivan22 Dec 12 2022 at 19:25

ну можно здесь

https://www.datanami.com/2022/05/23/inside-the-modern-data-stack/

Chelidonium Dec 4 2022 at 18:28

начало 'Big Data' было гораздо раньше

Pampam83 Dec 5 2022 at 00:29

Сноски? Зачем?

ivymike Dec 5 2022 at 01:04

программа IBM Deep Blue превзошла чемпиона по шахматам, Юрия Каспарова.

Кого, простите?

Bright_Translate Dec 5 2022 at 06:51

Пардон, речь о Гарри Каспарове, конечно же.

EvgenyVilkov Dec 9 2022 at 13:21

Сначала думал что статья переводная потому что встретился термин "столбцовое хранилище" :) Мне кажется что лучше заменить на термин "колоночное".

В статье HBase указано как столбцовое (колоночное) хранилище. Вы уверены что это правильный термин применительно к HBase?

В целом по материалу посвящённым людям бесспорно абсолютно очевидно что в public cloud единственно верным решением может быть только S3 storage + Compute services по потребностям (SQL, Spark и тд).

Вопрос что ждет enterprise on-premise?

А ждет то что public cloud подход будет натягиваться на on-prem. По этому пути идет и Cloudera как с k8s подходом так и virtual private cluster. Все это уже заворачивается в продукт CDP Private Cloud.

Так же на рынок придукт решения и продукты которые будут предлагать стандартный набор Hadoop data service без самого "толстого" Hadoop и без HDFS.