Как стать автором
Обновить

Комментарии 3

Спасибо! Очень вдохновляющая статья и призыв ко всеобъемлющей и качественной работе с данными! Заинтересовал расчёт стоимости хранения в S3 в сравнении с DataLake: что именно с чем сравнивается (различные варианты решения у одного и того же облачного провайдера или облачное решение с on-prem?) и что конкретно понимается под платформами DataLake? То есть хочется понять, за счёт чего получается такая разница, на чём происходит экономия.

Благодарю! Я взял цены на железо у крупного провайдера. Не PaaS, что бы расчеты были максимально чистые, не учитывать добавочную стоимость. Под DataLake - любое хранилище без схемы, куда данные просто записывают для дальнейшего извлечения информации. В первую очередь: локальные Hadoop HDFS. Если брать облачные, то там будет сильно дороже тк тут просто железо считается.

Зарегистрируйтесь на Хабре, чтобы оставить комментарий