Комментарии 3
Спасибо! Очень вдохновляющая статья и призыв ко всеобъемлющей и качественной работе с данными! Заинтересовал расчёт стоимости хранения в S3 в сравнении с DataLake: что именно с чем сравнивается (различные варианты решения у одного и того же облачного провайдера или облачное решение с on-prem?) и что конкретно понимается под платформами DataLake? То есть хочется понять, за счёт чего получается такая разница, на чём происходит экономия.
Благодарю! Я взял цены на железо у крупного провайдера. Не PaaS, что бы расчеты были максимально чистые, не учитывать добавочную стоимость. Под DataLake - любое хранилище без схемы, куда данные просто записывают для дальнейшего извлечения информации. В первую очередь: локальные Hadoop HDFS. Если брать облачные, то там будет сильно дороже тк тут просто железо считается.
Спасибо!
Data-Driven: от интуиции к фактам, и при чем тут data internals?