Сегодня гиперскейлеры — ключевые игроки в облачной индустрии. Неудивительно, что они оказывают прямое влияние на развитие кремниевой промышленности. Так, крупные операторы дата-центров разрабатывают собственные процессоры, компании разного уровня затачивают под них новые устройства — в том числе на базе архитектур ARM и RISC-V. Мы в beeline cloud решили разобраться в ситуации — куда движется рынок и что происходит прямо сейчас.
Горшочек продолжает варить
Гиперскейлеры — это дата-центры со способностью к быстрому масштабированию. Количество серверных стоек в машинных залах таких площадок может превышать 10 тыс. единиц. Они служат плацдармом для оборудования крупнейших облачных провайдеров, телекоммуникационных операторов и технологических корпораций.
По оценкам специалистов из аналитического агентства Synergy Research Group, в мире более 800 гипермасштабируемых ЦОД. Порядка 15% всех мощностей приходится на китайский рынок. Он сконцентрирован вокруг местных компаний вроде Alibaba, Tencent и Baidu. В Европе крупнейшими рынками дата-центров являются Ирландия и Нидерланды. Большое количество аналогичных проектов развивают в Дании и Швеции. Интерес к рынку во многом связан с климатом — фьорды и низкие температуры сокращают энергопотребление систем охлаждения в серверных.
Но абсолютным лидером на рынке гипермасштабируемых ЦОД остаются США — там находится 53% всех мировых мощностей. В одной только Вирджинии таких площадок больше, чем во всей Европе или Китае. Если говорить о России, то на отечественном рынке доминируют облачные подразделения крупных экосистемных компаний. Точную их долю в картине мира оценить сложно, однако за последнее время были запущены несколько крупных коммерческих дата-центров.
Инвестиции в подобного рода ЦОД обусловлены ростом мирового трафика, необходимостью увеличивать число хранилищ данных и ресурсов для их обработки. Этот тренд проявляется и в Южной Африке. В то же время ряд компаний-операторов снижает затраты на развитие гипермасштабируемой инфраструктуры — например, по этому пути идут китайские корпорации. Одна из причин такого поведения — все еще нестабильная ситуация на рынке электронных компонентов.
Ситуация с полупроводниками
На отрасль значительное влияние оказывает неопределенность в мировой экономике — в частности, логистике. Специалисты аналитической компании Resilinc утверждают, что цепочки поставок все еще не восстановились на 100%, и ряд полупроводниковых компонентов до сих пор в дефиците. Хотя в отдельных секторах ситуация улучшилась — в частности, в сфере сетевого оборудования и систем кондиционирования для дата-центров. Поставщики этих продуктов оптимизировали производственные стратегии и внедрили методы управления спросом. Если говорить о CPU и GPU, то здесь картина сложнее. По большей части производители восстановили производство после затяжного кризиса, но столкнулись с новой проблемой. Стремительное развитие языковых и генеративных ML-моделей привело к повышенному спросу на вычислительные модули со стороны гиперскейлеров и разработчиков систем ИИ. Поставщики процессоров и чипов для графических карт не поспевают за растущим интересом.
Компании инвестируют в развитие систем ИИ и представляют кастомные чипы для машинного обучения. Крупный западный облачный провайдер недавно представил специализированные устройства для задач инференса. И их производительность на 20% выше, по сравнению с обычными вычислительными модулями. Примерно в то же время похожую систему разработали в Google, и Microsoft тоже строит аналогичные планы. Здесь также стоит отметить, что системы ИИ сами помогают проектировать процессоры для дата-центров — оптимизируют компоновочные планы и среднюю длину проводников.
Помимо узкоспециализированных чипов, заточенных под работу с системами ИИ, гиперскейлеры в целом берут курс на systems-on-a-chip (SoC). Такой подход позволяет кастомизировать вычислительные компоненты под нужды конкретного дата-центра, параллельно оптимизируя стоимость и энергопотребление. Подобные системы строят на базе одной из двух архитектур — ARM и RISC-V.
В середине мая о запуске специализированного чипа на базе ARM для операторов дата-центров и облачных провайдеров объявила копания Ampere Computing. Их процессор имеет 192 ядра, которые можно конфигурировать по-отдельности — например, ограничивать каждому из них потребление памяти. Встроенные системы мониторинга предупреждают о появлении сбоев Дополнительный бонус процессоров на базе ARM: они потребляют на 60% меньше электроэнергии. В масштабах облачного провайдера это выливается в колоссальную экономию на счетах за электричество.
Конкуренцию процессорам ARM составляют компоненты на базе RISC-V. В конце прошлого года целое семейство подобных процессоров представила компания Ventana Micro Systems. Разработчики утверждают, что новые чипы разработаны с чистого листа и поэтому не подвержены таким атакам, как Spectre или Meltdown. Процессор имеет чиплет-дизайн, и каждый оператор дата-центра может подстраивать его под свои нужды – например, менять количество ядер. Каждый чиплет включает до 16 ядер, а максимально возможное их количество 192 ядра (на 12 чиплетах).
Однако пока производство чипов на основе RISC-V находится на низком уровне. Процессорам ARM потребовалось больше десяти лет, чтобы получить достаточное распространение в машинных залах гипермасштабируемых ЦОД, и RISC-V предстоит еще долгая дорога. Надежду дает тот факт, что список программного обеспечения уже достаточно обширен. В нем числятся дистрибутивы Ubuntu и Debian, системы управления базами данных MySQL и Redis, а также проект OpenJDK.
Понятная история
В целом история с микропроцессорами — это продолжение рыночных тенденций, которые закрепились на рынке уже более десяти лет. Западные гиперскейлеры давно разрабатывают собственное аппаратное обеспечение и приобретают стартапы, способные посодействовать в этом направлении. Стандартные off the shelf решения их не устраивали, и современный тренд на кастомизацию процессоров, является логическим продолжением. Тренд успешно «подогревают» правительственные инициативы. Они стимулируют развитие локального производства полупроводников. По этому пути идут США, Россия, Япония и страны Европы.
Но очевидно, что более мощные кастомные чипы требуют эффективных систем охлаждения. Этот факт отражается на стоимости электричества для операторов центров обработки данных. Примерно 3% потребляемой электроэнергии в мире приходится на дата-центры, и неудивительно, что в гипермасштабируемых ЦОД уделяют особое внимание вопросам энергоэффективности.
beeline cloud — secure cloud provider. Разрабатываем облачные решения, чтобы вы предоставляли клиентам лучшие сервисы.
Больше материалов в нашем блоге на Хабре:
• Как мы делали курс Base Cloud DevOps и что он дает новичкам в DevOps и Kubernetes
• На пороге «нейрозимы» — что разработчики систем ИИ думают о будущем технологии
• От «топа» до курьера: кому нужны MDM-решения и что они умеют