Walmart, China Mobile, большой адронный коллайдер и даже игры Blizzard Entertainment — все используют OpenStack. Однако, делают это по-своему.

OpenStack — решение для организации облачных сред с открытым исходным кодом, которое обладает большой гибкостью и возможностями настройки. Поэтому решение справляется, как с рядовыми задачами, так и с высоконагруженными конфигурациями.

Хотя про OpenStack говорят не так активно, как 5 лет назад, он никуда не уходил. Напротив: всё больше компаний присматриваются к нему. Например, мы в «Инферит Облако» построили инфраструктуру именно на этом решении. 

Сегодня вспоминаем четыре облачных проекта, которые стали возможны благодаря гибкости и возможности масштабирования OpenStack.

CERN (Европейская организация ядерных исследований)

Внутри дата центра CERN. Фото superuser.openinfra.dev

Главный проект CERN — большой адронный коллайдер. Эксперименты с коллайдером генерируют огромные объёмы данных. Облачная платформа на OpenStack играет решающую роль в управлении этими данными. Ещё учёные предоставляют инфраструктуру и ресурсы тысячам исследователей по всему миру.

К 2022 году частное облако разрослось до 9 000 физических узлов с 500 000 ядер. Эта инфраструктура поддерживает множество научных, административных и вычислительных задач, необходимых для функционирования CERN.

В CERN реализовали проект Worldwide LHC Computing Grid (WLCG). Это объединённая сеть из более чем 170 вычислительных центров в 42 странах.

WLCG использует OpenStack для обеспечения вычислительной мощности, необходимой для анализа огромного объёма данных, получаемых в коллайдере. Результат — тысячи учёных по всему миру получать доступ к данным в режиме реального времени. 

Грид-сеть CERN. В середине находится центр обработки данных Tier-0  где на ленточных носителях хранятся первичные данные. Фото academcity.org

zOpenStack позволяет CERN быстро и эффективно выделять огромные вычислительные ресурсы. Пользователи могут запрашивать виртуальные машины и хранилища через специальный веб-портал, что значительно сокращает время, необходимое для развертывания ресурсов. По расчётам CERN, без развёрнутой облачной сети этот процесс мог занимать до нескольких месяцев. Благо сейчас процесс автоматизирован и занимает нескольких минут. 

Кстати, учёные продолжают использовать магнитные ленты для долгосрочного хранения данных. В среднем такая лента хранит данные 30 лет и не очень прихотлива в хранении.

Хранилище магнитных лент на складе CERN. Фото thereeltoreelrambler.com

Развёртывание OpenStack в CERN включает в себя расширенные функции, такие как оркестрация контейнеров с использованием Kubernetes и подготовка «голого железа» (Bare Metal) с помощью OpenStack Ironic.

Нагрузки облачной инфраструктуры CERN можно оценить в реальном времени на их сайте. 

График создания облачным виртуальных машин для нужд сети CERN. В пиковые нагрузки за час запускается до 800 новых ВМ. Фото monit-grafana-open.cern.ch

В 2022 году эксперты CERN заявили, что готовятся модернизировать коллайдер. Это приведёт к увеличению обработки объёма данных и потребует новых вычислительных мощностей. Учёные планируют оставаться в экосистеме OpenStack.

Walmart

Крупнейшая в мире сеть оптовой и розничной торговли — сторонник продуктов с открытым исходным кодом. В разное время бизнес использовал более 60 OpenSource-решений.

Walmart создал сеть из 10 000 серверов, на которых развёрнута облачная инфраструктура на базе OpenStack, в распределительных центрах и более чем 5 500 магазинах. При этом частное облако OpenStack компании Walmart насчитывает более 800 000 ядер.

В центре обработки данных Walmart в Калифорнии. Фото reuters.com

Главная фишка Walmart — собственный инструмент Galaxy. Его задача — проверка облачных операций. Если где-то фиксируется проблема, Galaxy сообщает об этом. Так инструмент помогает поддерживать бесперебойную работу облачной инфраструктуры. 

До Walmart в американском ритейле доминировал реактивный подход, когда компании реагировали на проблему при её обнаружении. Galaxy работает иначе: он постоянно выполняет проверки, чтобы подтвердить работоспособность всех компонентов облака. Сегодня проактивный подход к проверкам стал мейнстримом.

Несмотря на партнёрство с Microsoft Azure, Walmart продолжает инвестировать в OpenStack и использовать его для своих нужд. Компания использует мультиоблачную инфраструктуру, которую называет триединая сеть. Она объединяет публичное и частное облако, пограничные узлы, позволяя Walmart гибко балансировать рабочие нагрузки и поддерживать непрерывность работы в периоды пиковой активности или простоев.

Принцип работы мультиоблачной инфраструктуры Walmart, также известной как триединая сеть. Фото Walmart

Используя OpenStack и Kubernetes, Walmart организует работу контейнеров на обширной вычислительной базе. Инфраструктура поддерживает скоростные обновления и внедрение новых функций, что значительно повышает гибкость цифровых платформ Walmart. Переход к мультиоблачной среде помогает гибко управлять расходами и позволяет избежать привязки к поставщикам.

Несмотря на конкуренцию со стороны крупных поставщиков облачных сервисов, Walmart, тем не менее, придерживается Open Source-решений. Не так давно компания объявила о планах расширить пул инструментом на основе  решений с открытым исходным кодом. Облака на основе OpenStack занимают в этих планах ключевую позицию.

China Mobile

Официально: крупнейший оператор мобильный связи в мире, обслуживающий около миллиарда абонентов. 

China Mobile управляет одной из крупнейших в мире систем виртуализации сетевых функций (NFV) на базе OpenStack. Эта обширная инфраструктура управляет более чем 50 000 серверами, поддерживая обширную телекоммуникационную сеть, которая обслуживает более 3 миллионов базовых станций.

Вычислительные мощности China Mobile. Фото superuser.openinfra.dev

Сеть NFV China Mobile поддерживает более 465 миллионов пользователей 5G и 300 миллионов пользователей IMS (IP-мультимедийной подсистемы). 

Для эффективного управления такими масштабами компания China Mobile разработала автоматизированную платформу AUTO, которая значительно сокращает время, необходимое для настройки и тестирования оборудования. AUTO может настроить все устройства в пуле ресурсов, насчитывающем более 1000 физических узлов, всего за 20 минут, и завершить тестирование за 80 минут. За год эта платформа помогла China Mobile свести к нулю количество сбоев в конфигурации и устранить более 15 000 проблем.

China Mobile внедрила конвейер CI-CT-CD (Непрерывная интеграция, тестирование и поставка) в сотрудничестве с Ericsson для интеграции своих решений. Этот конвейер обеспечивает автоматизированное развертывание и тестирование новых версий ПО, повышая эффективность и надёжность сетевых облачных сервисов.

Важно, что China Mobile активно участвует в работе сообщества OpenStack, делится своим опытом в области автоматизации и CI/CD. Компания также участвует в конференциях и событиях, посвящённых развитию решений с открытым исходным кодом. Сообщество больше всего интересует опыт компании в использовании NFV в телекоммуникационных средах.

Сейчас компания сместила акцент на развитие искусственного интеллекта, а председатель совета директоров China Mobile заявил, что компания «перешла от облаков к вычислениям». Правда, доходы облачных направлений за прошлый год выросли на 83%, а в 2023 году клиентская база пользователей 5G выросла на 42% — сеть выдержала приток новых абонентов. Значит использование OpenStack приносит результат и отказываться от него точно не будут.

Blizzard Entertainment 

«Я получил власть, которая и не снилась моему отцу!» Вероятно так может сказать руководитель сетевой инфраструктуры Blizzard Entertainment. Всё-таки 12 000 вычислительных хостов и несколько облаков — это не шутки.

Запуск новых сезонов в играх Blizzard часто сопровождается очередями на сервера. Без OpenStack, возможно, ситуация была бы хуже. Скриншот Reddit

Вы или ваши знакомые играют в Overwatch 2, Diablo IV и World of Warcraft? Знайте: для поддержки инфраструктуры этих игр Blizzard Entertainment использует OpenStack

В первую очередь Blizzard ценят возможности автоматического масштабирования OpenStack для управления высокими и переменными рабочими нагрузками в онлайн-играх. Количество игроков в будни, выходные и в период крупных обновлений — это три совершенно разные нагрузки на инфраструктуру. Автоматическое масштабирование помогает поддерживать производительность и стабильность за счёт выделения ресурсов, необходимых для удовлетворения потребностей игровых серверов.

Один из методов, который Blizzard использует в OpenStack, называется NUMA pinning. Этот технический приём позволяет оптимизировать использование игровыми серверами вычислительной мощности компьютера (CPU). Грубо говоря, NUMA следит, чтобы процессоры использовали свои разделы памяти, а компонент OpenStack Nova — выполняет первичные задачи. Такой подход гарантирует, что каждая виртуальная машина будет находиться в своей зоне памяти, не пересекаясь с зоной других ВМ.

Компания Blizzard решила несколько проблем, связанных с масштабированием своей игровой инфраструктуры. Одна из таких проблем решена при помощи брокера сообщений — RabbitMQ, который помогает различным частям системы взаимодействовать друг с другом, подобно тому, как почта доставляет сообщения.

Другой серьезной проблемой было масштабирование Neutron, сетевого компонента OpenStack. Blizzard столкнулась с проблемами в работе из-за совместного размещения служб на хостах контроллеров.

Обычно в среде OpenStack хосты контроллеры отвечают за управление и оркестровку различных облачных сервисов, включая сетевые (Neutron) и вычислительные (Nova). Когда несколько сервисов работают на одном и том же оборудовании или виртуальных машинах, то они конкурируют за ресурсы. При волнообразной нагрузке такая конкуренция может привести к перегрузке системы и снижению производительности. Blizzard решили эту проблему, переведя сотрудников Neutron RPC на виртуальные машины, что снизило нагрузку на control plane до 75% при обычной работе.

Подход Blizzard к использованию OpenStack предполагает постоянную настройку и масштабирование для поддержания эффективности и надежности инфраструктуры. Эта стратегия позволяет им поддерживать стабильную работу онлайн-игр, минимизировать сбои и обеспечивать производительность.

Заключение

С 2020 по 2021 годы  количество ядер. управляемых OpenStack, выросло на 66%.

Статистика популярности OpenStack — за год создано больше 100 облаков, а в «клубе миллиона ядер» уже больше 7 компаний. Фото superuser.openinfra.dev

OpenStack продолжает отчитываться о появлении новых проектов, инструментов и компонентов. У OpenStack практически безграничный потенциал в части кастомизации, поэтому появление новых масштабных кейсов — вопрос времени.

При этом вокруг OpenStack существует множество мифов. Например, принято считать, что OpenStack развёртывается вручную, что много времени уходит на исправление ошибок. На деле есть класс инструментов, которые помогают в развёртывании OpenStack и его отдельных компонентов. 

Интересно, что ещё недавно было модным «хоронить» OpenStack, особенно в иностранном сегменте интернета. Просто раньше он был на переднем крае технологий. Сейчас OpenStack осел в недрах центров обработки данных, служа основой для Kubernetes, AI/ML stack и телекоммуникационного NFV.

Если вы слышали о других заметных и известных проектах на OpenStack, расскажите о них в комментариях.