CloudEngine. Заявка на лидерство от Huawei. Часть 1

Данная статья открывает серию публикаций посвященных совершенно новой линейке оборудования компании Huawei под общим названием CloudEngine, а так же технологиям и решениям, примененным в этом оборудовании.

Введение


До настоящего времени в сегменте оборудования для дата-центров не было предложений от Huawei. В третьем квартале прошлого года стартовала промо-программа от Huawei, прежде всего для партнеров, посвященная этой новинке – серии коммутаторов для ЦОД.
Нет никаких сомнений, что Huawei ставила перед собой сразу несколько целей, создавая новую линейку оборудования:
1. Заполнить пробелы в спектре предлагаемого компанией на рынке оборудования
2. Догнать и опередить своих основных конкурентов
И можно точно сказать, что этих целей компания добилась.

Среди многочисленных потребностей современных дата-центров — постоянно растущие требования к пропускной способности. Эти требования диктуются, прежде всего, десятками тысяч серверов, объединенными сетевой подсистемой. Существует прогноз относительно того, каким будет доминирующий способ подключения сервера к СПД. Относительно этого, можно спрогнозировать какие типы портов на линейных картах и в каком количестве будут актуальны.


Рис. 1 Прогноз по типам используемых интерфейсов серверов в составе ЦОД

Помимо пропускной способности остро встают административные и технические проблемы:
— Миграция виртуальных машин в пределах ЦОД или между ЦОД одной компании;
— Управление трафиком в сетях, сегментированных на L2 и L3 (OSI);
— Передача трафика сетей хранения в те места ЦОД, где нет поддержки этого стандарта на коммутационном оборудовании, и прочие.
Безусловно, все проблемы устраняются применением комбинации решений, например, от вендоров VMWare и Cisco. Huawei же предлагает моновендорное решение начиная от программных продуктов серии nCentre с открытым API и возможностью интеграции с гипервизорами сторонних вендоров и заканчивая подсистемой передачи данных для ЦОД любого масштаба!
Итак, CloudEngine. Huawei разделила всю линейку на два больших сегмента – это CORE и TOR устройства. CORE-устройства позиционируются как «сердце» ЦОД, которое пропускает через себя все потоки данных, обеспечивая наивысшую отказоустойчивость. TOR (Top-Of-Rack) устройства выполняют роль стоечных агрегаторов, собирая на себе трафик от серверов, дисковых массивов или менее производительных сетевых устройств. Исходя из функционального деления, имеются принципиальные различия во внешнем исполнении. Все TOR устройства имеют одноюнитовое исполнение, CORE выполнены на базе различных шасси, 4 варианта на сегодняшний день включая CE12816 который не показан на Рис. 2.


Рисунок 2 – Семейство коммутаторов CloudEngine

Любую крупную сеть уровня Enterprise, к которым, кстати, так же относятся ЦОДы, можно идеализировать и описать многоуровневой схемой (Рис.3). Ниже представлено позиционирование устройств семейства CloudEngine всех типов.


Рис.3 – Идеализированная сетевая структура крупной ЛВС уровня Enterprise

Далее рассмотрим что же интересного предлагает Huawei потенциальным владельцам этого оборудования. Рассмотрим аппаратные и программные достоинства новых коммутаторов.

Аппаратная структура и особенности


Huawei демонстрирует неплохие конкурентные показатели в CORE-устройствах:
1. Пропускная способность внутренней шины коммутации до 2 Tbit/s на слот с возможность программного расширения в будущем до 4 Tbit/s
2. Высокая плотность портов — до 96х10G и 24х40G портов на слот. Суммарная плотность портов 1536х10G портов на шасси CE 12816.
3. Ультранизкая задержка при передаче данных – 2-5 микро секунд независимо от длины фрейма
4. Высокая доступность устройств благодаря возможности hot-swap любого элемента шасси.
5. Энергоэффективность на 50% выше среднего показателя на рынке

Анализ конкурентных предложений

Основным достоинством коммутаторов линейки CloudEngine прежде всего является резко выдающиеся за пределы аналогичных показателей у устройств других вендоров цифры по плотности портов и скорости передачи данных. Небольшое конкурентное сравнение на Рис.4


Рис. 4 Конкурентное сравнение

Чем достигается такая высокая скорость коммутации и низкая задержка:

— В коммутаторах серии CloudEngine12800 реализовано физическое соединение каждой линейной карты (LPU – Line Processing Unit) с каждой свич-фабрикой (SFU – Switch Fabric Unit), т.е. фактически получается матрица MxN (Рис. 5).


Рис.5 Способ внутреннего соединения LPU и SFU

— При передаче трафика между LPU используется динамическая неблокируемая CLOS-архитектура (Рис. 6). Ссылка на материалы с описанием сетей Клоза в приложении.


Рис. 6 Неблокируемая CLOS-архитектура

Данная технология совместно со способом коммутации плат SPU и LPU позволяет в каждый момент времени задействовать для передачи данных все свич-фабрики устройства. Используемая во многих аналогичных устройствах статическая CLOS-архитектура имеет ряд недостатков. Сравнение двух реализаций приведено в таблице 1.
Таблица 1


Высокая плотность портов, конечно, зависит от возможности передать через шину весь трафик, иначе в них бы не было смысла. Как показано выше в CloudEngine это не проблема. Дело за малым – подобрать производительную платформу для LPU, и! применить маленькие хитрости!
На рисунке 7 изображена самая производительная на данный момент линейная карта для платформы CE 12800, имеющая 24 40G порта на борту. Таким образом достигается суммарная скорость передачи 960 Гбит/C.


Рис. 7 – Линейнай карта LPU CE-L24LQ-EA

Однако, если необходимо резко нарастить количество портов, можно применить хитроумное приспособление – «разветвитель» (Рис. 8).


Рис. 8 – Делитель

Фактически внутри специального QSFP-модуля находится 4 отдельных модуля, работающих каждый на своей длине волны. Коммутатор вместо одного 40G интерфейса определяет 4х10G и плата CE-L24LQ-EA имеет уже максимум 24х4х10G = 96G интерфейсов! К слову, на плате можно комбинировать 40G и 4х10G интерфейсы, нет никаких ограничений.

Высокая доступность устройства реализуется, как было отмечено выше, возможностью горячей замены любого компонента шасси: CMU (Control Management Unit), LPU, MPU (Main Processing Unit), SFU,
PMU (Power management Unit), PSU (Power Supply Unit) и FAN. Более того, для всех устройств семейства СЕ12800 все платы кроме свич-фабрик идентичные! На рисунке 9 наглядно демонстрируется способ резервирования компонентов шасси.


Рис. 9 Резервирование компонентов шасси СЕ12800

Энергоэффективность оборудования серии СЕ12800 достигается благодаря следующим решениям:
— Применение чипов с высокой интеграцией. Т.е. вместо охлаждения десятков микросхем на плате, требуется охлаждать лишь единицы.
— Практически все процессоры и ASIC выполнены по 45-нм технологии, что позволяет значительно снизить энергопотребление таких компонентов.
— Запатентованная система охлаждения, а именно внутренняя структура шасси. Все это позволяет размещать устройства СЕ12800 в ЦОД не переживая за взаимное влияние на соседние стойки, организовывать теплые и холодные коридоры. (Рис. 10-11).

а) Вид сбоку справа б) Вид сверху

Рис. 10 Запатентованная система охлаждения


Рис. 11 Теплораспределение в горячих и холодных коридорах

Программная структура и особенности


Стоит сразу отметить, что Huawei очень активно развивает собственную модульную операционную систему VRP (Versatile Routing Platform), которая, вопреки всем слухам и байкам, не имеет ничего общего в коде с разработками конкурентов. За всю историю развития VRP претерпела много изменений от VRP1 до VRP5 и специально для CloudEngine, разработчики выпустили VRP8.
Ключевые особенности VRP8:
1. Поддержка вируализации и управления ресурсами виртуальных подсистем,
2. Поддержка кластеризации CSS (Cluster Switch System) и DCB (DataCenter Bridging)
3. Поддержка сетевой технологии TRILL (Transparent Interconnection of Lots of Links)
4. Поддержка FCoE (FiberChannel over Ethernet)
5. Улучшенная система управления конфигурациями

Теперь подробнее.

Виртуализация. В качестве дополнительной услуги для клиентов ЦОД Huawei предлагает рассматривать виртуализацию не только серверной части, но и сетевой. Для желающих полностью обособится и самостоятельно управлять всей своей инфраструктурой внутри ЦОД отлично подойдет возможность арендовать частичку CloudEngine (Рис.12).


Рис. 12 – Модель использования виртуальных систем на базе СЕ12800

Возможность виртуализации обеспечивается благодаря:
— Применению многоядерной многопроцессорной модели устройства,
— Применению модульной операционной системы

Виртуальная система обладает следующими особенностями:
— Индивидуальные Control, Forwarding, Management и Service plane,
— Индивидуально закрепленные за виртуальной системой линейные карты или порты карты,
— Индивидуально назначенные системные ресурсы (I\O, CPU, Mem) и конфигурация
— Полная изоляция от других виртуальных систем

Кластеризация. Нововведение от Huawei — это технологии CSS для СЕ12800 и iStack для ТОР, позволяющие объединить несколько физических коммутаторов в один логический, чтобы упростить управление сетью и улучшить её надежность.
В случае с CSS (Cluster Switch system) отличие от классического стека в том, что:
— Объединение осуществляется с использованием, как специальных карт, так и портов линейных карт (до 16 портов)
— Интеллектуальная балансировка нагрузки между портами и шасси коммутаторов в кластере
— Компоненты кластера могут быть разнесены на значительное расстояние (до 80 км)
— В кластер могут быть объединены любые типы шасси 12800.
Максимальное число коммутаторов в CSS — 4. Серия CE6800/5800 поддерживает стек до 16 коммутаторов. Простой пример использования CSS на Рис.13.


Рис. 13 Модель Back-to-Back, пример управления трафиком двух vlan.

TRILL. Модный протокол от IETF впервые реализован Huawei именно для линейки оборудования CloudEngine. TRILL (Transparent Interconnection of a Lots of Links) реализует передачу трафика на канальном уровне (L2), используя расширения протокола IS-IS и имеет следующие достоинства в сравнении с традиционными протоколами xSTP:
— Поддержка ECMP (Equal Cost Multi Path), возможность использовать одновременно основные и резервные соединения
— SPF алгоритм в основе механизма выбора маршрута для трафика, адаптация модели трафика для CLOS-архитектуры
— Единый control plane для Unicast и Multicast трафика
— Высокая скорость сходимости
— Поддержка большого числа устройств в одном домене TRILL (более 500 коммутаторов)

Все эти особенности протокола TRILL позволяют сделать полностью прозрачной процедуру создания и перемещения виртуальных серверов внутри облака и реальных внутри ЦОД.
Подробнее TRILL будет рассмотрен в следующих статьях.

FCoE. Как уже было отмечено, Huawei впервые реализовала функционал FCF (FCoE Forwarder) в устройствах CloudEngine. Благодаря этому появилась возможность привести существующую сеть или спроектировать новую в соответствии с современными потребностями. На рис. 14 показан результат объединения функционала устройств передачи данных и трафика систем хранения данных.


Рис. 14 Переход к конвергентным сетям



Заключение


В данной статье была сделана попытка донести до интернет-общественности информацию о новой линейке оборудования компании Huawei, а так же новейших программных и аппаратных технологиях реализованных в оборудовании серии CloudEngine. Подробно и детально описать некоторым моменты постараюсь в следующих статьях.

В статье частично использованы материалы «Для служебного использования», которых нет в публичном доступе.

Средняя зарплата в IT

120 000 ₽/мес.
Средняя зарплата по всем IT-специализациям на основании 6 051 анкеты, за 1-ое пол. 2021 года Узнать свою зарплату
Реклама
AdBlock похитил этот баннер, но баннеры не зубы — отрастут

Подробнее

Комментарии 5

    0
    По рисункам похвально, но был горький опыт с этим вендором. Обычно у них на входе скорость макс. а внутри таких больших устройства основная шина дает меньше.
      0
      Насколько мне известно, сейчас CloudEngine тестируются в нескольких крупных московских ЦОД, если получится узнать результат, то я напишу были ли выявлены несоответствия обещанной и реальной производительности.
      0
      Не понял насчёт системы охлаждения без холодных/горячих коридоров. Судя по картинкам, именно они и используются.
      Матричное соединение фабрик с лайн-картами сейчас, опять же, у всех.
      Виртуализация — способность «порубить» одну железку на несколько независимых логических? Я надеялся увидеть в этом разделе интеграцию с существующими вендорами. Arista, например, позволяет прямо на свитче посмотреть, какие виртуалки запущены на воткнутом в порт ESX-хосте, и автоматически активировать на нём нужные VLANы. Можно делать provisioning серверов прямо со свитча. А что есть у вас?
        0
        Я специально не стал детально описывать некоторые «фишки» т.к. хочу посвятить этому отдельные статьи. Как я писал, часть функционала у Huawei вообще ни где не была ранее реализована, так что очень вероятно, что первый блин будет пусть не комом, а хотя бы оладушкой :)
        0
        Основной особенностью оборудования от компании Huaeway является резко выдающиеся за пределы аналогичных показателей у устройств других вендоров количество неаргументированных понтов. Уж за что ругали циску с ее Up to 128Gbps, которые в реальной жизни с трудом живут на 64, но huaeway тут оставил всех далеко позади. Это оборудование надо обязательно тестировать, причем очень глубоко, в условиях, максимально приближенных к реальным.

        Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

        Самое читаемое