ETegro_Technologies Jun 1 2015 at 09:51

100 GbE

6 min

22K

Cloud computing *

Comments 49

norguhtar Jun 1 2015 at 11:00

>Процессор Intel Atom 2538
Закапывайте.

ETegro_Technologies Jun 1 2015 at 11:08

Аргументируйте, пожалуйста.

igordata Jun 1 2015 at 11:18

Можно перефразировать: «А почему у вас используется процессор Atom 2538?» И тогда по всем правилам, доказательство постулата ложится на плечи постулирующего. Могу предположить, что там усё у ней внутрях тотально железно-аппаратное, и поэтому на плечи Атома ложится только координация этих железяк между собой.

DancingOnWater Jun 1 2015 at 11:26

Ну тогда по всем канонам клинча в ответ услышите: «Священное право на собственные убеждения и личное мнение».

norguhtar Jun 1 2015 at 11:28

Там наличествует SDN. Он подразумевает, что в случае если правила нет на поток, то это все валит процессору, который обращается к контроллеру и тот говорит какое правило настроить фабрику. Плюс классическая схема подразумевает, что часть потока может быть отправлена на процессор общего назначения и обработана там. Это кстати ответ почему у cisco на их железяках был весьма дохлый NAT при прочих довольно хороших коммутационных характеристиках.

А я вот весьма не уверен, что Intel Atom 2538 сможет с адекватной скоростью обработать возможный поток.

ETegro_Technologies Jun 1 2015 at 11:33

Это правильное перефразирование. :)
Atom используется потому, что это это архитектура x86, что упрощает перенос собственных дополнительных пакетов в среду сетевой ОС. Альтернативой являются процессоры на архитектурах MIPS и PowerPC.

Вы абсолютно правы, вся работа с трафиком между портами лежит исключительно на коммутирующей матрице, процессор и сетевая ОС нужны лишь для задания правил обработки пакетов матрицей.

Одиночный порт 100GbE практически полностью выедает пропускную способность PCIe x16 v3, «запихать» поток с 32 портов в процессор крайне сложно. Да и возможностей его, мягко говоря, будет несколько недостаточно.

norguhtar Jun 1 2015 at 11:42

Atom используется потому, что это это архитектура x86, что упрощает перенос собственных дополнительных пакетов в среду сетевой ОС. Альтернативой являются процессоры на архитектурах MIPS и PowerPC.

В Linux это никогда проблемой особой не было. А вот стоимость при сравнимых характеристиках может решать, так-как сравнимый даже с Atom MIPS/PowerPC будет стоить несколько дороже.

Вы абсолютно правы, вся работа с трафиком между портами лежит исключительно на коммутирующей матрице, процессор и сетевая ОС нужны лишь для задания правил обработки пакетов матрицей.

Т.е. пакеты в сетевую ОС нельзя внутрь отдать от слова никак?

Одиночный порт 100GbE практически полностью выедает пропускную способность PCIe x16 v3, «запихать» поток с 32 портов в процессор крайне сложно. Да и возможностей его, мягко говоря, будет несколько недостаточно.

Более того установленный процессор 10GbE имеет риск не прожевать.

ETegro_Technologies Jun 1 2015 at 11:49

>В Linux это никогда проблемой особой не было. А вот стоимость при сравнимых характеристиках может решать, так-как сравнимый даже с Atom MIPS/PowerPC будет стоить несколько дороже.

Вопрос в стоимости адаптации.
А разница стоимости x86/MIPS/Power несущественна от слова вообще.

>Т.е. пакеты в сетевую ОС нельзя внутрь отдать от слова никак?
На скоростях потока в матрице? Да. Там вся матрица висит на шине PCIe, по которой получает управляющие команды и отдает те данные, которые обучена отдавать. Собственно, вышеупомянутый Broadview введен Boradcom'ом как раз для расширения возможностей работы с трафиком на уровне мониторинга и анализа.

>Более того установленный процессор 10GbE имеет риск не прожевать.
Смотрите чуть ниже. Если нужно именно «жевать» трафик, то для этого сейчас принято ставить специализированные программируемые NPU.

norguhtar Jun 1 2015 at 11:58

Вопрос в стоимости адаптации.

Адаптация чего к чему?

Смотрите чуть ниже. Если нужно именно «жевать» трафик, то для этого сейчас принято ставить специализированные программируемые NPU.

Тогда зачем x86 да еще и с таким количеством памяти?

norguhtar Jun 1 2015 at 11:23

Процессор весьма дохлый. И что-то внятное сделать на нем нельзя. Грубо говоря если вдруг мне потребуется что-то сделать софтом и пакеты будут уходить к нему, то он много не прожует. Та же ситуация с SDN он может в некоторых случаях не успеть. И получится ситуация «Не прожевал волк бабушку!»

DancingOnWater Jun 1 2015 at 11:29

А для тех кто в танке можно расчеты и сравнение расчетов и практики у текущего поколения?

ETegro_Technologies Jun 1 2015 at 11:36

А через что вы собираетесь передавать поток в три терабита в процессор?

Про производительность процессоров можно поговорить отдельно.

norguhtar Jun 1 2015 at 11:38

Какие три терабита? Он хотя бы 10 гигабит осилит? Вот надо netflow отдавать. Кто этим будет заниматься?

ETegro_Technologies Jun 1 2015 at 11:42

32 порта х 100 GbE — это физические возможности коммутатора, которые реализованы на коммутационной матрице. Если вы собираетесь выводить поток из нее на обработку процессором — думайте, как вы их туда доставите.

Что же касается производительности x86… ну примерно так:
«Under the tests conducted by SDNCentral testing lab partners, the Brocade Vyatta 5600 vRouter platform ran on a mid-range, Intel Xeon server platform with dual 10-core Xeon processors (E5-2670v2 @ 2.50GHz). The tests measured L3 forwarding for a dual-socket CPU compute node with an aggregate system performance of 70 million packets per second and 80Gbps rates over a wide set of IP conditions – performance was comparable to many traditional hardware appliances.»

Поэтому перестаньте рассчитывать на то, что вы что-то успеете сделать х86-процессором с трафиком такого уровня.

norguhtar Jun 1 2015 at 11:45

Про то сколько может прожевать x86 процессор я в курсе, по этому и спрашиваю. Вопрос состоит зачем там процессор и что я им смогу сделать с трафиком. Если он там только как рулилка и возможная запускалка процессов, ну ок. Только с таким же успехом можно купить свитч без такого процессора.

ETegro_Technologies Jun 1 2015 at 11:50

Можно, конечно. Только матрица сама себе правил работы с трафиком не задаст.

norguhtar Jun 1 2015 at 11:59

Для задачи правил работы с трафиком как-то x86 процессора не надо. Можно обойтись более простым и менее мощным.

ETegro_Technologies Jun 1 2015 at 12:17

Можно поставить 2-х ядерный Атом.
Было бы желание и объём.

JDima Jun 1 2015 at 12:19

Дамы и господа, перед нами человек, предположительно никогда не материвший коммутаторы за низкую производительность RP. Уникальный кадр, спешите, смотрите!

Серьезно, после одноядерного камня на 700мгц в sup720 многоядерные относительно современные xeon'ы в нексусах — счастье. Первый можно стабильно загрузить до 100% настройкой SNMP опросов без каких-либо экстремальных таймеров и параметров, второй даже show tech переваривает не замечая нагрузки, за пару-тройку секунд. Обе платформы хардварные, не предполагается передача трафика через те процессоры.

Мне тоже не нравится выбор Атома, но по другой причине: могли бы и чего попроизводительнее впихнуть. Исключительно для control plane — про транзитные пакеты речь не идет.

По поводу упомянутого выше netflow — сам семплинг обычно хардварным делают, на крайняк есть sampled netflow (один пакет из X, где X может быть >100, передается RP, этого достаточно для общего понимания профиля трафика). Процессор только упаковывает уже собранную статистику и шлет коллектору. Иногда даже эта роль переносится на линейные карты, так как задача упаковки готовой статистики в пакеты может серьезно прогрузить RP…

norguhtar Jun 1 2015 at 12:23

Дамы и господа, перед нами человек, предположительно никогда не материвший коммутаторы за низкую производительность

А теперь внимательно почитайте все комментарии :)

Серьезно, после одноядерного камня на 700мгц в sup720 многоядерные относительно современные xeon'ы в нексусах — счастье. Первый можно стабильно загрузить до 100% настройкой SNMP опросов без каких-либо экстремальных таймеров и параметров, второй даже show tech переваривает не замечая нагрузки, за пару-тройку секунд.

Если для этого требуется xeon то я не знаю что мне приложить к лицу, видимо кроме рук еще и ноги :)

Мне тоже не нравится выбор Атома, но по другой причине: могли бы и чего попроизводительнее впихнуть. Исключительно для control plane — про транзитные пакеты речь не идет.

Я вообще про производительность тоже писал. Тут или или. Тут или лучше уже больше или же уж можно и ARM поставить. А так получается не рыба не мясо.

JDima Jun 1 2015 at 12:35

Если для этого требуется xeon то я не знаю что мне приложить к лицу, видимо кроме рук еще и ноги

Так у меня рука уже давно приросла к лицу, я давно ничему не удивляюсь. Отображение конфигурации грузит ЦП до 100% секунд на 5-10? Ок, ничего особенного (в конце концов, многие железки не просто файл читают, а по большей части реверсят то, что запрограммировано в железо). Отображение конфигурации отрабатывает мгновенно? Вот это уже необычно.

или же уж можно и ARM поставить. А так получается не рыба не мясо.

Какой смысл ставить ARM? Atom похож по производительности и по энергопотреблению. Следить за кодом сразу под две разные архитектуры — затратнее.

norguhtar Jun 1 2015 at 14:03

У них там linux. Никакой разницы, а ARM кстати по энергопотреблению получше будет :)

JDima Jun 1 2015 at 14:12

Linux — просто ядро. Есть еще и управляющий софт, который иногда довольно низкоуровнево пишут. И еще очень часто Linux там с RT вставками.

ARM сравним с Atom'ом.

www.extremetech.com/extreme/188396-the-final-isa-showdown-is-arm-x86-or-mips-intrinsically-more-power-efficient/2

Вообще, железка будет тратить на один порт больше, чем на весь процессор в пике. Что тут сравнивать?

norguhtar Jun 1 2015 at 14:21

Linux — просто ядро. Есть еще и управляющий софт, который иногда довольно низкоуровнево пишут. И еще очень часто Linux там с RT вставками.

Не в их случае. Управлятор же.

Вообще, железка будет тратить на один порт больше, чем на весь процессор в пике. Что тут сравнивать?

Тогда вообще не понятно зачем Atom.

JDima Jun 1 2015 at 14:24

Не в их случае. Управлятор же

И чо? Если управлятор излишне задумывается о чем-то постороннем, то рвутся соседства и теряется трафик.

Тогда вообще не понятно зачем Atom.

Так ведь потому что стоит копейки.

norguhtar Jun 1 2015 at 14:38

И чо? Если управлятор излишне задумывается о чем-то постороннем, то рвутся соседства и теряется трафик.

Ну давайте вместо того чтобы нормально писать код просто ставить жирный процессор. Это же проще :]

JDima Jun 1 2015 at 15:08

Какое отношение это имеет к качеству кода?

norguhtar Jun 1 2015 at 15:19

Вообще прямое. Вы просто не представляете как быдлокодом можно легко и не принужденно увеличить системные требования раза в два.

JDima Jun 1 2015 at 15:21

Всегда будут задачи, требующие как минимум нескольких секунд процессорного времени, каким бы сильным процессор ни был. Всегда будут другие задачи, которые обязательно должны отработать точно в срок (речь про миллисекунды).

ETegro_Technologies Jun 1 2015 at 14:18

ARM не будет лучше по потреблению, а единый репозиторий софта гораздо удобней.

norguhtar Jun 1 2015 at 14:21

Единый репозиторий с чем?

ETegro_Technologies Jun 1 2015 at 14:57

Оркестровка OpenStack, NFV продукты, автоматизация (Chef и т.д.), агенты sFlow.
Мало ли чего ещё захочется поставить.

У Гугла используется единый образ на все случаи жизни — он разворачивается на железке, по конфигурации понимает, где оказался, и устанавливает нужную роль.
Всё автоматом, без участия человека.

Будут у нас х86 серверы и PPC коммутаторы — так уже не сделать.

norguhtar Jun 1 2015 at 15:20

Оркестровка OpenStack, NFV продукты, автоматизация (Chef и т.д.), агенты sFlow.
Мало ли чего ещё захочется поставить.

Как дистрибутив? Так-то вообще практически для любого дистрибутива есть специальные фабрики позволяющие собирать под что угодно. А уж про openembedded я пожалуй промолчу :)

ETegro_Technologies Jun 1 2015 at 15:23

Да можно собирать подо всё, что угодно, никто не спорит.
Но зачем тянуть 2 ветки разработки вместо одной?

ilukyanov Jun 1 2015 at 19:08

Нет никакой разницы ровно до того момента, пока не возникнет необходимость поставить там что-нибудь свое, например какое-нибудь свое приложение на Java и нативные JNI-либы прицепом.

Главный плюс Atom'a именно в том, что это дешевый и слабый, но тем не менее x86 процессор. И разработчикам не нужно думать, как там кросс-компилить софт и как потом все это дело отлаживать.

ilukyanov Jun 1 2015 at 19:21

К вопросу о совместимости софта под ARMы — из нескольких протестированных моделей (среди которых Marvell и еще одна серверная модель) ни на одной линуксовый AIO не работает так, как работает на x86 (включая Atom). Тесты, которые на Atom'е съедают 10-15% CPU, все без исключения ARMы уводят в глубокий iowait в 60-80%.

Это в принципе все что нужно знать о зрелости армовой экосистемы.

equand Jun 2 2015 at 12:46

Netmap наше все в данном случае.

JDima Jun 2 2015 at 13:55

Каким боком он «все в данном случае»? Какое отношение он имеет к задачам RP свитча?

DancingOnWater Jun 1 2015 at 11:40

Не знаю, общая эрудиция говорит, что в любых процессорах шина не настолько широка, чтоб все пропустить; потому и спрашиваю про сравнение с текущим поколением.

ETegro_Technologies Jun 1 2015 at 15:22

Коммутатор делится на control plane (управляющая часть) и data plane (коммутирующая часть).
Наиболее удобная аналогия — коммутирующая часть выступает для управляющей устройством на PCIe шине, как GPU либо Xeon Phi.

Связь между ними — хорошо, если PCIe 2.0 x2 и гигабит, вопрос направления каких-либо потоков вообще не стоит.
Нужна управлялка только для программирования матрицы правилами + внешнего софта для оркестровки/автоматизации процесса.
Как появились коммутаторы 10G на Freescale P2020, так и в 100G можно поставить его же.
Атомы пришли в коммутаторы позже, но и они не меняются.

xdeller Jun 1 2015 at 11:43

Ну, немного о цифрах — у 100GE с обычным 1536b пакетами скорость классификации близка к 10Mpps — далеко не все современные фреймворки способны переваривать такой рейт на чем-то, кроме топовых процессоров. Если вас вдруг начнут атаковать и пакет рейт вырастет на порядок — x86 просто не будет способен это переварить, по нескольким причинам:
а) нельзя масштабироваться на соседние NUMA-ноды, то есть сокеты, слишком большие потери даже при bulk queuing пакетов для пересылки между процессором и очередями карт, сюда же записываем проблему с работой DCA, который хорошо вывозит работу с картой на сравнительно небольших объемах трафика,
б) классификация пакетов не может съедать ниже определенного числа тактов на пакет, равного примерно полусотне.

Иными словами, хотите крутой и производительный SDN — распределяйте обработку пакетов по коробкам, а там уже не имеет значения, атом ли это или топовый зеон. В сабжевом устройстве единственная задача управляющей платы — запускать линукс с программирующей сущностью, обычно это сцепленный с API матрицы виртуальный свич.

norguhtar Jun 1 2015 at 11:48

100GE с обычным 1536b пакетами скорость классификации близка к 10Mpps — далеко не все современные фреймворки способны переваривать такой рейт на чем-то, кроме топовых процессоров.

Про то и речь.

Иными словами, хотите крутой и производительный SDN — распределяйте обработку пакетов по коробкам, а там уже не имеет значения, атом ли это или топовый зеон.

Иными словами, а зачем тогда тут Atom? :)

В сабжевом устройстве единственная задача управляющей платы — запускать линукс с программирующей сущностью, обычно это сцепленный с API матрицы виртуальный свич.

С моей точки зрения ставить туда тогда 4 ядерный Atom с 8 гигабайтами памяти под такую задачу несколько избыточно. Не проще ARM туда воткнуть или MIPS?

ETegro_Technologies Jun 1 2015 at 11:55

>С моей точки зрения ставить туда тогда 4 ядерный Atom с 8 гигабайтами памяти под такую задачу несколько избыточно.

Пакеты мониторинга, управления и оркестрации нынче становятся весьма требовательными. Проще сразу заложить некоторый запас, чем сэкономить копейки на железе, а потом страдать, не влезая в пожелания заказчика.

Собственно, архитектуру процессора можно подобрать под конкретного заказчика, если он уже имеет широкомасштабную развернутую структуру. Оно же все реализуется на дочерних платах, как завещает OCP, и пророк его Facebook.

norguhtar Jun 1 2015 at 12:01

Пакеты мониторинга, управления и оркестрации нынче становятся весьма требовательными. Проще сразу заложить некоторый запас, чем сэкономить копейки на железе, а потом страдать, не влезая в пожелания заказчика.

Настолько? Не ну если на ruby писать то конечно и такого процессора будет мало.

Оно же все реализуется на дочерних платах, как завещает OCP, и пророк его Facebook.

Atom вынули, MIPS, ARM поставили?

ETegro_Technologies Jun 1 2015 at 12:07

>Настолько? Не ну если на ruby писать то конечно и такого процессора будет мало.

Нет границ у таланта индусокодеров!

>Atom вынули, MIPS, ARM поставили?

Практически.

Плата с красным тексталитом — «серверная» часть: впаянный процессор, RAM, флеш.

hsto.org/getpro/habr/post_images/404/0b9/1c0/4040b91c057566d811980065feb4dcd0.jpg

norguhtar Jun 1 2015 at 12:24

Ну учитывая размер, что-то другое в x86 сложновато будет впихнуть, хотя можно.

ETegro_Technologies Jun 1 2015 at 12:30

Можно поставить 8-ядерный атом, благо ничего менять не надо.

RicoX Jun 1 2015 at 19:00

Что касается готовности нового стандарта к массовому производству и внедрению, то здесь, на наш взгляд, все обстоит достаточно неплохо. Уже сейчас существует реализованный в железе, текстолите и кремнии полный спектр необходимого оборудования

Можно пример готовых к стандарту маршрутизаторов и брасов?

ETegro_Technologies Jun 2 2015 at 00:58

Cisco, Juniper, Alcatel-Lucent, Brocade, H3C, Huawei, ZTE — сколько угодно роутеров на любой вкус и цвет.
BRAS — кому он такой нужен?