company_banner

Горшочек, вари: серверный ARM-чип Marvell ThunderX3 с 96 ядрами и SMT4 для 384 потоков


    Недавно мы публиковали новость о 128-ядерном ARM-процессоре Altra Max. Также на Хабре упоминали серверные ARM-чипы, которые использует компания Amazon. Но, как оказалось, серверные процессоры c архитектурой ARM выпускают и другие компании.

    Так, еще в конце марта этого года был анонсирован процессор Marvell ThunderX3, это новое поколение серверных чипов от компании Marvell. Производитель увеличил количество ядер в своих процессорах с 32 до 96, оставив поддержку SMT4, которая дает возможность обрабатывать четыре потока одним ядром. Соответственно, такой чип способен обрабатывать 384 потока.


    По словам представителей компании, SMT4 — гарантия того, что конвейеры отдельных ядер нагружаются эффективно. Новые процессоры при этом способны отлично работать не только в условиях многопоточных, но и однопоточных вычислений. Что касается односокетной конфигурации, то здесь поддерживаются 64 линии PCI Express 4.0 lanes, в двухсокетной число линий PCIe 4.0 увеличено до 128. В случае двухсокетных конфигураций процессоры соединяются через 16 линий PCI Express 4.0.


    В отличие от прочих поставщиков ARM-чипов, предназначенных для серверов, компания Marvell использует не ARM Neoverse N1 архитектуру, а кастомную ARM8.3+. Информации о подсистеме кешей пока нет, но известно, что уровень латентности постоянен и не зависит от взаимного расположения ядер. А подсистема памяти аналогична Graviton2 и не включает восьмиканальный контроллер DDR4 с поддержкой частот до 3200 МГц.

    Компания выпустит несколько вариантов ThunderX3 с теплопакетами от 100 до 240 Вт. По словам разработчиков, энергоэффективность новинки на треть превосходит AMD Rome (EPYC 2 поколения). Техпроцесс новинки — TSMC 7 нм.


    Источник. Двухсокетная конфигурация с процессорами предыдущего поколения Thunder X2.

    Производительность чипа на 25% выше, чем у процессоров ThunderX2 предыдущего поколения. Это если говорить о многопоточном режиме работы. В однопоточном производительность увеличена на 60%. При этом с целочисленными операциями новинка справляется в три раза быстрее представителей предыдущего поколения, а с вычислениями с плавающей запятой — в пять раз.


    Новые чипы будут использоваться для решения задач по обработке крупных массивов данных. Благодаря особенностям чипов они позволят запускать больше виртуальных машин в случае однопроцессорных систем.

    Судя по результатам тестов, новые чипы по ряду показателей обгоняют конкурентов от Intel и AMD. Но это внутрикорпоративные испытания, к которым, как известно, стоит относиться с осторожностью.

    Процессоры все еще недоступны для сторонних экспертов, так что результатов независимых тестов пока нет. Выпустить новые процессоры компания собирается к концу 2020 года. Дополнительная информация будет предоставлена в августе. Ну уже сейчас компания заявила, что через два года выпустит новое поколение своих серверных процессоров.
    Хотите попробовать сервер на ARM-процессоре уже сейчас?

    Добро пожаловать в Selectel Lab!

    Selectel
    ИТ-инфраструктура для бизнеса

    Комментарии 37

      +6
      Наступает эпоха ARM?
        +3
        Она уже лет 10 всё наступает и наступает… но никак не может наступить почему-то.

        Посмотрим.

        P.S. Там проблема в том, по большому счёту, что ни у кого нет процессора на десктоп. Есть дешёвые процессоры для планшетов, есть дико дорогие для серверов (конкурирующие с ними x86 не дешевле — но вам-то что до этого?), для десктопа или даже лаптопа — нет ничего. Почему так получилось — неясно. Apple вроде подняла шумиху, может и на ChromeOS опять чего-нибудь забацают, тогда есть шанс. А так — это всё остаётся экзотикой как POWER или MIPS.

        P.P.S. Сам Apple ничего не изменит, так как для других он процессоры не выпускает, а это значит что вся его «революция» так и останется на десктопе в рамках 10% рынка… но вот шумиха вокруг Apple… может и сработает.
          +3
          для десктопа или даже лаптопа — нет ничего

          www.solid-run.com/nxp-lx2160a-family/honeycomb-workstation

          Surface Pro X
          Samsung Galaxy Book S

          Сам Apple ничего не изменит

          Уже изменил. Вы всё прозевали, но ARM одержал крупную победу руками Apple.
          Пока Майкрософт и прочие копались в песочнице, и ничего не делали для популяризации ARM ноутов и мотивации разработчиков, Apple на ваших глазах создал рынок ARM компьютеров. Apple самолично разрабатывает патчи для опенсорс софта под ARM.

          Почему так получилось — неясно.

          Разработчиков ARM серверов напрямую упрашивали выпустить доступную систему для разработки, но они вообще не врубались зачем это нужно. Да, выпустили ThunderXStation за $15k :) Вот такая в их понимании «доступная» система. У Ampere есть «всего» за $3800, что тоже является слишком большой ценой.

          10% рынка

          Напомню, что речь идёт о сотнях миллионов человек, а также об оптимизации под ARM опенсорс проектов, которыми пользуются все остальные.

            +4
            а где такую агитку скачать можно?
            0
            У Ampere есть «всего» за $3800

            у Apple будет дешевле? 3799?
              0
              У Apple будут макбуки на их процессоре. Думаете, самый дешёвый макбук будет $3799?
            +1
            P.P.S. Сам Apple ничего не изменит
            В целом переход на ARM уже давно оправдан, даже без apple. Но и они поменяют динамику, например в ближайшие пару лет на рынке ультрабуков они будут конкурировать 5нм ARMом против 7нм x86, это вообще разные категории энергоэффективности.
              +2
              Там проблема в том, по большому счёту, что ни у кого нет процессора на десктоп.
              Именно процессоры на десктоп есть, проблемы преимущественно с GPU, в основном из-за политики лицензирования Mali от ARM: драйверы поставлять можно только в бинарном виде, а производители SoC очень не спешат поддерживать что-либо, кроме своих ядер.

              К счастью, Amlogic движется в правильном направлении, сотрудничая с разработчиками основного ядра. Посмотрите: на плате ODROID C4 за $50 нормально работает и 3D-ускорение, и аппаратное декодирование видео (в т.ч. в браузере), и в игры можно играть.

              https://www.youtube.com/watch?v=4MfHMKcHaUc
                +2
                да, еще самсунги по слухам хотят себе радеоны лицензировать
                А там драйвера опенсорсные.
                Так что и на этом поле все устаканится со временем.
                А может даже будет лучше из-за такой обильной конкуренции.

                АРМ хорош хотя бы только тем, что игроков будет не 2, а 22.
                А это сильно меняет дело.
                  +2
                  Именно процессоры на десктоп есть, проблемы преимущественно с GPU

                  Процессоры для десктопа должны поддерживать PCIe слот, куда можно поставить любую видеокарту, как минимум.

                  Я привёл в пример дестопа 16-ядерный A72 — LX2160A, хотя этот процессор далеко не тянет на десктоп (и не предназначен для него).
                  Плата от SolidRun имеет:
                  4 x 10GbE SFP+ connectors and 1 x 1GbE RJ45 port. Other features include 3 x USB 3.0 and 3 x USB 2.0 port, PCIe x8 (open port), 4 x SATA, up to 64GB DDR4 memory (not included by default), eMMC, optional M.2, microSD, and GPIO header

                  Вы реально хотите сказать что Odroid — десктоп?

                  ODROID C4 за $50 нормально работает и 3D-ускорение

                  Одроид — просто игрушка.

                  Raspberry-PI 4 гораздо интереснее.
                  8ГБ памяти уже приемлемо.
                  4хA72 всё ещё на грани.
                  Есть UEFI+ACPI (с ограничениями).
                  rpi4-uefi.dev

                  Что даёт UEFI? Возможность загружать стандартные ОС:
                  blogs.vmware.com/vsphere/2019/10/esxi-on-arm-at-the-edge-on-the-smartnic-and-in-the-cloud.html
                  www.windowslatest.com/2020/02/09/heres-how-windows-10-runs-on-raspberry-pi-4-and-3

                    0
                    UEFI сейчас используется практически везде, в виде payload для u-boot. На части плат он установлен на SPI-флеш, что позволяет запустить, например, официальный ISO Ubuntu 20.04. Прямой загрузки ядра, без UEFI, почти не осталось на современных платах любого сегмента.
                      0
                      У меня только старые платы одроида с кастомным патченым ядром и uboot.
                      В любом случае полноценного (и доступного) десктопа на ARM нет и даже от Apple пока не предвидится. Я не готов выкладывать ~$4k за Ampere со старым процессором, разработанным ещё AMCC.
                  +1
                  Почему так получилось — неясно.

                  По той же причине, почему Itanium не взлетел, а AMD64 взлетел. Обычному пользователю нужна обратная совместимость — возможность полноценной работы с имеющимися у него программами. И ему плевать, какая там архитектура процессора.

                    +2
                    Ага, только речь не об обычных пользователях.

                    Речь о том, что разработчики, включая топов Redhat и других, «обивали пороги» ARM-оделов годами. Без успеха. Тот же Линус не переставал об этом повторять

                    www.realworldtech.com/forum/?threadid=183440&curpostid=183486

                    And the only way that changes is if you end up saying «look, you can deploy more cheaply on an ARM box, and here's the development box you can do your work on».
                    Actual hardware for developers is hugely important.


                    Как об стенку горох. Думаю, дело в менталитете. Эти конторы привыкли иметь дела с крупными заказчиками, для которых не составляет труда заказать рабочие станции за $15000 для своих штатных разработчиков.

                    То что можно продать 5000 плат по $1000 каким-то фанатам это для них даже не интересно и они реально не понимают зачем. Много мороки, работа в минус.

                    И ему плевать, какая там архитектура процессора.

                    Вот разработчикам как раз наплевать, а юзверям нет.
                  0
                  Давно пора, застой у Интел и отчасти АМД давно поднадоел, такое ощущение, что прогресс остановился.
                    0

                    Смотря в чем. Много серверных задач требуют может не такого огромного количества ядер, но зато реально мощных и быстрых, а ARM достаточно слаб в расчете на 1 ядро.


                    Так что всему своя ниша — там где речь идет о тысячах потоков, каждый из которых не критичен к микросекундам задержки — то очень даже ARM может прижиться.

                      +2

                      P.S. Если кто сомневается — говорю из личного опыта разработки сервисов критичных к микросекундным задержкам. В бою у нас используются пожирающие киловатты Xeon-ы с 36 ядрами на процессоре, и большую часть времени большая часть процессорных ядер крутит горячий спин-лок ожидая наступления того или иного события (например в виде UDP пакета на kernel bypass интерфейсе). Но вот когда некое событие наступило — нужно шпарить на максимальных оборотах, и никакой ARM тут пока не годится по скорости.


                      P.S. киловатты — речь идте о стойке серверной из нескольких таких товарищей.

                    +2
                    А пуркуа бы и не па? Чем выше конкуренция с x86 — тем лучше для потребителей.
                      +6
                      Палка о двух концах, писать софт под одну архитектуру проще, а оптимизировать — и подавно. Лично меня устраивает монополия х86, пока есть хотя бы два топовых вендора, которые двигают прогресс в конкуренции между собой.
                        –1
                        вы правда думаете, что оптимизировать под дикий зоопарк х86 процессоров чем-то проще?
                          0

                          ARM еще только "наступает", но там уже "зоопарк", так что спорно.

                            +3
                            Да, я правда так думаю, т. к. сам этим занимаюсь. Нет никакого дикого зоопарка. А зоопарк из х86 + ARM по определению несоизмеримо более дикий.
                              +1

                              Дикий зоопарк был лет так 25 назад, когда было с десяток производителей x86-совместимых процессоров, были несовместимые расширения команд и прочие особенности.

                            +3
                            Для конкуренции с х86 миру ARM не хватает в первую очередь нормальной поддержки софтом от производителей. Пока что среди производителей телефонных чипов ARM считается нормальным выпускать один кривой драйвер, под единственную (криво патченую производителем) версию ядра Линукс, ну или в лучшем случае поддерживать чип пару лет.
                            Производителю ARM для сервера и десктопа нужно сначала убедить пользователя, что его железо будет поддерживаться лет десять хотя бы.
                            +1
                            А как на арм вообще с теплом? Допустим базу данных со сложными выборками и обработками на малинке 4х ядерной запускаешь и по факту одноядерный атом быстрее, на том же смартфоне в игры начинаешь играть, он раскаляется, все эти гигагерцы АРМ можно на 4 делить, чтобы сравнить с x86, вероятно тут все дело в оптимизации софта, просто на малинке пытался сервер поднять и запустить сайт интернет-магазина ну чтобы локальный dev-сервак сделать, но я не смог дождаться генерации страницы, она вместо 20 мс генерировалась за 20 секунд…
                            И если это так, то получается что x86 эффективнее и дешевле АРМ. Может кто прояснит?
                              0

                              По поводу тепла: есть у меня нетбук на атоме с пассивным охлаждением. При примерно одинаковых задачах, он греется существенно больше, чем смартфон.
                              По поводу сервера, вы сравниваете то, что сравнивать очень сложно. Кроме процессора, может быть ещё много узких мест. Например, скорость работы накопителя.

                                +2
                                Например, скорость работы накопителя.
                                Почти наверняка. Я как-то поставил Windows 10 на SD-карту (в сети есть скрипты).

                                И сразу понял, почему Microsoft разрешает это делать только на специальные Windows To Go накопители.

                                Во-первых нажатие на любую кнопку — 5-10-20 секунд реакции. Во-вторых — 100% загрузка SD-карты в покое.

                                То есть Windows фоновыми процессами, до того, как вообще хоть одна программа была запущена, выжрала ресурсы SD-карты полностью.

                                И вы вот на этом собрались пускать типичную поделку говноделкининых «1000 запросов в базу на каждую страницу»?
                                  0
                                  да уже лет 7 как винда способна выжирать весь IO лимит HDD диска на фоновые задачи, кажется это популяризовало SSD быстрее чем что-либо остальное.
                                0
                                И если это так, то получается что x86 эффективнее и дешевле АРМ. Может кто прояснит?
                                1. Закрываем глаза.
                                2. Затыкаем уши.
                                3. Высасываем результат из пальца.


                                Работает отлично и показывает то, что вам хочется показать.

                                Допустим базу данных со сложными выборками и обработками на малинке 4х ядерной запускаешь и по факту одноядерный атом быстрее
                                Какой именно атом, какое охлаждение на малинке? А то, знаете ли, C2550 — тоже Atom, но у него тепловой бюджет на одно ядро больше, чем 4 ядра у RPi4.

                                на том же смартфоне в игры начинаешь играть, он раскаляется
                                А вы пробовали любой x86 процессор (да даже тот же Atom) использовать без активного охлаждения и с радиатором размером в почтовую марку? Попробуйте.

                                просто на малинке пытался сервер поднять и запустить сайт интернет-магазина ну чтобы локальный dev-сервак сделать, но я не смог дождаться генерации страницы, она вместо 20 мс генерировалась за 20 секунд…
                                Прекрасно просто. И вместо того, чтобы разобраться — чего там вашему серверу не хватило (памяти или может SD-карта вместо SSD, которая медленнее на два, а то и на три порядка «выстрелила»)… сразу вывод.

                                Ну да, думать же, не надо, мерить ничего не надо, комменты на Хабре строчить надо.
                                0

                                Я думаю для десктопа в частности для браузера много слабых ядер это даже хорошо. Сайты сейчас очень cpu нагружают

                                  0
                                  Почему от Cavium ThunderX в очень короткий срок отказались, по меньшей мере, Scaleway и Packet.com? Никто не мотивирует своё решение, Scaleway даже нормальный анонс не сделали, просто убрали возможность заказа серверов, после многих лет, и всё.

                                  Моё предположение — в серверах есть неустранимые аппаратные уязвимости.
                                    +1
                                    крайне маловероятно. скорее просто поставщики загнули цены или просто прекратили их продавать. ну или же производительность на 1$ их оказалась ниже традиционных x86-серверов
                                    +1
                                    Пока не будет философии Arm-совместимого железа по аналогии с x86 (ibm-pc совместимый) эпоха Arm на десктопе не наступит никогда.
                                      +2
                                      А вот какое арм-совместимое железо нужно среднему пользователю? Ну вот даже не среднему, а программисту. Я в последнее время понимаю, что мне для комфортной работы нужен только текстовый редактор и браузер. А из переферии клавиатура с мышь.
                                        0
                                        о какой философии идет речь? эпоха arm на десктопе уже наступает из-за действий apple

                                        не смотря на то, что arm будет на десктопах с mac os, это означает, что много софта, который по каким-то причинам имел проблемы с arm, начнет работать с ним.
                                        не забываем и про порты (ports/brew), которые по большей части GNU-шный софт. т.е. с переходом мака на арм, появится много патчей для GNU-шного софта, связанного с исправлением проблем и оптимизацией производительности

                                        а поскольку разработка BE ведется для запуска на линуксе, разработчики с mac os будут ставить линукс в виртуалку (косвенно через докер или явным образом), отсюда будет и линукс под арм развиваться быстрее

                                        кому-то и винда понадобится на маке с армом, тут правда легальног способа нет купить её под arm, ну будут пирать оем-дистр по началу, потом может MS и начнет продавать

                                        я уверен, что в течение года будет значительно движуха вокруг ARM из-за apple
                                          +1
                                          я уверен, что в течение года будет значительно движуха вокруг ARM из-за apple
                                          Движуха будет точно, но вот кто будет куда двигаться — то ли софт на ARM, то ли разработчики с маков на другие платформы… пока неясно.

                                          То есть понятно, что оба процесса будут наблюдаться… но какой будет доминировать?

                                      Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                                      Самое читаемое