company_banner

Компания Ampere анонсировала 128-ядерный ARM-процессор Altra Max



    Несколько месяцев назад калифорнийская компания Ampere представила первый в отрасли 80-ядерный ARM-процессор Ampere Altra. Этот чип на 64-битной архитектуре предназначен для установки в серверное оборудование, он не для потребительского рынка. Сейчас же компания расширила линейку процессоров, дополнив ее 128-ядерной моделью.

    Altra Max совместим с другими моделями Altra и могут устанавливаться в серверы, где уже стоят процессоры компании той же линейки. Вся она базируется на дизайне ARM Neoverse N1, он же лежит в основе процессоров AWS Graviton2 от AWS. Компания Ampere заявила, что новые процессоры позволят повысить производительность оборудования, в чем заинтересованы поставщики облачных услуг.

    Что касается характеристик, то новинка оснащена 128 физическими ядрами (без технологии многопоточности). Кэш L1 для инструкций и данных — 64 Кбайт, L2 — 1 МБ, L3 — 32 МБ для каждого из ядер. Тактовая частота ядер — 3.0 ГГц.



    Поддерживается восьмиканальная оперативная память ECC DDR4-3200, максимальный объем ОЗУ — 4 ТБ. Также поддерживается 128-линейный интерфейс PCI Express 4. Если установить два процессора на одну материнскую плату, то количество поддерживаемых линий составит 192. Известно, что 32 линии в этом случае используются для обмена данными между сокетами. Весь модельный ряд Altra производится по 7-нм техпроцессу от TSMC.

    В зависимости от модели энергопотребление чипов составляет от 45 до 250 Вт. У 80-ядерного Ampere Altra показатель TDP — 210 Вт.



    Разработчики предлагают использовать процессор для серверных приложений, включая аналитику данных, нейросети, базы данных, пограничные вычисления и облачные приложения. Специально для нужд машинного обучения Ampere реализовала на аппаратном уровне поддержку форматов данных FP16 (числа половинной точности) и INT8 (однобайтное представление целого числа). Предусмотрено аппаратное ускорение хэширования AES и SHA-256.


    Бенчмарк для 80-ядерного ARM процессора Ampere Altra

    По словам производителей, серверные ARM-процессоры эффективнее X86, во многом благодаря пониженному энергопотреблению. Поэтому можно повысить плотность размещения оборудования c этими процессорами в ЦОД, одновременно улучшив показатели удельной производительности, энергопотребления и тепловыделения.

    Сейчас в линейку Altra входит 12 процессоров, в продажу уже поступили процессоры с количеством ядер от 32 до 80, частотами от 1,7 до 3,3 ГГц и теплопакетами от 45 до 250 Ватт. Цены пока не озвучены.

    Известно, что новинкой заинтересовалось несколько партнеров, включая Gigabyte, Wiwynn, Cloudflare, Genymobile, NVIDIA, Equinix и менее крупные компании. Массовое производство новых процессоров начнется в 2021 году, так что и начало продаж можно ожидать примерно в это же время.

    «Компания Cloudflare крайне заинтересована в процессоре Ampere и его инновационной архитектуре. Мы приятно удивлены результатами предварительных тестов производительности. Рады возможности поработать с Ampere Altra Max со 128 ядрами и с нетерпением ждем процессор для тестов», — заявили в Cloudflare.

    Одновременно Ampere начала освоение 5-нм техпроцесса, именно эта технология будет использоваться при создании серверных процессоров следующего поколения. Они уже получили название Siryn и будут представлены через пару лет, ориентировочно в 2022 году. Насколько известно, они будут поддерживать PCI Express 5.0 и DDR5.



    Кроме процессоров, компания поставляет и платформы для них. Платформы доступны двух типов: первая — однопроцессорная Mt. Snow, вторая — двухпроцессорная Mt. Jade.

    А здесь можно почитать о том, как мы распаковывали, устанавливали и тестировали сервер с архитектурой arm64 — TaiShan 2280v2.
    Selectel
    ИТ-инфраструктура для бизнеса

    Комментарии 66

      0
      не дальновидно называть продукт «Max». потом будет super, giga?
        +1

        Ultra, Epic, ...?

        +3
        Да, нерядовой маркетинг — название компании также намекает на высокое потребление процессорами энергии, а не на высокую производительность.
          +6

          Это может быть имя. Сначала Макс, потом Сэм, Джон, Иннокентий…
          Семейство процессоров-то называется Ампер.

            +8
            Макс Ампер — это звучное имя. Для процессора.
              +4

              Хм, а если следующее семейство назовут Ом? А конкретный процессор Мин? Это будет звучно? :)

                0
                Деление на ноль. Сверхпроводник.
            +1
            в одной армии салдатам на увольнение раздавали презервативы, все брали стандартный и большой, и никто не захотел брать маленький. тогда руководство переименовало размеры в нормальный, большой и гигантский, в результате все солдаты начали брать свой размер.
            0
            SuperPlusTurboMax
            +8
            По словам производителей, серверные ARM-процессоры эффективнее X86, во многом благодаря пониженному энергопотреблению.

            Неее, посоны, маркетинговый буллщит здесь не сработает. Relative performance это конечно круто, как и "на 63% быстрее Intel Xeon", но только вот мы, технические задроты, любим абсолютные цифры, а там мы уже сами решим че круче.


            На их же бенчмарке они сравнили процессор с TDP 210 Вт с процессором с TDP 150 Вт, где получили преимущество с разницей в разницу между TDP, при в два раза меньшем техпроцессе.


            В итоге стойка от Интела будет при той же самой производительности жрать меньше чем стойка с Ampere Altra, и это с процессором по старому техпроцессу годичной давности.


            О том что серверы работают не с бенчмарками, а с реальным ПО которое будет работать медленнее by design — опустим.


            Хотелось бы видеть РЕАЛЬНЫЕ тесты реального ПО, с попугаями на ватт и попугаями на доллар.

              +1
              В прошлом году мы сравнивали для внутренних нужд ARM и х86
              — Huawei TaiShan 2280 V2 (2 x Kunpeng 920-4826 2.6GHz)
              — DELL PowerEdge R440 (2 x Intel Xeon Gold 6130 2.10GHz)

              Конечно тут не тот же самый процессор. Но картина думаю похожа. Могу привести выдержки:

              1. Результаты тестирования включением в продакшен кластер RELK
              На реальных задачах в кластере ElasticSearch сервер Huawei (ARM) показывает равную производительность с сервером Dell (x86) на процессоре Intel Xeon Gold 6130. Не смотрят на то, что Huawei работает на 10Тб HDD, а DELL – на SSD.

              2. Результаты синтетического теста на параллельную запись в ElasticSearch
              Сервер Huawei (ARM) на 20-30% более производителен чем Dell (x86) при параллельной записи, несмотря на то что Huawei на HDD, а Dell на SSD.

              3. Результаты теста на энерго-эффективность с использованием stress-ng
              В представленной на тест конфигурации сервер Huawei (ARM) примерно на 30% менее энергоэффективен чем Dell (x86).

                0

                Ну в принципе корелляция подчиняется и арифметике и физике. Напоминает автомобильные гонки где Петя радуется тому что сделал Васю, скромно умолчав что у него новый Chery с 3.5л, а у Васи старший Лексус 1.5л, и трек ему обошелся в 10 литров, а Васе в 5.


                Может появление ARM на этом рынке и к лучшему: многим людям хочется ДЕДИК, и подешевле, а эти 30% разницы в скорости на своем Вордпрессе они и не заметят. Главное чтобы цена была ощутимо дешевле аналогов.

                  0
                  Дедик под вордпресс о 128 ядрах? O_o
              +7

              Если там все те же 0.8V на ядре, то модель на 250W можно назвать 312 Ampere.

                0
                Производительность интелл начинает деградировать когда переходит порог пол сотни потоков, потому что там аппаратно 48 потока.
                У АМД аппаратно 128 потока, деградация заметна на числах больше 128.
                Ампер держит 160 потоков на 80 ядер без деградации производительности?
                Это как, это что за магия? Создаются фантомные ядра? Арм вроде не имеет гипертрединга.
                А дальше, что как будет вести себя система, когда потоков будет в 2.5 — 3 раза больше чем ядер? Дальше можно фантазировать. Появится еще 80 фонтомных ядер, или произойдет полный локдаун системы.
                В принципе, это — интрига, когда график останавливается перед очередным порогом.
                В общем эта статья свидетельствует, что за дело, взялись профессиональные маркетологи, которые легко проходят границы, от таких приемов маркетинга, как акцентировать, умолчать, до полного введения в заблуждение.
                  0
                  На графике 160 cores, видио тестировали на двухпроцессорной машинке. Но графики забавные, сравнивают ядра с потоками. Для Ампер он останавливается на 160, а для остальных продолжается за границы физических ядер.
                    0
                    На всех графиках — двухпроцессорные машины. На ampere имеем 160 ядер/потоков, на АМД 128 ядер/256 потоков. Интел 48/96. Всё максимально прозрачно. Тот же Aмазон продаёт VCPU, поэтому поток ARM против x86 — это честное сравнение, для платформы предназначенной для гиперскейлов.
                      0
                      Интел 48/96.
                      То есть по графику, интел даже на физических ядрах не может поддержать прирост производительности равномерный (график начинает задолго до 40 отклоняться), тогда как амд с их чиплетами и неравномерным доступом к кешам — ровно до физических?
                      И при этом графики ничего не говорят о реальном соотношении производительности разных систем? Ну то есть про то, что даже 160 потоков на 160 ядрах арма непонятно как относятся к 96 ядрам на 48 потоках? Может они при этом по всем тестам в два раза отстают. Незавсимо от масштабирования производительности на количества ядер.

                      Отличные графики ни о чём.
                        0
                        график начинает задолго до 40 отклоняться

                        Чему можно найти объяснения:
                        1) Падение частоты при задействовании всех ядер.
                        2) Упор в ПСП

                        ark.intel.com/content/www/us/en/ark/products/120502/intel-xeon-platinum-8160m-processor-33m-cache-2-10-ghz.html

                        Maximum Memory Speed 2666 MHz
                        Max # of Memory Channels 6

                        У Ampere и AMD 8 каналов x 3200, т.е. ПСП на 60% выше.

                        Дальнейшее падение уже из-за SMT.

                        тогда как амд с их чиплетами и неравномерным доступом к кешам — ровно до физических?

                        Если не гонять данные между чиплетами, то равномерным.
                        Не знаю что именно они там тестировали, но нагрузка именно такая — куча независимых потоков.

                        Отличные графики ни о чём.

                        Графики понятно о чём — о масштабируемости.
                        Считайте что N1 это 50-60% от Zen2
                          0
                          Ну то есть тесты непонятно чего с непонятно каким профитом.
                          Графики понятно о чём — о масштабируемости.
                          Без производительности — это абстрактный график, который должен доказать… ничего.
                          Если 512 ядер хорошо масштабируются, но в сумме работают на 2 ядра интела, то смысла в этом…
                          Считайте что N1 это 50-60% от Zen2
                          Чтоб так считать, нужны цифры. А то может оказаться, что 50-60% в тестах, где не только лишь все, а такие прикольные графики с масштабированием получились у них на частотах 1,7, а не 3,3 и там производительность ядра 30% от зен2, ибо маркетинг.
                            0
                            Чтоб так считать, нужны цифры.

                            По Graviton2 есть масса тестов. Собственно это цифры его.
                            Там точно-такое же ядро и обвязка похожа, но в случае Ampere,
                            80 ядер вместо 64 и частота выше на 40%.
                              0
                              Угу, а здесь у нас только
                              and whipped out this chart that showed the scalability of these respective server platforms mentioned above running the Stress-ng load generator.

                              И, кстати, глядя на заявленные ТДП, очень интересно, что переход от 2,6 Ггц к 2,8 Ггц привело к повышению ТДП на 25 Ватт. 2,8 до 3,0 — 35 Ватт. 3,0 до 3,3 — 40 Ватт.
                              По Graviton2 есть масса тестов. Собственно это цифры его.
                              Я видел те тесты, поэтому хотел бы отметить, что в тех тестах сравнивают не зен2, а конкретный заказной чип АМД, без указания характеристик (поиск выдал, что они не максимальные), не говоря уже о том, что в конкретном девайсе его могли ограничить с целью понижения потребления, например. Это не тест производительности АМД, а тест получаемых пользователем машин.
                                0
                                Зависимость потребления от частоты — нелинейная.

                                в тех тестах сравнивают не зен2, а конкретный заказной чип АМД
                                Zen2 это не CPU, а микроархитектура. Точно так же как и N1.

                                в конкретном девайсе его могли ограничить с целью понижения потребления, например.

                                Верно, поэтому для «облаков» не берут самые топовые чипы.
                                Тем более важно сравнить с оптимальным по perf/watt решением.
                                  0
                                  Зависимость потребления от частоты — нелинейная.
                                  Это я знаю, поэтому и повторяю тезис, про то, что реальных тестов нет. Только как параллелиться утилита да стресстестов на разных архитектурах…
                                  Zen2 это не CPU, а микроархитектура. Точно так же как и N1.
                                  Только ещё хуже: zen2 это реализуемый одной компанией архитектура. А тут разные компании, поэтому могли получить разный результат.
                                  Тем более важно сравнить с оптимальным по perf/watt решением.
                                  А он может быть и не оптимальным.
                                  Это то решение, которое выбрал облачный провайдер — а там решать может не perf/watt, а perf/$.
                                  Даже у этого вот разбежка от 2.6 до 3.3, а против гравитейшена 2 (с какими параметрами?) какой АМД был? а хз, не было данных.
                    0
                    Я думаю что это может быть завязано на реализации транспорта между ядрами. Кольцевая шина против инфинити фабрики и тд
                      0
                      Мне ещё интересно, как на самом деле там дела с конкурентным доступом к памяти. 8 каналов это хорошо, но вот что будет, когда ядра полезут по памяти так, что burstы нормально формироваться перестанут.
                      0
                      На арме бывает SMT, ещё с 2018 года:
                      www.arm.com/products/silicon-ip-cpu/cortex-a/cortex-a65ae

                      Вон в фичах — Simultaneous Multithreading, 2 треда в парраллели.
                        0
                        Как я понял, все эти ARM ядра — однопоточные. Те самые «фантомные» ядра у Intel и AMD как раз и являются причиной деградации, нельзя просто запустить 2 потока на одном ядре и думать, что производительность вырастет в 2 раза, это так не работает.
                        0

                        График "Бенчмарк для 80-ядерного ARM процессора Ampere Altra" вызывает много вопросов:


                        1. Почему подписи под графиками отличаются? У ARM написано "cores", у x86 — "threads". Они могут увеличивать cores на ARM динамически?
                        2. Если число потоков превышает число ядер — то дальнейший рост должен прекратиться. Более того, должно начаться падение и деградация, т.к. потоки будут лишь мешать друг другу. На графиках мы видим продолжающийся рост, хоть и более замедленный.
                        3. Почему для ARM не продолжили кривую? Надо было по аналогии с AMD — продолжить до 250, ну или хотя бы до 1000. Ведь там больше ядер, чем у AMD, не так ли?

                        Выглядит, как неумелые маркетинговые картиночки.

                          0
                          У ARM написано «cores», у x86 — «threads».

                          Потому что у ядер N1 нет SMT.

                          Если число потоков превышает число ядер — то дальнейший рост должен прекратиться.

                          Оно не превышает — графики для двухсокетных систем.
                          2*80 ядер Altra (160 cores)
                          2*64 ядер Epyc (256 threads)
                          Ну и кстати бывают задачи, которые можно ускорить поставив количество потоков больше числа ядер.
                          Например www.7-cpu.com

                          +1
                          О, здорово, в chome можно будет больше 2х вкладок открыть
                            0

                            По делам моей компании я пробовал купить Mt. Jade Two Socket Rack Server (2x 80 ядер) у компании Ampere, но мне это не удалось. На мои вопросы о сроках, о поставках и о диллере головной офис компании не ответил совсем до сих пор (4 месяца уже будет). Все эти теоретические успехи прекрасны, но по факту в продаже же нет ничего.

                              0
                              Напишите в твиттер :D
                              @jwittich — это их SVP of Products
                                0

                                Спасибо за контакт, напишу обязательно. Но увы, сама покупка не актуальна уже, мы в апреле-мае купили сервер от их конкурентов на базе ThunderX2 2x 32 cores.

                            0
                            TDP 250W на ARM. Приплыли.
                              0
                              В том то и дело. И это же 7 нм, и частоты не заоблачные. Видимо, дедушке кремнию действительно пора подыскивать замену.
                                0
                                А в чём ваше удивление? Любых процессоров можно напихать в чип под любой TDP.
                                Представляете, сколько их влезет на Cerebras Wafer Scale Engine?
                                  0
                                  Всего 128 более простых ядер, выполненных по современному техпроцессу, на относительно низких частотах, и опять 250 Вт. Перспектива где?
                                    0
                                    <2W на ядро? Это очень мало. Например в Epyc ядра потребляют половину энергии, остальное уходит на uncore, ЕМНИП.

                                    Напихали ядер, чтобы при этом они влезли на кристалл и в приемлемый теплопакет,
                                    В итоге «плотность вычислений» увеличивается.
                                    Перспектива в том, что на ARM производительность пока растёт быстрее чем росла на x86.
                                    Интел/АМД делают высокочастотные дизайны на high-perf техпроцессах, но в серверах они не имеют выигрыша по частоте. Наоборот, ARM уже выигрывает по частоте и количеству ядер благодаря более лучшей энергоэффективности и high-density техпроцессу.

                                    на относительно низких частотах,
                                    Базовую частоту 7742 напомнить? Она составляет 2.25ГГц.
                                      0
                                      2 Вт/ядро это неплохо, но и не удивительно, есть двухваттные интел, да и обычный кристалл при лёгком снижении напряжения и частоты может умерить аппетит на порядок.
                                      Речь о новой архитектуре, о долгих ожиданиях ARM в серверном/суперкомпьютерном сегментах. Свершилось, но чудо ли? Энергоэффективность архитектуры незначительно отличается от старшей и более сложной, выигрыша хотя бы на порядок по количеству ядер не предвидится.
                                        0
                                        выигрыша хотя бы на порядок по количеству ядер не предвидится.

                                        Можно и 7 шапок(с)
                                        Крайне легко сделать в 10 раз больше ядер ценой низкой однопоточной производительности.
                                        А вот сделать в 2 раза больше ядер и как минимум догнать по однопотоку — не легко.
                                        Для линейки Neoverse ARM ориентировался на 128-256 ядер на кристалле.
                                        В то время как будущий Интел IceLake будет иметь до 38 ядер вместо 28 сейчас.
                                          0
                                          Это понятно. Понятно также, что x86 это проприетарщина без перспектив стать доступной для сторонних производителей. Просто казалось, что ARM нацелен убить двух зайцев. Может у меня были завышенные ожидания по отношению к ARM в производительном сегменте.
                                            0
                                            Быстрые серверные ядра от ARM(конторы) — Zeus будут реализованы только в следующем году. Также, возможно уже в этом году будут Cortex-A78/X1. Пока непонятно как они выступят.

                                            Просто казалось, что ARM нацелен убить двух зайцев.

                                            ARM (архитектура) разработана с учётом предыдущих ошибок, поэтому она хорошо ложится на ОоО железо. Apple в конце года покажет state-of-art проц для ноутов.
                                              0
                                              Подождём, посмотрим. Спасибо за информацию.
                                        0
                                        Базовую частоту 7742 напомнить? Она составляет 2.25ГГц.
                                        Ну а базовая Threadripper 3990X 2,9Ггц, угадайте почему?

                                        Только они при этом имеют возможность и апаться до 4,3 на ядро при необходимости.

                                        Ну и напомнить кэш 7742? 292 Мб? (4+32+256), тут у нас сколько (64кб, 1 мб)*80 + 32 Мб? Это же бесплатно? Не греет проц, не жрёт ватты…
                                        Пока я вижу, что в каких-то задачах они могут быть интереснее. Внимание вопрос: не будет ли ещё интереснее в этих задачах ГПУ-ускорители?
                                        А общие задачи — они про комплекс решений, а не про прирост в стресс-тесте.
                                        При этом Роме — уже работают, полгода как у потребителей стоят и сейчас доля на серверном рынке двух её поколений уже процентов 10 (8 было на конец 19 года), это не просто анонсированы и пока не показаны решения.
                                        А к моменту показа в реальности 128 ядерных армов рукой дотянуть до выхода zen3 (ибо на 3-4 квартал назначено), где вроде как уже по 8 ядер на модуль и 32+ мб кеша L3 на эти 8 ядер.

                                        Пока АРМ теоретически выигрывает — АМД делает это в реале.
                                          0
                                          угадайте почему?

                                          TDP 280W

                                          Только они при этом имеют возможность и апаться до 4,3 на ядро при необходимости.

                                          При скольки рабочий ядрах?
                                          Таких частот я даже на 3950X не вижу. Не, он конечно в однопотоке до 4.8 раскочегаривается, но в нормальной ситуации (нагрузка на все ядра) там около 4ГГц.
                                          А ещё у TR всего 4 канала памяти — как бы он не слил Altra в memory-bound задачах, несмотря на кэш. У Интелов вообще кэша кот наплакал, тем не менее они более-менее справляются с AMD.

                                          Это же бесплатно? Не греет проц, не жрёт ватты…

                                          Я про это писал выше. (hint: uncore)

                                          Внимание вопрос: не будет ли ещё интереснее в этих задачах ГПУ-ускорители?

                                          Конкретно эти ядра плохо подходят для вычислений.
                                          Но Ampere прекрасно работает с ускорителями Nvidia =)

                                          Если же смотреть в целом, GPU, не считая дополнительных усилий, требований к квалификации программистов — это лишние копирования данных, хрупкость GPU-шного кода (glass-jaws), латентность. Поэтому Fugaku, как и его предшественник, чисто процессорный.
                                          GPU хорош для рекордов линпака и нейросетей, а остальные задачи так себе.
                                            0
                                            У Интелов вообще кэша кот наплакал, тем не менее они более-менее справляются с AMD.
                                            В однопотоке? Так-то нифига не справляется. На задачах под многопоток даже 10900K до 3950 не дотягивает (очень показательными были задачи стриминга игры). И это при диком ТДП.
                                            А в реальных расчётных многопотоках интел на данный момент не конкурент, особенно если учитывать стоимость проца и платформы, ТДП и производительность скопом.
                                            При скольки рабочий ядрах?
                                            Так универсальность же — многопоток на меньших (в зависимости от охлаждения проца и цепей питания), малопоток — на больших частотах. У АРМов же этих пока вижу варианты — фигарим на базовой максимум. Или 1-4 ядра для слабых задачек, 4 для сложных у смартфонных. А вот аналогов последних ноутных апушек от интела (на 10нм) или амд — на арме и близко не видел.
                                            Таких частот я даже на 3950X не вижу. Не, он конечно в однопотоке до 4.8 раскочегаривается, но в нормальной ситуации (нагрузка на все ядра) там около 4ГГц.
                                            Базовая 3500 МГц. Не, ну неплохо. Попробуйте даунвольтнуть проц, он будет греться меньше и возможно чуть выше частоты возьмет на всё. Плюс надо следить, что подсистема питания не перегревается — она тоже сейчас тротлить умеет.
                                            А ещё у TR всего 4 канала памяти — как бы он не слил Altra в memory-bound задачах, несмотря на кэш.
                                            Ну так ля этого и нужны тесты нормальные. Вот только у АМД это уже оттестированные реальные продукты, подчеркну. А куются ежедневно новые улучшения, и простора для маневров у них ещё много. В этом плане амазон ещё может для себя создавать, чтоб интел и амд подстегивать, ибо для себя делает и применение найдёт. А вот сторонним нужно предложить во-первых, выгодное, а во-вторых, перспективное в долгую (смысл перехода на новую платформу, если завтра она не будет иметь продолжения). АМД доказала вторым поколением серверных процов, что как игрок серьезно пришла на этот рынок, в течении полугода будет третье и вновь без конкуренции особой со стороны интела. Но даже при этом из-за инерции рынка у интела доля доминирующая просто.
                                              0
                                              В однопотоке?

                                              Да, и TigerLake уже сильно быстрее. Правда про серверные процессоры на нём даже не говорят.

                                              У АРМов же этих пока вижу варианты — фигарим на базовой максимум.

                                              Нет. У Ampere «sustained turbo» 3,3, базовая 3.
                                              ThunderX3 турбо 3, база — 2.2 (при максимальной нагрузке на FPU).

                                              А вот аналогов последних ноутных апушек от интела (на 10нм) или амд — на арме и близко не видел.

                                              Будет через полгода.

                                              Попробуйте даунвольтнуть проц, он будет греться меньше

                                              Рисковать стабильностью? Нафиг — нафиг. Я же его не в руках держу. Шуршит себе тихонько и ладно.
                                                +1
                                                Да, и TigerLake уже сильно быстрее.
                                                Только его — нет. Пара калек в ноутах. Тот же косяк — не собирается у них чипы с большими частотами, большим количеством ядер на этой архитектуре и этими нанометрами. Уже который год переварить свои инновации не могут. А вместо ушедшего Келлера наняли ещё кучу индусов, так что, видимо, совещания по мелким вопросам там так и будут собирать полусотни человек и не решать задачи дальше. К сожалению, если Интел не взбодрится, оптимизировав ненужную жировую прослойку из манагеров, то ждать от них многого не приходится.
                                                Будет через полгода.
                                                Угу. Будут. А у амд вон, уже новые интелриперы выходят, через неделю где-то. 3995WX PRO по слухам 64 ядра, восьмиканальный контроллер памяти, до 2 ТБ ОЗУ. Фотки уже есть, производство идёт, пока только характеристики не известны точно.
                                                Апушки 4750G уже 8 ядер на одном кристалле, хотя и зен2 ещё. По тестам они уже лучше, чем 3 серия без видиков. Плюс на матерях с 550 чипсетом эти апушки с ддр4-5600 уже запускались людьми — то есть и контроллер они подшаманили.
                                                Рисковать стабильностью? Нафиг — нафиг. Я же его не в руках держу. Шуршит себе тихонько и ладно.
                                                Там надо не сильно, на 0,05 что ли или вообще на 0,01. Наоборот, у многих как раз замечено, что процессоры начинают работать лучше, ибо авторазгон пока агрессивно с напряжением работает (скорее, даже не агрессивно, а исходя из усреднённых показателей первых серий процессоров, а чем позже выпущен процессор, тем качественнее кристаллы, обычно), а уменьшение напряжение ведёт к падению температуры ядра, на которую авторазгон и реагирует по сути, а значит в рамках того же теплового пакета — будут доступны больше частоты)
                                                  0
                                                  Угу. Будут. А у амд вон, уже новые интелриперы выходят, через неделю где-то.

                                                  Вы так говорите как будто они каждую неделю выходят. Есть цикл разработки продукта и он не обязан совпадать у разных компаний.
                                                  Релиз принципиально новой платформы это совершенно не то же самое что выпустить железку с подкрученными характеристиками, пусть даже и на новом сокете. Им даже не нужны новые кристаллы. 8 каналов и так есть на TR IOD (он от Rome).
                                                    0
                                                    У АМД — каждый год пока, чётко. Планы расписаны и в общем виде доступны всем, с точностью в пределах квартала.

                                                    Тут же получается, что рассказать — рассказали, а показать и дать — не дали (АМД когда представляет, означает, что товар уже в пути). И сравнивают с, по-сути, уже старым поколением. Но к тому моменту как что-либо в реале будет, у других УЖЕ новое выходит по графику. И будет реально когда-нибудь пока не равно, что будет в ближайшее время доступно. А когда? Если смотреть по АМД — то даже готовые процессоры ещё полгода не были доступны как готовые решения на серверном рынке из-за его инерции (отвыкли все делать серверы не на интеле). Сколько до возможности любому купить этот арм пройдёт? Когда он устареет и уже не будет оправдывать первоначальные графики по сравнению с конкурентами? В этом плане сравнение хорошо уровня «здесь и сейчас уже доступно». При этом, не забудьте, что амд ещё где-то через год или чуть дольше обновится однозначно, их положение сейчас устойчиво и перспективно. Это не стартап с красивыми графиками. Это фирма, которая за три года долю с фактически нуля до 10% нарастила планомерно конкретно в серверном бизнесе. Которая подрядилась строить не один супер.

                                                    Вот, гравитейшен2 уже доступен хотя бы для использования. А когда будет гравитейшен3? А когда амазону вздумается, потому что вполне вероятно, что ему и сейчас нигде не жмёт, а рынку был придан волшебный пендель и так. Может завтра, а может через два года…

                                                    В общем, пока всё это из разряда, что вот-вот выйдет убийца теслы со стороны кажется. Или что электромобили вот-вот убьют бензиновые.
                                                      0
                                                      Сколько до возможности любому купить этот арм пройдёт?

                                                      Я говорил про Apple, если что. У них, как правило, в день анонса можно заказать.
                                                      Больше никто вроде не собирается выпускать ARM аналоги «последних ноутных апушек».
                                                        0
                                                        В цитате были только тредрипер новые, поэтому я в ту сторону и продолжил думать.
                                                        Пока у апл можно заказать тестовый. Пока по тестам он так себе и на высокий сегмент не претендует.
                                                        В общем пока везде армы в будущем. При учёте, если прочие будут стоять — будущее есть. А если нет, тогда нужно бежать в два раза быстрее, чтоб хотя бы догнать и продолжить участвовать в гонке. Я вижу возможности повлиять на рынок только у эпла и амазона, но нужно ли это в реальности прям сейчас второму — для меня вопрос (ему важнее не что крутится, а доля рынка решения на этом), способен ли эпл в конкуренцию вот прям щаз за высокий сегмент (за два года полностью отказаться от интела -а это и про версии буков, и их системник с ксенонами заменить надо) — не уверен, второго Джобса для стимуляции — у них нет, пока новые решения их по мне равномерное движение показывают, по накатанной. А тут нужно рывок делать и эволюцию.

                                                        А прочие могут выкатить нишевые решения и на рынок не повлияют… Хотя возможны интересные поглощения.
                                                        Ладно, что-то у меня уже совсем философия пошла)
                                    0
                                    Номинальный TDP вообще никакой роли не играет. В реальности важен лишь показатель удельной производительности FLOPS/Вт. Это же камни для стационарных систем, а не для планшетов каких-нибудь.
                                      +1
                                      это как посмотреть, не играет. С одной стороны, туда надо запихать эти 250вт (т.е. чуть ли не 300А), с другой — потом их оттуда куда-то деть. А это все цена матери и системы охлаждения
                                        0
                                        В реальности мне надо знать, сколько у меня в ДЦ будет жрать стойка, чтобы понять, сколько ей надо дать питания и сколько с неё удалять тепла. А эта цифра весьма так зависит от того, сколько там жрут сервера.
                                          0
                                          Ваш комментарий подкрепляет мои слова: есть ЦОД и есть кабель, с которого энергетик разрешает снять 100кВт. Я постараюсь утилизировать эти 100кВт так, чтобы получить максимум FLOPS (или любой другой полезной работы). Меня не интересует то, что другой процессор потребляет на 10% меньше энергии. Для меня важно то, что он при этом делает на 20% меньше работы. Будет он жрать 180Вт или 250Вт, ничего не изменится, решение не принимается от номинала TDP, это бессмысленно.
                                            0
                                            Решение принимается по лимиту мощности потребления/мощности холода, которое на стойку выделено. Если я буду отталкиваться только от того, сколько мне киловатт с луча приходит — я получу дико фиговый ДЦ, КПД которого вполне себе сделает его нерентабельным. И при постановке вашего железа в ДЦ у вас либо спросят «а какая у вас тама мощность всех БП» или в лучшем случае «а сколько оно жрёт при 100% загрузке» и уже от этой цифры будут плясать с размещением вашего сервера, ибо если кидать как попало, то половина зала будет перегреваться, а в другой можно будет вино в стойках охлаждать не снимая фальшпола. И как ДЦ меня при этом совершенно не заботит, сколько попугаев у вашего железа, я вам хоть обогреватель с управлением по ethernet поставлю в свой ДЦ, платите за колокейшен и всё.
                                              0
                                              Если я буду отталкиваться только от того, сколько мне киловатт с луча приходит — я получу дико фиговый ДЦ, КПД которого вполне себе сделает его нерентабельным.

                                              Каким образом, по вашему, тут может снизиться КПД? Подход, что я описал выше, как раз и даёт максимальный КПД, т.е. максимум работы-на-ватт-мощности. Именно от того `сколько киловатт с луча приходит` и надо отталкиваться, других способов я не вижу.
                                                0
                                                Таким, что если раскидать тепловую мощность по машзалу по принципу «как попало», то с охлаждением начнутся проблемы, что вызовет снижение КПД за счёт того, что больше электроэнергии пойдет на систему охлаждения.
                                                  0
                                                  Дано: один процессор Cerebras, потребление 15 кВт, как у честной стойки. Ваши действия? Как правильно распределить его тепловую мощность по машзалу, чтобы он, бедолага, стоящий как весь машзал, не сгорел? А если таких будет сотня? Есть типовые решения?
                                                    0
                                                    Ну давайте ещё что-то типа сотни полностью нафаршированных Sun M6-32 пораскидываем по машзалу типового ДЦ. Колокешейн для такого найти весьма геморно, и уж если у вас стоят задачи применения такого — то впору свой собственный ДЦ строить под ваши собственные нужды.
                                                      0
                                                      В том то и дело, сама концепция типового машзала типового ДЦ будет меняться по мере изменения типовой начинки.

                                    Только полноправные пользователи могут оставлять комментарии. Войдите, пожалуйста.

                                    Самое читаемое