
За последние пару лет сразу несколько компаний объявили о многоядерных процессорах, создаваемых этими организациями для высоконагруженных систем. О некоторых таких проектах на Хабре писали, в том числе и мы, о других — нет.
Сейчас мы решили собрать вместе информацию о чипах с десятками и сотнями ядер, чтобы эти данные были в одном месте. В подборке — только информация о чипах, которые либо уже выпущены, либо близки к началу производства. Есть и другие проекты, но некоторые из них пока под большим вопросом — о них известно лишь со слов глав компаний, никто их не видел, не трогал и не тестировал.
Intel Xeon W-3300

Сначала разомнемся — вспомним чип от Intel. Это Xeon W-3300 для рабочих станций и серверов, который производится по 10 нм технологии, архитектура его ядра — Sunny Core. Количество ядер составляет от 12 до 38.
Чип вполне реален, его можно видеть вживую и даже купить. Правда, доступен такой процессор далеко не всем — его стоимость составляет $4500 за топовую модель.

Устанавливаются такие процессоры в материнские платы с разъёмом LGA4189 и чипсетом C21A.
Есть у Intel и другие чипы — линейка Xeon Scalable, количество ядер в которых достигает 40. Кстати, мы предлагаем на основе Intel® Xeon® Scalable 3-го поколения серверы — так что если такое оборудование нужно вашей к��мпании, велкам.
Указанные процессоры предназначены для работы в системах машинного обучения, видеомонтажа и другим работам с видео, 3D-моделирования и т.п.
128-ядерный процессор от Ampere

В 2019 году калифорнийская компания Ampere представила первый в отрасли 80-ядерный ARM-процессор, который получил название Ampere Altra. Он предназначен, в первую очередь, для работы в серверном оборудовании — в пользовательское устройство его установить не получится.
На днях компания ADLINK представила встраиваемый модуль COM-HPC на чипе Ampere Altra с 80 ядрами. Этот модуль может иметь максимум 768 ГБ оперативной памяти DDR4 c шестью каналами. Модуль предназначен для установки в системы автономного вождения, обработки изображений, обработки видео и т.п.
Компания Ampere не стала почивать на лаврах после выхода Altra. В 2020 году она анонсировала128-ядерный ARM-процессор Altra Max. Тогда сообщалось, что чип основан на ARM-архитектуре N1. Процессоры не предназначены для установки в пользовательские устройства, они будут выпускаться для нужд дата-центров и индустрии сетевых технологий в целом.

Что касается характеристик, то новинка оснащена 128 физическими ядрами (без технологии многопоточности). Кэш L1 для инструкций и данных — 64 Кбайт, L2 — 1 МБ, L3 — 32 МБ для каждого из ядер. Тактовая частота ядер — 3.0 ГГц.
Высокопроизводительные чипы — весьма интересная тема, но у нас есть и другие статьи, оцените — мы рассказываем о:
→ Объединение проектов в разных дата-центрах
→ Введение в SSD. Часть 5. Контроллерная
→ Selectel File Storage (Beta): места много не бывает
128-ядерные процессоры Tachyum Prodigy

В 2020 году компания Tachyum Prodigy рассказала о своих 128-ядерных процессорах, которые базируются на архитектуре собственной разработки. Процессоры планируется использовать в крупных ЦОД, высоконагруженных платформах, ИИ-системах и прочих направлениях, где нужна высокая производительность. Чип очень сложный, как сам по себе, так и в производстве, поэтому его разработка ведется не самыми быстрыми темпами.
Каждый процессор предоставляет до 625 Тфлопс, это примерно 2,5 Пфлопс на каждый сервер. Для обеспечения работы системы используется сервер-модуль собственной разработки компании. Достоинство чипов и систем Tachyum, по словам ее представителей, не только в мощных чипах и инфраструктуре, но и меньшем энергопотреблении и стоимости — не только самих систем, но и их эксплуатации.

В этом году компания все еще не представила полноценные чипы, но зато изготовила аппаратный эмулятор, который позволяет оценить эти чипы. Эмулятор разработан на базе ПЛИС, его системн��я плата базируется на четырех программируемых матрицах, которые имитируют работу сразу восьми ядер Prodigy. На базе этой системы компании удалось запустить Linux, доказав, таким образом, работоспособность своей системы.
Мало ядер? 512-ядерный чип от китайской компании

Ближе к концу лета китайская компания Ziguang заявила о создании процессора с 512 вычислительными ядрами. Он получил название H3C Engiant 800. Компания, о которой идет речь, является частью холдинга Tsinghua Unigroup. В него же входит Unisoc, разрабатывающая мобильные процессоры, и Yangtze Memory, которая создает чипы памяти.
Что касается чипа, то количество транзисторов в нем составляет около 40 млрд. При этом не совсем ясно, какая компания будет заниматься производством процессора. У разработчиков нет собственных фабрик, которые способны производить настолько необычные процессоры, поэтому, видимо, придется обращаться с сторонним компаниям. Чип выполнен по 7 нм техпроцессу.
Чип станет доступен уже с 2022 года. Но это речь о массовых заказах. Уже в этом году некоторые крупные клиенты получат тестовые образцы процессора, чтобы опробовать его в работе.
Еще больше? 850 тысяч ядер от Cerebras

Компания Cerebras представила WSE-2, 7-нм процессор с 850 тысячами ядер и энергопотреблением в 15 кВт. Площадь процессора равна площади кремниевой пластины. Количество транзисторов на ней составляет 2,6 трлн. Процессор предназначен для дата-центров, задач по обработке вычислений в области машинного обучения и искусственного интеллекта (AI).
И это не концепт, а рабочая система. Высокой производительности компания добивается благодаря сшиванию штампов на кремниевой пластине посредством коммуникационной сети. Общая пропускная способность в итоге повышается до 220 Пб/с. Частота ядер — от 2,5-3 ГГц.

Для работы с таким чипом нужна особая система. И разработчики создалии ее, назвав проект 15U. По словам авторов проекта, система на базе этого чипа позволяет обучать ИИ d 100-1000 раз быстрее любых других проектов.
Сейчас Cerebras представила облачную платформу Cerebras Cloud @ Cirrascale, которая предоставляет доступ к Cerebras CS-2 Wafer-Scale Engine (WSE) через облачный сервис Cirrascale.
«Набор инструментов компилятора предлагается с облачным набором инструментов, разработанным Cirrascale, — сказал генеральный директор Эндрю Фельдман (Andrew Feldman). — Итак, войдя в систему, вы получите доступ к вычислительному кластеру, хранилищу, CS-2; вы запустите свой стек компиляции и будете выполнять работу. Также вы получите контрольную точку и сохраните её в инфраструктуре Cirrascale, она будет идентифицирована, чтобы вы могли вернуться к выполнению этой работы позже. Все это интегрировано».

Понятно, что все это очень недешево — по словам представителей компании, сервис обойдется в $60 000 в неделю, $180 000 в месяц или $1 650 000 в год. За эти деньги пользователи получают доступ сразу ко всем ресурсам системы. Ее можно и купить, точная сумма неизвестна, но компания упоминала о нескольких миллионах долларов.

