Обновить
182
0
Максим Маслов@Armmaster

GPGPU AI Architect

Отправить сообщение

Редкий случай - толковая статья на Хабре про стартаперские дела. Обнимаю и жму руку, коллега.

Чипы там внутри стоят зарубежные, очевидно

Вы абсолютно верно полагаете

А ещё китайские фабы не печатают на заказ иностранных клиентов. Покупать китайское - пожалуйста, а печатать ваше они не будут.

Давайте вы не будете писать о том, о чём не имеете ни малейшего понятия и вводить людей в заблуждение.

Во-первых, речь не про Трамплин, а про Эльбрус/Байкал, которые можно перепроектировать под другую фабрику.

Во-вторых, это не перепроектирование "с нуля". Логическая часть процессора может остаться относительно неизменной (по модулю некоторых оговорок). Требуется провести физизический дизайн под новую технологию.

Так всё же, в чём проблема перепроектировать чип под другую фабрику?

Этого чипа с векторным расширением в кремнии не существует

  • В чём именно заключалась "тухлость подхода" на практике?

  • Проблемы были в стандартных расширениях ISA, в каких-то конкретных кастомных или же в чем-то еще?

В том,что CPU подход принципиально уступает по эффективности специализированным для AI. И от наличия RISC-V ISA толку никакого. Тут вкратце об этом написано:

https://habr.com/ru/companies/baikalelectron/articles/915346/

В публичных анонсах ET-SoC-1 было что-то интересное -- 1088 ядер, 158 Infer/sec/Watt на ResNet-50 (int8). Реальность сильно расходилась с анонсами?

Реальность в том, что ET-SoC-1 на 7нм давал 140 TOPS int8 на 1ГГц, и чуть больше 200 TOPS на 1.5 ГГц, тогда как Nvidia A100 на тех же 7нм 624 TOPS (частота до 1.41 ГГц). И это не считая проблем с утилизацией и моделью программирования. Вот и вся математика, после которой дальнейшая судьба CPU с векторно-матричными расширениями в мире AI никаких вопросов не вызывает

У T-Head своё нестандартное векторное расширение.

На симуляторах это скорее всего замерялось, но дело не в этом. Нет смысла писать статью "про производительность", где нет цифр производительности. Потому что эти манипуляции на уровне СИ-кода и интрисиков к перформансу прямого отношения никакого не имеют

Как-то быстро список закончился.

Разработки Tenstorrent используют RISC-V для "Baby" core, т.е. для обычной управляющей логики CPU. А для AI используются Tensix Coprocessor, где никакой RISC-V судя по документации не используется, по причине того, что там он нафиг не нужен.

Из известного, была попытка у Esperanto на основе RISC-V + специализированное расширение делать AI. Как непосредственный участник проекта могу констатировать, что уже в процессе разработки тухлость этого подхода была многим очевидна. Собственно, потому Esperanto и почивало на бозу. Да и использовалось там не векторное расширение ( о котором статья), а специализированный набор команд.

В статье написано очень много глупостей, основанных на каких-то лозунгах, квинтэссенцией является:

Таким образом, RISC-V может быть очень актуальна для AI/ML-приложений

RISC-V на данный момент абсолютно неактуален для AI, потому что, во-первых , это CPU ISA, которая плохо подходит для AI задач, а во-вторых, на текущий момент нет настолько производительных RISC-V ядер, готовых тягаться с x86 в серверах. А в России нет даже готовых IP ядер с поддержкой векторного расширения. Вообще , у вас заголовок про производительность, а в статье нет ни одной цифры этой самой производительности. О чём тут вообще можно говорить

добавил упоминание про RISC-V, хотя не скрою, мне казалось это очевидным.

ой ли. specint — синтетическая синтетика, для процессорного ядра общего назначения не так уж и интересна.

SpecInt это главный тестбенч, на котором в профессиональном сообществе принято сравнивать именно производительность ядер общего назначения. Это не синтетика никакая, а набор реальных нагрузок.

и да, если мы говорим про самое производительное процессорное ядро, разработанное в России, то где сравнение с шумевшим не так давно эльбрусом?

Разработчики BI-672 не привели цифр для Эльбруса. По всей видимости потому, что они в нормальном виде нигде не опубликованы

и да, в статье свершенно не упоминается что это — arm, risc-v, что-то ещё; ядро создано на основе какого-то или с чистого листа, и прочие детали.

это RISC-V ядро, разработанное с нуля.

Архитектурная скорость мерялась на fpga прототипе, вестимо. Все остальные цифры по углам, вольтажу и тд можно резюмировать тем, что ядро заработает на 1.8 ГГц

RVV будет добавлено в течение ближайшего года.

Про планы/сроки по кремнию ничего не было озвучено, что понятно, т.к. это уже зависит от покупателя ядра и разработчика Asic, а не IP-хауса, которым является CloudBear

На презентации прозвучало, что при переходе от in-order BI-652 (можно считать близким аналогом ARM A57) к OoO BI-672 рост производительности составил 2х, при росте площади ядра в 1.8х. Т.е. удельная производительность на кремний выросла. В целом, BI-672 выглядит вполне на мировом уровне для такого класса ядер

К сожалению, точных данных по SCR9 у меня нет, только некоторые слухи и инсайды, на основе которых мне сложно нарисовать картину, за которую я бы хоть сколько-то поручился. Очень надеюсь, что коллеги из Syntacore/Yadro опубликуют официальные данные по своим последним разработкам и может статься, даже отнимут пальму первенства в звании самого производительного отечественного ядра у BI-672.

Понятно, что это лишняя работа, но если надо - делается. Вопрос ethernet интерфейса, естественно, обсуждался при проектировании. По сумме факторов было решено от него отказаться. Всё же одна из основный задач сделать конкурентный по цене чип.

1
23 ...

Информация

В рейтинге
4 517-й
Откуда
Долгопрудный, Москва и Московская обл., Россия
Зарегистрирован
Активность