Во-первых, речь не про Трамплин, а про Эльбрус/Байкал, которые можно перепроектировать под другую фабрику.
Во-вторых, это не перепроектирование "с нуля". Логическая часть процессора может остаться относительно неизменной (по модулю некоторых оговорок). Требуется провести физизический дизайн под новую технологию.
В чём именно заключалась "тухлость подхода" на практике?
Проблемы были в стандартных расширениях ISA, в каких-то конкретных кастомных или же в чем-то еще?
В том,что CPU подход принципиально уступает по эффективности специализированным для AI. И от наличия RISC-V ISA толку никакого. Тут вкратце об этом написано:
В публичных анонсах ET-SoC-1 было что-то интересное -- 1088 ядер, 158 Infer/sec/Watt на ResNet-50 (int8). Реальность сильно расходилась с анонсами?
Реальность в том, что ET-SoC-1 на 7нм давал 140 TOPS int8 на 1ГГц, и чуть больше 200 TOPS на 1.5 ГГц, тогда как Nvidia A100 на тех же 7нм 624 TOPS (частота до 1.41 ГГц). И это не считая проблем с утилизацией и моделью программирования. Вот и вся математика, после которой дальнейшая судьба CPU с векторно-матричными расширениями в мире AI никаких вопросов не вызывает
На симуляторах это скорее всего замерялось, но дело не в этом. Нет смысла писать статью "про производительность", где нет цифр производительности. Потому что эти манипуляции на уровне СИ-кода и интрисиков к перформансу прямого отношения никакого не имеют
Разработки Tenstorrent используют RISC-V для "Baby" core, т.е. для обычной управляющей логики CPU. А для AI используются Tensix Coprocessor, где никакой RISC-V судя по документации не используется, по причине того, что там он нафиг не нужен.
Из известного, была попытка у Esperanto на основе RISC-V + специализированное расширение делать AI. Как непосредственный участник проекта могу констатировать, что уже в процессе разработки тухлость этого подхода была многим очевидна. Собственно, потому Esperanto и почивало на бозу. Да и использовалось там не векторное расширение ( о котором статья), а специализированный набор команд.
В статье написано очень много глупостей, основанных на каких-то лозунгах, квинтэссенцией является:
Таким образом, RISC-V может быть очень актуальна для AI/ML-приложений
RISC-V на данный момент абсолютно неактуален для AI, потому что, во-первых , это CPU ISA, которая плохо подходит для AI задач, а во-вторых, на текущий момент нет настолько производительных RISC-V ядер, готовых тягаться с x86 в серверах. А в России нет даже готовых IP ядер с поддержкой векторного расширения. Вообще , у вас заголовок про производительность, а в статье нет ни одной цифры этой самой производительности. О чём тут вообще можно говорить
ой ли. specint — синтетическая синтетика, для процессорного ядра общего назначения не так уж и интересна.
SpecInt это главный тестбенч, на котором в профессиональном сообществе принято сравнивать именно производительность ядер общего назначения. Это не синтетика никакая, а набор реальных нагрузок.
и да, если мы говорим про самое производительное процессорное ядро, разработанное в России, то где сравнение с шумевшим не так давно эльбрусом?
Разработчики BI-672 не привели цифр для Эльбруса. По всей видимости потому, что они в нормальном виде нигде не опубликованы
и да, в статье свершенно не упоминается что это — arm, risc-v, что-то ещё; ядро создано на основе какого-то или с чистого листа, и прочие детали.
Архитектурная скорость мерялась на fpga прототипе, вестимо. Все остальные цифры по углам, вольтажу и тд можно резюмировать тем, что ядро заработает на 1.8 ГГц
Про планы/сроки по кремнию ничего не было озвучено, что понятно, т.к. это уже зависит от покупателя ядра и разработчика Asic, а не IP-хауса, которым является CloudBear
На презентации прозвучало, что при переходе от in-order BI-652 (можно считать близким аналогом ARM A57) к OoO BI-672 рост производительности составил 2х, при росте площади ядра в 1.8х. Т.е. удельная производительность на кремний выросла. В целом, BI-672 выглядит вполне на мировом уровне для такого класса ядер
К сожалению, точных данных по SCR9 у меня нет, только некоторые слухи и инсайды, на основе которых мне сложно нарисовать картину, за которую я бы хоть сколько-то поручился. Очень надеюсь, что коллеги из Syntacore/Yadro опубликуют официальные данные по своим последним разработкам и может статься, даже отнимут пальму первенства в звании самого производительного отечественного ядра у BI-672.
Понятно, что это лишняя работа, но если надо - делается. Вопрос ethernet интерфейса, естественно, обсуждался при проектировании. По сумме факторов было решено от него отказаться. Всё же одна из основный задач сделать конкурентный по цене чип.
Редкий случай - толковая статья на Хабре про стартаперские дела. Обнимаю и жму руку, коллега.
Чипы там внутри стоят зарубежные, очевидно
Вы абсолютно верно полагаете
Давайте вы не будете писать о том, о чём не имеете ни малейшего понятия и вводить людей в заблуждение.
Во-первых, речь не про Трамплин, а про Эльбрус/Байкал, которые можно перепроектировать под другую фабрику.
Во-вторых, это не перепроектирование "с нуля". Логическая часть процессора может остаться относительно неизменной (по модулю некоторых оговорок). Требуется провести физизический дизайн под новую технологию.
Так всё же, в чём проблема перепроектировать чип под другую фабрику?
Этого чипа с векторным расширением в кремнии не существует
В том,что CPU подход принципиально уступает по эффективности специализированным для AI. И от наличия RISC-V ISA толку никакого. Тут вкратце об этом написано:
https://habr.com/ru/companies/baikalelectron/articles/915346/
Реальность в том, что ET-SoC-1 на 7нм давал 140 TOPS int8 на 1ГГц, и чуть больше 200 TOPS на 1.5 ГГц, тогда как Nvidia A100 на тех же 7нм 624 TOPS (частота до 1.41 ГГц). И это не считая проблем с утилизацией и моделью программирования. Вот и вся математика, после которой дальнейшая судьба CPU с векторно-матричными расширениями в мире AI никаких вопросов не вызывает
.
У T-Head своё нестандартное векторное расширение.
На симуляторах это скорее всего замерялось, но дело не в этом. Нет смысла писать статью "про производительность", где нет цифр производительности. Потому что эти манипуляции на уровне СИ-кода и интрисиков к перформансу прямого отношения никакого не имеют
Как-то быстро список закончился.
Разработки Tenstorrent используют RISC-V для "Baby" core, т.е. для обычной управляющей логики CPU. А для AI используются Tensix Coprocessor, где никакой RISC-V судя по документации не используется, по причине того, что там он нафиг не нужен.
Из известного, была попытка у Esperanto на основе RISC-V + специализированное расширение делать AI. Как непосредственный участник проекта могу констатировать, что уже в процессе разработки тухлость этого подхода была многим очевидна. Собственно, потому Esperanto и почивало на бозу. Да и использовалось там не векторное расширение ( о котором статья), а специализированный набор команд.
В статье написано очень много глупостей, основанных на каких-то лозунгах, квинтэссенцией является:
RISC-V на данный момент абсолютно неактуален для AI, потому что, во-первых , это CPU ISA, которая плохо подходит для AI задач, а во-вторых, на текущий момент нет настолько производительных RISC-V ядер, готовых тягаться с x86 в серверах. А в России нет даже готовых IP ядер с поддержкой векторного расширения. Вообще , у вас заголовок про производительность, а в статье нет ни одной цифры этой самой производительности. О чём тут вообще можно говорить
Нет, это абсолютно нереально
добавил упоминание про RISC-V, хотя не скрою, мне казалось это очевидным.
SpecInt это главный тестбенч, на котором в профессиональном сообществе принято сравнивать именно производительность ядер общего назначения. Это не синтетика никакая, а набор реальных нагрузок.
Разработчики BI-672 не привели цифр для Эльбруса. По всей видимости потому, что они в нормальном виде нигде не опубликованы
это RISC-V ядро, разработанное с нуля.
Архитектурная скорость мерялась на fpga прототипе, вестимо. Все остальные цифры по углам, вольтажу и тд можно резюмировать тем, что ядро заработает на 1.8 ГГц
RVV будет добавлено в течение ближайшего года.
Про планы/сроки по кремнию ничего не было озвучено, что понятно, т.к. это уже зависит от покупателя ядра и разработчика Asic, а не IP-хауса, которым является CloudBear
На презентации прозвучало, что при переходе от in-order BI-652 (можно считать близким аналогом ARM A57) к OoO BI-672 рост производительности составил 2х, при росте площади ядра в 1.8х. Т.е. удельная производительность на кремний выросла. В целом, BI-672 выглядит вполне на мировом уровне для такого класса ядер
К сожалению, точных данных по SCR9 у меня нет, только некоторые слухи и инсайды, на основе которых мне сложно нарисовать картину, за которую я бы хоть сколько-то поручился. Очень надеюсь, что коллеги из Syntacore/Yadro опубликуют официальные данные по своим последним разработкам и может статься, даже отнимут пальму первенства в звании самого производительного отечественного ядра у BI-672.
Понятно, что это лишняя работа, но если надо - делается. Вопрос ethernet интерфейса, естественно, обсуждался при проектировании. По сумме факторов было решено от него отказаться. Всё же одна из основный задач сделать конкурентный по цене чип.