Comments / Profile of IKMC / Habr

Пользователь

Мультиклеточная архитектура: тесты и развитие

IKMC Apr 5 2021 at 08:04

LLVM заставили генерировать такой код с трудом. Да, там создание бэкенда рассчитано на регистровые машины, поэтому «из коробки» для нас почти ничего не работало, разве что матчинг инструкций.
Начало реализации подробнее написано в этой статье: Компилятор С/С++ на базе LLVM для мультиклеточных процессоров: быть или не быть?
Развитие здесь: Развитие компилятора C для нового мультиклета-нейропроцессора

Мультиклеточная архитектура: тесты и развитие

IKMC Apr 5 2021 at 07:59

В нашей статье про MultiClet S1 подробно написано про алгоритм откуда берутся эти цифры, посмотрите в конце: Перспектива: MultiClet S1
Для текущей статьи был сделан пересчет хэшрейта для частоты процессора и памяти 2 ГГц.

Мультиклеточная архитектура: тесты и развитие

IKMC Apr 3 2021 at 19:52

Проект Multiclet S1 находится в стадии разработки, следите за новостями :)
То, что на сайте «по запросу» — там много нюансов маркетинга и логистики, которые в прайсе не отразить или пришлось бы постоянно менять цену.

Мультиклеточная архитектура: тесты и развитие

IKMC Apr 3 2021 at 15:05

Спасибо! Посмотрим, разберемся.

Мультиклеточная архитектура: тесты и развитие

IKMC Apr 3 2021 at 11:23

На MultiClet B CoreMark показатель 0.935 / МГц. Производительность всех компилируемых программ сейчас сильно отстает из-за неоптимальности компиляции, мы это знаем.
Ядро MultiClet B (и S1) задумывалось как ускоритель. Уточню: там стоят 4 клетки, в каждой полноценный блок арифметики, поэтому пиковая производительность соответствующая на задачах с хорошим параллелизмом (см. показатели по Ethereum). CoreMark брался потому, что он достаточно известный, и чтобы было хоть на чем-то сравниваться, а так же показать, что хоть это и ускоритель, но он может выполнять полностью арбитрарный код.
Тем не менее, этот Risc-V процессор действительно более интересный кандидат для сравнения. Спасибо, что показали его, мы обязательно посмотрим на него повнимательнее. Можете дать ссылку, откуда взята информация по площади ядра U74?

Мультиклеточная архитектура: тесты и развитие

IKMC Apr 2 2021 at 15:10

Всё правильно, во всех бенчмарках Intel тратит меньше тактов на их выполнение — то есть да, быстрее. Вся ставка делается на то, что мультиклеточное ядро в 40 раз меньше по площади и энергопотреблению, отсюда и последние 2 строчки в бенчмарках, учитывающие это.

Развитие компилятора C для нового мультиклета-нейропроцессора

IKMC Dec 20 2019 at 13:06

В коремарке там кстати сплошные циклы на си, больше для сравнения компиляторов скорей подходит чем для измерения производительности.

Так и есть. Статья, в основном, писалась для демонстрации прогресса компилятора.

Развитие компилятора C для нового мультиклета-нейропроцессора

IKMC Dec 20 2019 at 13:05

И правда. Спасибо за замеченную неточность, таблицы поправил.

Развитие компилятора C для нового мультиклета-нейропроцессора

IKMC Dec 19 2019 at 15:32

Данные взяты из этой статьи. Там написано, что это за аббревиатура.

Развитие компилятора C для нового мультиклета-нейропроцессора

IKMC Dec 19 2019 at 15:30

Очень интересно побаловаться было бы с компилятором и процессором

С компилятором уже можно побаловаться, SDK есть на сайте Мультиклета.

Будет ли возможность приобрести набор разработчика?

Да, конечно.

Развитие компилятора C для нового мультиклета-нейропроцессора

IKMC Dec 19 2019 at 15:28

2.5ГГц vs 1.6ГГц, это значительная прибавка, можно узнать, это новый техпроцесс или вы так раскочегарили на 28нм?

Это ECAD оценки, сделанные для техпроцесса 7 нм.

S2 в свободной продаже будет?

Будет.

В прошлой статье я спрашивал, в чём причина просадки по FIXPT MOPS относительно R1, у которого 0.714 против 0.115 текущих?

Как выяснилось, WhetStone для R1 запускался в режиме single precision, т.е. все операции с плавающей точкой были 32-битного типа float. Для S1 и S2 запускали double precision, с 64-битным типом double. Так получилось, что конкретно в этом блоке на каждой итерации дважды происходит конвертация из целого типа в тип с плавающей точкой. Конвертация во float — это одна процессорная команда, а вот в double — это вызов целой конвертирующей функции. В результате на конвертацию уходит куда больше времени, чем на сам блок.

Перспектива: MultiClet S1

IKMC Jan 7 2019 at 09:07

Уже развернуты учебные классы на R1 в УрФУ и УрГУПС. Ряд университетов в Санкт Петербурге и Москве обдумывает приобретение.

Перспектива: MultiClet S1

IKMC Jan 5 2019 at 12:51

Какие перспективы вашей архитектуры для задач компьютерного зрения (forward pass'ы нейронок и классические алгоритмы)?

По идее, всё, что имеет отношение к нейронным сетям, должно хорошо ложиться на мультиклеточную архитектуру. Но никто ещё не пробовал.

Есть ли прогресс по поддержке Rust'а?

Прогресса пока нет, но мы знаем, что есть интересующиеся. Какую-нибудь минимальную тестовую программу можно запустить, наверное, на любом языке, для которого сделан фронтенд LLVM (для Rust и C++ такое сработало). Но, как только программа усложнится, появятся конструкции, которые пока не может обработать либо бэкенд, либо ассемблер. В приоритете сейчас стоят оптимизации бэкенда, что повлияет потом на скорость работы любого языка.

Сотрудничаете ли вы с университетами, либо планируете ли вы это делать?

Пока не знаем.

Перспектива: MultiClet S1

IKMC Jan 5 2019 at 08:45

Руководство компании не рекомендует русскоязычным разрабам пользоваться английской частью сайта, заведомо вторичной и слабо сопровождаемой. Сейчас нет необходимости как-либо ее поддерживать, но если найдется англоязычное коммьюнити, заинтересованное в разработке или сотрудничестве, можно будет и сделать нужные переводы.

-1

Перспектива: MultiClet S1

IKMC Jan 4 2019 at 09:59

PCI-E 3.0 x4

Перспектива: MultiClet S1

IKMC Jan 4 2019 at 08:23

Теперь говорите что влегкую рассматривали 128 и 258 клеток, но остановились на 64. Где правда?

Клеток то всего 64, но объединены они в группы по 4, т.е. аппаратное распараллеливание алгоритма идет на 4 клетки.

Перспектива: MultiClet S1

IKMC Jan 3 2019 at 19:32

Именно с архитектурой бесплатно можно познакомиться прямо сейчас. В SDK включена модель-отладчик, которая эмулирует все команды процессора. Вы, конечно же, не узнаете реального быстродействия железа, но писать и отлаживать программы можно уже сейчас, используя модель. Мы, например, этим и занимаемся.

Перспектива: MultiClet S1

IKMC Jan 3 2019 at 11:40

Когда-то давно взламывали сайт, сейчас всё нормально должно быть. Может с сертификатами до сих пор проблема осталась, проверим.

Перспектива: MultiClet S1

IKMC Jan 3 2019 at 11:39

В том то и дело, они наделают асиков, в Ethereum в итоге на proof-of-stake перейдет. А на мультиклете можно будет просто алгоритм для другой криптовалюты написать. SDK же выложено в открытый доступ, кому надо майнить — те и напишут.

Какие конкретно будут платы — этот вопрос ещё решается.

Перспектива: MultiClet S1

IKMC Jan 3 2019 at 11:27

Нет, выбор топонормы обусловлен тем, что это минимальная «разумно доступная» топонорма, а российских фабов для такого производства, пока, к сожалению, не предвидится.