Pull to refresh
17
0

Пользователь

Send message
LLVM заставили генерировать такой код с трудом. Да, там создание бэкенда рассчитано на регистровые машины, поэтому «из коробки» для нас почти ничего не работало, разве что матчинг инструкций.
Начало реализации подробнее написано в этой статье: Компилятор С/С++ на базе LLVM для мультиклеточных процессоров: быть или не быть?
Развитие здесь: Развитие компилятора C для нового мультиклета-нейропроцессора
В нашей статье про MultiClet S1 подробно написано про алгоритм откуда берутся эти цифры, посмотрите в конце: Перспектива: MultiClet S1
Для текущей статьи был сделан пересчет хэшрейта для частоты процессора и памяти 2 ГГц.
Проект Multiclet S1 находится в стадии разработки, следите за новостями :)
То, что на сайте «по запросу» — там много нюансов маркетинга и логистики, которые в прайсе не отразить или пришлось бы постоянно менять цену.
Спасибо! Посмотрим, разберемся.
На MultiClet B CoreMark показатель 0.935 / МГц. Производительность всех компилируемых программ сейчас сильно отстает из-за неоптимальности компиляции, мы это знаем.
Ядро MultiClet B (и S1) задумывалось как ускоритель. Уточню: там стоят 4 клетки, в каждой полноценный блок арифметики, поэтому пиковая производительность соответствующая на задачах с хорошим параллелизмом (см. показатели по Ethereum). CoreMark брался потому, что он достаточно известный, и чтобы было хоть на чем-то сравниваться, а так же показать, что хоть это и ускоритель, но он может выполнять полностью арбитрарный код.
Тем не менее, этот Risc-V процессор действительно более интересный кандидат для сравнения. Спасибо, что показали его, мы обязательно посмотрим на него повнимательнее. Можете дать ссылку, откуда взята информация по площади ядра U74?
Всё правильно, во всех бенчмарках Intel тратит меньше тактов на их выполнение — то есть да, быстрее. Вся ставка делается на то, что мультиклеточное ядро в 40 раз меньше по площади и энергопотреблению, отсюда и последние 2 строчки в бенчмарках, учитывающие это.
В коремарке там кстати сплошные циклы на си, больше для сравнения компиляторов скорей подходит чем для измерения производительности.
Так и есть. Статья, в основном, писалась для демонстрации прогресса компилятора.
И правда. Спасибо за замеченную неточность, таблицы поправил.
Данные взяты из этой статьи. Там написано, что это за аббревиатура.
Очень интересно побаловаться было бы с компилятором и процессором
С компилятором уже можно побаловаться, SDK есть на сайте Мультиклета.

Будет ли возможность приобрести набор разработчика?
Да, конечно.
2.5ГГц vs 1.6ГГц, это значительная прибавка, можно узнать, это новый техпроцесс или вы так раскочегарили на 28нм?
Это ECAD оценки, сделанные для техпроцесса 7 нм.

S2 в свободной продаже будет?
Будет.

В прошлой статье я спрашивал, в чём причина просадки по FIXPT MOPS относительно R1, у которого 0.714 против 0.115 текущих?
Как выяснилось, WhetStone для R1 запускался в режиме single precision, т.е. все операции с плавающей точкой были 32-битного типа float. Для S1 и S2 запускали double precision, с 64-битным типом double. Так получилось, что конкретно в этом блоке на каждой итерации дважды происходит конвертация из целого типа в тип с плавающей точкой. Конвертация во float — это одна процессорная команда, а вот в double — это вызов целой конвертирующей функции. В результате на конвертацию уходит куда больше времени, чем на сам блок.
Уже развернуты учебные классы на R1 в УрФУ и УрГУПС. Ряд университетов в Санкт Петербурге и Москве обдумывает приобретение.
Какие перспективы вашей архитектуры для задач компьютерного зрения (forward pass'ы нейронок и классические алгоритмы)?
По идее, всё, что имеет отношение к нейронным сетям, должно хорошо ложиться на мультиклеточную архитектуру. Но никто ещё не пробовал.

Есть ли прогресс по поддержке Rust'а?
Прогресса пока нет, но мы знаем, что есть интересующиеся. Какую-нибудь минимальную тестовую программу можно запустить, наверное, на любом языке, для которого сделан фронтенд LLVM (для Rust и C++ такое сработало). Но, как только программа усложнится, появятся конструкции, которые пока не может обработать либо бэкенд, либо ассемблер. В приоритете сейчас стоят оптимизации бэкенда, что повлияет потом на скорость работы любого языка.

Сотрудничаете ли вы с университетами, либо планируете ли вы это делать?
Пока не знаем.
Руководство компании не рекомендует русскоязычным разрабам пользоваться английской частью сайта, заведомо вторичной и слабо сопровождаемой. Сейчас нет необходимости как-либо ее поддерживать, но если найдется англоязычное коммьюнити, заинтересованное в разработке или сотрудничестве, можно будет и сделать нужные переводы.
Теперь говорите что влегкую рассматривали 128 и 258 клеток, но остановились на 64. Где правда?

Клеток то всего 64, но объединены они в группы по 4, т.е. аппаратное распараллеливание алгоритма идет на 4 клетки.
Именно с архитектурой бесплатно можно познакомиться прямо сейчас. В SDK включена модель-отладчик, которая эмулирует все команды процессора. Вы, конечно же, не узнаете реального быстродействия железа, но писать и отлаживать программы можно уже сейчас, используя модель. Мы, например, этим и занимаемся.
Когда-то давно взламывали сайт, сейчас всё нормально должно быть. Может с сертификатами до сих пор проблема осталась, проверим.
В том то и дело, они наделают асиков, в Ethereum в итоге на proof-of-stake перейдет. А на мультиклете можно будет просто алгоритм для другой криптовалюты написать. SDK же выложено в открытый доступ, кому надо майнить — те и напишут.

Какие конкретно будут платы — этот вопрос ещё решается.
Нет, выбор топонормы обусловлен тем, что это минимальная «разумно доступная» топонорма, а российских фабов для такого производства, пока, к сожалению, не предвидится.

Information

Rating
Does not participate
Registered
Activity