Как стать автором
Обновить

Комментарии 42

Превосходно! Прочёл на одном дыхании.

Вопрос про FIXPT MOPS / MHz 0.714 0.116
Уполовинили FP, а чем объясняется столь низкий результат в целочисленных?

Второй момент, хотелось бы так же тесты на модном нынче RayTracing, раз уж процессор может всё и позиционируется как ускоритель.
Кода под рукой нет, посмотрим, как праздники кончатся. Но, возможно, в старых (или новых) измерениях ошибка, ибо у старой архитектуры нет никаких преимуществ перед новой.

Если вы подразумеваете realtime Ray Tracing, как в видеокартах NVidia, то у них аппаратное ускорение этого дела, отдельные ядра над этим работают. А мультиклеточный процессор, в том то и дело, может исполнять любой код, а не только графические задачи. Аппаратного ускорения для чего-то конкретного нет.
Надо заметить, что техпроцесс 28 нм – это самый низкий бытовой диапазон, не требующий специальных разрешений на использование, поэтому был выбран именно он.
WUT? Вы о чем вообще? Чьи специальные разрешения требуются, например, на 16 нм?
Вы сильно удивитесь. В Intel, например, чтобы работать на проектах процессоров, которые будут выпущены на 14, 10 и 7 нм, нужно получить лицензию государственного департамента США (по крайней мере, гражданам России точно).
Россиянин в американской компании — это одно, а не находящейся под санкциями российской компании выпустить майнинговый (или любой другой невоенный) чип на 7-10 нм TSMC организационно ничего не мешает. Более того, такие проекты вполне себе есть. Точнее, в случае с майнерами, скорее были, чем есть)
Не буду спорить, хотя допускаю, что там могут быть какие-то другие подводные камни.
С другой стороны, топовые техпроцессы дороже, чем 28 нм. Может быть, в этом и есть причина? (-:
Вполне вероятно, что главный фактор — цена. Но это не то, что сказано в статье.
Что касается подводных камней, то они существуют, но проекты ниже 28 нм в России делаются.
16 нм и более низкие топонормы требуют очень сложного и длительного процесса заключения индивидуального NDA с фабрикой с массой ограничений и подписок, контролем проекта на требования законодательства некоторых стран и, соответственно, рядом производственных рисков, которые компании в настоящее время не нужны.

А как без переноса реализовывать 128битную арифметику теперь эффективно?

«На данный момент новый процессор находится в разработке, но уже появились первые результаты и можно оценить, на что он будет способен.»

Пока ни как.
А почему Google под ссылкой на официальный сайт компании «Мультиклет» выдаёт приписку «Возможно, этот сайт был взломан»?
Когда-то давно взламывали сайт, сейчас всё нормально должно быть. Может с сертификатами до сих пор проблема осталась, проверим.
О! Радует, что необычная архитектура получила развитие! Спасибо за статью, ждем результаты с кремния!

В новой ревизии немало архитектурных изменений.
Вот, в частности, возможность адресовать аргументы в памяти для любых команд — а как в этом случае выполняются зависимости по памяти?
Например, чтение после записи в пределах одного параграфа. А если в разных параграфах? Есть ли какая-то модель памяти, которой придерживается процессор? Является ли завершение параграфа барьером по записи?

Еще вот интересно: в первых версиях, насколько я понял, распределение инструкций по клеткам было реализовано «по модулю»: каждая n-ая команда попадает в n-ую клетку. Добавили ли хитрый планировщик, который мог бы учитывать фактическую готовность клетки?
По умолчанию контроль очередности чтения и записи включен, то есть если сделать две подряд идущие команды записи и чтения по подному адресу, то чтение дождется записи и считает уже новое значение. Если контроль выключен, никаких гарантий нет, но все записи зато могут проходить параллельно. Завершение параграфа больше не влияет ни на записи, ни на установления регистров.

Второе нужно уточнить, но вроде бы да, если одна команда исполняется долго, то остальные клетки продолжают выборку.
НЛО прилетело и опубликовало эту надпись здесь
Не совсем понимаю, что вы имеете ввиду. Если вы о чем-то из предыдущих статей, то в R1 можно было реконфигурировать клетки для совместного исполнения кода: 4 клетки вместе выполняют один код, 2 группы по 2 клетки выполняют 2 разных кода, или 4 клетки отдельно выполняют разный код. В S1 только один вариант: 16 раздельных мультиклеток, в каждой 4 клетки вместе выполняют код.
PCI-E 3.0 x4
Это всё круто, но чёт очень похоже на энтузиастов, которым просто нравится сам процесс и они как-то удачно нашли инвестора.

Когда ждать в продаже?
Лучше! Не инаестора, а ICO!
Первые образцы сверхпроизводительного российского 28-нанометрового процессора Multiclet S1 для майнинга (добычи криптовалюты) должны увидеть свет в сентябре 2018 г. («плюс минус месяц»), а первые устройства-майнеры на его основе — в ноябре. Об этом CNews рассказал основатель проекта RMC по созданию данного «железа», а также интернет-омбудсмен, глава и владелец «Радиус груп» Дмитрий Мариничев.


Заодно наконец-то превратили девайс из очень странного процессоров общего назначения во вменяемый ускоритель.
НЛО прилетело и опубликовало эту надпись здесь
Несколько вопросов:
— Какие перспективы вашей архитектуры для задач компьютерного зрения (forward pass'ы нейронок и классические алгоритмы)? На мой взгляд данная сфера намного более сладкая чем майнинг криптовалют.
— Есть ли прогресс по поддержке Rust'а? Два года назад вы писали что тестовая программа написанная на Rust'е запускалась без особых проблем. Например, сообщество вокруг RISC-V проявило весьма заметный интерес к первоклассной поддержке Rust'а.
— Сотрудничаете ли вы с университетами, либо планируете ли вы это делать? Например, вы могли бы предоставлять заинтересованным университетам во временное или постоянное использование мультиклеты для проведения исследований с их использованием. Тут, думаю, была бы обоюдная польза, вам пиар, потенциальные будущие заказчики, отзывы от пытливых исследователей (что поможет в будущем при общении с реальным бизнесом) и возможно дополнительные применения, которые вы упустили из виду, а им статьи и, если очень повезёт, хороший потенциал для создания стартапа.
Какие перспективы вашей архитектуры для задач компьютерного зрения (forward pass'ы нейронок и классические алгоритмы)?
По идее, всё, что имеет отношение к нейронным сетям, должно хорошо ложиться на мультиклеточную архитектуру. Но никто ещё не пробовал.

Есть ли прогресс по поддержке Rust'а?
Прогресса пока нет, но мы знаем, что есть интересующиеся. Какую-нибудь минимальную тестовую программу можно запустить, наверное, на любом языке, для которого сделан фронтенд LLVM (для Rust и C++ такое сработало). Но, как только программа усложнится, появятся конструкции, которые пока не может обработать либо бэкенд, либо ассемблер. В приоритете сейчас стоят оптимизации бэкенда, что повлияет потом на скорость работы любого языка.

Сотрудничаете ли вы с университетами, либо планируете ли вы это делать?
Пока не знаем.
Уже развернуты учебные классы на R1 в УрФУ и УрГУПС. Ряд университетов в Санкт Петербурге и Москве обдумывает приобретение.
28нм связано с тем что планируете производить на Российских площадках?
А в России есть или в обозримой перспективе будет 28 нм?
НЛО прилетело и опубликовало эту надпись здесь
Не 130 (которые по факту 250), а все же 90. Но ни о каких 28 нм, конечно речи нет, разве что в интервью одного широко известного академика, в которых нет ни слова по том, на каком оборудовании он предполагает выпускать эти 28 нм.
Нельзя просто взять и перенести выпуск чипа с одной площадки на другую. У каждой компании, у которой есть фабрики, свои библиотеки элементов, на базе которых делается физический дизайн (то есть, грубо говоря, логические элементы раскладываются в транзисторы). Поэтому, чтобы перенести выпуск, скажем, с Global Foundries на TSMC, нужно переделывать физдизайн, а это некоторые затраты ресурсов. То есть, даже если в России появится производство 28 нм, не получится просто так, безболезненно на него переехать.
Тем не менее, переезд с фабрики на фабрику — это типовая задача, которая регулярно решается разными людьми, и которая представляет собой намного меньшую трату ресурсов, чем разработка проекта с нуля или переход с совсем других топологических норм (не говорим сейчас о скейлинге типа 45->40).
Нет, выбор топонормы обусловлен тем, что это минимальная «разумно доступная» топонорма, а российских фабов для такого производства, пока, к сожалению, не предвидится.
В этом случае, хэшрейт такой платы будет равен либо превышать хэшрейты существующих видеокарт, при этом энергопотребление платы с S1 будет в два раза меньше, даже чем у видеокарт с топонормами 16 и 14 нм.
вы забыли, что 470 можно даунвольтить, память разогнать по частоте и таймингам и получить не 25,8 а 30мх… то же самое с 1080ти. 55 достижимы при энергопотреблении меньшем, чем указано в таблице.
ну а также, что уже есть асики, которые какраз в два раза энергоэффективнее видеокарт… соотвественно для данного алгоритма уже будет вставать вопрос цены… сколько же эти ускорители будут стоить? хотя конечно в отличии от асиков данное решение будет и универсальным, вот только разработчики нужны на написание софта :) а много ли их?

плюс про 20 процессоров на одну плату, вы не забыли, что придется тогда и памяти поставить хотя бы 20*4гб (а лучше 8 для универсальности)? что и по размерам и по цене…
В том то и дело, они наделают асиков, в Ethereum в итоге на proof-of-stake перейдет. А на мультиклете можно будет просто алгоритм для другой криптовалюты написать. SDK же выложено в открытый доступ, кому надо майнить — те и напишут.

Какие конкретно будут платы — этот вопрос ещё решается.
на эфире еще есть идеи сменить алго с даггера на прогпов
а по поводу того кому надо…
так под ПЛИС тоже есть всё, только вот пишущих намного меньше, ибо сложнее. так и тут.
если будет отсутствие писателей нужного софта — ненужны они будут никому…
а отсюда я б на месте разработчиков демоплаты простенькие распространял бы бесплатно, чтобы желающие могли познакомиться с архитектурой…
а там… видно будет…
Именно с архитектурой бесплатно можно познакомиться прямо сейчас. В SDK включена модель-отладчик, которая эмулирует все команды процессора. Вы, конечно же, не узнаете реального быстродействия железа, но писать и отлаживать программы можно уже сейчас, используя модель. Мы, например, этим и занимаемся.
хм… а ссылочки есть?
так то вроде интересная архитектура :)
Сайт мультиклет, вроде как в декабре ПО обновили, думаю это уже всё новое.
А вроде бы говорили, что теоретический предел в распараллеливании алгоритма на клетки — около 12 клеток, и далее эффективность вычислений не растет, больше тратится на синхронизацию и работу с памятью. Теперь говорите что влегкую рассматривали 128 и 258 клеток, но остановились на 64. Где правда?
Теперь говорите что влегкую рассматривали 128 и 258 клеток, но остановились на 64. Где правда?

Клеток то всего 64, но объединены они в группы по 4, т.е. аппаратное распараллеливание алгоритма идет на 4 клетки.
оффтоп:
Я так понимаю вы работаете в MC?
Наймите (не лично вы), пожалуйста, переводчика.
Хотел дать ссылку на англоязычный форум, но что-то стало стыдно.
Англоязычная часть сайта это же «кровь из глаз». «МГИМО финишд?»
multiclet.com/index.php/en/company/about-company
Руководство компании не рекомендует русскоязычным разрабам пользоваться английской частью сайта, заведомо вторичной и слабо сопровождаемой. Сейчас нет необходимости как-либо ее поддерживать, но если найдется англоязычное коммьюнити, заинтересованное в разработке или сотрудничестве, можно будет и сделать нужные переводы.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий

Публикации

Истории