Комментарии 42
Превосходно! Прочёл на одном дыхании.
Вопрос про FIXPT MOPS / MHz 0.714 0.116
Уполовинили FP, а чем объясняется столь низкий результат в целочисленных?
Второй момент, хотелось бы так же тесты на модном нынче RayTracing, раз уж процессор может всё и позиционируется как ускоритель.
Вопрос про FIXPT MOPS / MHz 0.714 0.116
Уполовинили FP, а чем объясняется столь низкий результат в целочисленных?
Второй момент, хотелось бы так же тесты на модном нынче RayTracing, раз уж процессор может всё и позиционируется как ускоритель.
Кода под рукой нет, посмотрим, как праздники кончатся. Но, возможно, в старых (или новых) измерениях ошибка, ибо у старой архитектуры нет никаких преимуществ перед новой.
Если вы подразумеваете realtime Ray Tracing, как в видеокартах NVidia, то у них аппаратное ускорение этого дела, отдельные ядра над этим работают. А мультиклеточный процессор, в том то и дело, может исполнять любой код, а не только графические задачи. Аппаратного ускорения для чего-то конкретного нет.
Если вы подразумеваете realtime Ray Tracing, как в видеокартах NVidia, то у них аппаратное ускорение этого дела, отдельные ядра над этим работают. А мультиклеточный процессор, в том то и дело, может исполнять любой код, а не только графические задачи. Аппаратного ускорения для чего-то конкретного нет.
Надо заметить, что техпроцесс 28 нм – это самый низкий бытовой диапазон, не требующий специальных разрешений на использование, поэтому был выбран именно он.WUT? Вы о чем вообще? Чьи специальные разрешения требуются, например, на 16 нм?
Вы сильно удивитесь. В Intel, например, чтобы работать на проектах процессоров, которые будут выпущены на 14, 10 и 7 нм, нужно получить лицензию государственного департамента США (по крайней мере, гражданам России точно).
Россиянин в американской компании — это одно, а не находящейся под санкциями российской компании выпустить майнинговый (или любой другой невоенный) чип на 7-10 нм TSMC организационно ничего не мешает. Более того, такие проекты вполне себе есть. Точнее, в случае с майнерами, скорее были, чем есть)
Не буду спорить, хотя допускаю, что там могут быть какие-то другие подводные камни.
С другой стороны, топовые техпроцессы дороже, чем 28 нм. Может быть, в этом и есть причина? (-:
С другой стороны, топовые техпроцессы дороже, чем 28 нм. Может быть, в этом и есть причина? (-:
16 нм и более низкие топонормы требуют очень сложного и длительного процесса заключения индивидуального NDA с фабрикой с массой ограничений и подписок, контролем проекта на требования законодательства некоторых стран и, соответственно, рядом производственных рисков, которые компании в настоящее время не нужны.
А как без переноса реализовывать 128битную арифметику теперь эффективно?
А почему Google под ссылкой на официальный сайт компании «Мультиклет» выдаёт приписку «Возможно, этот сайт был взломан»?
О! Радует, что необычная архитектура получила развитие! Спасибо за статью, ждем результаты с кремния!
В новой ревизии немало архитектурных изменений.
Вот, в частности, возможность адресовать аргументы в памяти для любых команд — а как в этом случае выполняются зависимости по памяти?
Например, чтение после записи в пределах одного параграфа. А если в разных параграфах? Есть ли какая-то модель памяти, которой придерживается процессор? Является ли завершение параграфа барьером по записи?
Еще вот интересно: в первых версиях, насколько я понял, распределение инструкций по клеткам было реализовано «по модулю»: каждая n-ая команда попадает в n-ую клетку. Добавили ли хитрый планировщик, который мог бы учитывать фактическую готовность клетки?
В новой ревизии немало архитектурных изменений.
Вот, в частности, возможность адресовать аргументы в памяти для любых команд — а как в этом случае выполняются зависимости по памяти?
Например, чтение после записи в пределах одного параграфа. А если в разных параграфах? Есть ли какая-то модель памяти, которой придерживается процессор? Является ли завершение параграфа барьером по записи?
Еще вот интересно: в первых версиях, насколько я понял, распределение инструкций по клеткам было реализовано «по модулю»: каждая n-ая команда попадает в n-ую клетку. Добавили ли хитрый планировщик, который мог бы учитывать фактическую готовность клетки?
По умолчанию контроль очередности чтения и записи включен, то есть если сделать две подряд идущие команды записи и чтения по подному адресу, то чтение дождется записи и считает уже новое значение. Если контроль выключен, никаких гарантий нет, но все записи зато могут проходить параллельно. Завершение параграфа больше не влияет ни на записи, ни на установления регистров.
Второе нужно уточнить, но вроде бы да, если одна команда исполняется долго, то остальные клетки продолжают выборку.
Второе нужно уточнить, но вроде бы да, если одна команда исполняется долго, то остальные клетки продолжают выборку.
НЛО прилетело и опубликовало эту надпись здесь
Не совсем понимаю, что вы имеете ввиду. Если вы о чем-то из предыдущих статей, то в R1 можно было реконфигурировать клетки для совместного исполнения кода: 4 клетки вместе выполняют один код, 2 группы по 2 клетки выполняют 2 разных кода, или 4 клетки отдельно выполняют разный код. В S1 только один вариант: 16 раздельных мультиклеток, в каждой 4 клетки вместе выполняют код.
Какая периферия будет на процессоре? Какие характеристики у PCI-Е?
Это всё круто, но чёт очень похоже на энтузиастов, которым просто нравится сам процесс и они как-то удачно нашли инвестора.
Когда ждать в продаже?
Когда ждать в продаже?
Лучше! Не инаестора, а ICO!
Заодно наконец-то превратили девайс из очень странного процессоров общего назначения во вменяемый ускоритель.
Первые образцы сверхпроизводительного российского 28-нанометрового процессора Multiclet S1 для майнинга (добычи криптовалюты) должны увидеть свет в сентябре 2018 г. («плюс минус месяц»), а первые устройства-майнеры на его основе — в ноябре. Об этом CNews рассказал основатель проекта RMC по созданию данного «железа», а также интернет-омбудсмен, глава и владелец «Радиус груп» Дмитрий Мариничев.
Заодно наконец-то превратили девайс из очень странного процессоров общего назначения во вменяемый ускоритель.
НЛО прилетело и опубликовало эту надпись здесь
Имеет ли эта архитектура что-то общее с транспьютером?
Несколько вопросов:
— Какие перспективы вашей архитектуры для задач компьютерного зрения (forward pass'ы нейронок и классические алгоритмы)? На мой взгляд данная сфера намного более сладкая чем майнинг криптовалют.
— Есть ли прогресс по поддержке Rust'а? Два года назад вы писали что тестовая программа написанная на Rust'е запускалась без особых проблем. Например, сообщество вокруг RISC-V проявило весьма заметный интерес к первоклассной поддержке Rust'а.
— Сотрудничаете ли вы с университетами, либо планируете ли вы это делать? Например, вы могли бы предоставлять заинтересованным университетам во временное или постоянное использование мультиклеты для проведения исследований с их использованием. Тут, думаю, была бы обоюдная польза, вам пиар, потенциальные будущие заказчики, отзывы от пытливых исследователей (что поможет в будущем при общении с реальным бизнесом) и возможно дополнительные применения, которые вы упустили из виду, а им статьи и, если очень повезёт, хороший потенциал для создания стартапа.
— Какие перспективы вашей архитектуры для задач компьютерного зрения (forward pass'ы нейронок и классические алгоритмы)? На мой взгляд данная сфера намного более сладкая чем майнинг криптовалют.
— Есть ли прогресс по поддержке Rust'а? Два года назад вы писали что тестовая программа написанная на Rust'е запускалась без особых проблем. Например, сообщество вокруг RISC-V проявило весьма заметный интерес к первоклассной поддержке Rust'а.
— Сотрудничаете ли вы с университетами, либо планируете ли вы это делать? Например, вы могли бы предоставлять заинтересованным университетам во временное или постоянное использование мультиклеты для проведения исследований с их использованием. Тут, думаю, была бы обоюдная польза, вам пиар, потенциальные будущие заказчики, отзывы от пытливых исследователей (что поможет в будущем при общении с реальным бизнесом) и возможно дополнительные применения, которые вы упустили из виду, а им статьи и, если очень повезёт, хороший потенциал для создания стартапа.
Какие перспективы вашей архитектуры для задач компьютерного зрения (forward pass'ы нейронок и классические алгоритмы)?По идее, всё, что имеет отношение к нейронным сетям, должно хорошо ложиться на мультиклеточную архитектуру. Но никто ещё не пробовал.
Есть ли прогресс по поддержке Rust'а?Прогресса пока нет, но мы знаем, что есть интересующиеся. Какую-нибудь минимальную тестовую программу можно запустить, наверное, на любом языке, для которого сделан фронтенд LLVM (для Rust и C++ такое сработало). Но, как только программа усложнится, появятся конструкции, которые пока не может обработать либо бэкенд, либо ассемблер. В приоритете сейчас стоят оптимизации бэкенда, что повлияет потом на скорость работы любого языка.
Сотрудничаете ли вы с университетами, либо планируете ли вы это делать?Пока не знаем.
Уже развернуты учебные классы на R1 в УрФУ и УрГУПС. Ряд университетов в Санкт Петербурге и Москве обдумывает приобретение.
28нм связано с тем что планируете производить на Российских площадках?
А в России есть или в обозримой перспективе будет 28 нм?
НЛО прилетело и опубликовало эту надпись здесь
Нельзя просто взять и перенести выпуск чипа с одной площадки на другую. У каждой компании, у которой есть фабрики, свои библиотеки элементов, на базе которых делается физический дизайн (то есть, грубо говоря, логические элементы раскладываются в транзисторы). Поэтому, чтобы перенести выпуск, скажем, с Global Foundries на TSMC, нужно переделывать физдизайн, а это некоторые затраты ресурсов. То есть, даже если в России появится производство 28 нм, не получится просто так, безболезненно на него переехать.
Нет, выбор топонормы обусловлен тем, что это минимальная «разумно доступная» топонорма, а российских фабов для такого производства, пока, к сожалению, не предвидится.
В этом случае, хэшрейт такой платы будет равен либо превышать хэшрейты существующих видеокарт, при этом энергопотребление платы с S1 будет в два раза меньше, даже чем у видеокарт с топонормами 16 и 14 нм.вы забыли, что 470 можно даунвольтить, память разогнать по частоте и таймингам и получить не 25,8 а 30мх… то же самое с 1080ти. 55 достижимы при энергопотреблении меньшем, чем указано в таблице.
ну а также, что уже есть асики, которые какраз в два раза энергоэффективнее видеокарт… соотвественно для данного алгоритма уже будет вставать вопрос цены… сколько же эти ускорители будут стоить? хотя конечно в отличии от асиков данное решение будет и универсальным, вот только разработчики нужны на написание софта :) а много ли их?
плюс про 20 процессоров на одну плату, вы не забыли, что придется тогда и памяти поставить хотя бы 20*4гб (а лучше 8 для универсальности)? что и по размерам и по цене…
В том то и дело, они наделают асиков, в Ethereum в итоге на proof-of-stake перейдет. А на мультиклете можно будет просто алгоритм для другой криптовалюты написать. SDK же выложено в открытый доступ, кому надо майнить — те и напишут.
Какие конкретно будут платы — этот вопрос ещё решается.
Какие конкретно будут платы — этот вопрос ещё решается.
на эфире еще есть идеи сменить алго с даггера на прогпов
а по поводу того кому надо…
так под ПЛИС тоже есть всё, только вот пишущих намного меньше, ибо сложнее. так и тут.
если будет отсутствие писателей нужного софта — ненужны они будут никому…
а отсюда я б на месте разработчиков демоплаты простенькие распространял бы бесплатно, чтобы желающие могли познакомиться с архитектурой…
а там… видно будет…
а по поводу того кому надо…
так под ПЛИС тоже есть всё, только вот пишущих намного меньше, ибо сложнее. так и тут.
если будет отсутствие писателей нужного софта — ненужны они будут никому…
а отсюда я б на месте разработчиков демоплаты простенькие распространял бы бесплатно, чтобы желающие могли познакомиться с архитектурой…
а там… видно будет…
Именно с архитектурой бесплатно можно познакомиться прямо сейчас. В SDK включена модель-отладчик, которая эмулирует все команды процессора. Вы, конечно же, не узнаете реального быстродействия железа, но писать и отлаживать программы можно уже сейчас, используя модель. Мы, например, этим и занимаемся.
А вроде бы говорили, что теоретический предел в распараллеливании алгоритма на клетки — около 12 клеток, и далее эффективность вычислений не растет, больше тратится на синхронизацию и работу с памятью. Теперь говорите что влегкую рассматривали 128 и 258 клеток, но остановились на 64. Где правда?
Теперь говорите что влегкую рассматривали 128 и 258 клеток, но остановились на 64. Где правда?
Клеток то всего 64, но объединены они в группы по 4, т.е. аппаратное распараллеливание алгоритма идет на 4 клетки.
оффтоп:
Я так понимаю вы работаете в MC?
Наймите (не лично вы), пожалуйста, переводчика.
Хотел дать ссылку на англоязычный форум, но что-то стало стыдно.
Англоязычная часть сайта это же «кровь из глаз». «МГИМО финишд?»
multiclet.com/index.php/en/company/about-company
Я так понимаю вы работаете в MC?
Наймите (не лично вы), пожалуйста, переводчика.
Хотел дать ссылку на англоязычный форум, но что-то стало стыдно.
Англоязычная часть сайта это же «кровь из глаз». «МГИМО финишд?»
multiclet.com/index.php/en/company/about-company
Руководство компании не рекомендует русскоязычным разрабам пользоваться английской частью сайта, заведомо вторичной и слабо сопровождаемой. Сейчас нет необходимости как-либо ее поддерживать, но если найдется англоязычное коммьюнити, заинтересованное в разработке или сотрудничестве, можно будет и сделать нужные переводы.
Зарегистрируйтесь на Хабре, чтобы оставить комментарий
Перспектива: MultiClet S1