Comments 65
Но чем больше в процессоре инструкций, тем сложнее его архитектура, тем больше внутри элементов и следовательно его и модернизировать сложнее, и для перехода на другой техпроцесс будет сложнее, и с поднятием частоты все не так просто - чем длиннее разные цепочки внутри архитектуры, тем сложнее синхронизировать такты. А точнее просто будут дольше задержки, чтобы обеспечить проход самой длинной логической цепочки...
Поэтому потенциал оценить на данном этапе именно сравнивая с интелами - сложно. У каждой архитектуры свой путь..
Сейчас уже не так делают. Микрокод в процессор и пусть он со всем вагоном инструкций разбирается. Уже давно даже до эмуляции всяких депрекейтед штук дошло. Совместимость это важно.
Сам процессор может работать или с подмножеством инструкций или вообще на другом ассемблере. Компиляторы соберут программу из правильных инструкций, чтобы быстро было.
но все равно на механическом уровне есть архитектура состоящая из транзисторов, и от нее и зависит легкость модификаций и масштабирования
Микрокод в процессор и пусть он со всем вагоном инструкций разбирается.
Раздекодировать несколько инструкций за такт микрокодом надо постараться... Для некоторых инструкций микрокод, конечно, используется, но то, что исполняется часто, обрабатывается кастомной захардкоженной логикой.
"сейчас" - это когда? В 1970-х годах, когда были популярны процессоры на основе микрокода? Так как их трудно конвейеризировать, то процессоры в 1980-х стали hardwired, с микрофоном для редко используемых инструкций. Или вы путаете микрокод с превращением CISC инструкций в RISC-образные микроинструкции в PentiumPro 1996 года? И когда вы говорите про компиляцию, вы имеете в виду именно компилятор типа GCC или LLVM - или бинарную компиляцию в процессорах типа Trasmets в 2000 году?
А что сегодня делает так называемый микрокод, что загружается в процессор? Чисто конфигурация модулей или может как-то влиять на логику, не встраивают там ПЛИС внутрь?
Микрокод - это конкретный очень специальный способ построения последовательных конечных автоматов. Он удобен, когда выбор следующего действия (активации контрольных сигналов) делается на основе небольшого количества сигналов, а цепочка действия напротив длинная. Например одна команда, как у VAX-11 в 1970-е, делает несколько обращений к памяти, аутоинкременты итд, а то и целую формулу считает. Их тогда реализовывали микрокодом.
Но когда процессор конвейерный, комбинации сигналов из разных стадий конвейера неудобно учитывать микрокодом, потому что будет слишком много случаев и микрокода будет много. Так как микрокод хранится в памяти, то придется заводить большие статические памяти, появится проблема с ее латентностью, размерами, энергопотреблением.
Во современных процессорных ядрах (от ARM, RISC-V) как правило микрокода вообще нет. Все решения принимаются комбинационной логикой без всяких обращений к памяти микрокода. Эта логика синтезируется из кода на языке описания аппаратуры Verilog или VHDL, и это описание микрокодом не является.
(Вообще с термином микрокод часто бывает путаница - есть даже люди которые путают его с инструкциями которые выполняет процессор)
В процессорах с легасу микрокод где-то есть если нужно чего-то остановить и долго последовательно делать цепочку действий (с таким не работал).
То что у интела называется c середины 1990-х "микроинструкции" - это не микрокод, это просто превращение CISC-инструкций в RISC-подобные, которые удобнее обрабатывать динамическим конвейером.
Во современных процессорных ядрах (от ARM, RISC-V) как правило микрокода вообще нет.
Что, PMU и подобные вещи (скажем, ARM SPE, BRBE) тоже на чистой логике?
Я с ARM PMU не работал, но из общих соображений и по его описанию - зачем там нужен микрокод? Для измерения производительности в ядрах и чипах, с которыми я работал, просто заводится куча счётчиков, которые увеличиваются при определенных событиях (скажем сбрасывании строки кэша в память). Доступ к этим счётчикам можно сделать через memory-mapped регистры или отладочный интерфейс. Ведь чистая логика - это не только прямолинейные A and B or C, но с логикой без лишнего уровня микрокода можно строить конечные автоматы, итеративно обрабатывать таблицы в памяти, привязывающие строки исходного кода к событиям через program counter итд.
А сгенерировать прерывание по переполнению счётчика? В случае SPE - ещё и записать в буфер в памяти кучу данных об инструкции (latency, DLA и т.д.) в специальном формате.
Сгенерировать прерывание по переполнению счётчика - это так банально, что я даже не буду это спрашивать у студента на интервью. Для записи информации в буфер тоже микрокода не нужно - достаточно конечного автомата, который это делает. В роутерных чипах даже связные списки в памяти обрабатывают без микрокода. Без всякого микрокода можно даже текст парсировать чистым хардвером - я написал пост об этом "Как делать парсинг текста голым хардвером, без процессора и без софтвера" https://habr.com/ru/articles/278681/
А может вы просто путаете логику с комбинационной логикой? То есть предполагаете, что весь хардверный дизайн сводится к и/или/не, а любые сложные или повторяющиеся действия требуют микрокода?
Если так, то спешу пояснить: помимо комбинационной логики есть ещё последовательностная логика, то есть кроме и/или/не есть ещё и элементы состояния - d-триггеры. Как только мы вводим элементы состояния, то можно строить (безо всякого микрокода), конечные автоматы, конвейеры и очереди, с помощью которых можно вычислять сложные формулы, писать в память какая была латентность итд.
Понятно, что без триггеров и сдвиговых регистров процессор не построишь. Вопрос только, стоит ли тратить кастомную логику и транзисторы на каждую фичу, напрямую не связанную с производительностью (выполнением инструкций, постоянно встречающихся в реальном коде) и не дешевле ли вставить интепретатор микрокода? Ну и возможность что-то пофиксить после выхода железяки тоже полезна.
А из чего, по вашему, состоит "интерпретатор микрокода"? В основном из куска памяти, к которой еще и нужна логика, чтобы ее загружать.Он что, бесплатный? Если заменить каждый конечный автомат в типичном современном ASIC на microcoded конечный автомат с встроенным SRAM и интерфейсом для загрузки его снаружи, то это приведет к сильному увеличению размера чипа и увеличению энергопотребления - так просто не делается кроме особых случаев. А большинство дизайнов еще и конвейерные, где micrcoded state machine вообще не вписывается.
Он что, бесплатный?
Естественно нет, вопрос в общем количестве транзисторов на одну схему интерпретации и память кода под разную функциональность или кастомную реализацию на логике каждой новой фичи мониторинга и т.п. Опять же - я не про базовую функциональность процессора по исполнению инструкций.
Я делал кастомную реализацию performance counters для GPU. Количество транзисторов для того, чтобы завести новый счетчик и логику, привязывающую событие к этому счетчику разумеется меньше, чем счетчик + эта же логика в микрокоде. Вообще вы пробовали сами реализовать какой-нибудь игрушечный процессор с микрокодом и без него? Возьмите к примеры schoolRISCV (такой образовательный процессор на 240 строк верилога), перепишите его сначала в многотактовый, а потом в процессор с микрокодом, а потом в конвейерный, и сравните все четыре реализации. Вопрос с микрокодом сам отпадет.
Вообще вы пробовали сами реализовать какой-нибудь игрушечный процессор с микрокодом и без него?
Нет - так что честно говоря спорю в основном для получения новых знаний )
кастомную реализацию performance counters для GPU
Там возможность семплинга (и соответственно привязки событий к коду) была? Просто счётчик, инкрементирующийся по какому то условию, которое можно получить логической функцией от имеющихся сигналов, конечно проще захардкодить.
Эта привязка делается с помощью записи текущего PC - Program Counter-а. Хардверу не нужно хранить внутри имя файла и строки. Это может вычислить софтвер, которые получает массив троек (текущий такт, program counter, событие), и при этом имеет информацию от компилятора и линкера какому номеру строки соответствует PC.
Да, забыл поблагодарить за упоминание schoolRISCV - действительно интересная вещь для самообразования. И кстати - что думаете про Chisel, стоит ли на него смотреть?
Да, и что вы называете кастомной реализацией и некастомной? Сейчас все реализации - это код на языке Verilog который превращается в ASIC standard cells. Если вы хотите фиксировать событие типа выталкивания строки кэша, то вам все равно нужно завести сигнал и подсоединить его от места где вырабатывается решение на выталкивание к месту где увеличивается счетчик (новая группа D-триггеров), после чего иметь возможность значение с этого счетчика куда-то отправить (скажем на шину данных при декодировании адреса, на который отображается доступ к этому регистру). Эту логику придется завести с микрокодом или без, тут он никак не поможет. Блок микрокода не может узнать через телепатию, что кэш решил вытолкнуть строку. Микрокод - это просто способ хранения изменяемых конечных автоматов в памяти.
Да, и что вы называете кастомной реализацией и некастомной?
Отдельная схема под конкретный функционал или общая схема для интепретации микрокода и код в памяти для разных вещей (legacy инструкции, PMU, управление температурой/частотой и прочих не связанных с основной работой штук, которых в современном процессоре пруд пруди).
Если вы хотите фиксировать событие типа выталкивания строки кэша
Фиксация события, конечно, делается на логике. Вопрос в реакции - особенно если хочется записать в буфер в памяти адрес инструкции, адрес данных, в каком конкретно кеше (а может и в TLB) был промах, latency и т.д. Ну или писать в буфер в память полную историю выполнения, по максимуму минимизируя объём данных (типа Intel PT). Верю, что можно описать на верилоге и реализовать отдельным блоком транзисторов - вопрос, стоит ли?
Вы думаете собрать десять сигналов в одну конкатенацию и записать ее в буфер сильно сложнее, чем записать один сигнал? Это может быть сложнее, если все эти сигналы появляются на разных стадиях конвейера и их нужно задерживать относительно друг друга или пропускать через очереди FIFO чтобы собрать в одном месте, но ... как этому поможет микрокод?
cобрать десять сигналов в одну конкатенацию и записать ее в буфер
Зависит ещё от формата буфера (в том же PT это заметно посложнее, чем набор полей фиксированной длины). Согласен, что конечным автоматом на логике это вполне реализуется - возможно, так действительно стоит делать, надо сравнивать конкретные реализации.
То самое превращение "CISC инструкций в RISC-подобные", а точнее последние -- вполне можно считать микрокодом, близким к тому что называется "вертикальный микрокод", просто те получающиеся инструкции выполняются уже не на примитивном вычислителе, а на супер-сложном суперскалярном ядре. И когда разные там сложные х86 инструкции декодируются в микрокод (или как нонче принято говорить, в risc-подобные) уже не всегда логикой декодера, а иногда вычитываются из ROM или RAM (а это есть в х86), то вот уже настоящий микрокод в хранилище, применяемый правда не ко всем инструкциям и в случае RAM -- только для патчинга.
А вы часом не путаете латентность, latency, количество тактов - и задержки внутри такта, связанные с propagation delay - пикосекундными задержками на комбинационной логике? А также архитектуру (системы команд) и микроархитектуру (устройство конвейера)?
Зашел узнать результаты каких-то новых и интересных тестов, а в итоге вся статья сводится к одному предложению - поскольку процессор намного хуже всех аналогов, то у него больше всего перспектив улучшения.
Я понял по другому: процессор сделанный по старым нормам не катастрофически проигрывает процам начального уровня от Интел/АМД. Если его перевести на новые нормы, даже ничего не меняя - только за счёт этого увеличим производительность, а ещё и архитектуру улучшат.
Ну и останется самая простая часть - переписать весь существующий софт под новую архитектуру.
Перекомпилировать. И после перекомпиляции всего существующего софта под АРМ это не выглядит страшным.
Ага, все именно так и говорят про свои платформы - просто перекомпилируй. По итогу оказывается, что все несколько сложнее, и где-то что-то приходится дописывать, исправлять и т.д. А компиляторы начинают обрастать всякими специальными штуками под платформы.
И я просто напомню, что на ARM работает подавляющее большинство мобильных девайсов, а также ее официально поддерживают и развивают всякие крупные компании типа Apple, Microsoft и прочие Samsung'и. Все ли хорошо с этим у китайцев?
Китай бигтех тоже поддержит. Хуавей, Алибаба и иже с ними. Компиляторы и инструменты они сделают.
Тут важнее чтобы средний бизнес поддержал и пересобрал свой софт. Для этого нужно проникновение этих процов в люди. Если цена на проц в будет хорошей и доступно много то должно взлететь. Почему нет?
Потому что так рынок не работает. Либо ты приносишь на рынок что-то новое, либо у тебя есть какая-то уникальная особенность. Чуть лучше цена вряд ли заставит кого-то перейти с проверенных решений на какие-то новые. Это не первый и не последний процессор (в том числе китайский), который пытается выйти на конкурентный рынок.
Да и насчет цены, кстати, тоже есть сомнения. Чтобы цены была хорошей, нужно выпускать и продавать действительно много процессоров.
Просто не хуже или не сильно хуже и дешевле достаточно. Рынок с радостью возьмет нормального поставщика независимого от Америки. Просто для безопасности и диверсификации рисков.
До этого ерунда была. Я именно про универсальный ЦПУ сравнимый с существующими. Пока такого предложения не было.
Цену можно и дотировать. Китай уже столько денег вложил что такие дотации мелочи.
Рынок с радостью возьмет нормального поставщика независимого от Америки.
А что, это для кого-то, кроме России, проблема? И чем вендор-лок на Китай лучше, чем на США?
Я именно про универсальный ЦПУ сравнимый с существующими.
Так вот упомянутый вами ARM чем не ок? Производителей много (в том числе китайских), перекатится с одного вендора на другого относительно просто.
Китай уже столько денег вложил что такие дотации мелочи.
Тут не все так просто. Область очень дорогая и технологичная, а потребители нужны по всему миру, чтобы это все как-то окупалось. Китай может обязать всех внутри это использовать, но на прибыль тогда это вряд ли выйдет. А на внешние большие рынки непонятно как выходить, потому что там есть свои уверенные игроки (США, ЕС, Индия... даже России непонятно, зачем сажать себя на эту сомнительную иглу).
А что, это для кого-то, кроме России, проблема? И чем вендор-лок на Китай лучше, чем на США?
Внезапно да. Для всех. Никто теперь не уверен в поставках.
Не перейти на другой вендор лок. Покупать и там и там. Защитить себя от внезапной отмены и потенциальных проблем. Это типовой паттерн закупок вообще. Минимум два независимых поставщика для всего критичного.
Для того же сетевого оборудования полсети построить на Хуавее, а вторую половину на Циске это разумное и дальновидное решение.
Так вот упомянутый вами ARM чем не ок? Производителей много (в том числе китайских), перекатится с одного вендора на другого относительно просто.
А сколько их них могут послать Вашингтон с его хотелками? С учетом что нужен не просто АРМ, а серверный или хотя бы дестктопный процессор. Не хуже того что уже есть.
А на внешние большие рынки непонятно как выходить, потому что там есть свои уверенные игроки (США, ЕС, Индия... даже России непонятно, зачем сажать себя на эту сомнительную иглу).
Игрок там один. В этом то и дело.
Выходить понятно как. Выставить огромные партии на продажу, раздавать всем демо образцы, давать бесплатный доступ к облакам на попробовать. Поставить такую цену что доллар на ватт на вычислительную мощность выйдет выгоднее Интела. Ничего нового.
Внезапно да. Для всех. Никто теперь не уверен в поставках.
О каких "всех" вы говорите, я не могу понять. Мне вот не надо.
Кто не уверен в поставках? Я вот уверен в поставках.
Вы перечислить можете кого-то?
Для того же сетевого оборудования полсети построить на Хуавее, а вторую половину на Циске это разумное и дальновидное решение.
Эээ... Не знаю, как бы это вам сказать. Скажу как есть: сетевое оборудование Хуавей во многих странах (и на всех ключевых точках) вообще запрещено. Никто не хочет ставить на критическую инфраструктуру оборудование из страны с сомнительной репутацией (да и Хуавей уже за руку ловили).
А сколько их них могут послать Вашингтон с его хотелками?
Моргните, если эти вашингтонцы сейчас с вами в одной комнате и мешают жить :)
Выходить понятно как. Выставить огромные партии на продажу, раздавать всем демо образцы, давать бесплатный доступ к облакам на попробовать. Поставить такую цену что доллар на ватт на вычислительную мощность выйдет выгоднее Интела. Ничего нового.
Великолепный план, Уолтер. Просто охренный, если я правильно понял. Надёжный, как швейцарские часы. (с)
Вы перечислить можете кого-то?
Список стран ООН откройте. Вот они. Кроме разве что Канады.
Никто сейчас не уверен что их завтра не отменят и им не придется сервера через Казахстан возить. Довезут, конечно. Но нафиг этот геморрой нужен?
Скажу как есть: сетевое оборудование Хуавей во многих странах (и на всех ключевых точках) вообще запрещено
Америка это не многие страны. Это ровно одна страна.
Что интересно говорит что нашлись закладки тоже только Америка. Другие страны искали и не нашли. Само по себе это вроде ничего не говорит, но в комплексе толсто намекает.
Весь остальной мир оборудование Хуавей активно закупает. Причины этих закупок мне понятны. Инженеров надо учить, эксплуатировать надо учиться, проблемы надо собирать. Это даже за деньги не купить.
Напомню что лучшие безопасники в мире в 2024 году это Касперский. Они нашли аппаратную закладку в Айфонах. Может быть американские (или подконтрольные им) тоже нашли и им запретили говорить, но это недоказуемо. Так что Касперский лучший.
Моргните, если эти вашингтонцы сейчас с вами в одной комнате и мешают жить
Моргаю. Закупать железки через Казахстан неудобно. Возить черти как тем более неудобно. Как завтра звать инженеров Нвидии помогать дебажить очередной косяк я не уверен. Но думаю что что-нибудь получится придумать. И на закуску мою машину обслуживают через софт работающий через впн куда-то и аккаунт оттуда же. Причем тут машина я вообще не понял. Это прямо действия Вашингтона.
Если бы хотелки Вашингтона реализовались полностью, то я бы сидел без макбука, айфона и без серверов с А100. Моя жизнь от этого стала бы заметно хуже. И не только моя, но и окружающих меня людей. Деньги есть, о бесплатности речи не идет.
Список стран ООН откройте. Вот они. Кроме разве что Канады.
О, прекрасный охват. Если вы эксперт такого широкого профиля, и легко можете говорить за весь мир, то предложу сузить этот список до Испании. Расскажите мне, пожалуйста, чем Испанию не устраивает США как поставщик? И как в стране борются с этой проблемой? И почему они перешли бы на Китай?
Никто сейчас не уверен что их завтра не отменят и им не придется сервера через Казахстан возить.
Мой нетворкинг охватывает всю планету, но про озвученную вами проблему я слышу только от коллег из РФ/РБ. Я также не испытываю никаких проблем с поставками железа, так что воистину не понимаю, о чем вы.
Америка это не многие страны. Это ровно одна страна.
Ой, а еще ЕС.
А еще Австралия.
А еще Индия.
Дальше сами по списку ООН можете проверить.
Напомню что лучшие безопасники в мире в 2024 году это Касперский.
Нет повода вам не доверять :) Не понял только, как это к контексту треда относится.
Если бы хотелки Вашингтона реализовались полностью, то я бы сидел без макбука, айфона и без серверов с А100.
Зачем при этом вы пользуетесь Вашингтонской техникой?))))
Расскажите мне, пожалуйста, чем Испанию не устраивает США как поставщик? И как в стране борются с этой проблемой? И почему они перешли бы на Китай?
Отличный пример.
Вот есть такая страна Каталония. Решит она побороться за независимость с испанской оккупацией которая их душит и не дает жить. Побороться нормально со стрельбой и взрывами. Испания в ответ начнет КТО против террористов. Тоже со стрельбой и бомбардировками.
Кого из них отменят? Кому придется в Казахстане сервера закупать? Я не знаю. Испания видимо верит что Каталонию отменят. Не знаю почему они в этом так уверены. Я бы на их месте еще подумал.
Мой нетворкинг охватывает всю планету, но про озвученную вами проблему я слышу только от коллег из РФ/РБ. Я также не испытываю никаких проблем с поставками железа, так что воистину не понимаю, о чем вы.
Я тоже люблю поболтать с людьми.
Проблем нет. Есть опасения. Для шантажа Вашингтон не стесняется использовать ничего (я снова по те же сервера с макбуками. обычные бытовые штуки). И надо либо от него заранее защититься или делать то что говорит Вашингтон. Опасения серьезные и о них говорят. Местами уже начали что-то делать. Понятно что это работа на годы.
Дальше сами по списку ООН можете проверить.
Индия ничего не запрещала. Они нормальные и могут думать о своих интересах.
Остальные ну так себе пример. Эти страны что-то объединяет. Не догадаетесь что?
Зачем при этом вы пользуетесь Вашингтонской техникой
Я пользуюсь техникой бигтеха. Она классная. К бихтеху я отношусь очень лояльно. У него свои интересы, они мне понятны и одобряемы мной.
Вашингтон пока ими командует. Это печально. Но что поделать. Эту проблему Эпплу придется самому решать.
Сначала я подумал, что расскажу все-таки реальное положения дел про страну, в которой я живу и веду международный бизнес (Испания, та самая Каталония - Барселона).
Потом подумал, что мне надо опуститься до уровня вашего бреда с КТО, бомбардировками, покупкой оборудования из ЕС в Казахстане, отмена Каталонии и т.д., а я, что уж таить, не силен в генерации бреда.
У нас, очевидно, разный мир, который в сложившейся ситуации едва ли имеет точки пересечения. Для упражнений "в Интернете кто-то не прав" я стар, поэтому предлагаю на этом и остановится. Если кто-то увидит и прочитает эту ветку, сделает выводы сам.
И чем вендор-лок на Китай лучше, чем на США?
Для китайских кастомеров, на которых в основном ориентируется Longsoon, разница принципиальная.
Внутри Китая рынок очень специфично развивается и управляется. Там легко могут обязать использовать только свое и все. И да, на внутреннем рынке это будет работать.
Но для того, чтобы тянуть свои процы, одного внутреннего рынка мало. А расширяться на глобальный сложно по целому ряду причин (в том числе и китайскому вендор-локу).
одного внутреннего рынка мало
Китайский внутренний рынок - это очень много, и пока проблема скорее в том, чтобы произвести достаточно, а не в поиске покупателей. Тот же Longsoon за пределы Китая сейчас в принципе не продаётся - https://uk.pcmag.com/processors/144404/china-bans-exports-of-its-homegrown-loongson-chips
Так вот Ваша статья - и есть подтверждение, что тяжело развивать продукты мирового уровня в Китае. Правительство тебе почему-то запрещает экспорт, и ты должен думать, как развиваться на внутреннем рынке. Но дело том, что процы - штука оооочень дорогая (вся инфраструктура для их производства), поэтому более-менее конкурентоспособным его можно сделать только делая очень большие партии, распродавая по всему миру. И как минимум в этом списке должен быть свободный выход на рынки США, ЕС, Индии, Японии, Южной Корее, России. Из этого списка более-менее выход возможен только в Россию.
Я, в общем, не против, если у ребят получится. Конкуренция - это всегда хорошо, так что лично от себя пожелаю удачи и успехов. Но есть у меня некоторый скепсис.
Ага, а где-то приходится и ассемблерные вставки писать.
Играть в игрушки и в прочий хайлоад пока нельзя. В банкоматы, бухгалтерию, секретарш и прочие 50% применений уже можно. Как только у SMIC появится свой 5-7 нм массовый, то будет закрыто уже 90% возможных сценариев использования, ибо архитектурно процессор очень не плох. Корень его ограничений лежит в используемом техпроцессе, а не в сложности архитектуры. Так что анекдот совсем мимо.
Анекдот относится к заголовку статьи.
В этом-то и вся соль: вот интел с переходом с 14 нм на хотя бы 10 нм 5 лет мучался, и до сих пор там вопросы остались, грядущему 14900 опять 400 ватт пикового потребления пророчат. Хотя при всех управленческих закидонах (у кого их нет), интелу не откажешь в понимании деталей архитектур и техпроцессов.
Так что пусть китайцы на своих суконно-посконных "5-7 нм" хоть микроконтроллер какой успешно в серию пустят, а потом можно будет прио перспективы.
Ну как бы SMIC на 7нм вполне успешно и массового выпускается полноценный Kirin 9000S, который куда как сложнее любого микроконтроллера. Я конечно понимаю, что в основе своей для этого производства используется степперы ASML на 14нм. Но переделали то они их на 7нм уже сами. Другой разговор, что свободных мощностей нет и нужны именно полностью свои степперы.
в банкоматы, бухгалтерию и прочие секретутки офисные - можно свои православные кирины и медиатеки.
вопрос же не в самом процессоре, а в софте, который на нём будет крутиться. пока что как я понимаю этот процессор ничего не умеет. а медиатеки и кирины - умеют. собирай опенсорс под арм и запускай.
Только мне значения IPC для floating point кажутся странными (для всех архитектур)? Или там flops per cycle с учётом векторизации?
«Практически с нуля»? Они же вроде отталкивались от наработок RISC-V.
Вот цитата создателей: «a new RISC ISA, which is a bit like MIPS or RISC-V».
Он не может быть с нуля, посколько вся линейка лонгсунов делалась уже 25 лет, это была сложная история, причем ещё до 2010 года они купили у MIPS Technologies архитектурную лицензию на MIPS64 (то есть были совместимы по системе команд с MIPS, хотя и сделали собственную микроархитектуру, структуру конвейера). Так как я в то время работал в MIPS Technologies в Sunnyvale, California, я лично знаю VP Sales который летал в КНР и продал им лицензию. Конечно они потом добавили кучу дополнительных инструкций, но это все равно не с нуля.
На всякий случай обращаю внимание, что у рассматриваемого процессора 3A6000 целых 16 ядер, НО всего 16 Мб L3 кеша и 50 Вт TDP.
Получается, что надо увеличить в 2-4 раза L3 и снять лимиты TDP до 200 Вт хотя бы, чтобы уж на равных с современными кочегарнями быть. А раз снимаем лимиты, то и частоту поднять можно. Вот тогда получится процессор с современными характеристиками и (возможно) производительностью (не берём в учёт архитектуру, о которой пока инфы не густо).
В любом случае, как выше заметили, ещё 1-2 поколения и этот Loongson сможет закрыть 90% потребностей. Это успех!
Великолепно для начала. По сути Китай с ноги ворвался в клуб держав способных разрабатывать и выпускать CPU. До них перечень стран проектирующих\выпускающих CPU выглядел так: США, Тайвань, Россия. Тайвань со своими VIA C3 и Transmeta слился с рынка. Ну про Россию мы и так все знаем...
Так, если ограничить частоту работы ядер других процессоров 2,5 ГГц, то оказывается, что Loongson
Вчера наш спортсмен выступал не очень. Но сегодня мы прострелили остальным ноги и наш пришёл на финиш пятым!
Честно говоря статья какая-то странная, начинается с того что процессор появился, а потом мы видим заголовок: "Когда появится новинка?".
Еще поражает скепсис русскоязычного автора относительно производительности 16 (!!!) ядерного процессора, так и хочется сказать: "Чья бы корова мычала ...", причем скепсис выведенный из сравнения с i7, i5, да пусть даже i3. Так и хочется спросить: "Где наше отечественное производство, а где i3, хотя бы?"
Еще тезис про "система команд новой архитектуры включает около 2000 уникальных инструкций" для меня выглядит очень сомнительным, кто же будет весь софт под новый ассемблер переделывать вплоть до компиляторов, и ядер операционных систем, мне кажется автор статьи что-то не понял, ляпнул не понимая что прочитал в исходнике, лишь бы звучало модно-перспективно.
В общем статья рассчитана на тех кто ловит красивые-умные слова (каждое слово) и их комбинации. Для тех кто что-то понимает это какой-то выброс информационного шума.
Еще тезис про "система команд новой архитектуры включает около 2000 уникальных инструкций" для меня выглядит очень сомнительным, кто же будет весь софт под новый ассемблер переделывать вплоть до компиляторов, и ядер операционных систем, мне кажется автор статьи что-то не понял, ляпнул не понимая что прочитал в исходнике, лишь бы звучало модно-перспективно.
а может это специально придумано. чтобы чужой софт можно было использовать, а вот свой проприетарный китайский - только на этих китайских процессорах.
а-ля церикопик.
тезис про "система команд новой архитектуры включает около 2000 уникальных инструкций" для меня выглядит очень сомнительным
В соответствующем enum'е в llvm примерно столько и есть. И, соответственно, есть работающее семейство компиляторов )
Китайский процессор Loongson 3A6000: производительность оставляет желать лучшего, но перспективы — отличные