EntityFX Jul 28 2021 at 00:26

Энтузиаст протестировал новые китайские процессоры Loongson 3A5000

6 min

21K

ГК ICL corporate blogHigh performance*CPU

+16

Comments 37

Coocos Jul 28 2021 at 00:51

7-Zip [64] 16.02 : Copyright (c) 1999-2016 Igor Pavlov : 2016-05-21
p7zip Version 16.02 (locale=ru_RU.UTF-8,Utf16=on,HugeFiles=on,64 bits,8 CPUs Intel(R) Core(TM) i7-4700MQ CPU @ 2.40GHz (306C3),ASM,AES-NI)

Intel(R) Core(TM) i7-4700MQ CPU @ 2.40GHz (306C3)
CPU Freq: - - - 64000000 - - - - -

RAM size:   15945 MB,  # CPU hardware threads:   8
RAM usage:   1765 MB,  # Benchmark threads:      8

                       Compressing  |                  Decompressing
Dict     Speed Usage    R/U Rating  |      Speed Usage    R/U Rating
         KiB/s     %   MIPS   MIPS  |      KiB/s     %   MIPS   MIPS

22:      15721   636   2406  15293  |     186656   691   2305  15921
23:      14990   651   2346  15273  |     182849   684   2313  15823
24:      14848   666   2398  15966  |     166581   686   2130  14621
25:      14111   679   2371  16112  |     152368   676   2005  13560
----------------------------------  | ------------------------------
Avr:             658   2380  15661  |              684   2188  14981
Tot:             671   2284  15321

А у меня на 4700 другие результаты.

EntityFX Jul 28 2021 at 00:56

Но тут 8 потоков, всё-равно неплохо выходит.

-1

deseven Jul 28 2021 at 11:50

немного не дотягивает до Core i7-2600

Да уж, немного не дотягивает, на 30-50% медленнее почти во всех тестах.

EntityFX Jul 28 2021 at 12:01

Учитывайте, что это RISC процессор и 4 ядра на 2.5 ГГц, а не 8 потоков на 3.4 ГГц, так что всё нормально. Вот там на картинке 8 и 16 ядерные варианты будут, вот на них надо бы сравнивать.

-1

akaAzazello Jul 28 2021 at 12:41

Учитывайте, что лежащий в его основе MIPS именно RISC с 32 регистрами CPU/FPU - т.е. с точки зрения архитектуры он выиграшнее amd64 с ее 16 регистрами и необходимостью транслировать CISC в RISK

EntityFX Jul 28 2021 at 12:45

Там они кардинально переделали MIPS, так что можно уже и не считать MIPSом, оставили только 32 регистра и PC, ну и 1 категория команд совпадает, остальные свои.

-1

creker Jul 28 2021 at 21:24

Далеко не факт. Кроме разве что количества регистров, что сказывается на эффективности кодогенерации, все остальное просто пальцем в небо. Смысла ставить одну архитектуру выше другой нет никакого. Нужно смотреть сколько ядер, сколько кэша, сколько потребляет энергии и нормировать на эти показатели попугаи в бенчмарках. Вот так и можно будет сравнить.

akaAzazello Jul 29 2021 at 10:26

Мне кажется, вы недооцениваете, сколько сложностей доставляет на многоконвейреном процессоре исполнение CISC команд с их разной длинной. К счастью, инженеры Intel(в PentiumPro) и AMD(базируясь на NexGen 6x86/K6) ещё в середине 1990х это осознали и перевели все свои х86 процессоры на RISC архитектуру внутри.

И трансляция "на лету" х86 во внутренний RISC далеко не бесплатна - требует немалого транзисторного бюджета (который в ином случае можно израсходовать на те е ядре/кеши/размер файла регистров/и т.д.), и добавляет некоторую небольшую латентность (особенно когда кто-нибудь напришет оператор switch на пару десяткой вариантов).

Так что разница будет - несколько процентов в среднем. И врядли больше 10%

creker Jul 29 2021 at 12:37

Этот миф частенько повторяется, но он мифом так и остается. Если бы это было правдой, современные x86 были бы ограничены производительностью фронтэнда, а точнее его декодерами. Но это не так, ботлнеки все время в совсем других местах. Если посмотреть на тот же зен 3, который имеет существенный прирост IPC, основные изменения там совсем в других местах, а самое главное это измененная архитектура L3 кэша.

Насколько эта трансляция не бесплатная я не знаю, но доподлинно известно, что практически вся площадь кристалла нынче это кэши, файл регистров, очереди. Логика занимает ничтожную долю. Поэтому аргумент сомнителен без каких-то пруфов. Уж латентность вообще бессмысленный вопрос в свете внеочередного исполнения, конвейерной обработки, префетчинга и прочих трюков, которые скрывают любые задержки. Касается это в том числе современного RISC.

Так что нет. Пока не будет каких-то объективных данных, в этот миф верить я просто так не буду. И консенсус примерно такой же в индустрии. Спор этот не имеет никакого практического смысла и в современных процессора давно нет четкой границы RISC и CISC. Поэтому нужно смотреть на самое главное - что процессор может на деле. А на деле мы видим, то в топовом сегменте АРМ не имеет преимущества над x86 - ampere процессоры идут на равных с эпиками. Если бы все было так однозначно, эпик был бы оставлен далеко позади.

deseven Jul 28 2021 at 15:11

Не понимаю, почему это нужно учитывать? Есть два процессора, которые напрямую сравниваются друг с другом, при этом русским по белому написано, что первый "немного не дотягивает" до второго, при отставании в тестах на 30-50%. Какая разница сколько в каком из них ядер?

creker Jul 28 2021 at 21:29

Какая? Может давайте core i7 с эпиками 64 ядерными сравнивать тогда? Какая ведь разнца? Смысл это учитывать в том, что процессоры абсолютно разные и нужно попугаи нормировать на характеристики процессоров. Это если не брать в расчет цену, которая может совсем другой расклад дать. У интела как минимум выше частоты, больше ядер и скорее всего существенно выше потребление.

deseven Jul 29 2021 at 11:37

Не я выбирал что и с чем в этой статье сравнивается, задайте эти вопросы автору.

-3

EntityFX Jul 29 2021 at 11:42

Что было под рукой, с тем и сравнил.

-1

creker Jul 29 2021 at 12:13

И это ваш аргумент? Что было под рукой, то и взяли. Плюс этот процессор не имеет аналогов, чтобы сравнить с чем-то. Это не амд и интел, которые как копирка друг друга. Раз такие условия, то нужно адаптироваться под них, а значит интерпретировать результаты тестов согласно разнице процессоров. Что в статье и сделано - 30-50% разницы с учетом, что процессоры разных весовых категорий.

EntityFX Jul 29 2021 at 13:27

В общем, достаточно на хороший уровень они вышли и по роудмапу будут расти, так что нормально, найдут где применить.

deseven Jul 29 2021 at 21:00

Понятно - аналогов нет, что имели то и взяли, если бы ~~у бабушки были яйца~~ у i7-2600 было в 2 раза меньше потоков и частоты...

А по факту можно конечно разницу и в треть, и в 2 раза называть "немного не дотягивает", кто бы спорил, вопрос исключительно в качестве таких заявлений.

UFO just landed and posted this here

YourMama Jul 28 2021 at 14:56

Главное, что там нет бэкдора в виде Intel ME

EntityFX Jul 28 2021 at 15:09

)) Рекламу недавно на Ютубе показали, что самая защищённая технология))

checkpoint Jul 28 2021 at 18:26

Не расстраиватесь, у Loongson 3A5000 имеются свои бэкдоры, от КПК.

EntityFX Jul 28 2021 at 19:19

:-))))

0xC0CAC01A Dec 7 2021 at 17:42

Вопрос в тему. А есть процессоры, хоть 32-битные, но в которых гарантированно отсутствуют бекдоры и чтобы это можно было проверить?

Tiriet Dec 13 2022 at 09:15

А что лично Вам нужно, чтобы "гарантированно проверить"? миллиард транзисторов, есличо.

checkpoint Jul 28 2021 at 18:25

Байкал BE-M1000 дает 68248 coremarks/MT на частоте 2.0ГГц, что на 20% поболее чем у Loongson 3A5000 (54826 coremarks/MT) на частоте 2.5ГГц при примерно том же энергопотреблении. Байкал BE-M1000 — это ARM Cortex-A57, в то время как Loongson 3A5000 — творчески переработанный MIPS64 со всеми вытекающими проблемами совместимости.

EntityFX Jul 28 2021 at 19:23

Подождите, но у Байкала-М частота 1.5 ГГц и 8 ядер, а тут 4 ядра.

checkpoint Jul 28 2021 at 19:52

Да, действительно 1.5ГГц у BE-M1000, моя ошибка. Получается, что у Байкала производительнось на ядро составляет 5.6 coremark/MHz, против 5.4 coremark/MHz у Loongson. Как не сравнивай — Байкал выигрывает. :-)

В большинстве случаев, для конечного пользователя нетбука без разницы за счет чего получается вычислительная мощность, главное что бы ютуб не тормозил. Так вот, на Байкале ютубчик будет пошустрее (без аппаратных видекодеков).

Если сравнивать по coremark-ам, то производительность ядра Loongson 3A5000 соответствутет BCM2711 (Raspberry Pi 4) при существенно, в разы, бОльшем энергопотреблении первого. В общем, Loongson это эдакий китайский Эльбрус — не шибко быстрый, но свой, родной и уникальный. :-)

EntityFX Jul 28 2021 at 19:55

Ютубчик тестировал на Байкале, хорошо тянет 1080 @ 30. Но да, Loongson как и Эльбрус хороши в ГФлопсах.

checkpoint Jul 28 2021 at 20:09

Да, мы тоже тестировали Байкал — в целом, годный камень для нетбуков и прочих «АРМов секретаря». Эльбрус-8СВ — мало пригоден для этой цели. Подозреваю, что Loongson — так же как и Эльбрус.

Для утилизации ГФлопсов нужны специальзированные приложения, заточенные под конкретную архитектуру FPU, а их нет.

EntityFX Jul 28 2021 at 21:07

Поэтому МЦСТ надо открывать архитектуру и может смогут портировать всю обвязку ПО, кроме Си и Плюсов. Байкалом пользуюсь: Интернет, видео и для кодинга хватает. На Эльбрусе удалённо работаю: он игры нормально запускает, но софта мало.

checkpoint Jul 28 2021 at 21:49

Ваши слова до Богу в уши… Не слышат нас на верху, к сожалению.

Tiriet Dec 13 2022 at 09:21

ГФлопсы нужны в рассчетах. Рассчеты в основной своей массе- это здоровенный "фронтенд" для подготовки большущего массива чисел, который потом запускает нудное и мерзкое перемножение и сложение этих массивов какой-то библиотечкой на 10кб скомпилированного кода- вырезка из IMKL, условно, или AlgLib. Так вот затачивать под FPU достаточно только эту библиотечку, и то, не всю, а самые часто используемые ее функции, и это совсем не страшная задача.

EntityFX Jul 28 2021 at 19:24

Простите, случайно нажал на -1, а отменить уже никак((

xlop-chik Jul 28 2021 at 22:47

то хотя бы дайте ссылку на алиэкспрес - где такое купить?! дайте две! самое то для домашней файловой помойки.

p1024x Jul 28 2021 at 23:28

Любопытный тест, однозначно ПЛЮС!

Хотя с практической точки зрения, смысла в таком сравнении не много.

Процессору Core i7 2600k более 10 лет, и сравнивать его с процессором 2021 года конечно интересно, но практического смысла не имеет. Отставание при этом серьёзное, но Intel это компания с более чем 50 летней историей, с огромным бюджетом. Компания, которая является по сути монополистом и обладает всеми преимуществами economy of scale.

Так или иначе, показатели хорошие.

EntityFX Jul 29 2021 at 13:27

Нашёл что-то похожее, что было в наличии.

Tiriet Dec 13 2022 at 09:33

MediaTek каких-то десять лет назад выпускала тупые, медленные, глючные процессоры для мобил (по-моему, МТ6575), на которых работал ChangJang G22- тупорогий и феноменально сонный муляж HTC Sensation (на Квалком 8260). А каких-то 5 лет назад медиатек уже выпускала Helio P10- очень даже бодренький конкурент и последним квалкомам, и техасовским омарам.

kovserg Jul 30 2021 at 07:48

Выглядит так что у i7 2 канала памяти используются, а у 3A5000 только один канал памяти задействован.

AMD Phenom 9500 sAM2+ с тактовой частотой 2,2 ГГц: 2200 МГц × 4 ядра × 4⋅10−3 = 35,2 Гигафлопса
Для четырёхъядерного процессора Core 2 Quad Q6600: 2400 МГц × 4 ядра × 4⋅10−3 = 38,4 Гигафлопса.

Более новые процессоры могут исполнять до 8 (например, Sandy и Ivy Bridge, 2011—2012 гг, AVX) или до 16 (Haswell и Broadwell, 2013—2014 гг, AVX2 и FMA3) операций над 64-битными числами с плавающей запятой в такт (на каждом ядре)[13]. В последующих процессорах ожидается исполнение 32 операций в такт (Intel Xeon Skylake, Xeon *v5, 2015 г, AVX512)[14]

Sandy и Ivy Bridge c AVX: 8 Флопс/такт двойной точности[15], 16 Флопс/такт одинарной точности
Intel Core i7 2700:/Intel Core i7 3770: 8*4*3900 МГц = 124,8 Гфлопс пиковая двойной точности, 16*4*3900 = 249,6 Гфлопс пиковая одинарной точности.

Intel Haswell/Broadwell с AVX2 и FMA3: 16 Флопс/такт двойной точности[15]; 32 одинарной точности Флопса/такт
Intel Core i7 4770: 16*4*3900 МГц = 249,6 Гигафлопса пиковая двойной точности, 32*4*3900 = 499,2 Гфлопс пиковая одинарной точности.

Так что тесты максимальной производительности слегка странные. 3dnews.ru/936197