Комментарии 62
P.S. К слову, Raspberry Pi поддреживает armhf, а запускалась, судя по всему без hard float (armel обычно без hard-float). Поэтому и показывает катастрофически низкие результаты
www.7-cpu.com/cpu/Apple_A9.html
********************************************************
Dhrystone Benchmark Version 2.1 Non-optimised via C/C++ Tue May 12 17:05:07 2020
VAX MIPS rating: 2701.63
Classic Benchmark Ratings for CPUSpeed.txt where 100 MHz Pentium = 100
Integer Dhry2 NoOpt 8442
Numeric results were correct
Windows NT Version 6.2, build 9200,
CPU GenuineIntel, Features Code BFEBFBFF, Model Code 000506E3, 4008 MHz
Memory 2097151 KB, Free 2097151 KB
********************************************************
Dhrystone Benchmark Version 2.1 Optimised via C/C++ Tue May 12 17:05:23 2020
VAX MIPS rating: 13820.29
Classic Benchmark Ratings for CPUSpeed.txt where 100 MHz Pentium = 100
Integer Dhry2 Opt 10630
Numeric results were correct
Windows NT Version 6.2, build 9200,
CPU GenuineIntel, Features Code BFEBFBFF, Model Code 000506E3, 4008 MHz
Memory 2097151 KB, Free 2097151 KB
********************************************************
Dhrystone Benchmark Version 2.1 Non-optimised via C/C++ Tue May 12 16:53:16 2020
VAX MIPS rating: 5420.16
Classic Benchmark Ratings for CPUSpeed.txt where 100 MHz Pentium = 100
Integer Dhry2 NoOpt 16938
Numeric results were correct
Windows NT Version 6.2, build 9200,
CPU AuthenticAMD, Features Code 178BFBFF, Model Code 00870F10, 3593 MHz
Memory 2097151 KB, Free 2097151 KB
********************************************************
Dhrystone Benchmark Version 2.1 Optimised via C/C++ Tue May 12 16:54:39 2020
VAX MIPS rating: 15493.76
Classic Benchmark Ratings for CPUSpeed.txt where 100 MHz Pentium = 100
Integer Dhry2 Opt 11918
Numeric results were correct
Windows NT Version 6.2, build 9200,
CPU AuthenticAMD, Features Code 178BFBFF, Model Code 00870F10, 3593 MHz
Memory 2097151 KB, Free 2097151 KB
Вот вам вброс:
Huawei Server (Kunpeng 920 (armv8.4 64 core x 2 CPU)) 128 ЯДЕР:
- Dhrystones — 21 011,57 single-thread
- Whetstones — 4 340,75 single-thread; 544 503,55 multi-thread
- Coremark — 19 309,99 single-thread; 2 196 796,34 multi-thread
- Scimark 2 — Composite: 1 477,36; FFT: 1 185,13; SOR: 1 090,89 MonteCarlo:
431,59; Sparse: 1 473,08; LU: 3 206,11 - LINPACK 100x100 DP — 3 368,37 single-thread;
Если что, ничего не имею против Эльбрусов (хотя и считаю VLIW морально устаревшей), просто не стоит забывать о синтетичности этих тестов.
Ну там есть момент, что у эльбруса в команды так работают, а в случае x86 только определенные. Но для того чтобы он выполнял столько команд за такт, нужно специально оптимизировать код.
Да кстати в чем VLIW морально устарел? В том что под него сложно делать оптимизирующий компилятор?
EPIC хорош только там, где память быстрая и кэши не нужны — иначе его предсказания о том, как группировать операции, тупо не работают. Когда Intel развивал IA64, они были под влиянием великой аферы RDRAM — иного источника предположения про быструю память не было. Хотя и сейчас можно пересесть на SRAM (умножив ценник памяти этак на 12)… для обычных вычислений не окупается, хотя всякие embedded DSP на нём вполне массово строятся.
Уязвимости типа Meltdown со всеми потомками — да, проблема. Но методы лечения были понятны с самого начала, и проблема в том, чтобы выбрать из них оптимальные и отработать в железе.
умножив ценник памяти этак на 12
Конкуренция на рынке, конечно же, способствует снижению необоснованно завышенных цен, но никакой конкуренции среди производителей чипов нет: они не сражаются за рынок, они его делят.
Победа «дешёвой» конденсаторной (Dynamic) над «дорогой» транзисторной (Static) RAM случилась примерно так: давно-давно, лет 40 назад, когда частоты CPU измерялись единицами Мегагерц, некий оптимизатор (без кавычек) решил, что тратить на 1 бит RAM лишь 1 транзистор и 1 конденсатор гораздо выгоднее, чем 6 транзисторов; необходимость перезаряжать конденсатор не могла по тем временам как-то значимо отразиться на скорости доступа к RAM или на энергопотреблении. Со временем, частота CPU возросла в 1000 раз, цена на один транзистор упала в 1000 раз, RAM стоит так мало, что каждый потребитель может купить её в большем количестве, чем ему нужно; вроде бы, пора перестать экономить транзисторы и избавиться от конденсаторов, но нет: вместо этого строится многоэтажная иерархия кэшей с суперзамороченным контролем когерентности. Анонсированный перенос многослойной DRAM под одну крышку с CPU всех проблем конденсаторной памяти не решит.
Условная фотоматрица для телескопа дорогая еще по тому что брак там зашкаливает.
64 Bit MP SSE MFLOPS Benchmark 1, 56 Threads, Thu May 21 15:36:12 2020
Test 4 Byte Ops/ Repeat Seconds MFLOPS First All
Words Word Passes Results Same
Data in & out 102400 2 140000 0.082168 348945 See log No
Data in & out 1024000 2 14000 0.079809 359257 See log No
Data in & out 10240000 2 1400 0.147738 194073 See log No
Data in & out 102400 8 140000 0.099896 1148074 See log No
Data in & out 1024000 8 14000 0.083505 1373428 See log No
Data in & out 10240000 8 1400 0.142038 807447 See log No
Data in & out 102400 32 140000 0.264153 1736687 See log No
Data in & out 1024000 32 14000 0.212867 2155113 See log No
Data in & out 10240000 32 1400 0.214916 2134560 See log No
Coremark O3 27666.343893
Coremark O4 27633.851468
Coremark Ofast 27546.312237
Coremark mp2 O3 52521.008403
Coremark mp2 O4 52388.020606
Coremark mp2 Ofast 53344.002134
Coremark mp4 O3 95653.733485
Coremark mp4 O4 95096.582467
Coremark mp4 Ofast 88982.815194
Coremark mp8 O3 87696.861183
Coremark mp8 O4 87857.378189
Coremark mp8 Ofast 100156.494523
Dhrystone O2 25139
Dhrystone O3 25524.37
Dhrystone Ofast 25799.14
Linpack O2 4122.88
Linpack O3 5465.6
Linpack Ofast 5491.6
Scimark O3 2338.83
Scimark O4 2333.84
Scimark Ofast 2230.48
Whetstone O2 5784.372
Whetstone O3 5573.884
Whetstone Ofast 6010.528
Whetstone mp O2 19668
Whetstone mp O3 22602
Whetstone mp Ofast 23647
Архив результатов yadi.sk/d/hJGRkX7gMOeWXw
64 Bit MP SSE MFLOPS Benchmark 1, 4 Threads, Wed May 13 08:03:17 2020
Test 4 Byte Ops/ Repeat Seconds MFLOPS First All
Words Word Passes Results Same
Data in & out 102400 2 10000 0.055166 37124 0.764063 Yes
Data in & out 1024000 2 1000 0.051106 40074 0.970753 Yes
Data in & out 10240000 2 100 0.411623 4975 0.997008 Yes
Data in & out 102400 8 10000 0.089668 91359 0.850936 Yes
Data in & out 1024000 8 1000 0.093701 87427 0.982338 Yes
Data in & out 10240000 8 100 0.420208 19495 0.998200 Yes
Data in & out 102400 32 10000 0.377783 86738 0.660150 Yes
Data in & out 1024000 32 1000 0.381274 85944 0.953652 Yes
Data in & out 10240000 32 100 0.460269 71193 0.995215 Yes
Выложил ваш результат: https://github.com/EntityFX/anybench/tree/master/results/intel-core-i5-4670
Не, ну а что, маркетологи показывают нам гигагерцы и гигабайты, только почему-то ноутбук с большим числом ядер сливает декстопу и так далее.
Ответ: производительность тупо пропорциональна потребляемой мощности.
То есть если Эльбрусий жрет меньше в пять раз Интеля и в несколько раз более рапберри пай, то и производительность будет соответствующей.
Ну и потребление с ростом частоты нелинейно растёт.
Смысл статьи теряется и становится абсурдным.
Ну если есть такие машины, сравните и мне вышлите результаты, я обязательно добавлю топовые процы.
ТС, напишите в статье честно о том, почему нет данных по SPEC CPU )))
Дисклеймер: многие производители позоhных ЦПУ предпочтут Гикбенч с Дристуном два раза, но только не SPEC CPU, и упаси Боже не fp.
Результаты для Ryzen 1800x в стоке без разгона CPU и RAM, в одноканале.
https://yadi.sk/d/eNpK7iVEeZkkWQ
|----------|---------------|---------------|-----------------|----------|
| E8C-SWTX | Dhrystones | 5 865,19 | 7 617,93 | 129,88 |
| E8C-SWTX | Whetstones | 1 517,62 | 1 582,78 | 104,29 |
| E8C-SWTX | Whetstones MP | 12 980,00 | 10 967,00 | 84,49 |
| E8C-SWTX | LINPACK | 1 075,27 | 934,11 | 86,87 |
| E8C-SWTX | MPMFLOPS | 160 334,00 | 75 685,00 | 47,20 |
| E8C-SWTX | Coremark | 3711 | 6 163,50 | 166,09 |
| E8C-SWTX | Coremark MP | 28 846,15 | 49 025,07 | 169,95 |
| E8C-SWTX | Scimark 2 | 511,43 | 412,79 | 80,71 |
| E8C-SWTX | | | | 100,84 |
| E8C-SWTX | Whetstones JS | 30 | 417,15 | 1 390,50 |
x86-64 (ia32/x86/i386/amd64/EM64T/Intel/AMD)
это две разных, но связанных инженерно, исторически и коммерчески архитектуры:
x86/i386/ia32 от Intel (позволил себе поменять порядок в пользу хронологического, возможно ошибочного)
AMD64/EM64T от AMD
у которых есть общее обобщающее название, и это не x86-64, а просто x86.
Большое тестирование процессоров различных архитектур