Pull to refresh

Comments 37

7-Zip [64] 16.02 : Copyright (c) 1999-2016 Igor Pavlov : 2016-05-21
p7zip Version 16.02 (locale=ru_RU.UTF-8,Utf16=on,HugeFiles=on,64 bits,8 CPUs Intel(R) Core(TM) i7-4700MQ CPU @ 2.40GHz (306C3),ASM,AES-NI)

Intel(R) Core(TM) i7-4700MQ CPU @ 2.40GHz (306C3)
CPU Freq: - - - 64000000 - - - - -

RAM size:   15945 MB,  # CPU hardware threads:   8
RAM usage:   1765 MB,  # Benchmark threads:      8

                       Compressing  |                  Decompressing
Dict     Speed Usage    R/U Rating  |      Speed Usage    R/U Rating
         KiB/s     %   MIPS   MIPS  |      KiB/s     %   MIPS   MIPS

22:      15721   636   2406  15293  |     186656   691   2305  15921
23:      14990   651   2346  15273  |     182849   684   2313  15823
24:      14848   666   2398  15966  |     166581   686   2130  14621
25:      14111   679   2371  16112  |     152368   676   2005  13560
----------------------------------  | ------------------------------
Avr:             658   2380  15661  |              684   2188  14981
Tot:             671   2284  15321

А у меня на 4700 другие результаты.

Но тут 8 потоков, всё-равно неплохо выходит.

немного не дотягивает до Core i7-2600

Да уж, немного не дотягивает, на 30-50% медленнее почти во всех тестах.

Учитывайте, что это RISC процессор и 4 ядра на 2.5 ГГц, а не 8 потоков на 3.4 ГГц, так что всё нормально. Вот там на картинке 8 и 16 ядерные варианты будут, вот на них надо бы сравнивать.

Учитывайте, что лежащий в его основе MIPS именно RISC с 32 регистрами CPU/FPU - т.е. с точки зрения архитектуры он выиграшнее amd64 с ее 16 регистрами и необходимостью транслировать CISC в RISK

Там они кардинально переделали MIPS, так что можно уже и не считать MIPSом, оставили только 32 регистра и PC, ну и 1 категория команд совпадает, остальные свои.

Далеко не факт. Кроме разве что количества регистров, что сказывается на эффективности кодогенерации, все остальное просто пальцем в небо. Смысла ставить одну архитектуру выше другой нет никакого. Нужно смотреть сколько ядер, сколько кэша, сколько потребляет энергии и нормировать на эти показатели попугаи в бенчмарках. Вот так и можно будет сравнить.

Мне кажется, вы недооцениваете, сколько сложностей доставляет на многоконвейреном процессоре исполнение CISC команд с их разной длинной. К счастью, инженеры Intel(в PentiumPro) и AMD(базируясь на NexGen 6x86/K6) ещё в середине 1990х это осознали и перевели все свои х86 процессоры на RISC архитектуру внутри.

И трансляция "на лету" х86 во внутренний RISC далеко не бесплатна - требует немалого транзисторного бюджета (который в ином случае можно израсходовать на те е ядре/кеши/размер файла регистров/и т.д.), и добавляет некоторую небольшую латентность (особенно когда кто-нибудь напришет оператор switch на пару десяткой вариантов).

Так что разница будет - несколько процентов в среднем. И врядли больше 10%

Этот миф частенько повторяется, но он мифом так и остается. Если бы это было правдой, современные x86 были бы ограничены производительностью фронтэнда, а точнее его декодерами. Но это не так, ботлнеки все время в совсем других местах. Если посмотреть на тот же зен 3, который имеет существенный прирост IPC, основные изменения там совсем в других местах, а самое главное это измененная архитектура L3 кэша.

Насколько эта трансляция не бесплатная я не знаю, но доподлинно известно, что практически вся площадь кристалла нынче это кэши, файл регистров, очереди. Логика занимает ничтожную долю. Поэтому аргумент сомнителен без каких-то пруфов. Уж латентность вообще бессмысленный вопрос в свете внеочередного исполнения, конвейерной обработки, префетчинга и прочих трюков, которые скрывают любые задержки. Касается это в том числе современного RISC.

Так что нет. Пока не будет каких-то объективных данных, в этот миф верить я просто так не буду. И консенсус примерно такой же в индустрии. Спор этот не имеет никакого практического смысла и в современных процессора давно нет четкой границы RISC и CISC. Поэтому нужно смотреть на самое главное - что процессор может на деле. А на деле мы видим, то в топовом сегменте АРМ не имеет преимущества над x86 - ampere процессоры идут на равных с эпиками. Если бы все было так однозначно, эпик был бы оставлен далеко позади.

Не понимаю, почему это нужно учитывать? Есть два процессора, которые напрямую сравниваются друг с другом, при этом русским по белому написано, что первый "немного не дотягивает" до второго, при отставании в тестах на 30-50%. Какая разница сколько в каком из них ядер?

Какая? Может давайте core i7 с эпиками 64 ядерными сравнивать тогда? Какая ведь разнца? Смысл это учитывать в том, что процессоры абсолютно разные и нужно попугаи нормировать на характеристики процессоров. Это если не брать в расчет цену, которая может совсем другой расклад дать. У интела как минимум выше частоты, больше ядер и скорее всего существенно выше потребление.

Не я выбирал что и с чем в этой статье сравнивается, задайте эти вопросы автору.

Что было под рукой, с тем и сравнил.

И это ваш аргумент? Что было под рукой, то и взяли. Плюс этот процессор не имеет аналогов, чтобы сравнить с чем-то. Это не амд и интел, которые как копирка друг друга. Раз такие условия, то нужно адаптироваться под них, а значит интерпретировать результаты тестов согласно разнице процессоров. Что в статье и сделано - 30-50% разницы с учетом, что процессоры разных весовых категорий.

В общем, достаточно на хороший уровень они вышли и по роудмапу будут расти, так что нормально, найдут где применить.

Понятно - аналогов нет, что имели то и взяли, если бы у бабушки были яйца у i7-2600 было в 2 раза меньше потоков и частоты...

А по факту можно конечно разницу и в треть, и в 2 раза называть "немного не дотягивает", кто бы спорил, вопрос исключительно в качестве таких заявлений.

UFO just landed and posted this here

Главное, что там нет бэкдора в виде Intel ME

)) Рекламу недавно на Ютубе показали, что самая защищённая технология))

Не расстраиватесь, у Loongson 3A5000 имеются свои бэкдоры, от КПК.

Вопрос в тему. А есть процессоры, хоть 32-битные, но в которых гарантированно отсутствуют бекдоры и чтобы это можно было проверить?

А что лично Вам нужно, чтобы "гарантированно проверить"? миллиард транзисторов, есличо.

Байкал BE-M1000 дает 68248 coremarks/MT на частоте 2.0ГГц, что на 20% поболее чем у Loongson 3A5000 (54826 coremarks/MT) на частоте 2.5ГГц при примерно том же энергопотреблении. Байкал BE-M1000 — это ARM Cortex-A57, в то время как Loongson 3A5000 — творчески переработанный MIPS64 со всеми вытекающими проблемами совместимости.

Подождите, но у Байкала-М частота 1.5 ГГц и 8 ядер, а тут 4 ядра.

Да, действительно 1.5ГГц у BE-M1000, моя ошибка. Получается, что у Байкала производительнось на ядро составляет 5.6 coremark/MHz, против 5.4 coremark/MHz у Loongson. Как не сравнивай — Байкал выигрывает. :-)

В большинстве случаев, для конечного пользователя нетбука без разницы за счет чего получается вычислительная мощность, главное что бы ютуб не тормозил. Так вот, на Байкале ютубчик будет пошустрее (без аппаратных видекодеков).

Если сравнивать по coremark-ам, то производительность ядра Loongson 3A5000 соответствутет BCM2711 (Raspberry Pi 4) при существенно, в разы, бОльшем энергопотреблении первого. В общем, Loongson это эдакий китайский Эльбрус — не шибко быстрый, но свой, родной и уникальный. :-)

Ютубчик тестировал на Байкале, хорошо тянет 1080 @ 30. Но да, Loongson как и Эльбрус хороши в ГФлопсах.

Да, мы тоже тестировали Байкал — в целом, годный камень для нетбуков и прочих «АРМов секретаря». Эльбрус-8СВ — мало пригоден для этой цели. Подозреваю, что Loongson — так же как и Эльбрус.

Для утилизации ГФлопсов нужны специальзированные приложения, заточенные под конкретную архитектуру FPU, а их нет.

Поэтому МЦСТ надо открывать архитектуру и может смогут портировать всю обвязку ПО, кроме Си и Плюсов. Байкалом пользуюсь: Интернет, видео и для кодинга хватает. На Эльбрусе удалённо работаю: он игры нормально запускает, но софта мало.

Ваши слова до Богу в уши… Не слышат нас на верху, к сожалению.

ГФлопсы нужны в рассчетах. Рассчеты в основной своей массе- это здоровенный "фронтенд" для подготовки большущего массива чисел, который потом запускает нудное и мерзкое перемножение и сложение этих массивов какой-то библиотечкой на 10кб скомпилированного кода- вырезка из IMKL, условно, или AlgLib. Так вот затачивать под FPU достаточно только эту библиотечку, и то, не всю, а самые часто используемые ее функции, и это совсем не страшная задача.

Простите, случайно нажал на -1, а отменить уже никак((

то хотя бы дайте ссылку на алиэкспрес - где такое купить?! дайте две! самое то для домашней файловой помойки.

Любопытный тест, однозначно ПЛЮС!

Хотя с практической точки зрения, смысла в таком сравнении не много.

Процессору Core i7 2600k более 10 лет, и сравнивать его с процессором 2021 года конечно интересно, но практического смысла не имеет. Отставание при этом серьёзное, но Intel это компания с более чем 50 летней историей, с огромным бюджетом. Компания, которая является по сути монополистом и обладает всеми преимуществами economy of scale.

Так или иначе, показатели хорошие.

Нашёл что-то похожее, что было в наличии.

MediaTek каких-то десять лет назад выпускала тупые, медленные, глючные процессоры для мобил (по-моему, МТ6575), на которых работал ChangJang G22- тупорогий и феноменально сонный муляж HTC Sensation (на Квалком 8260). А каких-то 5 лет назад медиатек уже выпускала Helio P10- очень даже бодренький конкурент и последним квалкомам, и техасовским омарам.

Выглядит так что у i7 2 канала памяти используются, а у 3A5000 только один канал памяти задействован.

AMD Phenom 9500 sAM2+ с тактовой частотой 2,2 ГГц: 2200 МГц × 4 ядра × 4⋅10−3 = 35,2 Гигафлопса
Для четырёхъядерного процессора Core 2 Quad Q6600: 2400 МГц × 4 ядра × 4⋅10−3 = 38,4 Гигафлопса.

Более новые процессоры могут исполнять до 8 (например, Sandy и Ivy Bridge, 2011—2012 гг, AVX) или до 16 (Haswell и Broadwell, 2013—2014 гг, AVX2 и FMA3) операций над 64-битными числами с плавающей запятой в такт (на каждом ядре)[13]. В последующих процессорах ожидается исполнение 32 операций в такт (Intel Xeon Skylake, Xeon *v5, 2015 г, AVX512)[14]

Sandy и Ivy Bridge c AVX: 8 Флопс/такт двойной точности[15], 16 Флопс/такт одинарной точности
Intel Core i7 2700:/Intel Core i7 3770: 8*4*3900 МГц = 124,8 Гфлопс пиковая двойной точности, 16*4*3900 = 249,6 Гфлопс пиковая одинарной точности.

Intel Haswell/Broadwell с AVX2 и FMA3: 16 Флопс/такт двойной точности[15]; 32 одинарной точности Флопса/такт
Intel Core i7 4770: 16*4*3900 МГц = 249,6 Гигафлопса пиковая двойной точности, 32*4*3900 = 499,2 Гфлопс пиковая одинарной точности.


Так что тесты максимальной производительности слегка странные. 3dnews.ru/936197
Sign up to leave a comment.