Comments 35
Первые тесты DTK с Apple A12Z показали, что в Geekbench v5 тестовый ARM-комплект показывает результаты на уровне Apple MacBook Air 2020 (Single-Core: 1064, Multi-Core: 2163).Я правильно понимаю из того твита на французском, что это ещё и результаты x86-теста, запущенного в эмуляции Розеттой?
that these tests are running under virtualization, using Apple’s Rosetta technology, as the Geekbench testing software has not yet been optimised for Apple Silicon.
Так что похоже, переход на новую платформу может пройти очень быстро, раз уж даже на Розетте результаты вполне на уровне пусть и недорогого, но самого современного макбука.
И это ж еще процессор прошлогодний на новом устройстве.
Там несколько техник и статическая трансляция — лишь одна из них.
Rosetta can translate most Intel-based apps, including apps that contain just-in-time (JIT) compilers.
Одна из проблем трансляции х86 на ARM это реализация принятых на х86 правил упорядочивания обращений к памяти.
ARM-ы это weak ordering. x86 — strong ordering.
30% это довольно большая разница с нативом,
С другой стороны 70% от натива это очень круто для бинарной трансляции.
когда я всего лишь описал принцип розетты в данном случае
Вы утверждали что «Розетта ничего не эмулирует». Про «данный случай» речь не шла.
Проблема в том, что вы не можете утверждать что программа полностью статически откомпилирована пока не посмотрели лог рекомпилятора.
Полная статическая рекомпиляция — непростая задача. Вы реверсили софт, скажем, в IDA?
Если в самом процессоре как бы не было режима работы с специального для этого.
Зачем бы ему там быть? Этот процессор не предназначен для маков.
«Если исполняемый файл содержит только инструкции Intel, macOS автоматически запускает Rosetta и начинает процесс перевода. Когда перевод заканчивается, система запускает переведенный исполняемый файл вместо оригинала. Однако процесс перевода занимает время, поэтому пользователи могут почувствовать, что переведенные приложения запускаются или работают медленнее в разы.»
Также есть уточнение:
Rosetta может переводить большинство приложений на базе Intel, включая приложения, содержащие компиляторы JIT. Однако Rosetta не переводит следующие исполняемые файлы:
- Расширения ядра
- Приложения виртуальной машины, которые виртуализируют компьютерные платформы x86_64
(by Google Translate)
И еще некоторые наборы инструкций, не транслирует.
Интересно, что увидим в качестве замены Ксенона в актуальных МакПро?
Я же не путаю, что сейчас 4 энергоэффективных и четыре производительных ядра?
Ну, вы сказали про «больше ядер», только вот в контексте производительности стоит ли кивать в сторону «энергоэффективных ядер»?
Так вот и я о чем! Сейчас серверные АРМ — это эксперимент ради снижения энергопотребления. Тем, кто покупает Мак Про нужна производительность, а не энергоэффективность (Ксеон — это не про экономию энергии). Что они сделали в тестовом ките? Дали iPad’овский проц, с ещё одним разблокированным ядром, как я помню. Такой фокус с МакПро не пройдёт. Вот мне и интересно, будет ли маленькая революция в плане производительности от а14.
Производительность без энергоэффективности
Так там высокая производительность именно из-за высокой энергоэффективности.
Nvidia не стесняется в выражениях: GV100 is an extremely power-efficient processor.
GV100 — 7.8TFlops / 300W = 26 GFlop/Watt.
В реальных системах из top500 всё более скромно — Power+GV100 — 14 GFlop/Watt.
У Fujitsu ARM — 14-16.
У Intel — ~5.
греется как утюг
Греться система может хоть как ядерный реактор, но от этого она не перестанет быть энергоэффективной. Хоть она 1W потребляет, хоть мегаватт — важно соотношение.
Сейчас серверные АРМ — это эксперимент ради снижения энергопотребления
Дорогой «эксперимент». Один Fugaku имел бюджет в $910M.
нужна производительность, а не энергоэффективность
Сейчас, когда серверные процы упираются исключительно в энергопотребление, это практически одно и то же.
Не думали, почему EPYC 7742 64-ядерный имеет базовую частоту в 2.25ГГц/3.4 turbo? Просто достаточно и пары десятков ядер на частоте 4.5 ГГц чтобы упереться в TDP 225W.
80-ядерный Ampere Altra имеет 80-ядер и частоту 3.3ГГц (sustained turbo).
Хотя ядра там, по нынешним меркам, слабенькие — 1 поток Zen2 против одного ядра N1 (на одной частоте), 128-ядерный Altra MAX (семплинг которого начинается в конце года) должен порвать любой существующий серверный х86 процессор по «целочисленной» производительности.
Если брать HPC, A64FX показывает>3TFlops в FP64, примерно столько же ожидается и у 96-ядерного Thunder X3.
Так что лучшие х86 уже проигрывают по производительности.
Дали iPad’овский проц, с ещё одним разблокированным ядром, как я помню.
GPU ядром.
Такой фокус с МакПро не пройдёт.
Этот проц не пойдёт ни в какой новый Мак.
Его поставили, потому что другого не было и он больше подходит для девкита чем телефонный — больше памяти, выше TDP и ПСП для работы с экранами высокого разрешения.
На лонче будет 12-ядерный процессор — 8 больших ядер и 4 маленьких.
www.anandtech.com/show/13661/the-2018-apple-ipad-pro-11-inch-review/4
Процессорная часть A12Z аналогична A12X.
Только вот Apple запрещает публиковать результаты тестов для DTK.
А так-то под macOS можно и 2017-й собрать (нужно 16GB для полного теста).
1. Она не производит ни процессоры, ни потребительских устройств — нет финансовых мотивов, нет проблем с релизным циклом Интела (который так мучал Эппл)
2. Нет миллиона приложений под Windows На ARM (у Эплла есть миллион приложений которые можно будет запустить на армовом ноуте)
3. Нет огромного сообщества разработчиков, знакомых с программированием на их АРМ под Windows
А у нас пока нет прецедентов АРМ-ов мощностью тянущих «средний и высокий». То, что показала эппл — это конкуренция entry level: MacBook Air, MacBook Pro 13.
Вообще-то могут: https://en.wikipedia.org/wiki/ARM_big.LITTLE#Heterogeneous_multi-processing_(global_task_scheduling)
Это просто не используется для Rosetta 2 из-за усложнения обеспечения более строгой модели памяти x86 в присутствии разных типов ядер.
Оказалось, что этот DTK за $500 как минимум не уступает Apple MacBook Air 2020 с процессором Intel Core i3-1000NG4 за $999.
Но ведь для DTK это ничтожно мало?
Разработчики получили и начали тестировать первые комплекты Developer Transition Kit с чипом Apple A12Z