Недоступная роскошь от Intel: Core i9-9990XE с 14 ядрами на частоте 5,0 ГГц (1 часть)
В разделе «Системные тесты» основное внимание уделяется тестированию в реальных условиях, с которыми сталкивается потребитель, с небольшим уклоном в пропускную способность. В этом разделе мы рассмотрим время загрузки приложения, обработку изображений, простую физику, эмуляцию, нейронное моделирование, оптимизированные вычисления и разработку трехмерных моделей, с использованием легкодоступного и настраиваемого программного обеспечения. Хотя некоторые из тестов попроще перекрываются возможностями больших продуктов, таких как PCMark, (мы публикуем эти значения в разделе офисных тестов), всё же стоит рассмотреть тестируемый объект с разных ракурсов. Во всех тестах мы подробно объясним, что тестируется, и как именно мы тестируем.
Одним из наиболее важных аспектов пользовательского опыта и рабочего процесса является скорость реакции системы. Хорошим тестом здесь является проверка времени загрузки приложений. Большинство программ в наши дни, когда они хранятся на SSD, загружаются почти мгновенно, однако некоторые офисные инструменты требуют предварительной загрузки активов, прежде чем они будут готовы к работе. В большинстве операционных систем также используется кэширование, поэтому, когда определенное программное обеспечение загружается часто (веб-браузер, офисные инструменты), его можно инициализировать гораздо быстрее.
В предыдущем пакете тестов мы проверяли, сколько времени потребуется для загрузки большого PDF-документа в Adobe Acrobat. К сожалению, этот тест был кошмаром в смысле программирования, и отказывался переходить на Win10 RS3 без боя. Тем временем мы обнаружили приложение, которое способно автоматизировать этот тест, и решили использовать GIMP, популярное и бесплатное приложение для редактирования фотографий. Это редактор с открытым исходным кодом, главная альтернатива Adobe Photoshop. Мы настроили его для загрузки большого дизайнерского шаблона размером 50 МБ, и выполнили нагрузку 10 раз с интервалом 10 секунд между ними. Из-за кэширования первые 3-5 результатов часто медленнее, чем остальные, и время для кэширования может быть непоследовательным, поэтому мы принимаем среднее из последних пяти результатов, чтобы показать обработку ЦП при кэшированной загрузке.
Загрузка приложений – это как прогулка по парку для Core i9-9990XE.
Программное обеспечение FCAT было разработано для обнаружения микро-залипаний, упавших кадров, и запуска графических тестов, когда две видеокарты объединены вместе для рендеринга сцены. Из-за игровых движков и графических драйверов не все комбинации GPU работали идеально, в результате чего программное обеспечение фиксировало цвета для каждого визуализированного кадра и динамически производило RAW запись данных с помощью устройства захвата видео.
Программное обеспечение FCAT принимает записанное видео, в нашем случае это 90 секунд 1440p игры Rise of the Tomb Raider, и преобразовывает данные о цвете в данные времени кадра, поэтому система может отображать «наблюдаемую» частоту кадров и коррелировать с энергопотреблением видео ускорителей. Этот тест, в силу того, насколько быстро он был составлен, является однопоточным. Мы запускаем процесс, и получаем время завершения как результат.
FCAT даёт достаточно равные результаты для всех процессоров, и лишь несколько процентов разделяют все компоненты Intel.
Наш 3DPM-тест — это кастомный бенчмарк, разработанный для моделирования шести различных алгоритмов движения частиц в трехмерном пространстве. Алгоритмы были разработаны как часть моей кандидатской диссертации и, в конечном счете, лучше всего работают на графическом процессоре, и дают хорошее представление о том, как потоки команд интерпретируются различными микроархитектурами.
Ключевой частью алгоритмов является генерация случайных чисел — мы используем относительно быструю генерацию, которая завершает реализацию цепочек зависимостей в коде. Главное обновление по сравнению с примитивной первой версией этого кода — была решена проблема False Sharing в кэшах, что было основным узким местом. Мы также рассматриваем применение версий AVX2 и AVX512 этого теста для будущих обзоров.
Для этого теста мы запускаем стоковый набор частиц, используя шесть различных алгоритмов, в течение 20 секунд, с 10-секундными паузами, и сообщаем об общей скорости движения частиц в миллионах операций (движений) в секунду.
Когда мы запускаем тест 3DPM в стандартном режиме, 9990XE снова показывает небольшую регрессию по сравнению с 7940X, что, возможно, указывает на то, что для mesh требуются дополнительные МГц.
При использовании инструкций AVX512 наш 9990XE раскрывает крылья, как и остальные процессоры Intel HEDT, но все же может подняться только к более медленному 7940X, несмотря на равное количество ядер. Здесь тест больше ограничивает по ядрам, чем по частоте, что указывает на то, что в этом тесте есть несколько остановок конвейера.
Один из популярных запрошенных тестов в нашем пакете — это эмуляция консоли. Возможность выбрать игру из устаревшей системы и запустить ее очень привлекательна, и зависит от усилий эмулятора: требуется значительно более мощная система x86, чтобы иметь возможность точно эмулировать старую консоль, отличную от x86. Особенно если код для этой консоли была сделан с учетом некоторых физических недоработок и багов оборудования.
Для нашего теста мы используем популярное программное обеспечение для эмуляции Dolphin, и запускаем через него вычислительный проект, чтобы определить, насколько точно наши процессоры могут эмулировать консоль. В этом тесте работа под эмуляцией Nintendo Wii будет длиться около 1050 секунд.
Последнюю версию Dolphin можно скачать
Dolphin — это однопоточный тест, поэтому здесь мы видим самые высокочастотные процессоры от Intel и AMD на верхних позициях.
Этот бенчмарк был первоначально разработан для моделирования и визуализации активности нейронов и синапсов в мозге. Программное обеспечение поставляется с различными предустановленными режимами, и мы выбрали малый бенчмарк, который выполняет симуляцию мозга из 32 тысячи нейронов / 1,8 миллиардов синапсов, что эквивалентно мозгу морского слизня.
Мы сообщаем результаты теста как возможность эмулировать данные в режиме реального времени, поэтому любые результаты выше «единицы» подходят для работы в реальном времени. Из двух режимов, режим «без запуска синапсов», который является тяжелым для DRAM, и режим «с запуском синапсов», в котором нагружается процессор, мы выбираем последний. Несмотря на наш выбор, на тест по-прежнему влияет скорость DRAM.
DigiCortex можно загрузить
DigiCortex любит частоту памяти и внутренние скорости больше, чем чистую частоту ядра, и поэтому 9990XE здесь не особо хорошо работает.
Я как-то слышал об y-Cruncher как об инструменте, помогающем вычислять различные математические константы. Но после того, как я начал говорить с его разработчиком, Alex Yee, исследователем из NWU и теперь разработчиком оптимизации программного обеспечения, я понял, что он оптимизировал программное обеспечение просто невероятным образом, чтобы получить лучшую производительность. Естественно, любая симуляция, которая занимает 20+ дней, получит выгоду от 1% прироста производительности! Алекс начал работу с y-Cruncher в качестве проекта в средней школе, и сейчас проект находится в актуальном состоянии. Алекс постоянно работает над ним, чтобы воспользоваться новейшими наборами инструкций, даже прежде чем они станут доступны на аппаратном уровне.
Для нашего теста мы запускаем y-Cruncher v0.7.6 через все возможные оптимизированные варианты двоичных, однопоточных и многопоточных вычислений, включая оптимизированные для AVX-512 бинарные файлы. Тест заключатся в том, чтобы вычислить 250 миллионов знаков числа Pi, и мы используем однопоточные и многопоточные версии этого теста.
Пользователи могут скачать y-cruncher с сайта Алекса
y-Cruncher – тест, ускоренный применением AVX-512, и новый процессор с высокой частотой получает лучший результат в однопоточном тесте.
Один из ISV, с которым мы работаем в течение нескольких лет, — это Agisoft. Кампания разрабатывает программное обеспечение под названием PhotoScan, которое преобразует ряд 2D-изображений в 3D-модель. Это важный инструмент в разработке и архивировании моделей, и опирается на ряд однопоточных и многопоточных алгоритмов для перехода от одной стороны вычисления к другой.
В нашем тесте мы берем версию 1.3.3 программного обеспечения с набором данных большого размера — фотографии 84 x 18 мегапикселей. Мы прогоняем тест по довольно быстрому набору алгоритмов, но все же более строгому, чем наш тест 2017 года. В результате мы сообщаем об общем времени завершения процесса.
Веб-сайт Agisoft Photoscan можно найти здесь
Agisoft – это тест с вариативной многопоточностью, и, похоже, Core i9-9990XE имеет лучшую комбинацию ядер и потоков.
Набор тестов Office предназначен, чтобы сосредоточиться на более стандартных отраслевых тестах, которые фокусируются на офисных рабочих процессах. Это больше синтетические тесты, но мы также проверяем производительность компилятора в этом разделе. Для пользователей, которым важно оценивать оборудование в целом, обычно это самые важные критерии, которые стоит принимать во внимание.
Наряду с PCMark существует бенчмарк 3DMark, Futuremark (UL) – набор игровых тестов. Каждый игровой тест состоит из одной или двух сцен, тяжелых для графического процессора, а также физического теста, зависящего от того, когда был написан тест и на какую платформу он нацелен. Основными испытуемыми, в порядке приростания сложности, являются Ice Storm, Cloud Gate, Sky Diver, Fire Strike и Time Spy.
Некоторые из подтестов предлагают другие варианты, такие как Ice Storm Unlimited, который предназначен для мобильных платформ с внеэкранным рендерингом, или Fire Strike Ultra, который предназначен для высокопроизводительных систем 4K с большим количеством добавленных функций. Стоит заметить, что Time Spy в настоящее время имеет режим AVX-512 (который мы можем использовать в будущем).
В более простых тестах, таких как Ice Storm, наличие самой высокой частоты делает 9990XE лучшим калькулятором физики, который у нас есть.
Общий инструмент для межплатформенного тестирования на мобильных устройствах, ПК и Mac, GeekBench 4 — это идеальное синтетическое испытание системы по целому ряду алгоритмов, требующих максимальной пропускной способности. Тесты включают в себя шифрование, сжатие, быстрое преобразование Фурье, операции с памятью, физику n-тела, операции с матрицами, манипуляции с гистограммой и парсинг HTML.
Я включаю этот тест по причине популярности запроса, хотя результаты его очень уж синтетические. Многие пользователи часто придают большое значение его результатам из-за того, что он скомпилирован на разных платформах (хотя и разными компиляторами).
Мы записываем оценки основных подтестов (Crypto, Integer, Floating Point, Memory) в нашу базу результатов тестирований, но для обзора публикуем только общие однопоточные и многопоточные результаты.
Ввиду направленности на low-end системы, или small form factor системы, веб-тесты, как правило, трудно стандартизировать. Современные веб-браузеры часто обновляются, не давая возможности отключить эти обновления, поэтому трудно поддерживать какую-то общую платформу. Быстрый темп развития браузера означает, что версии (и показатели производительности) могут меняться с недели на неделю. Несмотря на это, веб-тесты часто являются важным показателем для пользователей: многие из современных офисных работ связаны с веб-приложениями, особенно с электронными и офисными приложениями, а также с интерфейсами и средами разработки. Наш набор веб-тестов включает несколько тестов, являющихся индустриальным стандартом, а также несколько популярных, но несколько устаревших тестов.
Мы также включили наши устаревшие, но всё ещё популярные тесты в этот раздел.
Компания, стоящая за тестовым пакетом XPRT, Principled Technologies, недавно выпустила новейший веб-тест, и вместо того, чтобы добавить год выпуска к названию, его просто назвали «3». Этот новейший (по крайней мере, сейчас) тест разработан на основании таких предшественников: тесты взаимодействия с пользователем, офисных вычислений, построения графиков, сортировки списков, HTML5, манипулирования изображениями, и в некоторых случаях даже тесты ИИ.
Для нашего бенчмарка мы запускаем стандартный тест, который отработает контрольный список семь раз и дает конечный результат. Мы проводим такой тест четыре раза, и выводим среднее значение.
Пользователи могут получить доступ к тесту WebXPRT по адресу
Более старая версия WebXPRT — издание 2015 года, в котором внимание уделяется немного другому набору веб-технологий и фреймворков, которые, впрочем, используются сегодня. Это по-прежнему актуальный тест, особенно для пользователей, которые взаимодействуют с не самыми последними веб-приложениями на рынке, и таких пользователей много. Разработка веб-фреймворков движется очень быстро и обладает высокой текучестью. Фреймворки быстро разрабатываются, встраиваются в приложения, используются, и тут же разработчики переходят к следующему. А адаптация приложения под новый фреймворк — сложная задача, особенно с такой скоростью циклов развития. По этой причине множество приложений «застряли во времени», и остаются актуальными для пользователей в течение многих лет.
Как и в случае с WebXPRT3, основной бенчмарк отрабатывает контрольный набор семь раз, выводя окончательный результат. Мы повторяем это четыре раза, выводим среднее и показываем окончательные результаты.
Наш новейший веб-тест — Speedometer 2, который проходит по целому ряду фреймворков javascript, чтобы сделать всего три простых вещи: построить список, включить каждый элемент в списке, и удалить список. Все фреймворки реализуют одни и те же визуальные сигналы, но, что очевидно, делают это по-разному.
Наш тест проходит весь список фреймворков и дает окончательный балл под названием «rpm», один из внутренних показателей бенчмарка. Мы выводим этот показатель как окончательный результат.
Популярный веб-тест в течение нескольких лет, но теперь уже не обновляемый, — Octane от Google. Версия 2.0 выполняет пару десятков задач, связанных с вычислениями, таких как регулярные выражения, криптография, трассировка лучей, эмуляция и вычисление уравнений Навье — Стокса.
Тест дает каждому из подтестов оценку, и возвращает среднее геометрическое в качестве конечного результата. Мы проводим полный бенчмарк четыре раза и оцениваем окончательные результаты.
Еще более старый, чем Octane, перед нами Kraken, на этот раз разработанный Mozilla. Это старый тест, который выполняет относительно однообразную вычислительную механику, такую как обработка звука или фильтрация изображений. Похоже, что Kraken производит очень нестабильный результат, зависящий от версии браузера, поскольку этот тест сильно оптимизирован.
Основной бенчмарк проходит через каждый из подтестов десять раз, и возвращает среднее время завершения для каждого цикла в миллисекундах. Мы запускаем полный бенчмарк четыре раза, и замеряем средний результат.
Первый «наследованный» тест в пакете — первая версия нашего теста 3DPM. Это конечная нативная версия кода, как если бы она была написана ученым без знания того, как работает компьютерное оборудование, компиляторы или оптимизация (как это и было в самом начале). Тест представляет собой большой объем научного моделирования в дикой природе, где получение ответа более важно, чем скорость вычислений (получение результата за 4 дня приемлемо, если результат верный; год учится программировать и получить результат через 5 минут – не приемлемо).
В этой версии единственная реальная оптимизация была в флагах компилятора (-O2, -fp: fast): компиляция в релиз режиме и включение OpenMP в основных циклах вычислений. Циклы не были подогнаны под размеры функций, а самым серьезным замедлением работы является false sharing в кеше. Код также имеет длинные цепи зависимостей, основанные на генерации случайных чисел, что приводит к снижению производительности на некоторых вычислительных микроархитектурах.
3DPM v1 как и 3DPM v2 можно загрузить здесь: 3DPMv2.1.rar (13,0 МБ)
Этот тест перекодирования очень стар, им пользовался Anandtech еще во времена процессоров Pentium 4 и Athlon II. В нем стандартизованное видео 720p перекодируется с двойным преобразованием, а бенчмарк показывает кадры в секунду каждого прохода. Тест является однопоточным, и в некоторых архитектурах мы упираемся в ограничение IPC — instructions-per-clock.
Мы посвятили несколько статей рассмотрению, почему числа TDP, указанные на коробке, бесполезны для большинства пользователей: слабость определения TDP у Intel состоит в том, что оно показывает охлаждение, необходимое для работы процессора на базовой частоте. «Требуемое охлаждение» — это термин, обозначающий мощность рассеивания тепла у кулера, что не полностью совпадает с энергопотреблением процессора (из-за потерь), но достаточно точно для наших выводов здесь.
Для Core i9-9990XE это означает, что, когда все 14 ядер работают в нормальной конфигурации с тактовой частотой 4,0 ГГц, без турбо, процессор гарантированно будет работать на 255 Вт или меньше. Однако в нашем случае ICC фиксирует процессор на его турбо скорости 5,0 ГГц на «бесконечное» время. Это означает, что мы никогда не увидим 4,0 ГГц, только 5,0 ГГц.
В нашем тестировании у ICC была, по крайней мере, какое-то подобие «Turbo», что означало, что чип может работать в режиме ожидания. На холостом ходу система будет работать на частоте 1,2 ГГц, но всё на тех же 1,29 вольт, как установлено для чипа. Это приводит к потреблению полной мощности в режиме ожидания: 266 Вт, и температуре чипа 24 ° C в помещении с температурой 20 ° C. К сожалению, мы не смогли измерить мощность чипа напрямую из-за особенностей того, как Intel управляет показаниями питания в программном обеспечении. Мы смогли измерит частоту mesh на холостом ходу, которая составила 900 МГц.
При запуске полностью многопоточного теста, такого как Cinebench R20, было легко обнаружить, что каждое ядро достигло частоты 5,0 ГГц. С появлением таких функций, как Speed Shift, Intel стремится максимально быстро вывести процессор из режима ожидания на пик 5,0 ГГц. Во время продолжительной работы CB20, которая возможна через командную строку, мы смогли наблюдать пиковое энергопотребление системы 600 Вт, и это значит, что на частоте 5,0 ГГц этот ЦП кушает дополнительные 334 Вт в сравнении с холостым ходом — это потребление в основном делится между ядрами, но что-то достается mesh, а что-то уйдет на потери доставки энергии. На полной скорости частота mesh поднимается до 2,4 ГГц.
Естественно, для установки этого теплового монстра в систему 1U требуется существенное охлаждение, которое мы вкратце описали вначале. Поскольку это охлаждение работает на полной скорости, даже в режиме ожидания, оно не влияет на потребление энергии, когда мы увеличиваем рабочую нагрузку. Что касается температуры, внутренние датчики показали пиковую температуру 81C, при напряжении 1.290 вольт. Для 14-ядерного процессора с частотой 5,0 ГГц это просто отличный результат.
Касательно тестирования шума: эта штука громкая. С проприетарной системой жидкостного охлаждения ICC в таком небольшом 1,75-дюймовом форм-факторе, ничто не сможет позаботиться о тех 350–400 Вт, на которые способен процессор, кроме быстрого потока и мощных вентиляторов. Эта система обеспечивает охлаждение на своей полной мощности как в режиме холостого хода, так и при полной нагрузке. Показатель шума составил огромные 78 децибел в 1 футе (30 см) от закрытой системы. Тот факт, что система выполнена в форм-факторе 1U, должен указывать на то, располагаться она должна где-то в стойке в центре обработки данных, а не в офисе. Мне не так повезло, и я смог провести тестирование системы только тогда, когда все члены моей семьи и соседей отсутствовали целый день.
Мы провели некоторые замеры с тестами AVX-512. В этом случае процессор работает на частоте всего лишь 3,8 ГГц на полной скорости, что указывает на смещение -12. Похоже, что Intel, поднимая одноядерную частоту с помощью биннинга, не так уж принимала во внимание AVX-512, или, по крайней мере, надеялась, что также будет таким же эффективным. В этом режиме мы наблюдали обычное энергопотребление системы на уровне 600 Вт, однако тепловыделение процессора немного повысилось — до 82C.
Из-за ограничений материнской платы в системе — она заблокирована системным провайдером, мы не смогли предпринять дополнительный разгон. При этом я уверен, что OEM-партнеры и системные интеграторы хотели бы, чтобы конечные пользователи не применяли дополнительный разгон, чтобы этот процессор «без MSRP, без гарантии производства новых чипов» — внезапно не накрылся раньше времени.
Корпорация Intel так и не анонсировала Core i9-9990XE на рынке. Мы впервые рассказали об этом в январе этого года на выставке CES в январе, после того как несколько источников на этом аукционе подтвердили происходящее: 14-ядерный процессор с тактовой частотой 5,0 ГГц в неизвестном количестве будет доступен для некоторых системных интеграторов и OEM-партнеров через аукцион. Intel не предоставляет никаких гарантий, поэтому эти интеграторы рисковали, и в конечном итоге могли предложить слишком высокую цену за чип, который, возможно, не смогут продать.
В конце концов, на первом аукционе оказались (как минимум) три компании, из которых две ушли с процессорами. Мы очень быстро обнаружили, что CaseKing раскупили большую часть, и в итоге компания разместила их для прямой продажи (с гарантией 1 год) на своих веб-сайтах, по цене 2999 евро (сейчас — 2849 евро), а также предложила несколько их профильных экстремально разогнанных систем (на водяном охлаждении) с этим чипом внутри. Мы также видели по крайней мере один чип у Puget Systems, и еще одной компанией стал ICC, партнер Intel, который фокусируется на ряде рынков, включая финансовый рынок. Именно ICC создала систему 1U для этого чипа и предоставила нам образец для анализа.
Система оснащена специальным фирменным жидкостным охлаждением, которое мы не можем вам показать. Однако эта штука просто чудовищная, и может соответствующим образом отводить до 400 Вт тепла процессора в форм-факторе 1,75 дюйма. Это очень громкая система: мы зарегистрировали 78 децибел, независимо от того, находится ли система в режиме ожидания или работает с полной нагрузкой. Учитывая, что это сервер 1U, можно предположить, что лучшее место для него — центр обработки данных. Я не сомневаюсь, что процессор можно перенести в корпус tower, но тогда, как и в случае с 28-ядерным Xeon W-3175X, который мы тестировали в январе, для обуздания его потребуется существенная возня с охлаждением.
По производительности, кастомная система от ICC была создана для высокочастотного трейдинга. Она включает всего лишь 32 ГБ DDR4, но работает на DDR4-3600 с откорректированными сабтаймингами. Мы изначально добавили наше стандартное тестирование SSD и GPU, но из-за сложности системы мы не могли запускать игры на ней. Зато из-за высокой однопоточной производительности Core i9-9990XE просто порвал все другие высокопроизводительные десктоп процессоры — как и должно было быть. Все Intel Core лежит поверженное, только Xeon W-3175X, 28-ядерный процессор, может одержать верх в многопоточных задачах, и всё равно Core i9-9990XE убивает его, когда частота становится ограничивающим фактором. Это видно в нашем тесте компиляции, где важен правильный баланс ядер и частоты — Core i9-9990XE установил новый мировой рекорд в этом тесте. Существуют некоторые предостережения: частота mesh в некоторых тестах кажется сдерживающим фактором, или же частота при входе и выходе из турбо-режимов может вызвать дополнительные задержки в тестах.
При сравнении с аналогами от AMD, частота 5,0 ГГц проходит сквозь конкурентов, как нож сквозь масло. AMD должна отыгрываться на своих 32-ядерных процессорах Threadripper, и даже в таком случае это компромисс: 14 ядер на 5,0 ГГц против 32 ядер на ~ 3,4 ГГц означает, что у 2990WX есть преимущество только в случае «сырых» вычислений, при любом сценарии с зависимостью от памяти, или добавлением AVX2 / AVX512, выводит Core i9-9990XE в лидеры.
Мы, очевидно, не можем озвучить точную цену. W-3175X стоит $ 3000, примерно как и i9-9990XE, имеет поддержку ECC и шесть каналов памяти, но не имеет такой частоты одного потока. 2990WX — это дизайн NUMA, который хорошо работает в сфокусированных приложениях. В отличие от него, i9-9990XE хорошо работает практически в каждом сценарии, но 2990WX дешевле на 30-40%.
Не за горами 8-ядерный процессор Intel с тактовой частотой 5,0 ГГц, Core i9-9900KS. Это процессор потребительского уровня, имеющий всего два канала памяти и 16 линий PCIe 3.0, но он будет стоить $ 513 при запуске через пару дней (30 октября). Пользователи, интересующиеся полностью готовым процессором с частотой 5,0 ГГц (т. е. Не разогнанным), вероятно, обнаружат, что 9900KS выглядит как хорошая стартовая позиция, а позднее можно задуматься о 9990XE, когда такие вещи, как пропускная способность памяти, начинают становится проблемой.
Что касается доступности, никто не сможет обеспечить массовые поставки Core i9-9990XE: у Intel есть несколько чипов, которые соответствуют спецификациям, и они продаются системным интеграторам. Поэтому, если клиенту необходимо купить некоторое количество чипов, ему придется работать с системным интегратором, выделив неопределенный бюджет для аукциона. И даже тогда нет гарантии, что у Intel будет нужное количество доступных чипов (или что кто-то не перебьет вашу ставку). Также Intel не предоставляет никаких гарантий системному интегратору, что означает дополнительную стоимость. Компаниям, которые рассматривают приобретение одной из этих систем, возможно, придется работать с единственным экземпляром. Для сравнения мы ожидаем, Core i9-9900KS будут доступны для компаний более естественным образом, напрямую у ритейлеров.
В конечном счете, Core i9-9990XE является неожиданностью. Это огромный сюрприз, если точнее. Это похоже на одного из рукодельных боевых роботов в Robot Wars (Великобритания) или BattleBots (США): что-то полностью выходящее за рамки нормы, большое, грозное и неадекватное. Что-то, что вы, возможно, хотели бы иметь, но вряд ли когда-то получите.
Спасибо, что остаётесь с нами. Вам нравятся наши статьи? Хотите видеть больше интересных материалов? Поддержите нас, оформив заказ или порекомендовав знакомым, облачные VPS для разработчиков от $4.99, 30% скидка для пользователей Хабра на уникальный аналог entry-level серверов, который был придуман нами для Вас: Вся правда о VPS (KVM) E5-2650 v4 (6 Cores) 10GB DDR4 240GB SSD 1Gbps от $20 или как правильно делить сервер? (доступны варианты с RAID1 и RAID10, до 24 ядер и до 40GB DDR4).
Dell R730xd в 2 раза дешевле? Только у нас 2 х Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 ТВ от $199 в Нидерландах! Dell R420 — 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB — от $99! Читайте о том Как построить инфраструктуру корп. класса c применением серверов Dell R730xd Е5-2650 v4 стоимостью 9000 евро за копейки?
Системные тесты
В разделе «Системные тесты» основное внимание уделяется тестированию в реальных условиях, с которыми сталкивается потребитель, с небольшим уклоном в пропускную способность. В этом разделе мы рассмотрим время загрузки приложения, обработку изображений, простую физику, эмуляцию, нейронное моделирование, оптимизированные вычисления и разработку трехмерных моделей, с использованием легкодоступного и настраиваемого программного обеспечения. Хотя некоторые из тестов попроще перекрываются возможностями больших продуктов, таких как PCMark, (мы публикуем эти значения в разделе офисных тестов), всё же стоит рассмотреть тестируемый объект с разных ракурсов. Во всех тестах мы подробно объясним, что тестируется, и как именно мы тестируем.
Загрузка приложений: GIMP 2.10.4
Одним из наиболее важных аспектов пользовательского опыта и рабочего процесса является скорость реакции системы. Хорошим тестом здесь является проверка времени загрузки приложений. Большинство программ в наши дни, когда они хранятся на SSD, загружаются почти мгновенно, однако некоторые офисные инструменты требуют предварительной загрузки активов, прежде чем они будут готовы к работе. В большинстве операционных систем также используется кэширование, поэтому, когда определенное программное обеспечение загружается часто (веб-браузер, офисные инструменты), его можно инициализировать гораздо быстрее.
В предыдущем пакете тестов мы проверяли, сколько времени потребуется для загрузки большого PDF-документа в Adobe Acrobat. К сожалению, этот тест был кошмаром в смысле программирования, и отказывался переходить на Win10 RS3 без боя. Тем временем мы обнаружили приложение, которое способно автоматизировать этот тест, и решили использовать GIMP, популярное и бесплатное приложение для редактирования фотографий. Это редактор с открытым исходным кодом, главная альтернатива Adobe Photoshop. Мы настроили его для загрузки большого дизайнерского шаблона размером 50 МБ, и выполнили нагрузку 10 раз с интервалом 10 секунд между ними. Из-за кэширования первые 3-5 результатов часто медленнее, чем остальные, и время для кэширования может быть непоследовательным, поэтому мы принимаем среднее из последних пяти результатов, чтобы показать обработку ЦП при кэшированной загрузке.
Загрузка приложений – это как прогулка по парку для Core i9-9990XE.
FCAT: обработка изображений
Программное обеспечение FCAT было разработано для обнаружения микро-залипаний, упавших кадров, и запуска графических тестов, когда две видеокарты объединены вместе для рендеринга сцены. Из-за игровых движков и графических драйверов не все комбинации GPU работали идеально, в результате чего программное обеспечение фиксировало цвета для каждого визуализированного кадра и динамически производило RAW запись данных с помощью устройства захвата видео.
Программное обеспечение FCAT принимает записанное видео, в нашем случае это 90 секунд 1440p игры Rise of the Tomb Raider, и преобразовывает данные о цвете в данные времени кадра, поэтому система может отображать «наблюдаемую» частоту кадров и коррелировать с энергопотреблением видео ускорителей. Этот тест, в силу того, насколько быстро он был составлен, является однопоточным. Мы запускаем процесс, и получаем время завершения как результат.
FCAT даёт достаточно равные результаты для всех процессоров, и лишь несколько процентов разделяют все компоненты Intel.
3D Particle Movement v2.1: Броуновское движение
Наш 3DPM-тест — это кастомный бенчмарк, разработанный для моделирования шести различных алгоритмов движения частиц в трехмерном пространстве. Алгоритмы были разработаны как часть моей кандидатской диссертации и, в конечном счете, лучше всего работают на графическом процессоре, и дают хорошее представление о том, как потоки команд интерпретируются различными микроархитектурами.
Ключевой частью алгоритмов является генерация случайных чисел — мы используем относительно быструю генерацию, которая завершает реализацию цепочек зависимостей в коде. Главное обновление по сравнению с примитивной первой версией этого кода — была решена проблема False Sharing в кэшах, что было основным узким местом. Мы также рассматриваем применение версий AVX2 и AVX512 этого теста для будущих обзоров.
Для этого теста мы запускаем стоковый набор частиц, используя шесть различных алгоритмов, в течение 20 секунд, с 10-секундными паузами, и сообщаем об общей скорости движения частиц в миллионах операций (движений) в секунду.
Когда мы запускаем тест 3DPM в стандартном режиме, 9990XE снова показывает небольшую регрессию по сравнению с 7940X, что, возможно, указывает на то, что для mesh требуются дополнительные МГц.
При использовании инструкций AVX512 наш 9990XE раскрывает крылья, как и остальные процессоры Intel HEDT, но все же может подняться только к более медленному 7940X, несмотря на равное количество ядер. Здесь тест больше ограничивает по ядрам, чем по частоте, что указывает на то, что в этом тесте есть несколько остановок конвейера.
Dolphin 5.0: эмуляция консоли
Один из популярных запрошенных тестов в нашем пакете — это эмуляция консоли. Возможность выбрать игру из устаревшей системы и запустить ее очень привлекательна, и зависит от усилий эмулятора: требуется значительно более мощная система x86, чтобы иметь возможность точно эмулировать старую консоль, отличную от x86. Особенно если код для этой консоли была сделан с учетом некоторых физических недоработок и багов оборудования.
Для нашего теста мы используем популярное программное обеспечение для эмуляции Dolphin, и запускаем через него вычислительный проект, чтобы определить, насколько точно наши процессоры могут эмулировать консоль. В этом тесте работа под эмуляцией Nintendo Wii будет длиться около 1050 секунд.
Последнюю версию Dolphin можно скачать
Dolphin — это однопоточный тест, поэтому здесь мы видим самые высокочастотные процессоры от Intel и AMD на верхних позициях.
DigiCortex 1.20: Моделирование мозга морского слизня
Этот бенчмарк был первоначально разработан для моделирования и визуализации активности нейронов и синапсов в мозге. Программное обеспечение поставляется с различными предустановленными режимами, и мы выбрали малый бенчмарк, который выполняет симуляцию мозга из 32 тысячи нейронов / 1,8 миллиардов синапсов, что эквивалентно мозгу морского слизня.
Мы сообщаем результаты теста как возможность эмулировать данные в режиме реального времени, поэтому любые результаты выше «единицы» подходят для работы в реальном времени. Из двух режимов, режим «без запуска синапсов», который является тяжелым для DRAM, и режим «с запуском синапсов», в котором нагружается процессор, мы выбираем последний. Несмотря на наш выбор, на тест по-прежнему влияет скорость DRAM.
DigiCortex можно загрузить
DigiCortex любит частоту памяти и внутренние скорости больше, чем чистую частоту ядра, и поэтому 9990XE здесь не особо хорошо работает.
y-Cruncher v0.7.6: Вычисления, оптимизированные для микроархитектуры
Я как-то слышал об y-Cruncher как об инструменте, помогающем вычислять различные математические константы. Но после того, как я начал говорить с его разработчиком, Alex Yee, исследователем из NWU и теперь разработчиком оптимизации программного обеспечения, я понял, что он оптимизировал программное обеспечение просто невероятным образом, чтобы получить лучшую производительность. Естественно, любая симуляция, которая занимает 20+ дней, получит выгоду от 1% прироста производительности! Алекс начал работу с y-Cruncher в качестве проекта в средней школе, и сейчас проект находится в актуальном состоянии. Алекс постоянно работает над ним, чтобы воспользоваться новейшими наборами инструкций, даже прежде чем они станут доступны на аппаратном уровне.
Для нашего теста мы запускаем y-Cruncher v0.7.6 через все возможные оптимизированные варианты двоичных, однопоточных и многопоточных вычислений, включая оптимизированные для AVX-512 бинарные файлы. Тест заключатся в том, чтобы вычислить 250 миллионов знаков числа Pi, и мы используем однопоточные и многопоточные версии этого теста.
Пользователи могут скачать y-cruncher с сайта Алекса
y-Cruncher – тест, ускоренный применением AVX-512, и новый процессор с высокой частотой получает лучший результат в однопоточном тесте.
Agisoft Photoscan 1.3.3: преобразование 2D-изображения в 3D-модель
Один из ISV, с которым мы работаем в течение нескольких лет, — это Agisoft. Кампания разрабатывает программное обеспечение под названием PhotoScan, которое преобразует ряд 2D-изображений в 3D-модель. Это важный инструмент в разработке и архивировании моделей, и опирается на ряд однопоточных и многопоточных алгоритмов для перехода от одной стороны вычисления к другой.
В нашем тесте мы берем версию 1.3.3 программного обеспечения с набором данных большого размера — фотографии 84 x 18 мегапикселей. Мы прогоняем тест по довольно быстрому набору алгоритмов, но все же более строгому, чем наш тест 2017 года. В результате мы сообщаем об общем времени завершения процесса.
Веб-сайт Agisoft Photoscan можно найти здесь
Agisoft – это тест с вариативной многопоточностью, и, похоже, Core i9-9990XE имеет лучшую комбинацию ядер и потоков.
Office Tests
Набор тестов Office предназначен, чтобы сосредоточиться на более стандартных отраслевых тестах, которые фокусируются на офисных рабочих процессах. Это больше синтетические тесты, но мы также проверяем производительность компилятора в этом разделе. Для пользователей, которым важно оценивать оборудование в целом, обычно это самые важные критерии, которые стоит принимать во внимание.
3DMark Physics: вычисление физики в играх
Наряду с PCMark существует бенчмарк 3DMark, Futuremark (UL) – набор игровых тестов. Каждый игровой тест состоит из одной или двух сцен, тяжелых для графического процессора, а также физического теста, зависящего от того, когда был написан тест и на какую платформу он нацелен. Основными испытуемыми, в порядке приростания сложности, являются Ice Storm, Cloud Gate, Sky Diver, Fire Strike и Time Spy.
Некоторые из подтестов предлагают другие варианты, такие как Ice Storm Unlimited, который предназначен для мобильных платформ с внеэкранным рендерингом, или Fire Strike Ultra, который предназначен для высокопроизводительных систем 4K с большим количеством добавленных функций. Стоит заметить, что Time Spy в настоящее время имеет режим AVX-512 (который мы можем использовать в будущем).
В более простых тестах, таких как Ice Storm, наличие самой высокой частоты делает 9990XE лучшим калькулятором физики, который у нас есть.
GeekBench4: Синтетический тест
Общий инструмент для межплатформенного тестирования на мобильных устройствах, ПК и Mac, GeekBench 4 — это идеальное синтетическое испытание системы по целому ряду алгоритмов, требующих максимальной пропускной способности. Тесты включают в себя шифрование, сжатие, быстрое преобразование Фурье, операции с памятью, физику n-тела, операции с матрицами, манипуляции с гистограммой и парсинг HTML.
Я включаю этот тест по причине популярности запроса, хотя результаты его очень уж синтетические. Многие пользователи часто придают большое значение его результатам из-за того, что он скомпилирован на разных платформах (хотя и разными компиляторами).
Мы записываем оценки основных подтестов (Crypto, Integer, Floating Point, Memory) в нашу базу результатов тестирований, но для обзора публикуем только общие однопоточные и многопоточные результаты.
Веб-тесты и устаревшие тесты
Ввиду направленности на low-end системы, или small form factor системы, веб-тесты, как правило, трудно стандартизировать. Современные веб-браузеры часто обновляются, не давая возможности отключить эти обновления, поэтому трудно поддерживать какую-то общую платформу. Быстрый темп развития браузера означает, что версии (и показатели производительности) могут меняться с недели на неделю. Несмотря на это, веб-тесты часто являются важным показателем для пользователей: многие из современных офисных работ связаны с веб-приложениями, особенно с электронными и офисными приложениями, а также с интерфейсами и средами разработки. Наш набор веб-тестов включает несколько тестов, являющихся индустриальным стандартом, а также несколько популярных, но несколько устаревших тестов.
Мы также включили наши устаревшие, но всё ещё популярные тесты в этот раздел.
WebXPRT 3: веб-задачи современного мира, включая ИИ
Компания, стоящая за тестовым пакетом XPRT, Principled Technologies, недавно выпустила новейший веб-тест, и вместо того, чтобы добавить год выпуска к названию, его просто назвали «3». Этот новейший (по крайней мере, сейчас) тест разработан на основании таких предшественников: тесты взаимодействия с пользователем, офисных вычислений, построения графиков, сортировки списков, HTML5, манипулирования изображениями, и в некоторых случаях даже тесты ИИ.
Для нашего бенчмарка мы запускаем стандартный тест, который отработает контрольный список семь раз и дает конечный результат. Мы проводим такой тест четыре раза, и выводим среднее значение.
Пользователи могут получить доступ к тесту WebXPRT по адресу
WebXPRT 2015: тестирование HTML5 и Javascript Web UX
Более старая версия WebXPRT — издание 2015 года, в котором внимание уделяется немного другому набору веб-технологий и фреймворков, которые, впрочем, используются сегодня. Это по-прежнему актуальный тест, особенно для пользователей, которые взаимодействуют с не самыми последними веб-приложениями на рынке, и таких пользователей много. Разработка веб-фреймворков движется очень быстро и обладает высокой текучестью. Фреймворки быстро разрабатываются, встраиваются в приложения, используются, и тут же разработчики переходят к следующему. А адаптация приложения под новый фреймворк — сложная задача, особенно с такой скоростью циклов развития. По этой причине множество приложений «застряли во времени», и остаются актуальными для пользователей в течение многих лет.
Как и в случае с WebXPRT3, основной бенчмарк отрабатывает контрольный набор семь раз, выводя окончательный результат. Мы повторяем это четыре раза, выводим среднее и показываем окончательные результаты.
Speedometer 2: Javascript Frameworks
Наш новейший веб-тест — Speedometer 2, который проходит по целому ряду фреймворков javascript, чтобы сделать всего три простых вещи: построить список, включить каждый элемент в списке, и удалить список. Все фреймворки реализуют одни и те же визуальные сигналы, но, что очевидно, делают это по-разному.
Наш тест проходит весь список фреймворков и дает окончательный балл под названием «rpm», один из внутренних показателей бенчмарка. Мы выводим этот показатель как окончательный результат.
Google Octane 2.0: Core Web Compute
Популярный веб-тест в течение нескольких лет, но теперь уже не обновляемый, — Octane от Google. Версия 2.0 выполняет пару десятков задач, связанных с вычислениями, таких как регулярные выражения, криптография, трассировка лучей, эмуляция и вычисление уравнений Навье — Стокса.
Тест дает каждому из подтестов оценку, и возвращает среднее геометрическое в качестве конечного результата. Мы проводим полный бенчмарк четыре раза и оцениваем окончательные результаты.
Mozilla Kraken 1.1: Core Web Compute
Еще более старый, чем Octane, перед нами Kraken, на этот раз разработанный Mozilla. Это старый тест, который выполняет относительно однообразную вычислительную механику, такую как обработка звука или фильтрация изображений. Похоже, что Kraken производит очень нестабильный результат, зависящий от версии браузера, поскольку этот тест сильно оптимизирован.
Основной бенчмарк проходит через каждый из подтестов десять раз, и возвращает среднее время завершения для каждого цикла в миллисекундах. Мы запускаем полный бенчмарк четыре раза, и замеряем средний результат.
3DPM v1: Naïve Code Вариант 3DPM v2.1.
Первый «наследованный» тест в пакете — первая версия нашего теста 3DPM. Это конечная нативная версия кода, как если бы она была написана ученым без знания того, как работает компьютерное оборудование, компиляторы или оптимизация (как это и было в самом начале). Тест представляет собой большой объем научного моделирования в дикой природе, где получение ответа более важно, чем скорость вычислений (получение результата за 4 дня приемлемо, если результат верный; год учится программировать и получить результат через 5 минут – не приемлемо).
В этой версии единственная реальная оптимизация была в флагах компилятора (-O2, -fp: fast): компиляция в релиз режиме и включение OpenMP в основных циклах вычислений. Циклы не были подогнаны под размеры функций, а самым серьезным замедлением работы является false sharing в кеше. Код также имеет длинные цепи зависимостей, основанные на генерации случайных чисел, что приводит к снижению производительности на некоторых вычислительных микроархитектурах.
3DPM v1 как и 3DPM v2 можно загрузить здесь: 3DPMv2.1.rar (13,0 МБ)
x264 HD 3.0: устаревший тест транскодирования
Этот тест перекодирования очень стар, им пользовался Anandtech еще во времена процессоров Pentium 4 и Athlon II. В нем стандартизованное видео 720p перекодируется с двойным преобразованием, а бенчмарк показывает кадры в секунду каждого прохода. Тест является однопоточным, и в некоторых архитектурах мы упираемся в ограничение IPC — instructions-per-clock.
Энергопотребление, частоты и термические характеристики
Мы посвятили несколько статей рассмотрению, почему числа TDP, указанные на коробке, бесполезны для большинства пользователей: слабость определения TDP у Intel состоит в том, что оно показывает охлаждение, необходимое для работы процессора на базовой частоте. «Требуемое охлаждение» — это термин, обозначающий мощность рассеивания тепла у кулера, что не полностью совпадает с энергопотреблением процессора (из-за потерь), но достаточно точно для наших выводов здесь.
Для Core i9-9990XE это означает, что, когда все 14 ядер работают в нормальной конфигурации с тактовой частотой 4,0 ГГц, без турбо, процессор гарантированно будет работать на 255 Вт или меньше. Однако в нашем случае ICC фиксирует процессор на его турбо скорости 5,0 ГГц на «бесконечное» время. Это означает, что мы никогда не увидим 4,0 ГГц, только 5,0 ГГц.
В нашем тестировании у ICC была, по крайней мере, какое-то подобие «Turbo», что означало, что чип может работать в режиме ожидания. На холостом ходу система будет работать на частоте 1,2 ГГц, но всё на тех же 1,29 вольт, как установлено для чипа. Это приводит к потреблению полной мощности в режиме ожидания: 266 Вт, и температуре чипа 24 ° C в помещении с температурой 20 ° C. К сожалению, мы не смогли измерить мощность чипа напрямую из-за особенностей того, как Intel управляет показаниями питания в программном обеспечении. Мы смогли измерит частоту mesh на холостом ходу, которая составила 900 МГц.
При запуске полностью многопоточного теста, такого как Cinebench R20, было легко обнаружить, что каждое ядро достигло частоты 5,0 ГГц. С появлением таких функций, как Speed Shift, Intel стремится максимально быстро вывести процессор из режима ожидания на пик 5,0 ГГц. Во время продолжительной работы CB20, которая возможна через командную строку, мы смогли наблюдать пиковое энергопотребление системы 600 Вт, и это значит, что на частоте 5,0 ГГц этот ЦП кушает дополнительные 334 Вт в сравнении с холостым ходом — это потребление в основном делится между ядрами, но что-то достается mesh, а что-то уйдет на потери доставки энергии. На полной скорости частота mesh поднимается до 2,4 ГГц.
Естественно, для установки этого теплового монстра в систему 1U требуется существенное охлаждение, которое мы вкратце описали вначале. Поскольку это охлаждение работает на полной скорости, даже в режиме ожидания, оно не влияет на потребление энергии, когда мы увеличиваем рабочую нагрузку. Что касается температуры, внутренние датчики показали пиковую температуру 81C, при напряжении 1.290 вольт. Для 14-ядерного процессора с частотой 5,0 ГГц это просто отличный результат.
Касательно тестирования шума: эта штука громкая. С проприетарной системой жидкостного охлаждения ICC в таком небольшом 1,75-дюймовом форм-факторе, ничто не сможет позаботиться о тех 350–400 Вт, на которые способен процессор, кроме быстрого потока и мощных вентиляторов. Эта система обеспечивает охлаждение на своей полной мощности как в режиме холостого хода, так и при полной нагрузке. Показатель шума составил огромные 78 децибел в 1 футе (30 см) от закрытой системы. Тот факт, что система выполнена в форм-факторе 1U, должен указывать на то, располагаться она должна где-то в стойке в центре обработки данных, а не в офисе. Мне не так повезло, и я смог провести тестирование системы только тогда, когда все члены моей семьи и соседей отсутствовали целый день.
Мы провели некоторые замеры с тестами AVX-512. В этом случае процессор работает на частоте всего лишь 3,8 ГГц на полной скорости, что указывает на смещение -12. Похоже, что Intel, поднимая одноядерную частоту с помощью биннинга, не так уж принимала во внимание AVX-512, или, по крайней мере, надеялась, что также будет таким же эффективным. В этом режиме мы наблюдали обычное энергопотребление системы на уровне 600 Вт, однако тепловыделение процессора немного повысилось — до 82C.
Из-за ограничений материнской платы в системе — она заблокирована системным провайдером, мы не смогли предпринять дополнительный разгон. При этом я уверен, что OEM-партнеры и системные интеграторы хотели бы, чтобы конечные пользователи не применяли дополнительный разгон, чтобы этот процессор «без MSRP, без гарантии производства новых чипов» — внезапно не накрылся раньше времени.
Intel Core i9-9990XE: Выводы
Корпорация Intel так и не анонсировала Core i9-9990XE на рынке. Мы впервые рассказали об этом в январе этого года на выставке CES в январе, после того как несколько источников на этом аукционе подтвердили происходящее: 14-ядерный процессор с тактовой частотой 5,0 ГГц в неизвестном количестве будет доступен для некоторых системных интеграторов и OEM-партнеров через аукцион. Intel не предоставляет никаких гарантий, поэтому эти интеграторы рисковали, и в конечном итоге могли предложить слишком высокую цену за чип, который, возможно, не смогут продать.
В конце концов, на первом аукционе оказались (как минимум) три компании, из которых две ушли с процессорами. Мы очень быстро обнаружили, что CaseKing раскупили большую часть, и в итоге компания разместила их для прямой продажи (с гарантией 1 год) на своих веб-сайтах, по цене 2999 евро (сейчас — 2849 евро), а также предложила несколько их профильных экстремально разогнанных систем (на водяном охлаждении) с этим чипом внутри. Мы также видели по крайней мере один чип у Puget Systems, и еще одной компанией стал ICC, партнер Intel, который фокусируется на ряде рынков, включая финансовый рынок. Именно ICC создала систему 1U для этого чипа и предоставила нам образец для анализа.
Система оснащена специальным фирменным жидкостным охлаждением, которое мы не можем вам показать. Однако эта штука просто чудовищная, и может соответствующим образом отводить до 400 Вт тепла процессора в форм-факторе 1,75 дюйма. Это очень громкая система: мы зарегистрировали 78 децибел, независимо от того, находится ли система в режиме ожидания или работает с полной нагрузкой. Учитывая, что это сервер 1U, можно предположить, что лучшее место для него — центр обработки данных. Я не сомневаюсь, что процессор можно перенести в корпус tower, но тогда, как и в случае с 28-ядерным Xeon W-3175X, который мы тестировали в январе, для обуздания его потребуется существенная возня с охлаждением.
По производительности, кастомная система от ICC была создана для высокочастотного трейдинга. Она включает всего лишь 32 ГБ DDR4, но работает на DDR4-3600 с откорректированными сабтаймингами. Мы изначально добавили наше стандартное тестирование SSD и GPU, но из-за сложности системы мы не могли запускать игры на ней. Зато из-за высокой однопоточной производительности Core i9-9990XE просто порвал все другие высокопроизводительные десктоп процессоры — как и должно было быть. Все Intel Core лежит поверженное, только Xeon W-3175X, 28-ядерный процессор, может одержать верх в многопоточных задачах, и всё равно Core i9-9990XE убивает его, когда частота становится ограничивающим фактором. Это видно в нашем тесте компиляции, где важен правильный баланс ядер и частоты — Core i9-9990XE установил новый мировой рекорд в этом тесте. Существуют некоторые предостережения: частота mesh в некоторых тестах кажется сдерживающим фактором, или же частота при входе и выходе из турбо-режимов может вызвать дополнительные задержки в тестах.
При сравнении с аналогами от AMD, частота 5,0 ГГц проходит сквозь конкурентов, как нож сквозь масло. AMD должна отыгрываться на своих 32-ядерных процессорах Threadripper, и даже в таком случае это компромисс: 14 ядер на 5,0 ГГц против 32 ядер на ~ 3,4 ГГц означает, что у 2990WX есть преимущество только в случае «сырых» вычислений, при любом сценарии с зависимостью от памяти, или добавлением AVX2 / AVX512, выводит Core i9-9990XE в лидеры.
Мы, очевидно, не можем озвучить точную цену. W-3175X стоит $ 3000, примерно как и i9-9990XE, имеет поддержку ECC и шесть каналов памяти, но не имеет такой частоты одного потока. 2990WX — это дизайн NUMA, который хорошо работает в сфокусированных приложениях. В отличие от него, i9-9990XE хорошо работает практически в каждом сценарии, но 2990WX дешевле на 30-40%.
Не за горами 8-ядерный процессор Intel с тактовой частотой 5,0 ГГц, Core i9-9900KS. Это процессор потребительского уровня, имеющий всего два канала памяти и 16 линий PCIe 3.0, но он будет стоить $ 513 при запуске через пару дней (30 октября). Пользователи, интересующиеся полностью готовым процессором с частотой 5,0 ГГц (т. е. Не разогнанным), вероятно, обнаружат, что 9900KS выглядит как хорошая стартовая позиция, а позднее можно задуматься о 9990XE, когда такие вещи, как пропускная способность памяти, начинают становится проблемой.
Что касается доступности, никто не сможет обеспечить массовые поставки Core i9-9990XE: у Intel есть несколько чипов, которые соответствуют спецификациям, и они продаются системным интеграторам. Поэтому, если клиенту необходимо купить некоторое количество чипов, ему придется работать с системным интегратором, выделив неопределенный бюджет для аукциона. И даже тогда нет гарантии, что у Intel будет нужное количество доступных чипов (или что кто-то не перебьет вашу ставку). Также Intel не предоставляет никаких гарантий системному интегратору, что означает дополнительную стоимость. Компаниям, которые рассматривают приобретение одной из этих систем, возможно, придется работать с единственным экземпляром. Для сравнения мы ожидаем, Core i9-9900KS будут доступны для компаний более естественным образом, напрямую у ритейлеров.
В конечном счете, Core i9-9990XE является неожиданностью. Это огромный сюрприз, если точнее. Это похоже на одного из рукодельных боевых роботов в Robot Wars (Великобритания) или BattleBots (США): что-то полностью выходящее за рамки нормы, большое, грозное и неадекватное. Что-то, что вы, возможно, хотели бы иметь, но вряд ли когда-то получите.
Немного рекламы :)
Спасибо, что остаётесь с нами. Вам нравятся наши статьи? Хотите видеть больше интересных материалов? Поддержите нас, оформив заказ или порекомендовав знакомым, облачные VPS для разработчиков от $4.99, 30% скидка для пользователей Хабра на уникальный аналог entry-level серверов, который был придуман нами для Вас: Вся правда о VPS (KVM) E5-2650 v4 (6 Cores) 10GB DDR4 240GB SSD 1Gbps от $20 или как правильно делить сервер? (доступны варианты с RAID1 и RAID10, до 24 ядер и до 40GB DDR4).
Dell R730xd в 2 раза дешевле? Только у нас 2 х Intel TetraDeca-Core Xeon 2x E5-2697v3 2.6GHz 14C 64GB DDR4 4x960GB SSD 1Gbps 100 ТВ от $199 в Нидерландах! Dell R420 — 2x E5-2430 2.2Ghz 6C 128GB DDR3 2x960GB SSD 1Gbps 100TB — от $99! Читайте о том Как построить инфраструктуру корп. класса c применением серверов Dell R730xd Е5-2650 v4 стоимостью 9000 евро за копейки?