Intel недавно представила обновленную линейку новых четырехъядерных процессоров Intel Broadwell Xeon E3-1200 v4. Серия серверных процессоров Intel Xeon E3-1200 v3 появилась на рынке во 2-м квартале 2013 года и и была тихо обновлена во втором квартале 2014 года на модели типа Е3-1231 v3. Теперь анонсированы Xeon v4. Разберемся: что же нового предлагает нам Intel?
В терминологии стратеги «тик-так», Broadwell это «тик»: производитель использовал архитектуру Haswell в 14-нанометровом исполнении. «Тик» не предполагает революционных изменений. Аналитики считают, что в этой фазе Intel допиливает известные технологии, а улучшения будут косметические. По спецификации Broadwell обеспечивает пониженное энергопотребление и сопоставимую с процессорами предыдущего поколения общую производительность.
Рассмотрим три новых серверных процессора Intel Xeon E3-1200 v4 на сокете LGA 1150.
Объем кэш-памяти третьего уровня урезан на 2 Мб, то есть на четверть по сравнению с предыдущими моделями Xeon. Как замечает www.anandtech.com, потеря 2 Мб L3 несущественна, учитывая появление eDRAM объемом 128 МБ в L4.
В начале 2007 года Intel и IBM совместно с AMD, Toshiba и Sony почти одновременно заявили о технологии, которая позволит ускорить работу процессоров в два раза. Для этого было предложено использовать память eDRAM (embedded DRAM), которая будет применяться вместе с технологией «кремний на изоляторе» (SOI, Silicon-on-Insulator). В IBM заявили, что это позволит существенно ускорить кэш-память, в три раза увеличить ее плотность и в пять раз уменьшить потребляемую мощность в режиме бездействия процессора. Тогда планировалось использовать кэш-память объемом 24 Мб.
Технологически embedded DRAM — это DRAM, встраиваемая («embedded») в процессор в отличие от SDRAM. eDRAM требует напряжения 1 В, что заметно ниже питания обычной памяти. На практике это означает, что eDRAM потребляет меньше энергии, обеспечивая сопоставимое быстродействие. Ячейки eDRAM меньшего размера — 0.108um² для SRAM и 0.029um² для eDRAM — на чип того же размера влезет на порядок больше чуть более медленных ячеек памяти.
Intel не только поставил известный Haswell на 14-нанометровые рельсы. В процессорах Broadwell производитель использовал возможности eDRAM настолько полно, насколько это сегодня возможно. Производитель заявляет о 25% улучшении таких параметров, как энергопотребление и тепловыделение.
Кристалл eDRAM Crystalwell объемом 128 МБ играет роль кэш-памяти четвертого уровня. Кэш подобного объема был у Haswell, но лишь в топовых моделях E7. При этом eDRAM может использоваться и графическим ядром, и вычислительными ядрами процессора при обработке больших объемов данных — например, текстур. По заявлению производителя, Crystalwell обеспечивает пиковую пропускную способность на уровне 51,2 Гбайт/с в каждую сторону (102,4 Гбайт/с суммарно).
Согласно тестам, проведенным 3Dnews.ru, латентность основанного на eDRAM L4-кэша составляет 55 тактов, а пропускная способность — примерно вдвое выше по сравнению с двухканальной DDR3-1866 SDRAM.
Crystalwell позволяет процессору преодолеть относительные ограничения низкой пропускной способности системной памяти и показать лучшее быстродействие в задачах по обработке HD-видео и в математических операциях.
Согласно собственным тестам Intel (использовался Supermicro SuperServer), при использовании Broadwell возможна одновременная обработка 4368 HD-видеопотоков. Этот же показатель при использовании процессоров Haswell составляет 3120. Налицо увеличение производительности на 40%. Все материнские платы Supermicro серии Х10 подерживают v4 после обновления BIOS.
В новой линейке процессоров использовано графическое ядро Iris Pro Graphics, «облегченную» версию которого ранее можно было встретить только в мобильных процессорах Haswell. Теперь Iris Pro Graphics P6300 имеет конфигурацию GT3е и 48 исполнительных устройств (EU, execution units) против 40 EU в графических ядрах Iris Pro Graphics 5100 и 5200 у Haswell.
Использование Iris Pro Graphics P6300 является и существенным отличием новых Xeon от Xeon E3-1200 v3 на Broadwell: в прошлой линейке использовались менее продвинутые Intel HD Graphics P4600 и Intel HD Graphics P4700.
Понятным преимуществом рассматриваемых процессоров является то, что устанавливаются они в слот LGA1150: владельцы материнских плат на основе набора системной логики Intel Z97 и Intel H97 могут легко апгрейдить систему. Формально новые Xeon совместимы с материнскими платами на основе набора системной логики восьмой серии на сокете LGA1150.
Пользователи, обновляющиеся с Haswell на Broadwell, теперь могут сделать это сравнительно дешево. Так, если рекомендованные цены Intel на E3-1285L v3 составляют $774, то стоимость E3-1285L v4 — $445.
Недостатком для некоторых пользователей может оказаться невозможность разгона этих процессоров. Впрочем, эта серия Xeon — серверное решение, а любителям оверклокинга производитель предлагает другие процессоры новой линейки.
В ряде тестов, проведенных www.anandtech.com, процессоры Intel Broadwell Xeon E3-1200 v4 показали противоречивые результаты.
При архивировании 2867 файлов общим объемом 1,52 Гб лучший результат показал E3-1285L v4, обогнав даже более мощный E3-1285 v4.
Однако в других тестах Xeon отставал от конкурентов. Конвертация серии из 170 изображений с помощью приложения FastStone Image Viewer v.4.9 оказалась для новых Xeon довольно сложной задачей.
Запуск эмулятора игровых консолей Dolphin показал, что в отработке 3D-сцен Intel Broadwell Xeon E3-1200 v4 опережает только слабые процессоры.
В то же время при конвертировании видео формата x264 в mp4 Broadwell отстал только от Intel Core i7 6700К.
Линейка процессоров Intel Broadwell Xeon E3-1200 v4 благодаря использованию нового кристалла памяти eDRAM обгоняет старые модели в решении тяжелых вычислительных задач и обработке HD-видео при сниженных значениях мощности и тепловыделения.
1) высокопроизводительные графические станции
2) выделенные сервера выполняющие задачи транскодирования и потокового вещания без использования GPU типа Tesla. Новые процессоры Интел показывают 40% к производительности на таких задачах и позволяют снизить издержки на аппаратную часть транскодеров. Тут приведена сравнительная таблица производительности для продуктов онлайн-вещания Wowza — какие процессоры для каких задач подходят.
2) выделенные сервера позволяющие виртуализировать графические приложения — для этого раньше было нужно ставить Теслу или что-то подобное
Мы в Hostkey предлагаем в аренду выделенные сервера в Москве и Нидерландах — новый тип процессоров для виртуализации 3Д приложений и стриминга/обработки видео появится у нас в начале 2016 года.
Для подобных задач мы рекомендуем клиентам использовать многоядерные процессоры Xeon старших серий, например машина в конфигурации 2х Xeon E5-2670 v2 с 20 ядрами на 2,5ГГц в на базе суперкомпьютерной платформы Т-Платформы и 32Гб памяти обойдется в 23000 рублей в месяц.
В терминологии стратеги «тик-так», Broadwell это «тик»: производитель использовал архитектуру Haswell в 14-нанометровом исполнении. «Тик» не предполагает революционных изменений. Аналитики считают, что в этой фазе Intel допиливает известные технологии, а улучшения будут косметические. По спецификации Broadwell обеспечивает пониженное энергопотребление и сопоставимую с процессорами предыдущего поколения общую производительность.
Рассмотрим три новых серверных процессора Intel Xeon E3-1200 v4 на сокете LGA 1150.
Процессор | Xeon E3-1285 v4 | Xeon E3-1285L v4 | Xeon E3-1265L v4 |
Ядра/потоки | 4/8 | 4/8 | 4/8 |
Технология Hyper-Threading | Есть | Есть | Есть |
Тактовая частота | 3,5 ГГц | 3,4 ГГц | 2,3 ГГц |
Максимальная частота в турбо-режиме | 3,8 ГГц | 3,8 ГГц | 3,3 ГГц |
Разблокированный множитель | Нет | Нет | Нет |
TDP | 95 Вт | 65 Вт | 35 Вт |
HD Graphics | Iris Pro P6300 | Iris Pro P6300 | Iris Pro P6300 |
Частота графического ядра | 1150 МГц | 1150 МГц | 1050 МГц |
L3-кэш | 6 Мбайт | 6 Мбайт | 6 Мбайт |
Интегрированная eDRAM | 128 Мбайт | 128 Мбайт | 128 Мбайт |
Поддержка DDR3 | 1333/1600/1866 | 1333/1600/1866 | 1333/1600/1866 |
Технологии vPro/TSX-NI/TXT/VT-d | Есть | Есть | Есть |
Расширения набора инструкций | AVX 2.0 | AVX 2.0 | AVX 2.0 |
Сокет | LGA1150 | LGA1150 | LGA1150 |
Объем кэш-памяти третьего уровня урезан на 2 Мб, то есть на четверть по сравнению с предыдущими моделями Xeon. Как замечает www.anandtech.com, потеря 2 Мб L3 несущественна, учитывая появление eDRAM объемом 128 МБ в L4.
Что такое eDRAM?
В начале 2007 года Intel и IBM совместно с AMD, Toshiba и Sony почти одновременно заявили о технологии, которая позволит ускорить работу процессоров в два раза. Для этого было предложено использовать память eDRAM (embedded DRAM), которая будет применяться вместе с технологией «кремний на изоляторе» (SOI, Silicon-on-Insulator). В IBM заявили, что это позволит существенно ускорить кэш-память, в три раза увеличить ее плотность и в пять раз уменьшить потребляемую мощность в режиме бездействия процессора. Тогда планировалось использовать кэш-память объемом 24 Мб.
Технологически embedded DRAM — это DRAM, встраиваемая («embedded») в процессор в отличие от SDRAM. eDRAM требует напряжения 1 В, что заметно ниже питания обычной памяти. На практике это означает, что eDRAM потребляет меньше энергии, обеспечивая сопоставимое быстродействие. Ячейки eDRAM меньшего размера — 0.108um² для SRAM и 0.029um² для eDRAM — на чип того же размера влезет на порядок больше чуть более медленных ячеек памяти.
Intel не только поставил известный Haswell на 14-нанометровые рельсы. В процессорах Broadwell производитель использовал возможности eDRAM настолько полно, насколько это сегодня возможно. Производитель заявляет о 25% улучшении таких параметров, как энергопотребление и тепловыделение.
Кристалл eDRAM Crystalwell объемом 128 МБ играет роль кэш-памяти четвертого уровня. Кэш подобного объема был у Haswell, но лишь в топовых моделях E7. При этом eDRAM может использоваться и графическим ядром, и вычислительными ядрами процессора при обработке больших объемов данных — например, текстур. По заявлению производителя, Crystalwell обеспечивает пиковую пропускную способность на уровне 51,2 Гбайт/с в каждую сторону (102,4 Гбайт/с суммарно).
Согласно тестам, проведенным 3Dnews.ru, латентность основанного на eDRAM L4-кэша составляет 55 тактов, а пропускная способность — примерно вдвое выше по сравнению с двухканальной DDR3-1866 SDRAM.
Crystalwell позволяет процессору преодолеть относительные ограничения низкой пропускной способности системной памяти и показать лучшее быстродействие в задачах по обработке HD-видео и в математических операциях.
Согласно собственным тестам Intel (использовался Supermicro SuperServer), при использовании Broadwell возможна одновременная обработка 4368 HD-видеопотоков. Этот же показатель при использовании процессоров Haswell составляет 3120. Налицо увеличение производительности на 40%. Все материнские платы Supermicro серии Х10 подерживают v4 после обновления BIOS.
Видеоядро Iris Pro Graphics
В новой линейке процессоров использовано графическое ядро Iris Pro Graphics, «облегченную» версию которого ранее можно было встретить только в мобильных процессорах Haswell. Теперь Iris Pro Graphics P6300 имеет конфигурацию GT3е и 48 исполнительных устройств (EU, execution units) против 40 EU в графических ядрах Iris Pro Graphics 5100 и 5200 у Haswell.
Использование Iris Pro Graphics P6300 является и существенным отличием новых Xeon от Xeon E3-1200 v3 на Broadwell: в прошлой линейке использовались менее продвинутые Intel HD Graphics P4600 и Intel HD Graphics P4700.
Понятным преимуществом рассматриваемых процессоров является то, что устанавливаются они в слот LGA1150: владельцы материнских плат на основе набора системной логики Intel Z97 и Intel H97 могут легко апгрейдить систему. Формально новые Xeon совместимы с материнскими платами на основе набора системной логики восьмой серии на сокете LGA1150.
Пользователи, обновляющиеся с Haswell на Broadwell, теперь могут сделать это сравнительно дешево. Так, если рекомендованные цены Intel на E3-1285L v3 составляют $774, то стоимость E3-1285L v4 — $445.
Недостатком для некоторых пользователей может оказаться невозможность разгона этих процессоров. Впрочем, эта серия Xeon — серверное решение, а любителям оверклокинга производитель предлагает другие процессоры новой линейки.
Тесты
В ряде тестов, проведенных www.anandtech.com, процессоры Intel Broadwell Xeon E3-1200 v4 показали противоречивые результаты.
При архивировании 2867 файлов общим объемом 1,52 Гб лучший результат показал E3-1285L v4, обогнав даже более мощный E3-1285 v4.
Однако в других тестах Xeon отставал от конкурентов. Конвертация серии из 170 изображений с помощью приложения FastStone Image Viewer v.4.9 оказалась для новых Xeon довольно сложной задачей.
Запуск эмулятора игровых консолей Dolphin показал, что в отработке 3D-сцен Intel Broadwell Xeon E3-1200 v4 опережает только слабые процессоры.
В то же время при конвертировании видео формата x264 в mp4 Broadwell отстал только от Intel Core i7 6700К.
Подводем итоги
Линейка процессоров Intel Broadwell Xeon E3-1200 v4 благодаря использованию нового кристалла памяти eDRAM обгоняет старые модели в решении тяжелых вычислительных задач и обработке HD-видео при сниженных значениях мощности и тепловыделения.
Для чего они нужны:
1) высокопроизводительные графические станции
2) выделенные сервера выполняющие задачи транскодирования и потокового вещания без использования GPU типа Tesla. Новые процессоры Интел показывают 40% к производительности на таких задачах и позволяют снизить издержки на аппаратную часть транскодеров. Тут приведена сравнительная таблица производительности для продуктов онлайн-вещания Wowza — какие процессоры для каких задач подходят.
2) выделенные сервера позволяющие виртуализировать графические приложения — для этого раньше было нужно ставить Теслу или что-то подобное
Мы в Hostkey предлагаем в аренду выделенные сервера в Москве и Нидерландах — новый тип процессоров для виртуализации 3Д приложений и стриминга/обработки видео появится у нас в начале 2016 года.
Для подобных задач мы рекомендуем клиентам использовать многоядерные процессоры Xeon старших серий, например машина в конфигурации 2х Xeon E5-2670 v2 с 20 ядрами на 2,5ГГц в на базе суперкомпьютерной платформы Т-Платформы и 32Гб памяти обойдется в 23000 рублей в месяц.