Часть 1 >> Часть 2>>Часть 3
В 2018 году AMD Radeon Technologies Group позволила себе небольшую передышку. После запуска архитектуры Polaris в 2016, и архитектуры Vega в 2017, AMD решила насладиться первым полным годом на архитектуре Vega. Вместо запуска третей архитектуры по прошествии 3 лет, компания сосредоточится на дальнейшем расширении семейства, выводя на рынок варианты ноутбуков и серверов Vega. Несмотря на то, что усилия AMD в области ноутбуков пошли мягко сказать по странному направлению, работа по созданию сервера Radeon Instinct привела к позитивному результату. В итоге компания анонсировала первый 7-нм GPU.
После обновления продукта последнего поколения в ноябре, в виде Radeon RX 590, мы ожидали, что некоторое время AMD уделит внимание потребителю. Вместо этого AMD сделала довольно неожиданный анонс на CES 2019: компания выпустит новую потребительскую карту хай-энд сегмента, Radeon VII (Seven). Основанная на вышеупомянутом серверном графическом процессоре, видеокарта позиционируется как новейший флагман. Созданная как для геймеров, так и для создателей контента, Radeon VII должна стать решительным шагом AMD в сторону любителей игр. Пришла и наша очередь рассмотреть новейшую карту AMD.
На первый взгляд в Radeon VII все кажется очевидным. Кремниевая основа карты — это AMD Vega 20 GPU, производная от оригинальной Vega 10, которая была усовершенствована для научных вычислений и машинного обучения, и построена на ультрасовременном 7-нм технологическом процессе TSMC для повышения производительности. Это важная веха для AMD в создании серверных графических процессоров – они выпустили первый высокопроизводительный GPU серверного класса со времен GPU Hawaii в 2013 году. AMD не терпелось продемонстрировать Vega 20 на позднем этапе своего развития, так как этот GPU является сердцем относительно новых серверных ускорителей Radeon Instinct MI50 и MI60 от AMD.
Vega 20, прежде всего предназначенная для серверов, не относится к классу графических процессоров, которые могли бы дешево и просто найти дорогу к потребителю. Но произошло нечто неожиданное: NVIDIA почти не изменила показатель производительности на доллар. Вместо этого, новые карты GeForce RTX на основе Turing сконцентрированы на опциях, которые призваны провозгласить новую парадигму рендеринга игр с эффектами трассировки лучей в реальном времени, и выделить для этой цели больше ресурсов GPU Turing. Конечным результатом стали относительно высокие цены на карты серии GeForce RTX 20, хотя их прирост производительности в играх намного меньше, чем обычно при смене поколений видеокарт.
Столкнувшись с менее враждебной ценовой средой, чем ожидалось вначале, AMD решила, наконец, представить Vega 20 потребителям, сражаясь с NVIDIA на одном из этих высоких ценовых уровней. Radeon VII выходит в массы с ценой $ 699, а GeForce GTX 2080 становится новой флагманской игровой картой Radeon.
Глядя на таблицу спецификаций, Radeon VII поставляется с пиковыми тактовыми частотами 1800 МГц, в то время как официальная пиковая частота составляет 1750 МГц. Это хороший прогресс в сравнении с RX Vega 64, где тактовая частота составляла всего 1630 МГц, значит, AMD есть еще около 10% прироста в частоте. А благодаря открытому кулеру и пересмотренному SMU, Radeon VII сможет еще быстрее повышать и лучше поддерживать высокие тактовые частоты. Так что, хотя последняя карта AMD не добавляет больше ROP или CU (на самом деле даже имеется небольшое снижение по сравнению с RX Vega 64), она поднимает на новый уровень пропускную способность.
Однако самое большое изменение по сравнению с RX Vega 64 состоит в том, что AMD удвоила объем памяти, и более чем удвоила пропускную способность памяти. Это возможно благодаря 7-нм техпроцессу, из-за которого новейший графический процессор AMD имеет относительно скромный размер матрицы 331 мм2. Дополнительное пространство позволило AMD интерпозер и еще два стека HBM2, что позволило увеличить количество VRAM и расширить шину памяти. AMD также смогла немного увеличить частоту памяти: с 1,89 Gbps/pin на RX Vega 64 до плоской 2 Gbps/pin на Radeon VII.
Интересно, что, исходя из базовых характеристик, Radeon VII по сути является Radeon Instinct MI50. Таким образом, у AMD есть риск «каннибализации» продаж Instinct, если высокая производительность Radeon VII заинтересует профессиональных пользователей компьютеров. В результате AMD сократила некоторые функции чипа, чтобы лучше дифференцировать продукты. Мы поговорим об этом чуть позже, но главное заключается в том, что карта работает с меньшей частотой, чем FP64, теряет полную поддержку чипов ECC и, что естественно для потребительского продукта, использует игровые драйверы Radeon Software вместо профессионального стека драйверов Instinct.
Конечно, всякий раз, когда вы говорите о подключении серверного графического процессора к потребительской видеокарте, вы говорите о мощной карте с большим потенциалом, и это, безусловно, относится к Radeon VII. В двух словах, преимущество новейшей флагманской карты AMD заключается в высокой производительности, и максимальными в своем классе 16 ГБ памяти HBM2. Как одно из немногих очевидных преимуществ спецификации AMD по сравнению с конкурентами NVIDIA, объем VRAM является важной частью маркетинга AMD; они будут уделять большое внимание созданию контента и играм, интенсивно использующим VRAM. Новинкой в этой карте является и кулер с тремя вентиляторами, пришедший на смену одно-вентиляторному кулеру на картах Radeon RX Vega 64/56.
Кроме того, еще одно небольшое изящное изменение: AMD самостоятельно выходит на розничный рынок в качестве поставщика плат и напрямую продает новую карту по установленной цене $ 699. Учитывая, что AIB также сегодня выпускают свои брендированные референс-карты, это возможность избежать завышенных цен на запуск.
Между тем, глядя на конкурентную ситуацию, возникает пару вопросов, которые нужно решать. Важная часть предложения — это (как это стало обычным в последнее время) комплект игр. В текущем пакете Raise the Game Fully Loaded pack бесплатно представлены Devil May Cry 5, The Division 2 и Resident Evil 2 с картами Radeon VII, RX Vega и RX 590. Между тем, карты RX 580 и RX 570 позволяют выбрать две игры из трех. Как положено, комплект игр будет просто добавленной стоимостью по сравнению с прямым конкурентом — в данном случае RTX 2080 — но у NVIDIA есть свой собственный дуэльный комплект Game On с Anthem и Battlefield V. В сценарии, где Radeon VII, как ожидается, будет сражаться за потребителей с RTX 2080, без шанса на окончательную победу, эти дополнительные преимущества становятся все важнее.
Radeon VII знаменует собой первый запуск продукта с момента недавнего изменения конкурентной среды из-за технологии мониторов с переменной частотой обновления. Мониторы с переменной частотой обновления экрана уже стали обязательным атрибутом для геймеров, и с момента запуска этой технологии в начале этого десятилетия между картами AMD и NVIDIA было явное разделение. Карты AMD поддерживают VESA Adaptive Sync, более известную под брендом AMD FreeSync, в то время как десктоп карты NVIDIA поддерживают только свою фирменную G-Sync. Но в прошлом месяце NVIDIA неожиданно объявила о том, что их карты будут поддерживать VESA Adaptive Sync под маркой 'G-Sync Compatibility'. Подробных сведений о том, как устроена эта программа, мало, но в конце концов, адаптивная синхронизация может использоваться в драйверах NVIDIA, даже если панель FreeSync не сертифицирована G-Sync Compatible.
Конечным результатом является то, что, хотя новость от NVIDIA и не мешает AMD в плане реализации возможностей, это подрывает преимущество AMD в FreeSync — все дешевые мониторы VESA Adaptive Sync, которые раньше использовались только на картах AMD, теперь можно использовать и на картах NVIDIA. AMD, конечно же, была очень рада подчеркнуть «бесплатный» FreeSync, но в качестве оружия против NVIDIA этот маркетинговый ход потерял свою силу. Официальная линия AMD — считать это победой FreeSync.
Выпуск Radeon VII и его конкурентное позиционирование по сравнению с GeForce RTX 2080 означает, что AMD необходимо четко определить свою позицию в отношении нынешнего разрыва в возможностях между их картами и новейшими NVIDIA Turing. Поэтому позиция AMD осталась неизменной в технологиях DirectX Raytracing (DXR) и технологиях качества и производительности изображений на основе AI, таких, как DLSS. Короче говоря, аргумент AMD в том, что, по их мнению, разница в качестве изображения и прирост производительности не стоят цены за эти функции. Тем временем AMD не стоит на месте, и вместе с резервными драйверами DXR они работают над поддержкой WinML и DirectML для своих карт. Риск AMD: если DXR или усилия NVIDIA по DLSS начнут быстро развиваться, пробел в функциях станет гораздо более крупной проблемой.
В общем, выпуск 7-нм игрового графического процессора для потребителей в настоящее время является очень агрессивным шагом. Особенно на раннем этапе жизненного цикла этого процесса. Но у AMD попросту нет времени, чтобы подождать и понаблюдать. Единственным серьезным препятствием в продвижении продукта будет ценообразование: стоимость должна быть приемлемой для потребителей.
Это подводит нас к сегодняшнему запуску. С ценой $ 699 NVIDIA уже опустила ценовую планку, говоря о выделенном оборудовании для ускорения трассировки лучей и машинного обучения. Для Radeon VII, условия вращаются вокруг 16 ГБ HBM2 и ценности для полупрофессионалов и создателей контента. Все, что остается, это их игровая производительность.
Хотя мы уже знакомы с Vega 20 благодаря выпуску графических карт серверного класса Radeon Instinct MI50 и MI60, выход этого чипа на потребительский рынок означает первую 7-нм игровую карту. Быстрый переход к более низкому узлу — на этот раз от 14-нм LPP GlobalFoundries до 7-нм TSMC (CLN7FF) — и раньше был отличительной чертой AMD / ATi, и вот снова AMD спешит с выпуском, так рано доводя продукт до потребителей. В данном случае все атрибуты Vega 20 явно предназначены для профессионалов и серверов, хотя имеют преимущества и для игр.
В сложной истории Radeon VII судьба Веги была особенно загадочной. Начнем с того, что 7-нм графический процессор Vega 20, так рано пробившийся к потребителям, оказался сюрпризом. И хотя AMD упоминала Vega 20 только в отношении продуктов Radeon Instinct — ссылаясь на свою будущую архитектуру Navi при упоминании 7-нм графических процессорах для геймеров, — теперь AMD утверждает, выпуск Radeon VII на потребительский рынок был давно запланирован. Возможно, то же самое можно было бы сказать о Vega на 14 нм + / 12LP и графическом процессоре Vega 11 (не путать с 11 вычислительными блоками Ryzen 2400G Vega), хотя это вряд ли необычно, учитывая природу разработок в сфере полупроводников.
Честно говоря, AMD несколько прохладно относилась к Vega с момента запуска RX Vega, которая не вполне достигла поставленных целей. Пусть даже Radeon VII в каком-то смысле является «чипом Шредингера», он поднимает некоторые интересные вопросы о 7 нм. Например, AMD уже отодвигала сроки сэмплинга и запуска Vega 20 раньше. Выходит, сроки запуска Radeon VII — это самое раннее, что могло бы быть для наследника Radeon Instinct. Тем более, что при размере матрицы 331 мм2 это не маленькие мобильные SoC, которые мы видели до сих пор на TSMC 7 нм. Разработанный с учетом вычислений / ML-ориентированных улучшений, оснащенный 4 стеками HBM2 и созданный на зрелом и ультрасовременном 7-нм узле, GPU Vega 20 не выглядит как карта, готовая создать хорошее предложение по потребительским ценам. И все же благодаря счастливому стечению обстоятельств это произошло.
Vega 20 сочетает в себе обновленную архитектуру GCN 5 с 7-нм технологическим процессом, с транзисторами 13,2 В на 331 мм2 (по сравнению с 12,5 В на 496 мм2 для Vega 10). Как правило, при уменьшении размеров экономия пространства реинвестируется в большее количество транзисторов. Для игровой видеокарты это может означать что угодно, от большего количества CU и функциональных блоков, до перепроектирования макетов и усиленных каналов данных для повышения допуска по частоте. Последнее, конечно, должно обеспечить более высокую тактовую частоту, и такой выбор был важной частью дизайна Vega 10, где значительное количество транзисторов было использовано для достижения требуемых частотных характеристик. В сочетании с энергоэффективностью меньшего технологического узла новая микросхема может получить эти более высокие тактовые частоты без потребления дополнительной мощности.
Однако у Vega 20 большая часть сэкономленного пространства была оставлена «как есть»: на чипе больше свободного места. Для этого есть несколько причин, некоторые очевидные, а некоторые нет. Начнем с того, что для большого высокопроизводительного графического процессора на передовом 7-нм узле в начале жизненного цикла разработка и производство являются очень дорогостоящими. И, вероятно, с увеличением размера стоимость значительно возрастет, а прибыльность продукта снизится. И хотя 7-нм процесс TSMC до сих пор был публично замечен только в мобильных SoC, Vega 20, похоже, использует HPC-ориентированные библиотеки 7.5T, в отличие от использования библиотек 6T, предназначенных для мобильных SoC.
Но что еще более важно, сэкономленное пространство позволяет разместить еще два стека HBM2 на промежуточном устройстве аналогичного размера. Для плотностей и возможностей HBM2 текущего поколения предел для чипа с двумя стеками составляет 16 ГБ памяти при использовании пары стеков «8-Hi». Но для GPU серверного уровня — особенно для ориентированного на машинное обучение — необходима конфигурация из четырех стеков, чтобы обеспечить 32 ГБ памяти и более широкую 4096-битную шину. Для Vega 20 AMD выбрала именно такую конфигурацию, и, кроме того, выпускает версии чипа как 32 ГБ (8-Hi), так и 16 ГБ (4-Hi).
Radeon VII, в свою очередь, использует один из этих 16-ГБ чипов. Следует отметить, что это не первая 16-гигабайтная карта Vega от AMD — они уже выпускали карту с таким объемом памяти. Это была специализированная Vega Frontier Edition, но после выхода ее «на пенсию», это первый выпуск 16 ГБ видеокарты в линейке AMD Vega.
Оснащение потребительской карты 16 ГБ памяти — азартный ход со стороны AMD. И, я подозреваю, это одна из причин того, что AMD хочет отхватить и часть рынка профессиональной визуализации с помощью Radeon VII. Когда дело доходит до использования рабочей станции и задач по созданию контента, большой объем VRAM легко продать, поскольку уже есть задачи, которые могут использовать всю эту VRAM и даже больше. Но для игр это не самое разумное предложение, поскольку игры предъявляют более фиксированные требования к VRAM, а до сих пор таких больших карт не было, и разработчики еще не начали использовать ресурс видеопамяти 16 ГБ. Хотя с другой стороны, громкое утверждение «эта карта имеет более чем достаточное количество видеопамяти» может оказать серьезное влияние на продажи, и в 2019 году флагманская видеокарта для геймеров должна иметь это такой объем в любом случае.
Возвращаясь к дизайну Vega 20, другой шаг, который AMD предприняла, чтобы уменьшить сложность разработки и стоимость 7 нм, заключается в том, чтобы придерживаться уже известной архитектуры. AMD добавила небольшие оптимизации в сравнении с Vega 10, но они не рискнули сделать серьёзный редизайн. По сути, это логика шага «тик» известной «тик-так» стратегии Intel.
На самом деле Vega 20 настолько прямой наследник Vega 10, что, кроме числа контроллеров памяти, количество остальных функциональный блоков одинаково. Графический процессор объединяет 64 CU и 256 текстурных блоков, разделенных на 4 Shader Engine, а также 64 ROP и графический командный процессор AMD.
(Я должен добавить, что, следуя своему плану, AMD также аккуратно избегает вопроса о масштабировании шейдерного движка. Природа ограничения 4 Shader Engine в последние годы оставалась неясной, но с Vega были намеки на выход за эти пределы с улучшенной балансировкой нагрузки с помощью «intelligent workgroup distributors» (IWD). Независимо от этого, настроить и перепроектировать сбалансированную конфигурацию 4+ SE задача весьма сложная, и не имеет смысла, если AMD планирует внести фундаментальные изменения в GCN.)
Таким образом, на архитектурном уровне Vega 20 — это чисто эволюционный дизайн. Но с учетом вышесказанного, в нем немного больше «эволюции», чем просто уменьшение технологического узла. Комбинация этих улучшений означает, что на практике Vega 20 должна быть немного быстрее, чем Vega 10 при работе на равной тактовой частоте.
Наиболее заметное улучшение здесь — дополнительная пропускная способность памяти; вдвое больше на ROP, текстурный блок и ALU, чем было на Vega 10. Это особенно хорошо для ROP, которые традиционно нуждаются в большой пропускной способности. Не останавливаясь на достигнутом, AMD также внесла некоторые улучшения в Core Fabric, которая соединяет память с ROP (среди прочего). К сожалению, AMD не хочет разглашать, что это за улучшения, только подтвердили, что среди них нет никаких изменений в кэше.
Другая часть головоломки заключается в том, что AMD добавила новые инструкции и типы данных, которые в некоторых случаях ускорят машинное обучение. AMD не предоставила нам полную информацию, но в целом мы знаем, что они добавили поддержку типов данных INT8 и INT4, которые полезны для сценариев вывода с низкой точностью. AMD также добавила скалярное произведение FP16, которое сохраняется как результат FP32. Это довольно специфический сценарий, который полезен для некоторых алгоритмов машинного обучения, поскольку он дает более высокую точность результата, чем скалярное произведение FP16-in / FP16-out.
Говоря о типах данных, AMD также значительно увеличила производительность FP64 для Vega 20. В качестве базовой архитектуры, GCN позволяет создавать GPU со скоростью от 1/2 до 1/16 скорости FP32. Для чистых потребительских графических процессоров это всегда было 1/16. Однако для графических процессоров, которые несли многофункциональную нагрузку в качестве серверно-ориентированных чипов, были доступны скорости 1/4 и 1/2. Vega 20, в свою очередь, является первым ½ FP64 процессором от AMD со времен Hawaii в 2013 году. Это означает, что, хотя его общий прирост производительности FP32 по сравнению с картами Vega 10 не так заметен, его FP64-производительность намного лучше: более, чем 8x по сравнению с RX Vega 64 (теоретически). Конечно, как потребительская карта, Radeon VII не может всерьез воспользоваться этими преимуществами — она ограничена скоростью 1/4 — но об этом позже.
Но что касается блоков видео и контроллеров дисплея, AMD внесла только незначительные обновления. Официально контроллер дисплея (DCE) обновлен до версии 12.1, в то время как версия унифицированного видеодекодера (UVD) 7.2, а версия video coding engine (VCE) 4.1. Никакой дополнительной поддержки кодирования или декодирования по сравнению с Vega 10 не было добавлено. Мы так же обнаружили блоки Display Core Next от Raven Ridge и Video Core Next 1.0, так что это может быть последней архитектурой, которую эти ASIC почтили своим присутствием.
Обертывание функциональных блоков — новый стиль SMU, обсуждаемый в последних патчах ядра Linux. Другой особенностью является улучшенный термомониторинг, теперь число температурных диодов было удвоено до 64 датчиков. Как следствие, AMD теперь полностью перешла на мониторинг температуры узлов вместо мониторинга на границе. Измерения температуры узлов использовались и в Vega 10 (отображалось как температура ‘hotspot’), но Vega 20 полностью перешла на измерение температуры узла для всех скоростей кулера, турбочастот и тому подобного. Результатом является более точная отчетность, а также незначительный прирост производительности на 1-2%, на который AMD указывает в результатах внутреннего тестирования.
Обновленный SMU, как следствие вышесказанного, обладает таким эффектом: температура, тактовая частота и связанные с ними метрики GPU больше не считываются через регистры, а вместо этого извлекаются непосредственно из SMU. Естественно, это нарушает совместимость со сторонними утилитами (например, GPU-Z), и, хотя AMD уже уведомила некоторых разработчиков об изменениях, приложения необходимо будет обновлять для использования новых вызовов API от AMD.
Наконец, поскольку это первый высокопроизводительный чип Vega от AMD со времен оригинальной Vega 10 в 2017 году, возникает несколько вопросов, связанных с определенными перспективными хардварными функциями Vega. Информация от AMD не всегда была понятна, в результате чего эти функции стали постоянным источником конфуза потребителей.
С Vega 20, AMD, похоже, не собирается менять ситуацию. То есть дальнейших разработок AMD в отношении шейдеров примитивов не произошло. Шейдеры примитивов по-прежнему должны быть явно описаны разработчиками, а значит, не используется весь потенциал Next Generation Geometry (NGG) Vega 20 (хотя следует отметить, что опция Intelligent Workgroup Distributor всегда была включена).
Между тем, AMD Vegas 10 уже использовала Draw Stream Binning Rasterizer (DSBR), и здесь никаких изменений не произошло; функция включена для неопределенного списка игр. Согласно быстрой проверке на Rapid Packed Math (быстрый FP16), она используется для двух известных игр: Far Cry 5 и Wolfenstein II.
Одним из интересных и забавных последствий запуска Radeon VII является то, что впервые за долгое время AMD пришлось серьезно задуматься о том, как они собираются дифференцировать свои потребительские продукты от продуктов для рабочих станций и серверов. Сейчас AMD предлагает профессиональное оборудование в сериях Radeon Pro и Radeon Instinct, при этом GPU Vega 20 является первым по-настоящему серверным графическим процессором AMD. Таким образом, хотя профессиональные и потребительские продукты значительной степени дифференцированы по программным функциям, Radeon VII предоставляет некоторые новые опции, которые не являются действительно необходимыми для потребителей.
Это может показаться тривиальным вопросом – казалось бы, AMD лучше попросту оставить все функции включенными. Но поскольку компания пытается продвинуться в серверный бизнес с более высокой маржой, продукты для потребителей, такие как Radeon VII, на самом деле являются сложным предложением. AMD необходимо заблокировать достаточно серверной функциональности графического процессора Vega 20, чтобы не продавать потребительский эквивалент Radeon Instinct MI50 за малую часть цены. С другой стороны, в их интересах показать некоторые из этих функций, чтобы сделать Radeon VII действительно ценной картой (которая может оправдать цену в 699 долларов), а также дать разработчикам понять, какого уровня серверное оборудование может сделать AMD.
В данном случае речь идет о производительности FP64. Как мы отмечали в нашем обзоре графического процессора Vega 20, производительность FP64 в Vega 20 очень высокая: это половина скорости FP32, или 6,9 TFLOPS. Это одна из премиальных функций Vega 20, и с тех пор, как Radeon VII был впервые анонсирован на CES, компания изо всех сил пыталась решить, какую часть этой производительности на самом деле сделать доступной для Radeon VII. Во время его объявления нам сказали, что Radeon VII будет иметь неограниченную (1/2) производительность FP64, но позже было сказано, что она будет 1/8. Теперь, с фактическим выпуском карты, AMD наконец решилась: они взяли среднее и сообщили о скорости 1/4.
В стремлении прояснить ситуацию AMD сделала заявление:
Конечный результат заключается в том, что, хотя Radeon VII не будет столь же быстрым, как MI60 / MI50, когда дело доходит до вычислений на FP64, AMD предоставить карту, отстающую от лидеров всего на шаг.
При 3,5 TLFLOPS теоретической производительности FP64, Radeon VII находится в правильной ценовой категории. Попросту не существует других плат текущего поколения с ценой ниже 2000 долларов которые пытаются решить эту задачу. На всех картах NVIDIA GeForce и на всех других картах AMD Radeon отсутствует необходимое оборудование для быстрой FP64. Следующим ближайшим конкурентом Radeon VII в этом отношении является NVIDIA Titan V, которая более чем в 4 раза дороже.
Как мы видим, это немного нишевый рынок, особенно когда так много внимания отрасли уделяется производительности ИИ и нейронных сетей. Но, тем не менее, обладателями карты станут некоторые очень счастливые Data Scientist, особенно академические.
Говоря об искусственном интеллекте, следует отметить, что производительность машинного обучения является еще одной областью, где AMD урезала карту. К сожалению, более подробная информация не доступна в настоящее время. Но учитывая уникальные потребности рынка ML, я не удивлюсь, обнаружив, что производительность INT8 / INT4 немного снижена на Radeon VII. Или снижена производительность некоторых скалярных произведений FP16.
Также под нож пошла full-chip поддержка ECC. Благодаря врожденной функциональности HBM2 все карты Vega уже имеют ECC для своих DRAM. Однако Vega 20 была на шаг впереди с защитой ECC для своих внутренних кэшей, и к этой функции Radeon VII не имеет доступа.
Наконец, Radeon VII также немного сокращает возможности ввода-вывода вне чипа Vega 20. Хотя до сих пор AMD не поднимала много шума об этом, Vega 20 на самом деле является их первым GPU с поддержкой PCI-Express 4.0, и эта функция включена на картах Radeon Instinct. Однако для Radeon VII это не включено, и карта ограничена скоростями PCIe 3.0 (поэтому будущие покупатели Zen 2 не будут иметь карту PCIe 4.0 для полноценной работы со своим новым процессором). Точно так же внешние линки Infinity Fabric для поддержки нескольких графических процессоров были отключены, и Radeon VII будет выступать только соло.
В целом, нет ничего удивительного в выборе AMD, особенно с учетом целевого рынка Radeon VII и целевой цены. Но это заметные «урезания» будут иметь серьезное значение для определенных пользователей. И если они не подтолкнут этих пользователей к Radeon Instinct, то наверняка приведут к неизбежному Radeon Pro на Vega 20.
Перво-наперво дизайн и сборка. И для AMD Radeon VII мы уже заметили самое большое изменение: открытый воздушный кулер. Сохраняя матовую металлическую внешность предыдущих версий RX Vega 64 Limited Edition и Liquid, они отказались от воздуховода в пользу трех вентиляторов, стандартной пользовательской конфигурации AIB для высокопроизводительных карт.
В то время как серии NVIDIA GeForce RTX шли путем использования кулеров с двумя открытыми вентиляторами, AMD привыкла менять ситуацию по своему усмотрению. Помимо RX Vega 64 Liquid, AIO CLC R9 Fury X также имела впечатляющий дизайн. Но, как мы упоминали в отношении карт Founders Edition, отказ от воздуховода в пользу открытых кулеров означает принятие конфигурации отвода тепла, которая больше не может гарантировать полное самоохлаждение. То есть эффективность охлаждения теперь зависима от потока воздуха в шасси. Обычно это является проблемой для крупных OEM-производителей, которые конфигурируют машины с использованием карт типа «воздуховод», но это не касается карт самого высокого уровня, которые для пре-билд систем обычно поступают от системных интеграторов.
Переход на открытые кулеры выгоден более высоким TDP, а при 300 Вт TBP Radeon VII действительно один из лидеров энергопотребления. Казалось, всего на 5 Вт больше в сравнении с RX Vega 64. Но, возможно, излишек тепла выделяется двумя дополнительными стеками HBM2, плюс проблема в том, что потребляется то же количество энергии на меньшей площади кристалла. А мощность 300 Вт TBP означает, что вся сохраненная энергия от меньшего техпроцесса была реинвестирована в производительность. Если более высокие тактовые частоты Radeon VII – основная часть прироста производительности по сравнению с RX Vega 64, то воздуховод может не справиться с нагрузкой.
Возвращаясь к сборке Radeon VII, карта, естественно, имеет два 8-контактных разъема PCIe, но не имеет переключателя BIOS как RX Vega, для переключения BIOS на пониженное энергопотребление. А еще обычными светодиодами высвечивается надпись «Radeon» сбоку, и значок «R» в углу.
Что касается вывода на дисплей, здесь нет сюрпризов: 3x DisplayPort и 1x HDMI.
Небольшая разборка видеокарты выявила конфигурацию охлаждения с плоскими тепловыми трубками для TIM, вместо обычной пасты. Несмотря на низкую производительность с точки зрения теплопередачи, мы знаем, что карты RX Vega в конечном поставлялись в вариантах molded и unmolded, что требовало от производителей специальных инструкций. Возможно, это способ предотвратить потенциальные проблемы с разницей высоты ASIC.
Спасибо, что остаетесь с нами. Вам нравятся наши статьи? Хотите видеть больше интересных материалов? Поддержите нас оформив заказ или порекомендовав знакомым, 30% скидка для пользователей Хабра на уникальный аналог entry-level серверов, который был придуман нами для Вас: Вся правда о VPS (KVM) E5-2650 v4 (6 Cores) 10GB DDR4 240GB SSD 1Gbps от $20 или как правильно делить сервер? (доступны варианты с RAID1 и RAID10, до 24 ядер и до 40GB DDR4).
VPS (KVM) E5-2650 v4 (6 Cores) 10GB DDR4 240GB SSD 1Gbps до лета бесплатно при оплате на срок от полугода, заказать можно тут.
Dell R730xd в 2 раза дешевле? Только у нас 2 х Intel Dodeca-Core Xeon E5-2650v4 128GB DDR4 6x480GB SSD 1Gbps 100 ТВ от $249 в Нидерландах и США! Читайте о том Как построить инфраструктуру корп. класса c применением серверов Dell R730xd Е5-2650 v4 стоимостью 9000 евро за копейки?
В 2018 году AMD Radeon Technologies Group позволила себе небольшую передышку. После запуска архитектуры Polaris в 2016, и архитектуры Vega в 2017, AMD решила насладиться первым полным годом на архитектуре Vega. Вместо запуска третей архитектуры по прошествии 3 лет, компания сосредоточится на дальнейшем расширении семейства, выводя на рынок варианты ноутбуков и серверов Vega. Несмотря на то, что усилия AMD в области ноутбуков пошли мягко сказать по странному направлению, работа по созданию сервера Radeon Instinct привела к позитивному результату. В итоге компания анонсировала первый 7-нм GPU.
После обновления продукта последнего поколения в ноябре, в виде Radeon RX 590, мы ожидали, что некоторое время AMD уделит внимание потребителю. Вместо этого AMD сделала довольно неожиданный анонс на CES 2019: компания выпустит новую потребительскую карту хай-энд сегмента, Radeon VII (Seven). Основанная на вышеупомянутом серверном графическом процессоре, видеокарта позиционируется как новейший флагман. Созданная как для геймеров, так и для создателей контента, Radeon VII должна стать решительным шагом AMD в сторону любителей игр. Пришла и наша очередь рассмотреть новейшую карту AMD.
На первый взгляд в Radeon VII все кажется очевидным. Кремниевая основа карты — это AMD Vega 20 GPU, производная от оригинальной Vega 10, которая была усовершенствована для научных вычислений и машинного обучения, и построена на ультрасовременном 7-нм технологическом процессе TSMC для повышения производительности. Это важная веха для AMD в создании серверных графических процессоров – они выпустили первый высокопроизводительный GPU серверного класса со времен GPU Hawaii в 2013 году. AMD не терпелось продемонстрировать Vega 20 на позднем этапе своего развития, так как этот GPU является сердцем относительно новых серверных ускорителей Radeon Instinct MI50 и MI60 от AMD.
Vega 20, прежде всего предназначенная для серверов, не относится к классу графических процессоров, которые могли бы дешево и просто найти дорогу к потребителю. Но произошло нечто неожиданное: NVIDIA почти не изменила показатель производительности на доллар. Вместо этого, новые карты GeForce RTX на основе Turing сконцентрированы на опциях, которые призваны провозгласить новую парадигму рендеринга игр с эффектами трассировки лучей в реальном времени, и выделить для этой цели больше ресурсов GPU Turing. Конечным результатом стали относительно высокие цены на карты серии GeForce RTX 20, хотя их прирост производительности в играх намного меньше, чем обычно при смене поколений видеокарт.
Столкнувшись с менее враждебной ценовой средой, чем ожидалось вначале, AMD решила, наконец, представить Vega 20 потребителям, сражаясь с NVIDIA на одном из этих высоких ценовых уровней. Radeon VII выходит в массы с ценой $ 699, а GeForce GTX 2080 становится новой флагманской игровой картой Radeon.
Глядя на таблицу спецификаций, Radeon VII поставляется с пиковыми тактовыми частотами 1800 МГц, в то время как официальная пиковая частота составляет 1750 МГц. Это хороший прогресс в сравнении с RX Vega 64, где тактовая частота составляла всего 1630 МГц, значит, AMD есть еще около 10% прироста в частоте. А благодаря открытому кулеру и пересмотренному SMU, Radeon VII сможет еще быстрее повышать и лучше поддерживать высокие тактовые частоты. Так что, хотя последняя карта AMD не добавляет больше ROP или CU (на самом деле даже имеется небольшое снижение по сравнению с RX Vega 64), она поднимает на новый уровень пропускную способность.
Однако самое большое изменение по сравнению с RX Vega 64 состоит в том, что AMD удвоила объем памяти, и более чем удвоила пропускную способность памяти. Это возможно благодаря 7-нм техпроцессу, из-за которого новейший графический процессор AMD имеет относительно скромный размер матрицы 331 мм2. Дополнительное пространство позволило AMD интерпозер и еще два стека HBM2, что позволило увеличить количество VRAM и расширить шину памяти. AMD также смогла немного увеличить частоту памяти: с 1,89 Gbps/pin на RX Vega 64 до плоской 2 Gbps/pin на Radeon VII.
Интересно, что, исходя из базовых характеристик, Radeon VII по сути является Radeon Instinct MI50. Таким образом, у AMD есть риск «каннибализации» продаж Instinct, если высокая производительность Radeon VII заинтересует профессиональных пользователей компьютеров. В результате AMD сократила некоторые функции чипа, чтобы лучше дифференцировать продукты. Мы поговорим об этом чуть позже, но главное заключается в том, что карта работает с меньшей частотой, чем FP64, теряет полную поддержку чипов ECC и, что естественно для потребительского продукта, использует игровые драйверы Radeon Software вместо профессионального стека драйверов Instinct.
Конечно, всякий раз, когда вы говорите о подключении серверного графического процессора к потребительской видеокарте, вы говорите о мощной карте с большим потенциалом, и это, безусловно, относится к Radeon VII. В двух словах, преимущество новейшей флагманской карты AMD заключается в высокой производительности, и максимальными в своем классе 16 ГБ памяти HBM2. Как одно из немногих очевидных преимуществ спецификации AMD по сравнению с конкурентами NVIDIA, объем VRAM является важной частью маркетинга AMD; они будут уделять большое внимание созданию контента и играм, интенсивно использующим VRAM. Новинкой в этой карте является и кулер с тремя вентиляторами, пришедший на смену одно-вентиляторному кулеру на картах Radeon RX Vega 64/56.
Кроме того, еще одно небольшое изящное изменение: AMD самостоятельно выходит на розничный рынок в качестве поставщика плат и напрямую продает новую карту по установленной цене $ 699. Учитывая, что AIB также сегодня выпускают свои брендированные референс-карты, это возможность избежать завышенных цен на запуск.
Между тем, глядя на конкурентную ситуацию, возникает пару вопросов, которые нужно решать. Важная часть предложения — это (как это стало обычным в последнее время) комплект игр. В текущем пакете Raise the Game Fully Loaded pack бесплатно представлены Devil May Cry 5, The Division 2 и Resident Evil 2 с картами Radeon VII, RX Vega и RX 590. Между тем, карты RX 580 и RX 570 позволяют выбрать две игры из трех. Как положено, комплект игр будет просто добавленной стоимостью по сравнению с прямым конкурентом — в данном случае RTX 2080 — но у NVIDIA есть свой собственный дуэльный комплект Game On с Anthem и Battlefield V. В сценарии, где Radeon VII, как ожидается, будет сражаться за потребителей с RTX 2080, без шанса на окончательную победу, эти дополнительные преимущества становятся все важнее.
Radeon VII знаменует собой первый запуск продукта с момента недавнего изменения конкурентной среды из-за технологии мониторов с переменной частотой обновления. Мониторы с переменной частотой обновления экрана уже стали обязательным атрибутом для геймеров, и с момента запуска этой технологии в начале этого десятилетия между картами AMD и NVIDIA было явное разделение. Карты AMD поддерживают VESA Adaptive Sync, более известную под брендом AMD FreeSync, в то время как десктоп карты NVIDIA поддерживают только свою фирменную G-Sync. Но в прошлом месяце NVIDIA неожиданно объявила о том, что их карты будут поддерживать VESA Adaptive Sync под маркой 'G-Sync Compatibility'. Подробных сведений о том, как устроена эта программа, мало, но в конце концов, адаптивная синхронизация может использоваться в драйверах NVIDIA, даже если панель FreeSync не сертифицирована G-Sync Compatible.
Конечным результатом является то, что, хотя новость от NVIDIA и не мешает AMD в плане реализации возможностей, это подрывает преимущество AMD в FreeSync — все дешевые мониторы VESA Adaptive Sync, которые раньше использовались только на картах AMD, теперь можно использовать и на картах NVIDIA. AMD, конечно же, была очень рада подчеркнуть «бесплатный» FreeSync, но в качестве оружия против NVIDIA этот маркетинговый ход потерял свою силу. Официальная линия AMD — считать это победой FreeSync.
Выпуск Radeon VII и его конкурентное позиционирование по сравнению с GeForce RTX 2080 означает, что AMD необходимо четко определить свою позицию в отношении нынешнего разрыва в возможностях между их картами и новейшими NVIDIA Turing. Поэтому позиция AMD осталась неизменной в технологиях DirectX Raytracing (DXR) и технологиях качества и производительности изображений на основе AI, таких, как DLSS. Короче говоря, аргумент AMD в том, что, по их мнению, разница в качестве изображения и прирост производительности не стоят цены за эти функции. Тем временем AMD не стоит на месте, и вместе с резервными драйверами DXR они работают над поддержкой WinML и DirectML для своих карт. Риск AMD: если DXR или усилия NVIDIA по DLSS начнут быстро развиваться, пробел в функциях станет гораздо более крупной проблемой.
В общем, выпуск 7-нм игрового графического процессора для потребителей в настоящее время является очень агрессивным шагом. Особенно на раннем этапе жизненного цикла этого процесса. Но у AMD попросту нет времени, чтобы подождать и понаблюдать. Единственным серьезным препятствием в продвижении продукта будет ценообразование: стоимость должна быть приемлемой для потребителей.
Это подводит нас к сегодняшнему запуску. С ценой $ 699 NVIDIA уже опустила ценовую планку, говоря о выделенном оборудовании для ускорения трассировки лучей и машинного обучения. Для Radeon VII, условия вращаются вокруг 16 ГБ HBM2 и ценности для полупрофессионалов и создателей контента. Все, что остается, это их игровая производительность.
Под капотом Vega 20: GCN на 7 нм
Хотя мы уже знакомы с Vega 20 благодаря выпуску графических карт серверного класса Radeon Instinct MI50 и MI60, выход этого чипа на потребительский рынок означает первую 7-нм игровую карту. Быстрый переход к более низкому узлу — на этот раз от 14-нм LPP GlobalFoundries до 7-нм TSMC (CLN7FF) — и раньше был отличительной чертой AMD / ATi, и вот снова AMD спешит с выпуском, так рано доводя продукт до потребителей. В данном случае все атрибуты Vega 20 явно предназначены для профессионалов и серверов, хотя имеют преимущества и для игр.
В сложной истории Radeon VII судьба Веги была особенно загадочной. Начнем с того, что 7-нм графический процессор Vega 20, так рано пробившийся к потребителям, оказался сюрпризом. И хотя AMD упоминала Vega 20 только в отношении продуктов Radeon Instinct — ссылаясь на свою будущую архитектуру Navi при упоминании 7-нм графических процессорах для геймеров, — теперь AMD утверждает, выпуск Radeon VII на потребительский рынок был давно запланирован. Возможно, то же самое можно было бы сказать о Vega на 14 нм + / 12LP и графическом процессоре Vega 11 (не путать с 11 вычислительными блоками Ryzen 2400G Vega), хотя это вряд ли необычно, учитывая природу разработок в сфере полупроводников.
Честно говоря, AMD несколько прохладно относилась к Vega с момента запуска RX Vega, которая не вполне достигла поставленных целей. Пусть даже Radeon VII в каком-то смысле является «чипом Шредингера», он поднимает некоторые интересные вопросы о 7 нм. Например, AMD уже отодвигала сроки сэмплинга и запуска Vega 20 раньше. Выходит, сроки запуска Radeon VII — это самое раннее, что могло бы быть для наследника Radeon Instinct. Тем более, что при размере матрицы 331 мм2 это не маленькие мобильные SoC, которые мы видели до сих пор на TSMC 7 нм. Разработанный с учетом вычислений / ML-ориентированных улучшений, оснащенный 4 стеками HBM2 и созданный на зрелом и ультрасовременном 7-нм узле, GPU Vega 20 не выглядит как карта, готовая создать хорошее предложение по потребительским ценам. И все же благодаря счастливому стечению обстоятельств это произошло.
Vega 20 сочетает в себе обновленную архитектуру GCN 5 с 7-нм технологическим процессом, с транзисторами 13,2 В на 331 мм2 (по сравнению с 12,5 В на 496 мм2 для Vega 10). Как правило, при уменьшении размеров экономия пространства реинвестируется в большее количество транзисторов. Для игровой видеокарты это может означать что угодно, от большего количества CU и функциональных блоков, до перепроектирования макетов и усиленных каналов данных для повышения допуска по частоте. Последнее, конечно, должно обеспечить более высокую тактовую частоту, и такой выбор был важной частью дизайна Vega 10, где значительное количество транзисторов было использовано для достижения требуемых частотных характеристик. В сочетании с энергоэффективностью меньшего технологического узла новая микросхема может получить эти более высокие тактовые частоты без потребления дополнительной мощности.
Однако у Vega 20 большая часть сэкономленного пространства была оставлена «как есть»: на чипе больше свободного места. Для этого есть несколько причин, некоторые очевидные, а некоторые нет. Начнем с того, что для большого высокопроизводительного графического процессора на передовом 7-нм узле в начале жизненного цикла разработка и производство являются очень дорогостоящими. И, вероятно, с увеличением размера стоимость значительно возрастет, а прибыльность продукта снизится. И хотя 7-нм процесс TSMC до сих пор был публично замечен только в мобильных SoC, Vega 20, похоже, использует HPC-ориентированные библиотеки 7.5T, в отличие от использования библиотек 6T, предназначенных для мобильных SoC.
Но что еще более важно, сэкономленное пространство позволяет разместить еще два стека HBM2 на промежуточном устройстве аналогичного размера. Для плотностей и возможностей HBM2 текущего поколения предел для чипа с двумя стеками составляет 16 ГБ памяти при использовании пары стеков «8-Hi». Но для GPU серверного уровня — особенно для ориентированного на машинное обучение — необходима конфигурация из четырех стеков, чтобы обеспечить 32 ГБ памяти и более широкую 4096-битную шину. Для Vega 20 AMD выбрала именно такую конфигурацию, и, кроме того, выпускает версии чипа как 32 ГБ (8-Hi), так и 16 ГБ (4-Hi).
Radeon VII, в свою очередь, использует один из этих 16-ГБ чипов. Следует отметить, что это не первая 16-гигабайтная карта Vega от AMD — они уже выпускали карту с таким объемом памяти. Это была специализированная Vega Frontier Edition, но после выхода ее «на пенсию», это первый выпуск 16 ГБ видеокарты в линейке AMD Vega.
Оснащение потребительской карты 16 ГБ памяти — азартный ход со стороны AMD. И, я подозреваю, это одна из причин того, что AMD хочет отхватить и часть рынка профессиональной визуализации с помощью Radeon VII. Когда дело доходит до использования рабочей станции и задач по созданию контента, большой объем VRAM легко продать, поскольку уже есть задачи, которые могут использовать всю эту VRAM и даже больше. Но для игр это не самое разумное предложение, поскольку игры предъявляют более фиксированные требования к VRAM, а до сих пор таких больших карт не было, и разработчики еще не начали использовать ресурс видеопамяти 16 ГБ. Хотя с другой стороны, громкое утверждение «эта карта имеет более чем достаточное количество видеопамяти» может оказать серьезное влияние на продажи, и в 2019 году флагманская видеокарта для геймеров должна иметь это такой объем в любом случае.
Возвращаясь к дизайну Vega 20, другой шаг, который AMD предприняла, чтобы уменьшить сложность разработки и стоимость 7 нм, заключается в том, чтобы придерживаться уже известной архитектуры. AMD добавила небольшие оптимизации в сравнении с Vega 10, но они не рискнули сделать серьёзный редизайн. По сути, это логика шага «тик» известной «тик-так» стратегии Intel.
На самом деле Vega 20 настолько прямой наследник Vega 10, что, кроме числа контроллеров памяти, количество остальных функциональный блоков одинаково. Графический процессор объединяет 64 CU и 256 текстурных блоков, разделенных на 4 Shader Engine, а также 64 ROP и графический командный процессор AMD.
(Я должен добавить, что, следуя своему плану, AMD также аккуратно избегает вопроса о масштабировании шейдерного движка. Природа ограничения 4 Shader Engine в последние годы оставалась неясной, но с Vega были намеки на выход за эти пределы с улучшенной балансировкой нагрузки с помощью «intelligent workgroup distributors» (IWD). Независимо от этого, настроить и перепроектировать сбалансированную конфигурацию 4+ SE задача весьма сложная, и не имеет смысла, если AMD планирует внести фундаментальные изменения в GCN.)
Таким образом, на архитектурном уровне Vega 20 — это чисто эволюционный дизайн. Но с учетом вышесказанного, в нем немного больше «эволюции», чем просто уменьшение технологического узла. Комбинация этих улучшений означает, что на практике Vega 20 должна быть немного быстрее, чем Vega 10 при работе на равной тактовой частоте.
Наиболее заметное улучшение здесь — дополнительная пропускная способность памяти; вдвое больше на ROP, текстурный блок и ALU, чем было на Vega 10. Это особенно хорошо для ROP, которые традиционно нуждаются в большой пропускной способности. Не останавливаясь на достигнутом, AMD также внесла некоторые улучшения в Core Fabric, которая соединяет память с ROP (среди прочего). К сожалению, AMD не хочет разглашать, что это за улучшения, только подтвердили, что среди них нет никаких изменений в кэше.
Другая часть головоломки заключается в том, что AMD добавила новые инструкции и типы данных, которые в некоторых случаях ускорят машинное обучение. AMD не предоставила нам полную информацию, но в целом мы знаем, что они добавили поддержку типов данных INT8 и INT4, которые полезны для сценариев вывода с низкой точностью. AMD также добавила скалярное произведение FP16, которое сохраняется как результат FP32. Это довольно специфический сценарий, который полезен для некоторых алгоритмов машинного обучения, поскольку он дает более высокую точность результата, чем скалярное произведение FP16-in / FP16-out.
Говоря о типах данных, AMD также значительно увеличила производительность FP64 для Vega 20. В качестве базовой архитектуры, GCN позволяет создавать GPU со скоростью от 1/2 до 1/16 скорости FP32. Для чистых потребительских графических процессоров это всегда было 1/16. Однако для графических процессоров, которые несли многофункциональную нагрузку в качестве серверно-ориентированных чипов, были доступны скорости 1/4 и 1/2. Vega 20, в свою очередь, является первым ½ FP64 процессором от AMD со времен Hawaii в 2013 году. Это означает, что, хотя его общий прирост производительности FP32 по сравнению с картами Vega 10 не так заметен, его FP64-производительность намного лучше: более, чем 8x по сравнению с RX Vega 64 (теоретически). Конечно, как потребительская карта, Radeon VII не может всерьез воспользоваться этими преимуществами — она ограничена скоростью 1/4 — но об этом позже.
Но что касается блоков видео и контроллеров дисплея, AMD внесла только незначительные обновления. Официально контроллер дисплея (DCE) обновлен до версии 12.1, в то время как версия унифицированного видеодекодера (UVD) 7.2, а версия video coding engine (VCE) 4.1. Никакой дополнительной поддержки кодирования или декодирования по сравнению с Vega 10 не было добавлено. Мы так же обнаружили блоки Display Core Next от Raven Ridge и Video Core Next 1.0, так что это может быть последней архитектурой, которую эти ASIC почтили своим присутствием.
Обертывание функциональных блоков — новый стиль SMU, обсуждаемый в последних патчах ядра Linux. Другой особенностью является улучшенный термомониторинг, теперь число температурных диодов было удвоено до 64 датчиков. Как следствие, AMD теперь полностью перешла на мониторинг температуры узлов вместо мониторинга на границе. Измерения температуры узлов использовались и в Vega 10 (отображалось как температура ‘hotspot’), но Vega 20 полностью перешла на измерение температуры узла для всех скоростей кулера, турбочастот и тому подобного. Результатом является более точная отчетность, а также незначительный прирост производительности на 1-2%, на который AMD указывает в результатах внутреннего тестирования.
Обновленный SMU, как следствие вышесказанного, обладает таким эффектом: температура, тактовая частота и связанные с ними метрики GPU больше не считываются через регистры, а вместо этого извлекаются непосредственно из SMU. Естественно, это нарушает совместимость со сторонними утилитами (например, GPU-Z), и, хотя AMD уже уведомила некоторых разработчиков об изменениях, приложения необходимо будет обновлять для использования новых вызовов API от AMD.
Наконец, поскольку это первый высокопроизводительный чип Vega от AMD со времен оригинальной Vega 10 в 2017 году, возникает несколько вопросов, связанных с определенными перспективными хардварными функциями Vega. Информация от AMD не всегда была понятна, в результате чего эти функции стали постоянным источником конфуза потребителей.
С Vega 20, AMD, похоже, не собирается менять ситуацию. То есть дальнейших разработок AMD в отношении шейдеров примитивов не произошло. Шейдеры примитивов по-прежнему должны быть явно описаны разработчиками, а значит, не используется весь потенциал Next Generation Geometry (NGG) Vega 20 (хотя следует отметить, что опция Intelligent Workgroup Distributor всегда была включена).
Между тем, AMD Vegas 10 уже использовала Draw Stream Binning Rasterizer (DSBR), и здесь никаких изменений не произошло; функция включена для неопределенного списка игр. Согласно быстрой проверке на Rapid Packed Math (быстрый FP16), она используется для двух известных игр: Far Cry 5 и Wolfenstein II.
Производительность FP64 и разница между Radeon VII и Radeon Instinct MI50
Одним из интересных и забавных последствий запуска Radeon VII является то, что впервые за долгое время AMD пришлось серьезно задуматься о том, как они собираются дифференцировать свои потребительские продукты от продуктов для рабочих станций и серверов. Сейчас AMD предлагает профессиональное оборудование в сериях Radeon Pro и Radeon Instinct, при этом GPU Vega 20 является первым по-настоящему серверным графическим процессором AMD. Таким образом, хотя профессиональные и потребительские продукты значительной степени дифференцированы по программным функциям, Radeon VII предоставляет некоторые новые опции, которые не являются действительно необходимыми для потребителей.
Это может показаться тривиальным вопросом – казалось бы, AMD лучше попросту оставить все функции включенными. Но поскольку компания пытается продвинуться в серверный бизнес с более высокой маржой, продукты для потребителей, такие как Radeon VII, на самом деле являются сложным предложением. AMD необходимо заблокировать достаточно серверной функциональности графического процессора Vega 20, чтобы не продавать потребительский эквивалент Radeon Instinct MI50 за малую часть цены. С другой стороны, в их интересах показать некоторые из этих функций, чтобы сделать Radeon VII действительно ценной картой (которая может оправдать цену в 699 долларов), а также дать разработчикам понять, какого уровня серверное оборудование может сделать AMD.
В данном случае речь идет о производительности FP64. Как мы отмечали в нашем обзоре графического процессора Vega 20, производительность FP64 в Vega 20 очень высокая: это половина скорости FP32, или 6,9 TFLOPS. Это одна из премиальных функций Vega 20, и с тех пор, как Radeon VII был впервые анонсирован на CES, компания изо всех сил пыталась решить, какую часть этой производительности на самом деле сделать доступной для Radeon VII. Во время его объявления нам сказали, что Radeon VII будет иметь неограниченную (1/2) производительность FP64, но позже было сказано, что она будет 1/8. Теперь, с фактическим выпуском карты, AMD наконец решилась: они взяли среднее и сообщили о скорости 1/4.
В стремлении прояснить ситуацию AMD сделала заявление:
Видеокарта Radeon VII была создана для геймеров и создателей, энтузиастов и первопроходцев. Учитывая более широкий рынок, на который ориентируется Radeon VII, мы рассматривали различные уровни производительности FP64. Ранее мы сообщали, что Radeon VII обеспечивает 0,88 TFLOPS (DP = 1/16 SP). Однако, исходя из интереса и отзывов клиентов, мы хотим сообщить, что решили увеличить производительность вычислений с двойной точностью до 3,52 3,46 TFLOPS (DP = 1 / 4SP).
Если вы обратили внимание на производительность FP64 в своем тестировании, вы, возможно, видели этот прирост производительности, поскольку драйверы VBIOS и драйвера, которыми мы поделились с рецензентами, были предварительными тестовыми драйверами, в которых эти значения уже были установлены. Кроме того, мы обновили другие значения, чтобы отразить достижимую пиковую частоту при расчете производительности Radeon VII, как отмечено в [диаграммах].
Конечный результат заключается в том, что, хотя Radeon VII не будет столь же быстрым, как MI60 / MI50, когда дело доходит до вычислений на FP64, AMD предоставить карту, отстающую от лидеров всего на шаг.
При 3,5 TLFLOPS теоретической производительности FP64, Radeon VII находится в правильной ценовой категории. Попросту не существует других плат текущего поколения с ценой ниже 2000 долларов которые пытаются решить эту задачу. На всех картах NVIDIA GeForce и на всех других картах AMD Radeon отсутствует необходимое оборудование для быстрой FP64. Следующим ближайшим конкурентом Radeon VII в этом отношении является NVIDIA Titan V, которая более чем в 4 раза дороже.
Как мы видим, это немного нишевый рынок, особенно когда так много внимания отрасли уделяется производительности ИИ и нейронных сетей. Но, тем не менее, обладателями карты станут некоторые очень счастливые Data Scientist, особенно академические.
Говоря об искусственном интеллекте, следует отметить, что производительность машинного обучения является еще одной областью, где AMD урезала карту. К сожалению, более подробная информация не доступна в настоящее время. Но учитывая уникальные потребности рынка ML, я не удивлюсь, обнаружив, что производительность INT8 / INT4 немного снижена на Radeon VII. Или снижена производительность некоторых скалярных произведений FP16.
Также под нож пошла full-chip поддержка ECC. Благодаря врожденной функциональности HBM2 все карты Vega уже имеют ECC для своих DRAM. Однако Vega 20 была на шаг впереди с защитой ECC для своих внутренних кэшей, и к этой функции Radeon VII не имеет доступа.
Наконец, Radeon VII также немного сокращает возможности ввода-вывода вне чипа Vega 20. Хотя до сих пор AMD не поднимала много шума об этом, Vega 20 на самом деле является их первым GPU с поддержкой PCI-Express 4.0, и эта функция включена на картах Radeon Instinct. Однако для Radeon VII это не включено, и карта ограничена скоростями PCIe 3.0 (поэтому будущие покупатели Zen 2 не будут иметь карту PCIe 4.0 для полноценной работы со своим новым процессором). Точно так же внешние линки Infinity Fabric для поддержки нескольких графических процессоров были отключены, и Radeon VII будет выступать только соло.
В целом, нет ничего удивительного в выборе AMD, особенно с учетом целевого рынка Radeon VII и целевой цены. Но это заметные «урезания» будут иметь серьезное значение для определенных пользователей. И если они не подтолкнут этих пользователей к Radeon Instinct, то наверняка приведут к неизбежному Radeon Pro на Vega 20.
Познакомьтесь с Radeon VII
Перво-наперво дизайн и сборка. И для AMD Radeon VII мы уже заметили самое большое изменение: открытый воздушный кулер. Сохраняя матовую металлическую внешность предыдущих версий RX Vega 64 Limited Edition и Liquid, они отказались от воздуховода в пользу трех вентиляторов, стандартной пользовательской конфигурации AIB для высокопроизводительных карт.
В то время как серии NVIDIA GeForce RTX шли путем использования кулеров с двумя открытыми вентиляторами, AMD привыкла менять ситуацию по своему усмотрению. Помимо RX Vega 64 Liquid, AIO CLC R9 Fury X также имела впечатляющий дизайн. Но, как мы упоминали в отношении карт Founders Edition, отказ от воздуховода в пользу открытых кулеров означает принятие конфигурации отвода тепла, которая больше не может гарантировать полное самоохлаждение. То есть эффективность охлаждения теперь зависима от потока воздуха в шасси. Обычно это является проблемой для крупных OEM-производителей, которые конфигурируют машины с использованием карт типа «воздуховод», но это не касается карт самого высокого уровня, которые для пре-билд систем обычно поступают от системных интеграторов.
Переход на открытые кулеры выгоден более высоким TDP, а при 300 Вт TBP Radeon VII действительно один из лидеров энергопотребления. Казалось, всего на 5 Вт больше в сравнении с RX Vega 64. Но, возможно, излишек тепла выделяется двумя дополнительными стеками HBM2, плюс проблема в том, что потребляется то же количество энергии на меньшей площади кристалла. А мощность 300 Вт TBP означает, что вся сохраненная энергия от меньшего техпроцесса была реинвестирована в производительность. Если более высокие тактовые частоты Radeon VII – основная часть прироста производительности по сравнению с RX Vega 64, то воздуховод может не справиться с нагрузкой.
Возвращаясь к сборке Radeon VII, карта, естественно, имеет два 8-контактных разъема PCIe, но не имеет переключателя BIOS как RX Vega, для переключения BIOS на пониженное энергопотребление. А еще обычными светодиодами высвечивается надпись «Radeon» сбоку, и значок «R» в углу.
Что касается вывода на дисплей, здесь нет сюрпризов: 3x DisplayPort и 1x HDMI.
Небольшая разборка видеокарты выявила конфигурацию охлаждения с плоскими тепловыми трубками для TIM, вместо обычной пасты. Несмотря на низкую производительность с точки зрения теплопередачи, мы знаем, что карты RX Vega в конечном поставлялись в вариантах molded и unmolded, что требовало от производителей специальных инструкций. Возможно, это способ предотвратить потенциальные проблемы с разницей высоты ASIC.
Спасибо, что остаетесь с нами. Вам нравятся наши статьи? Хотите видеть больше интересных материалов? Поддержите нас оформив заказ или порекомендовав знакомым, 30% скидка для пользователей Хабра на уникальный аналог entry-level серверов, который был придуман нами для Вас: Вся правда о VPS (KVM) E5-2650 v4 (6 Cores) 10GB DDR4 240GB SSD 1Gbps от $20 или как правильно делить сервер? (доступны варианты с RAID1 и RAID10, до 24 ядер и до 40GB DDR4).
VPS (KVM) E5-2650 v4 (6 Cores) 10GB DDR4 240GB SSD 1Gbps до лета бесплатно при оплате на срок от полугода, заказать можно тут.
Dell R730xd в 2 раза дешевле? Только у нас 2 х Intel Dodeca-Core Xeon E5-2650v4 128GB DDR4 6x480GB SSD 1Gbps 100 ТВ от $249 в Нидерландах и США! Читайте о том Как построить инфраструктуру корп. класса c применением серверов Dell R730xd Е5-2650 v4 стоимостью 9000 евро за копейки?