Как стать автором
Обновить

«Спасибо за помощь, камрад!» Ускоряем игровой ПК на базе процессора AMD Ryzen

Время на прочтение5 мин
Количество просмотров117K
Всего голосов 23: ↑13 и ↓10+3
Комментарии41

Комментарии 41

Хорошо, уже что-то читал похожее на
стороннем ресурсе
икзибит
.
Теперь бы еще про Intel найти похожие исследования.
P.S. Впервые задумался о приобретении АМД системы.
Эх, молодежжж :)
Мы в свое время только на АМД и сидели, после P-3 я сменил 3 амд-платформы прежде чем на интел вернулся. Это был core 2 duo который к тому времени подешевел и стал массовым, народным.
У Intel-а нет такой сильной привязки к скорости памяти. Имею i5-6600+DDR4 2666. Через XMP профиль работает нормально на 3200. Для себя специально тестировал. В синтетике разница примерно 10%. В играх разницы не вижу совсем, даже по FPS.
Интересно что мешает двухканальной работе с DDR4-4000? И появится ли эта возможность в будущем?

Может имеете в виду "Dual Rank"? Одноканальный режим тут вообще нигде не рассматривается.

Двухканальный контроллер памяти DDR4, встроенный непосредственно в центральный процессор, поддерживает ОЗУ стандартов DDR4-2133, DDR4-2400 и DDR4-2666. Но есть один нюанс: работа на частоте 2666 МГц и выше возможна только для одноранговых модулей при условии их установки по одной планке в каждом канале.

Я об этом
при условии их установки по одной планке в каждом канале.
— и где тут об одноканальном режиме?

а почему так — дык банальная емкость входных цепей чипов памяти.
Читаем еще раз, для одноранговых модулей.
У двухранговых модулей при том же объеме в 2 раза больше микросхем памяти, чем у одноранговых.
это какбы понятно. и не факт что микросхем больше (1Rx8 и 2Rx16 будут иметь такое же кол-во микросхем), тут на одной линии данных больше микросхем висит.

но комментатор выше почему-то спрашивал об одноканальном режиме. про который никто и полслова не говорил.
Про одноканальный режим не говорилось, главное чтобы в каждом канале(из 2х) было по одной одноранговой планке, иначе контроллеру памяти становится плохо от нагрузки.
Не знаю в тему ли, но я всегда заказывал память «для АМД», просто потому что дешевле.
Не совсем в тему. Тут речь о том, какие лучше подбирать частоты (а кроме того, стоит обращать внимание на производителя чипов) у памяти DDR4, которая предназначена для работы как на AMD, так и на платформе Intel. Вы же имеете в виду самопальную китайскую память, сделанную из чипов, сдутых с б/у планок, которая на Intel не заводится из-за того, что заточена под контроллер памяти AMD.

Интегрированный контроллер памяти процессоров AMD поддерживает адресацию с использованием 11-разрядных столбцов и размером страницы 16 Кбит. Стандартные контроллеры памяти, встречающиеся в составе других платформ, используют 10-разрядные столбцы и размер страницы 8 Кбит.


Причём с какого-то момента (по-моему, начиная с сокета FM2) такая память уже не работает даже на AMD.
Погоняйте вычислительную гидродинамику с разной памятью — всё-таки Ryzen больше всего годится именно для научных расчётов.
«у чипов Ryzen очень медленно работает TLB-буфер». Погуглил что такое TLB-буфер: TLB — это специализированный кэш центрального процессора, используемый для ускорения трансляции адреса виртуальной памяти в адрес физической памяти. Получается, это кэш-память. Но как кэш-память может работать медленно, если она функционирует на частоте процессора? Поясните, пожалуйста. Или может я что-то не так понял. Буду благодарен.
Это другой кеш. Он не для данных, а для адресов. И отдельные части процессора могут работать на разных частотах, как быстрее, так и медленнее самого ядра (ядер). Тактироваться они так же могут по разному.

Сам TLB работает быстро, он транслирует виртуальные адреса в физические. Точнее L1 TLB работает очень быстро (1 такт?), но он очень небольшой (64 записи, одна запись описывает трансляцию одной страницы — чаще всего — 4КБ), его промахи попадают в L2 TLB, который уже медленнее (8 тактов), зато 1.5 тыс записей (физически такое количество записей сложно/невозможно адресовать за 1 такт высокой частоты).
Медленно обрабатываются промахи в (L2) TLB, когда TLU-блок процессора начинает хождение по таблице (дереву) страниц. В замерах http://www.7-cpu.com/cpu/Zen.html на разных размерах страниц заметно:
2 MB pages (32-bit)
2MB Data TLB L1: 64 items. full assoc. Miss Penalty = 8 cycles. Parallel miss:? cycles per access
2MB Data TLB L2: 1536 items. 2-way?. Miss Penalty =? cycles. Parallel miss:? cycles per access
4 KB pages mode (64-bit)


Data TLB L1: 64 items. full assoc. Miss penalty = 8 cycles. Parallel miss: 1 cycle per access
Data TLB L2: 1536 items. 8-way?. Miss penalty = 34? cycles. Parallel miss: 18? cycles per access (read from L3)
PDE cache =? items. Miss penalty =? cycles.


  Size        Latency       Increase   Description

  32 K     4                           
  64 K    11                       7   + 13 (L2)        
 128 K    14                       3   
 256 K    16                       2
 512 K    20                       4   + 8 (L1 TLB miss)
   1 M    35                      15   + 23 (L3)
   2 M    42                       7
   4 M    45                       3    
   8 M    63 +  5 ns      18 +  5 ns   + 34 ? (L2 TLB miss)
  16 M    72 + 48 ns       9 + 43 ns   + 90 ns (RAM)
  32 M    82 + 70 ns      10 + 22 ns
  64 M    87 + 81 ns       5 + 11 ns
 128 M    97 + 86 ns      10 +  5 ns   
 256 M   109 + 88 ns      10 +  2 ns
 512 M   113 + 89 ns       4 +  1 ns
1024 M   125 + 90 ns      12 +  1 ns

TLB работает на частоте процессорного ядра, оба D TLB находятся "рядом" (перед/параллельно) с L1 кэшем данных (попадание в L1 Tlb и L1d занимает в сумме 4 такта) — https://images.anandtech.com/doci/10591/HC28.AMD.11.png (I TLB — перед L1 кэшем инструкций — https://images.anandtech.com/doci/11170/AMD%20Ryzen%20Tech%20Day%20-%20Architecture%20Keynote-07%20-%20Copy%20%282%29.jpg; иллюстрации AMD из Anand 11170)

а почему нет тестов с модулями других производителей??
НЛО прилетело и опубликовало эту надпись здесь
Понимаю Ваш намек, но я хотел помягче спросить и имел ввиду — почему эта компания не производила тестов с другими модулями памяти других производителей? Есть модули, в разы лучше и компания не хочет рекламировать себя в друном свете? Желательно чтобы кто-то из компании ответил.
А давайте уже будем честны?
Как можно говорить о чесности, когда у вас снизу полосочки не с одного места начинаются. ;)
Ну а если серьезно, то похоже до широкой общественности инженеров начинает доходить тот простой факт, что узким горлышком в развитии производительности пк, давно стала оперативная память и вместо того чтобы изобретать ацкие костыли: ddr, тайминги и тд. Переходили на новые принципы оперативной памяти: mram, sram или что то другое.
Пора завязывать с кондесаторами!!!

да не вопрос, только готовы ли вы покупать SRAM по цене на порядок больше DRAM? т.к. 1 ячейка DRAM — 1 транзистор, 1 ячейка SRAM — 12 что ли.
1 ячейка DRAM — конденцатор, который просто держит заряд, да он дешев. НО его долго заряжать (ну в тех скоростях), его надо перезаряжать 50 раз в секунду, когда его читаешь его снова надо перезарядить, он может сам рязрядиться и многое многое, костылей там ппц.
1 якейка SRAM — 4 транзистора, могут работать на скорости проца, но кушают энергию как чугунный мост и очень большой процент брака, что делает их дорогими. Но если силы направить в эту сторону, то можно отладить и удешевить тех процесс, это я вам как инженер технолог говорю (на которого учился, но не работаю). Пример SSD сначала они были безумно дороги, а сейчас уже флешь память практически везде.
Во-во, даже где-то на хабре была статья про аццкую силу такой вот инфографики

Подумывал апгрейднуть свой Core 2 Quad на Ryzen, но с каждой статьёй про Ryzen тут я всё больше склоняюсь к мысли подождать ещё с полгода и взять потом Intel.

у меня тоже такие мысли (правда сижу на ddr3 i5-3470)
Но вот цена (2*8gbb ddr4 от 170евро убивает напрочь мысли о апгрейде)
16гиг это минимум на сегодня
А с чего это память в два раза выросла за год?
Как быстрая память поможет медленному TLB я так и не понял.
TLB хранит отображение виртуальных страниц в физические. Когда берётся страница для которой не был сделан перерасчет (или к ней давно не обращались и она выброшена из буфера) происходит TLB-промах (TLB-miss), во время которого рассчитывается новое отображение для страницы. Допустим в райзене TLB медленный, то что может сделать быстрая память? Ускорить рассчет нового отображения? О_о
вот сейчас бы в 2017 серьезно рассматривать амд вместо процессора
С выходом Ryzen — вполне себе достойный вариант
*Во всех режимах использовалась память с таймингами 16-18-18-36.

А нет ли результатов с другими таймингами, как для Ryzen 7? То, что разница в min FPS для DDR4-2400 12-12-12-32 и DDR4-3333 в большинстве протестированых игр укладывается примерно в 5% (кроме Ведмака и Battlefield, где разница больше, но при этом в разную сторону) — для Ryzen 5 тоже верно?
У меня была проблема с Rayzen 5 и Hyper X — система работала, но постоянно через минут 5 сваливалась в BSOD. Тайминги прописаны, биос тоже последний прошит был. В даташите совместимости модель памяти была прописана почти до последнего знака, не совпадало только количество планок в ките, у меня был кит 2 по 8Гб, а в ДШ прописан 4 по 8Гб и цвет — у меня черный, в ДШ — красный. Спасло только одно — опускание напряжения питания до 1.23В, хотя память может работать почти до 3х вольт нормально.
На трех вольтах от нее должны были остаться угольки, это же не sdram
Вы правы, мой косяк, 1,3 Вольта. Память HX430C15PB3K2/16. Но суть та же, пока не снизил напряжение сваливалась в синий экран, хотя, по логике, если она есть в списке поддерживаемых материнкой, то сама должна была выбрать не то чтобы наилучше по производительности, но хотя бы оптимальное по работоспособности напряжение.
а это вопросы к производителю памяти.
лично у меня от кингстона не особо приятные впечатления. уже обжигался на ам2+/ам3 — память типа работает, но в мемтесте раз в сутки проскакивает ошибка (единичная, но по одному и тому же адресу), итог — компиляция больших проектов валится, в myisam таблицы пишется мусор и т.п.
причем — некоторые планки глючат если их 2 на канал, некоторые — даже если одна на канал стоит, некоторые — работают стабильно.
сменил на кингстон с ЕСС — ни одного MCE с correctable/uncorrectable error за годы. т.е. могут же нормальные чипы ставить туда, где ошибки заметны… но — не хотят…

впрочем, у других производителей тоже не все гладко было на ам2+/ам3.
А почему кингстон не делает память на трушных самсунговских чипах B-die, которые лучше всего подходят для райзенов? На оверклокерах немало людей кто и дуалранки стабильно на 3333 гоняет. Сам перешел на райзен летом, в целом доволен и даже память на чипах xynix m-die на 3200 в итоге завел, правда не без плясок с бубном, но т.т.т работает без нареканий
На КДПВ, я так понимаю, Кингстон должен ассоциироваться именно с Гагариным?

Я сам долго мозги пудрил из за частоты оперативы для рузена 1600, пока не наткнулся на интересную статью. http://forum.asrock.com/forum_posts.asp?TID=4963&title=ryzen-ram-frequency-and-gaming
Поэтому я решил не переплачивать и поставил пару планок крушал балистикс спорт и разогнал их до 2800.

На AMD, надо с помощью bclk подбираться к заветным гигагерцам.
Тогда результат будет впечатляющим.
(в статье приведен пример «кукурузного» ускорения)
(в статье вообще нет полезной информации об ускорении платформы AMD)
Во-вторых, частота работы встроенного северного моста Data Fabric жестко привязана к частоте работы оперативной памяти. Для лучшей синхронизации в Ryzen он всегда работает на частоте вдвое ниже эффективной частоты памяти. Получается, если в компьютере используется комплект оперативной памяти DDR4-2133, то Data Fabric работает на частоте 1066 МГц.

память DDR — Double Data Rate — т.е. у неё частота, как и у Data Fabric — те же 1066МГц (и они работают в синхрнном режиме), а 2133 получает по повышению и понижению несущей частоты.
а 2133 получает по повышению и понижению несущей частоты

называется «работа по фронту и срезу синхроимпульса»
Зарегистрируйтесь на Хабре, чтобы оставить комментарий