Комментарии 41
Теперь бы еще про Intel найти похожие исследования.
P.S. Впервые задумался о приобретении АМД системы.
Мы в свое время только на АМД и сидели, после P-3 я сменил 3 амд-платформы прежде чем на интел вернулся. Это был core 2 duo который к тому времени подешевел и стал массовым, народным.
Может имеете в виду "Dual Rank"? Одноканальный режим тут вообще нигде не рассматривается.
Двухканальный контроллер памяти DDR4, встроенный непосредственно в центральный процессор, поддерживает ОЗУ стандартов DDR4-2133, DDR4-2400 и DDR4-2666. Но есть один нюанс: работа на частоте 2666 МГц и выше возможна только для одноранговых модулей при условии их установки по одной планке в каждом канале.
Я об этом
при условии их установки по одной планке в каждом канале.— и где тут об одноканальном режиме?
а почему так — дык банальная емкость входных цепей чипов памяти.
У двухранговых модулей при том же объеме в 2 раза больше микросхем памяти, чем у одноранговых.
но комментатор выше почему-то спрашивал об одноканальном режиме. про который никто и полслова не говорил.
Интегрированный контроллер памяти процессоров AMD поддерживает адресацию с использованием 11-разрядных столбцов и размером страницы 16 Кбит. Стандартные контроллеры памяти, встречающиеся в составе других платформ, используют 10-разрядные столбцы и размер страницы 8 Кбит.
Причём с какого-то момента (по-моему, начиная с сокета FM2) такая память уже не работает даже на AMD.
Сам TLB работает быстро, он транслирует виртуальные адреса в физические. Точнее L1 TLB работает очень быстро (1 такт?), но он очень небольшой (64 записи, одна запись описывает трансляцию одной страницы — чаще всего — 4КБ), его промахи попадают в L2 TLB, который уже медленнее (8 тактов), зато 1.5 тыс записей (физически такое количество записей сложно/невозможно адресовать за 1 такт высокой частоты).
Медленно обрабатываются промахи в (L2) TLB, когда TLU-блок процессора начинает хождение по таблице (дереву) страниц. В замерах http://www.7-cpu.com/cpu/Zen.html на разных размерах страниц заметно:
2 MB pages (32-bit)
2MB Data TLB L1: 64 items. full assoc. Miss Penalty = 8 cycles. Parallel miss:? cycles per access
2MB Data TLB L2: 1536 items. 2-way?. Miss Penalty =? cycles. Parallel miss:? cycles per access
4 KB pages mode (64-bit)
Data TLB L1: 64 items. full assoc. Miss penalty = 8 cycles. Parallel miss: 1 cycle per access
Data TLB L2: 1536 items. 8-way?. Miss penalty = 34? cycles. Parallel miss: 18? cycles per access (read from L3)
PDE cache =? items. Miss penalty =? cycles.
Size Latency Increase Description 32 K 4 64 K 11 7 + 13 (L2) 128 K 14 3 256 K 16 2 512 K 20 4 + 8 (L1 TLB miss) 1 M 35 15 + 23 (L3) 2 M 42 7 4 M 45 3 8 M 63 + 5 ns 18 + 5 ns + 34 ? (L2 TLB miss) 16 M 72 + 48 ns 9 + 43 ns + 90 ns (RAM) 32 M 82 + 70 ns 10 + 22 ns 64 M 87 + 81 ns 5 + 11 ns 128 M 97 + 86 ns 10 + 5 ns 256 M 109 + 88 ns 10 + 2 ns 512 M 113 + 89 ns 4 + 1 ns 1024 M 125 + 90 ns 12 + 1 ns
TLB работает на частоте процессорного ядра, оба D TLB находятся "рядом" (перед/параллельно) с L1 кэшем данных (попадание в L1 Tlb и L1d занимает в сумме 4 такта) — https://images.anandtech.com/doci/10591/HC28.AMD.11.png (I TLB — перед L1 кэшем инструкций — https://images.anandtech.com/doci/11170/AMD%20Ryzen%20Tech%20Day%20-%20Architecture%20Keynote-07%20-%20Copy%20%282%29.jpg; иллюстрации AMD из Anand 11170)
Ну а если серьезно, то похоже до широкой общественности инженеров начинает доходить тот простой факт, что узким горлышком в развитии производительности пк, давно стала оперативная память и вместо того чтобы изобретать ацкие костыли: ddr, тайминги и тд. Переходили на новые принципы оперативной памяти: mram, sram или что то другое.
Пора завязывать с кондесаторами!!!
1 якейка SRAM — 4 транзистора, могут работать на скорости проца, но кушают энергию как чугунный мост и очень большой процент брака, что делает их дорогими. Но если силы направить в эту сторону, то можно отладить и удешевить тех процесс, это я вам как инженер технолог говорю (на которого учился, но не работаю). Пример SSD сначала они были безумно дороги, а сейчас уже флешь память практически везде.
Подумывал апгрейднуть свой Core 2 Quad на Ryzen, но с каждой статьёй про Ryzen тут я всё больше склоняюсь к мысли подождать ещё с полгода и взять потом Intel.
TLB хранит отображение виртуальных страниц в физические. Когда берётся страница для которой не был сделан перерасчет (или к ней давно не обращались и она выброшена из буфера) происходит TLB-промах (TLB-miss), во время которого рассчитывается новое отображение для страницы. Допустим в райзене TLB медленный, то что может сделать быстрая память? Ускорить рассчет нового отображения? О_о
*Во всех режимах использовалась память с таймингами 16-18-18-36.
А нет ли результатов с другими таймингами, как для Ryzen 7? То, что разница в min FPS для DDR4-2400 12-12-12-32 и DDR4-3333 в большинстве протестированых игр укладывается примерно в 5% (кроме Ведмака и Battlefield, где разница больше, но при этом в разную сторону) — для Ryzen 5 тоже верно?
лично у меня от кингстона не особо приятные впечатления. уже обжигался на ам2+/ам3 — память типа работает, но в мемтесте раз в сутки проскакивает ошибка (единичная, но по одному и тому же адресу), итог — компиляция больших проектов валится, в myisam таблицы пишется мусор и т.п.
причем — некоторые планки глючат если их 2 на канал, некоторые — даже если одна на канал стоит, некоторые — работают стабильно.
сменил на кингстон с ЕСС — ни одного MCE с correctable/uncorrectable error за годы. т.е. могут же нормальные чипы ставить туда, где ошибки заметны… но — не хотят…
впрочем, у других производителей тоже не все гладко было на ам2+/ам3.
Я сам долго мозги пудрил из за частоты оперативы для рузена 1600, пока не наткнулся на интересную статью. http://forum.asrock.com/forum_posts.asp?TID=4963&title=ryzen-ram-frequency-and-gaming
Поэтому я решил не переплачивать и поставил пару планок крушал балистикс спорт и разогнал их до 2800.
Тогда результат будет впечатляющим.
(в статье приведен пример «кукурузного» ускорения)
(в статье вообще нет полезной информации об ускорении платформы AMD)
Во-вторых, частота работы встроенного северного моста Data Fabric жестко привязана к частоте работы оперативной памяти. Для лучшей синхронизации в Ryzen он всегда работает на частоте вдвое ниже эффективной частоты памяти. Получается, если в компьютере используется комплект оперативной памяти DDR4-2133, то Data Fabric работает на частоте 1066 МГц.
память DDR — Double Data Rate — т.е. у неё частота, как и у Data Fabric — те же 1066МГц (и они работают в синхрнном режиме), а 2133 получает по повышению и понижению несущей частоты.
«Спасибо за помощь, камрад!» Ускоряем игровой ПК на базе процессора AMD Ryzen