Комментарии 48
DEL
То чувство, когда ты сидишь на DDR3LR и тебе норм... Выбор очень зависит от задачи - под рендер, нейросетки или что-то такое DDR5 мастхев, под игры опять же, но есть еще куча задач, где до сих пор DDR3 сойдет, не говоря уже о DDR4.
Самое важное нововведение заключается в разделении каждого модуля на два независимых 32-битных канала вместо одного 64-битного в DDR4.
А это что-то даёт по сравнению с двухканальным включением DDR4? DDR5 весь не станет 4-канальной?...
Если DDR4 в массе своей работает на 3200 МТ/с, то DDR5 может предложить значения до 8400 МТ/с, и даже это не предел
Это скорость интерфейса. Делим ее на RAS/CAS задержки, и получаем скорости, собственно, ячеек памяти. Которые, как выясняются, особо-то с поколениями не меняются.
Встроенная коррекция ошибок (On-die ECC)
Плата за то, что ради нескольких процентов производительности память заставляют работать в режимах, несколько более близких к предельным?
DDR5 весь не станет 4-канальной?...
Нуу, в общем то технически станет. На скрине ниже 2 планки в мини пк на амд 7640hs

Технически может и станет. А процессор умеет делить обращения к памяти на 4 независимых сюжетных линии?
P.S. Прикольное название мат. платы.

Не сказал бы, что у DDR5 прям впечатляющий отрыв. Интересно, откуда у неё такой перекос по скорости записи?
Это не у нее, это у процессоров AMD контроллер памяти такой... Интересный.
У меня на скрине мобильный амд с самыми дешевыми базовыми планками и биосом в котором с памятью ничего сделать нельзя.
Вот пример DDR5 на нормальной частоте на уже старой платформе intel. Комплект стоил 9,5к рублей/32гб. После обновлений биоса и ручного разгона, на такой частоте можно спокойно жить, ошибок нет.

На Интелах нормальные плашки ДДР5 дают 120-130 гбс по чтению и записи. Ваши 45-50 уже давно устарели.
скорости, собственно, ячеек памяти. Которые, как выясняются, особо-то с поколениями не меняются.
Это задержки не меняются и даже немного ухудшаются с каждым поколением. А скорости очень даже растут, практически линейно. Топовая DDR4 выдаёт 60-70 ГБ/с (не берём в расчёт Gear 2, его никто в здравом уме не использует), топовая на данный момент DDR5 — 130+ ГБ/с, а это ещё только середина поколения.
Плата за то, что ради нескольких процентов производительности память заставляют работать в режимах, несколько более близких к предельным?
Для выжимания дополнительных соков CUDIMM придумали, а ECC здесь потому что конденсаторы становятся всё мельче, а шанс, что случайная частица перевернёт какой-нибудь бит — всё больше.
Задержки всё же снижаются со временем, если измерять в наносекундах. Просто они снижаются не так быстро как растёт частота - из-за возрастающих таймингов.
Ничего подобного. На синих процессорах для средней DDR3 в двухканале без тонкой настройки средние задержки были в районе 45 нс, для DDR4 — 55 нс, для DDR5 на монолитных процессорах — 65 нс, на чиплетных — 80-85 нс.
Это задержки доступа из ядер процессора. Ну, так сделаны архитектуры.
А это что-то даёт по сравнению с двухканальным включением DDR4? DDR5 весь не станет 4-канальной?...
до алдерлейка у интелов (на десктопах) был буквально один жирный канал в 128 бит. начиная с оного при подключении ддр5 там вполне полноценный нормальный четырехканал (той же ширины). и процессор таки научился юзать его раздельно и это даже заметно. если ядер много. до условных ядер 8 можно не париться.
Плата за то, что ради нескольких процентов производительности память заставляют работать в режимах, несколько более близких к предельным?
йеп. без ecc даже на десктопах уже было бы плохо.
Есть DDR4 двухранговая, там получается в общей сложенности 5000 с чем то скорость. Обычная DDR4 работает как бы в 2 такта, 1 такт работает, второй такт отдыхает, т.е. простаивает. Двухранговая половина чипов работает 1й такт и половина 2й такт, т.е. без простоев, что благоприятно сказывается на быстродействии и FPS.
Эээ, что? ЕМНИП ddr4 устроена традиционно.
DIMM - dual in line memory module. Dual означает что на модуле может быть 1 или 2 набора микросхем, это собственно и обозначается 1R или 2R.
Выбор этих наборов осуществляется через ногу CS0/CS1 модуля.
== cut ==
Chip select: All commands are masked when CS_n is registered HIGH. CS_n provides
external rank selection on systems with multiple ranks. CS_n is considered part of the
command code. (CS2_n and CS3_n are not used on UDIMMs
== cut ==
Так что нет никаких простоев в зависимости от 1R или 2R.
Может быть небольшой прирост производительности за счёт того, что два набора микросхем увеличивает размер "внутреннего буфера" чипов ( не помню как он правильно называется, пишу по сути ) А может быть и падение, за счёт того, что 2R модули материнка любит на меньшую частоту ставить.
Так что хотелось бы прудов на ваше заявление про скорости и т.д.
А как DDR5 для больших LLM, которые практически полностью пихают себя в озу (я имею в виду действительно большие модели типа 70b и выше для которых врама не напасешься), и скорость их работы ограничена не ЦП или ГПУ, а доступом по чтению из ОЗУ?
Я вот как раз этим и занялся. Запускал Deepseek V3, Qwen235 и тому подобное.
У меня стоит Nvidia 4090D 48GB, но большие модели не помещаются.
Сначала взял себе Dell Precision 7920, Intel Xeon Gold 5218:
6 каналов памяти
DDR4-2667
я поставил 6 планок по 64 GB (на Ebay каждая планка стоит около $70). Теоретически должно получиться 128GB/s. Intel mlc показывал, что у меня скорость - 121 GB/s. Stream показывал скорость 81 GB/s.
Опытным путём выяснил, что 120 GB/s - это медленно для больших моделей.
Взял Dell Precision T7960, Intel Xeon W5-3425:
8 каналов памяти
DDR5-4800
я поставил 8 планок по 64 GB (на Ebay каждая планка $260). Теоретически должно получиться 307 GB/s. Intel mlc показывает скорость до 190 GB/s. Маловато. Я стал разбираться: BIOS показывает, что у меня память работает в "Mixed mode", а как я думаю - должна в "Octa mode". Может быть проблема в том, что рэнкинг у меня 2Rx4, а я подозреваю, что с моим контроллеров памяти (Intel W790) похоже нужно 1Rx8 (такие на Ebay стоят $380 за планку и там написано что эти планки - для Dell). Получается надо выложить $3000 только за память, но я не уверен, что это решит вопрос: продолжаю разбираться - уже неделю переписываюсь в поддержкой Dell.
Ещё читал что процессоры поколения Intel Xeon W5-3425 способны "переваривать" около 20 GB/s на каждом ядре. У меня 12 ядер и получается, что даже если память разгонится на 307 GB/s, то процессор сможет держать только около 240 GB/s. Но пока вот получается около 190 GB/s. Так что наверное надо было брать процессор с 20+ ядрами. Но у процессоров с большим количество ядер - ниже тактовая частота, и я не уверен, что важнее.
То есть получается, что перейдя с Xeon 5218+DDR4 -> Xeon W5-3425+DDR5:
память ускорилась со 120 GB/s -> 190 GB/s
памяти стало больше: 384 GB -> 512 GB
я заплатил около $2500+ за апгрейд.
ещё на новом процессоре я получил AMX (Advanced Matrix Extensions), который значительно ускоряет обработку промптов (Prompt processing) при инференции и PCIe 5.0.
Для сравнения, у Nvidia RTX 4090D, скорость памяти: 1000 GB/s
Завидую. Скажите, а что там с гарантией на китайские 48-гиговые карты? Вы изучали вопрос?
Да, получается совсем не бюджетно, и ладно бы деньги. Выигрыш в скорости инференса на какие то проценты по сути.
И думается мне, выпустят и DDR5 и даже DDR10, сильно ситуация не поменяется, там упирается все в физическое ограничение внешних модулей. А на видеокарте чипы памяти запаяны и все дифпары рассчитаны как нужно - нет и разьема, который вносит доп. индуктивность в каждую линию.
Тут пожалуй только смотреть на эпики и эпические серверные материнки, в которые можно поставить до 30 тб озушки, все это дело в многоканале уже сможет запускать дипсик. Хотя стоить будет как чугунный мост. Но все еще в разы дешевле видеокарт.
упирается все в физическое ограничение
Я не соглашусь.
Вот например карточка RTX 4090 работает на скорости 1000 GB/s и не упирается в физические ограничения.
Проблема с технологиями последнего поколения всегда в том, что есть какие-то сценарии (edge cases), которые ещё не очень понятны.
Вот взял я 8 каналов памяти DDR5, но похоже для DELL планки нужно было брать 1Rx8, а не 2Rx4. Сейчас про это информации нигде нет, даже в официальном гайде у производителя материнской платы, а через пару лет это будет уже известно шире, и те, кто будут делать такую систему - получает не 190ГБ/c как я, а 250ГБ/c. А с другими материнками (или chipset?) 2Rx4 будут работать нормально.
Или вот взял я Xeon W5-3425, потому что везде пишут, что на процессоре инференция упирается в скорость памяти, а не в скорость процессора. Вот только нигде не пишут, что при некотором малом числе ядер - тем или иным образом скорость упрётся в это. И похоже оптимально иметь 24 ядра, - тогда наверное можно будет получить и около 300 GB/s на 8 каналов.
Вот первопроходцы и набивают шишки.
Кстати, вот ещё некоторые обнаруженных факторов, влияющих на инференцию на CPU, которые только-только начинают быть понятными:
современный софт для инференции не умеет работать с несколько процессорами - только с одним. Инференция на двух процессорах работает МЕДЛЕННЕЕ, чем на одном.
У AMD есть процессоры с большим количество ядер, поддержкой 12 каналов DDR5 памяти, - но оказывается, что там ядра разделены на группы CCD, и если этих групп мало, то работа с памятью никогда не будет на полной скорости. Для многих моделей процессоров 8-канальные Xeon будут быстрее 12-канальных AMD.
Да, действительно, все сложней чем думалось. Но в такие глубины я еще не прыгал) Хорошо бы освещать их по мере сил и желания...
Просто как бы не получилось такого, что некоторая сборка на "четырехпроцессорной серверной плате с зионами и охреналиардом памяти" стоит сильно дешевле чем сборка из a100. Кто его знает. Вы помогли мне посмотреть на это прям свежим другим взглядом.
Как может стоять вопрос про обновление только оперативной памяти? Если у вас ддр4, то без смены платформы вы на ддр5 не перейдёте, сейчас вроде нет материнок-франкенштейнов на несколько типов памяти.
А если менять платформу, то производительность у вас вырастет далеко не только за счёт смены типа памяти.
Зачем ваш этот фпс нужон? мс и 99% дайте.
Взять тот же гашиш импакт, 60 фпс вроде, но дикие лаги и просадки (не фризы), а почему? да потому что 99% 20 кадров. (Это почему-то только на 10 винде, на 11 самый минимум 99% - 54 кадра и естественно нет дергания)
Опускается опять же важный момент. По сети множество комментариев под подобными темами, где люди до сих пор пользуются DDR3. И если исходить, что мы не будем обновлять железо на горизонте 5 лет, то какой смысл брать DDR4, когда есть более актуальный стандарт по сравнительно одинаковой стоимости которая размажется на те самые 5 лет.
Чтобы обновить память нужно обновить платформу. У меня i7 920 первого поколения и 12 гигов ддр3. Вроде как хватает на всё. Правда в играх слаба, так как pcie версии 2. Думал перейти на 1151 сокете с чипсетом z390. Потому что деньгами дешевле выходит. И ещё, если я ддр3 гонял 10+ лет то и ддр4 столько же погоняю.
Сейчас самое время обмазываться DDR4 по уши, те же 2х32гб стоят вполне вменяемых денег, а значит можно смело пропускать свежее поколение оперативки и потом уже собирать систему с ноля на DDR6.
Как показало время, если у тебя нет узкоспециализированных задач, где требуется все самое свежее, то можно обновлять ПК раз в декаду.
Обмазываться по уши уже не получится. Самсунг, Микрон и Хюникс заявили о скорой остановке производства ДДР4... Результат налицо - модули ДДР4 подскочили в цене, и она непрерывно ползет вверх. Уже примерно в полтора раза выросла. Кому радость - пожалуй, только любителям платформы Xeon на сокете 2011-3 и китайских материнских плат. Там процессор кющяет старую серверную ЕСС память, и 4 канала дают вполне себе хороший результат в рабочих приложениях. А есть ведь и "двухголовые" китайплаты - там вообще раздолье. Особенно с учетом ценников на процессоры... 14-ядерный 28-поточный Бродвел за чуть больше ОДНОЙ (!!!!!) тысячи рублей - это ли не счастье?

Цену определяет спрос. Дешево - значит нафиг не нужно никому. А не нужно никому обычно или потому что остальное (материнка та же) дорогое или не найти в продаже. И/или потому что все эти многоядерные монстры очень специфичны - однопоточная скорость никакая.
Но зато тут 6, 8 и более каналов памяти, круто конечно.
Как вам такое комбо например?


Да память, да ядра... но медленно же :-\
Двухголовость для обычного юзера это двойная головная боль имени "а умеет ли эта чертова софтина правильно работать с NUMA", поскольку как только второй проц лезет в память первого, случается "ой, а чё енто мы так адово тормозим, будто я снова на 775 сокете?" (смешнее было только со старыми оптеронами эпохи фуфикуса, когда набив памяти ты вдруг понимал, что система скинула её частоту). И надо не забывать учитывать, что дофигаядерные дешевые серверные зеоны отличаются ну очень низкой производительностью на ядро в силу низкой частоты -> надо брать высокочастотные, а они уже не так дёшево стоят.
Из вариантов купить сейчас 2х32гб ddr4 даже за 13000-14000 руб и забыть на какое-то количество лет про нехватку оперативной памяти, или же менять целиком материнку с процессором, охлаждением и памятью, что даже с учетом продажи старого железа выйдет в 30000+, тут и говорить не о чем.
Мы же говорим о "гражданской" ddr4 и ПК для дома, а не о серверных решениях.
Как там ситуация обстоит я не знаю.
Даже с учетом подорожания, это дешевле чем в начале этого года, когда тот же комплект стоил 18000р.
У меня что то не так с логикой или должно быть наоборот? Ведь это 4к игры требуют большей производительности ОЗУ. Потому что разрешения текстур выше. Кмк разница в 1080р вызвана не разной частотой ОЗУ, а материнкой и/или кривостью самих игр.
У меня что то не так с логикой или должно быть наоборот?
Что-то не так с пониманием, как работает игра. Текстуры затягиваются в память видеокарты один раз при подгрузке локации. Потом видеокарта отображает всё, практически не обращаясь к основному ОЗУ, точнее, обращаясь, если видеопамяти не хватает для отображения сцены, но тогда производительность падает радикально, и для этого эффекта вам нужна видяха с 8 Гб ОЗУ и самыми современными играми в 4К. А основным потребителем ОЗУ при рендеринге является процессор, который для каждого кадра там взаимодействие объектов обсчитывает, выполняет игровые скрипты и так далее. И этот объем вычислений фиксированный, он не зависит от разрешения, только от количества кадров, которые процу надо обсчитать. Соответственно, если разрешение небольшое, видеокарта успевает больше кадров в секунду отрендерить, и процессор больше занят своей работой, обсчитывая скрипты для сотни кадров. А если разрешение большое, видеокарта успевает отрендерить меньше кадров, и работы процессору также остаётся меньше. Соответственно, и к ОЗУ он обращается меньше.
Huanghi x99 fx8
2690v4 14 ядер 28 потоков
128 гигов Ddr4 2400
Скорость чтения записи
60000 МБит.сек
Сервер на 2 таких ароцах.
8 канал памяти
133000 Мбит сек.
О ДДР5 пока не думал ибо 4 канал равен двуканалу ддр5
Сколько потребляет эта тумба-юмба?
У меня на подобном был 1200 блок. 256Gb ram, 2690v2 х2, плата inspur - в "почти простое" 100-130Вт (10 виртуалок и куча контейнеров), при нагрузке до 800 Ватт, ибо там еще три видяхи (Mi50 + две затычки). Дома оно слишком уж шумно и греет, так что или в ДЦ ставить, или в кладовку прятать с вентиляцией...
Думать надо о новом процессоре, если не хватает зиона. А на рабочих задачах старого многоядернмка хватит надолго
Задам, вероятно, нубский вопрос, но как снижение напряжения снижает потребляемую мощность? Там вроде как ещё амперы есть, что бы ватты получить.
вот щаз бы ещё обзорщикам понимать, что для сравнения влияния памяти на игры нужно сравнивать не средний, минимальный или максимальный fps, а 1% low.
и внезапно выяснится, что эффект от перехода на DDR5 хорошо заметен даже в 4k
DDR4 или DDR5 в играх и на домашнем ПК: пора ли обновлять оперативную память?