Pull to refresh

Comments 113

Пока нет. Возможно, появится какой нибудь майнер. Условная monero - нет, не ускоряется.

Оно ускоряет нейросети (работу и/или обучение) в некоторых случаях. Примерно раз в 20. В случае распознавания голоса (Alexa, Алиса) - точно ускоряет в процессе работы, в некоторых случаях помогает только в процессе обучения. Вероятно, может ускорить наложение каких-либо эффектов при обработке видео, но видеокарта должна справиться лучше.

Примерно раз в 20

А можно пруф на столь сильное утверждение? Лично я не верю, что AVX512 будет в 20 раз быстрее AVX/AVX2.

UFO just landed and posted this here

Внезапно, AVX-VNNI к AVX512 не имеет никакого отношения.

Intel, выпилив AVX512 вместе с AVX512-VNNI, предоставила в Alder Lake альтернативу в виде 256-битных инструкций:

https://www.intel.com/content/www/us/en/docs/intrinsics-guide/index.html#techs=AVX_VNNI

Так что по-прежнему жду пруф в виде сравнения скорости работы AVX512-VNNI с AVX-VNNI и предполагаю, что существенной разницы в скорости не будет.

UFO just landed and posted this here
Ускоряет некоторую лютую математику, например разного рода алгоритмы факторизации.
UFO just landed and posted this here

Каким образом? Типа, если бы не отключили в игровом процессоре AVX-512, то гугл в датацентры бы себе i9-12900k вместо Зионов закупал что ли?

Гугл нет, а вот туча производителей контента могли бы задуматься и купить более дешевый аналог. Это искусственная сегментация рынка и интел этим всю жизнь страдал. ECC можно еще вспомнить, который они не хотят включать в потребительских моделях.

Какой вообще софт кроме бенчмарков сейчас скомпилирован с поддержкой AVX512 зная, что поддержки этих инструкций на десктопе днём с огнём не сыщешь?

Все, что связано с рендерингом, пакеты вроде matlab, например. Прямо вот под статьей у меня ссылка на "Intel оптимизировала библиотеку Numpy под AVX-512, ускорив вычисления Python в 14—32 раза". Я думаю таких приложений тонна и это как раз тот сегмент рынка, где люди могли бы взять обычный настольный процессор вместо HEDT или серверных процев.

в чём грязь-то?

В искусственной сегментации рынка, а здесь еще и в отключении того, за что люди уже заплатили деньги. За такое впору бы коллективный иск подать.

тем, что производитель не даёт использовать режимы, которые практически гарантированно поджарят устройство у всех пользователей, кроме десяти экстримальных оверклокеров, которые будут пытаться превзойти эти лимиты под жидким азотом.

У всех современных процесоров есть встроенные защиты, которые не дадут ничего поджарить. Что делают пользователи это их дело и интел, вообще-то, всегда поддерживал разгон. Будь то любительский или экстремальный. k серия для этого и существует.

Серьезно, вы в интеле работаете что ли? Аргументация на уровне их презентаций, где они любят подгогонять цифры бенчей и петь про "Real World Performance".

UFO just landed and posted this here

Кстати, почему-то никто так норм и не оттестировал, хотя PCIe 4.0 железа уже довольно много.

Но тут надо понимать что стандарт PCI это еще и требования к физическим параметрам проводников/шины: длина, сечение, сопротивление и черт знает что еще. Очевидно PCIe 3.0 шина физически не соответствует. И то что железо и на старом стандарте формально работало(т.е. рисовало 4.0), не означает что пользователь не словит проблем при попытки утилизировать всю пропускную способности шины. Ведь стандраты эти инженеры не от скуки годами разрабатывают.

Жадность это не отменяет, однако еще есть вероятность что они там жопу себе прикрывают от претензий в несовместимости. Но тогда бы оставили опцию для этузиастов ¯ \ _ (ツ) _ / ¯. В любом случае не стоит ждать чудес от физически несовместимого оборудования.

Прикрыли жопу, да. А для всяких энтузиастов есть ранние сборки биосов, где ПСИе5 ещё предполагался.

UFO just landed and posted this here

Да, ошибся.

Да, именно из-за отсутствия гарантий в работе железа, которое изначатьно и не предполагалось под такой режим работы, решение было оставлено на усмотрение вендоров.

UFO just landed and posted this here

Мне кажется это пошло еще с момента обнаружения уязвимостей (тех самых, с помощью которых так до сих пор никто никого и не взломал) и появления Ryzen'ов. Теперь Интел всем должен за стагнацию в развитии процессоров, которую Ryzen'ы якобы переломили (а по факту лишь в прошлом году смогли временно перегнать Core'ы). И при этом никого почему-то не волнует, что AVX512 в продуктах AMD вообще не присутствует.

Интел они перегнали с самого первого поколения. Просто это касалось нагрузок за пределами игр. 3 поколение смогло обогнать окончательно и в играх. Поэтому не якобы, а именно что интел только к 12 поколению смог какую-то конкуренцию амд составить.

И при этом никого почему-то не волнует, что AVX512 в продуктах AMD вообще не присутствует.

А это здесь вообще при чем? Сабж про интел конкретно. А волнует оно того, кому эти инструкции нужны. От того, что амд быстрее, люди не перестали внезапно покупать интел. Там все еще есть фичи, которые есть только у интел.

Это касалось нагрузок не только за пределами игр, но и за пределами серфинга, офисных приложений, да вообще всего кроме многопоточных бенчмарков и приложений для создания контента. Создатели последних, кстати, давно уже догадались перенести многопоточные нагрузки на GPU, которые, между прочим, как раз предназначены для такого, в отличии от CPU. Так что по факту остаются только архивация да компиляция кода.

по соотношению производительности к вложенным $ уже первые рязани интелу серьезную конкуренцию делали, вторые и дальше только на самых топовых комбинациях (если закрыть глаза на цену) уступали. Т.е в любой задаче, которой надо хоть немного больше, чем 1 ядро (ибо там и i3 хватит) условный Ryzen 5 оказывался шустрее и вкуснее условного i5, а если переводить в $ — то при равной цене сравнивались Ryzen 7 vs Core-i5, что уже точно не в пользу Intel было.

И только упоротые фанаты бенчмарков и "+1 фпс в играх" сравнивали флагманские решения не взирая на ценник (т.е десктопный i9 сравнивали с рязанью, которой можно взять 2 штуки по цене этого i9 (что очевидно лучше) или вовсе заменить на Threadripper схожей цены и уделать i9, но его уже почему-то с еще более дорогими HEDT-решениями и зеонами сравнивали, а не с конкурентом равного ценового сегмента).

Т.е по сути за фиксированную сумму в N денег начиная со 2-го поколения рязаней у AMD можно было взять более производительные варианты.
Это касалось нагрузок не только за пределами игр, но и за пределами серфинга, офисных приложений,

Что это у вас за серфинг и офисные приложения такие, что им ядер рязани не хватает и надо именно печку на 5+ Ггц? Браузер монеро майнит? Хром, к слову, чудесно грузит кучу ядер.
UFO just landed and posted this here
Теперь Интел всем должен за стагнацию в развитии процессоров, которую Ryzen'ы якобы переломили (а по факту лишь в прошлом году смогли временно перегнать Core'ы)

именно что переломили, с появлением реальной конкуренции с райзенами прогресс у intel явно ускорился.


И при этом никого почему-то не волнует, что AVX512 в продуктах AMD вообще не присутствует.

что удивительного в том, что amd внедряет новые команды разработки intel позднее, чем intel?

UFO just landed and posted this here
2. В бытность свою датасотонистом мои коллеги и я вполне собирали нужный софт из исходников под конкретные машины. Да и сейчас, вне датасайенса, есть вполне ускоряемые этим всем задачи, для которых можно (и нужно) писать код самому

Именно. А то развели всяких докеров, да ещё бывает из-под виртуалок (!), а то что тормозит — так это апгрейд нужен.
UFO just landed and posted this here
Смешно же про серверы, которым прям так нужен этот AVX-512 и которые вместо зионов бы корки брали. Во-первых, на подавляющем большинстве серверов (хоть нормальных, хоть «хетзнеровских» десктопах) крутить AVX-512 — последнее, что является приоритетом при выборе процессора, 99% это всякие веб-сервера, БД и прочее. Во-вторых, даже если это был бы numpy во все поля, то 99% тупо ставят его из пакетов и почти никто и никогда не собирает под конкретную платформу, а никаких готовых сборок под AVX-512 днём с огнём не найти. Как специалист говорю, не верите?

Ок. Мы вас поняли. Но если AVX-512 настолько никому не нужен как вы описали и никому не мешал т.е включали его и отключали Е-ядра лишь полторы калеки-энтузиаста (которые на бабках интела не скажутся), а простой потребитель знать не знал и ему это нафиг не сдалось — зачем интелу все эти заморочки с требованиями к производителям материнок выпилить поддержку? Не многовато ли возни из-за 10 человек на планете?
защищает этих самых домашних потребителей от энтерпрайз закупщиков. Или вы бы хотели, чтобы в процессорах за 300 баксов был полный фарш и это было бы идеальным решением для массового серверного рынка? Посмотрите на видеокарты и поймете, что случилось бы в такой ситуации.

А, т.е таки признаете, что интел умышленно искусственно делит грязными приемчиками? :)
Ничего не случилось бы. Тратили бы меньше бабок на производство зеонов и больше бабок на производство core. У них же не дефицит мощностей, раз их хватает удовлетворять потребителей зеонов сейчас? Просто перераскинут и всё, потребителей то в целом больше не станет.

А то сейчас это очень напоминает столь же хитрожопую Nvidia, у которой GTX 3060 имеет 12 гб памяти, а более производительные 3060 ti — 3070 — 3080 имеют по 8-10гб, дабы независимо от выбора к 40хх поколению карта устарела либо по камню, либо по объему памяти и всё равно пошла под замену.
UFO just landed and posted this here
А что до сложных стратегий «тут столько памяти, тут ядер, чтобы под замену пошло» — посмотрите, самая популярная карта в стиме это GTX 1060. Никто вам руки не выкручивает «устаревшими по памяти» картами

Выкручивают. Нейронки без VRAM на погонять. В VR c нормальным разрешением без VRAM не погонять.
А тут варианты или слабая видяха, но с памятью, или шустрая, но бесполезная.

Но так то да, я до сих пор модельки на 1080Ti гоняю, ибо 2080Ti стоила не разумно относительно возможностей (а RTX не нужен ни для VR, ни для ML), а из новых или 3080Ti (стоит космос, учитывая что ML чисто для себя, а не по работе) или 3060 (т.е та же 1080Ti, только с лучами).

Смешно же про серверы, которым прям так нужен этот AVX-512 и которые вместо зионов бы корки брали.

Причём тут сервера и он нужен нетолько на сервере, к тому же нужно начать с изучения вопроса. Там на половине этих хеонов никакого реального авх512 нет.

Если говорить про десктоп, то никаких авх512 здесь нет вообще. Это была единственная надежа. Единственное, где можно что-то получить - это на мёртвой платформе с протухшем скайлеком.

Во-первых, на подавляющем большинстве серверов (хоть нормальных, хоть
"хетзнеровских" десктопах) крутить AVX-512 — последнее, что является
приоритетом при выборе процессора, 99% это всякие веб-сервера, БД и
прочее.

Терминально невежество. Симды используются везде. Даже с таком днище как веб-серверы, которыми мир не ограничивается. Как минимум там есть криптография, типичный дефолт чача+поли раза в 2 быстрее скалярных аналогов. И то лишь потому, что в интелел есть циклический сдвиг, а всимдах нет. Всё это скейлится линейно практически. Там есть работа со строками, которые либо реалузются симдами, либо форвардятся в glibc.

Не говоря уже о всяких мемсетах/мемкопи, которые процентов 20 времени месят эти "серверы".

Ради идентереса можете пойти посмотреть бенчмарки glibc vs ембедед-поделки, в том числе и в чём-то реальном. Основная разница - это симды.

Во-вторых, даже если это был бы numpy во все поля, то 99% тупо
ставят его из пакетов и почти никто и никогда не собирает под конкретную
платформу, а никаких готовых сборок под AVX-512 днём с огнём
не найти.

Ещё более терминальное невежество. Нормальный компилятор умеет в сборку под множество таргетов и выбор нужного клона в рантайме. Так это сделано в той же glibc. Так же это, скорее всего, сделано и в numpy. В любом случае, кому нужно - тот накатит.

Как специалист говорю, не верите?

Мне уже откровений выше достаточно, но я не поленился погуглить:

At runtime import, the CPU is probed for the set of supported CPU features. A mechanism is used to grab the pointer to the most appropriate kernel, and this will be the one called for the function.

Там максимально невнятно написано, но судя по всему это есть. Опять же, специалиста видно издалека.

Зайдите в ods.ai и устройте
опрос в канале hardware сколько процентов хоть раз собирало хоть
что-нибудь под свою конкретную платформу и кому в жизни помешало
отстутствие avx512 или кто десктопные камни в серверы пихал, особенно с
разгоном AVX до 5.1. Не нравится ods, давайте другое, более релевантное
по вашему мнению сообщество опросим.

Зачем мне опрашивать какое-то "сообщество", которое, особенно в случае с питоном, на 95% состоит из студентоты, которое ищет то как сбацать лабу. И никакой ЦА бизнеса интела не является.

Про лимит разгона AVX до 5.1ГГц. Мало ли какие у Интела были причины это сделать? Может там уже сигналы разваливаются при большей частоте? Или локальное тепловыделение настолько высокое, что какие-то части успевают критически нагреться или ещё что угодно? Справедливости ради, в оригинальной статье Игорь упоминает, что эти лимиты и раньше были и возможные причины перечисляет и предлагает как было бы лучше коммуницировать эту информацию со стороны Интела, вовсе не брызжет кислотой о том, какой Интел "грязный".

Причины тому очевидны и они правильно описаны в статье. Никаких иных причин нет и быть не может. Частота ни на что не влияет, при прочих равных. Сказки про перегрев не работают, потому как есть генерируемое, а есть отводящиеся тепло. Нет смысла ограничивать первое, когда второе изменяется. Т.е. при более худшем охлаждении будут всё те же эффекты на более низкой частоте.

Ну, если бы вы её открыли, то увидели бы, что это агитка Интела как раз, где они на порядки ускоряют отдельные функции,
это не тоже самое, что "ускорить питон в 20 раз", если у вас конечно
код не состоит из бесконечного цикла вычисляющего арккосинус на массивах
:) И это кажется сравнение с полным отсутствием векторизации, даже не AVX2 vs AVX512

Опять же, терминальное невежество и любимые сказки про "бесконечные циклы". Надо ещё про наносекунды с казать. Только в avx512 мы получили доступ к нормальному умножению из плавучки, а не костылю. С учётом fma и x2 шириной - это даёт даже не 2 и не 4 раза.

Я понимаю недовольство тем, что Интел не даёт всё и сразу и желательно подешевле, особенно когда оно есть в железке физически

Я не понимаю кто и зачем начал это плюсовать? Ведь здесь каждое откровение - невежество в терминальной стадии.

Вот опять же, кто хочет и чего подешевле? Вот мне нужена железяка с avx512. Я не хочу платить 500-2k баксов в месяц за дедик на aws, который к тому же, неудобно использовать.

Покупать хеоны мне неупало, потому что это мусор. Хеоны с настящим avx512 не бывают с нормальной частотой, а использовать 2-3гцц днище на десктопе, да ещё и с мусорной памятью невозможно.

Я бы купил ака-декстопный интеловский огрызок, но он мёртвый. Интел под него новое железо не выпускает. Это моя вина?

а на то, как всё это железо будет использоваться в реальности и кому
продаваться, то можно увидеть, что в большинстве случаев разница будет
едва ли не в пользу потребителя — и отсутствия AVX-512 никто не заметит и
в лимит AVX 5.1Ггц не упрётся (у меня i5-12600k и он на "штатных"
4.6ГГц и "супербашне" прыгает до 100 градусов за 1 секунду в
ycruncher'e).

Опять же, очередной пример невежества и отствия дружбы с логикой. Интел как раз таки и отключает это, потому что это как раз таки очень много кому нужно. Если было бы ненужно - не отключал бы, очевидно. Зачем делать что-то, если можно не делать с тем же результатом? Это тупо невыгодно.

Кстати, я помню таких же фанбоеев, которые мне рассказывали куллстори про "у интела были причины", когда интел прокидал меня с z270.

И сегментация рынка не только лишает домашних потребителей
"энтерпрайз" фичей, но и защищает этих самых домашних потребителей от
энтерпрайз закупщиков.

Нет, никаким образом. Кстати, как то быстро меняется история. То вдруг "это никому ненужно", а теперь уже "защищает". Зачем защищать?

Или вы бы хотели, чтобы в процессорах за 300
баксов был полный фарш и это было бы идеальным решением для массового
серверного рынка? Посмотрите на видеокарты и поймете, что случилось бы в
такой ситуации.

Ничего бы не случилось. Ситуация с видеокартами никак не связана с майнингом. Она связана с глобальными проблемами и созданием искусственного дефицита. При этом кому нужно всё вполне отгружается.

Но рассуждения глупость не поэтому. Есть количество процессоров, где интел продаёт n + m, есть два рынка. Есть все резко свичнутся в n, то ничего не изменится. Просто m никто не будет покупать и интел не будет выпускать m.

Только интел этого делать не будет и будет специально создавать дефицит, именно потому, что это невыгодно.

Вот просто пример с видеокартами. Себестоимость производства любых чипов практически одинакова, как минимум она одинакова для одинаковых чипов. Внимание вопрос - зачем нвидия выпускает всякий мусор, если можно выпускать только топ-карты? Будут покупать столько же, а навара больше.

Правильно, потому что нвидии невыгодно, чтобы у пользователя были жирные видюхи. Они хотят в это время как можно больше заматать дерьма, чтобы в последующем у купившик какой-то огрызок был стимул купить новое.

Поэтому нвидия будет продавать те же чипы, только максимально обрезанные. Рассказывая эти сказки про "брак" и прочую чушь.

Как же усиленно интел-боты и фанаты невежества гадят в карму. Что им ещё делать, кроме как затыкать неугадных и даже не пытаться что-то ответить.

И никак же они усиленно плюсуют того, кто попросту врёт и враньё кого опровергается за 2минут использования гагла(привете avx и numpy).

Фиксирую так же то, как они будут оправдываться, раскказывая, что гадят они потому, что я как-то их оскорбил. И это будет очередным враньё, потому как об этом:

обиженного подростка

Да, именно называние оппонентов обиженными подростками - это то самое глушилово неугодных. При этом ладно бы этому были какие-то пруфы, как это сделал я в случае с "терминальными невежеством".

Мне максимально похрен на их попытки, поэтому просто сообщаю о ситуации тем, кто будет не разбираясь бежать минусовать заминованной и плюсовать заплюсованной.

Я поставил вам минус в карму исключительно за токсичную лексику и троллинг.

Я здесь сторонний наблюдатель, мне без разницы, правы вы или нет, но подобного общения на Хабре я видеть не хочу.

Какую лексику? Подробнее. Какой троллинг? Насколько же интел/невежества-боты предсказуемы. Ещё под какого-то наблюдателя косит. Очевидно подобному персонажу "без разницы" прав кто-то либо нет, в том числе и он сам.

Отвечу известной цитатой: "Вы все дураки и не лечитесь! Одна я умная, в белом пальто свою красивая!"

Соглашусь, что не всем это нужно. Но вот конкретно мне это нужно. Квантовой химией занимаюсь. Там расчёты не очень паралеляться, а вот AVX512 там в тему и память быстрая там нужна. Специально ждал DDR5, чтобы в пару с AVX512 себе комп собрать.

Какой вообще софт кроме бенчмарков сейчас скомпилирован с поддержкой AVX512 зная, что поддержки этих инструкций на десктопе днём с огнём не сыщешь?
libx265
image

AOM-AV1
UFO just landed and posted this here
то подтверждение или опровержение моего аргумента? :)
Опровержение.
Если я вот прямо сейчас скачаю условный HandBrake и запущу перекодирование в x265 там будет поддержка AVX512 или нет? Или мне нужно будет поставить линукс, скачать исходники libx265, собрать с march=native?
Что-то среднее. Качать исходники и компилировать ничего не нужно. По умолчанию флаг avx512 не включается на системах, которые его поддерживают. Но он есть. Его нужно включить с помощью параметра «asm=avx512» (можно и в Handbrake, и в ванильном ffmpeg через CLI): www.hwcooling.net/en/intel-avx-512-tested-in-x265-how-to-enable-it-and-does-it-help
UFO just landed and posted this here
Да, это все же больше идет на пользу процессорам с большим количеством ядер, где можно запустить несколько кодирований сразу (ибо у того же libx265 есть потолок по количеству ядер, которые он может эффективно использовать).
Правда это даст в лучшем случае 5-10%
Часовой видео файл 2160Р кодируется slow пресетом на моей системе с 3900Х (avx-256) примерно 10-12 часов. 10% для такой задачи — заметный прирост.

Часовой видео файл 2160Р кодируется slow пресетом на моей системе с 3900Х (avx-256) примерно 10-12 часов.

Ага. Вот только энкордер hevc_nvenc с пресетом slowest даёт производительность почти на два порядка больше на GTX1080: 1080p кодируется со скоростью ~200 fps (slow — 300 fps).

Даже если нет дискретной видеокарты, то встроенное видеоядро с аппаратной поддержкой кодирования-декодирования есть почти везде.

Ну и зачем в таким случае напрягать процессор?

Ну и зачем в таким случае напрягать процессор?
Соотношение размер\качество у аппаратных кодировщиков заметно страдает, приходится устанавливать больше битрейт (а лучше CRF, если грамотно подходить к вопросу, вместо которого у NVENC, к сожалению, CQP) чтобы достичь того же качества.
Аппаратное кодирование нужно для быстрого рендера, или для live-видео. Для архивного видео приходится использовать софтовый энкодер.

Не спорю, софтварный кодек намного лучше.

Однако же: 1 час архивного видео в моём случае занимает около 2 гигов, если же упаковать хорошим программным кодеком с пресетом, ориентированным на качество, то получится 1-1.5 гига.

Всего у меня порядка 100 гигов пожатого видео в архиве. Если бы перекодировал программным кодеком, то вышло бы около 50 гигов (в лучшем случае) ценой 20 суток работы CPU (он у меня довольно старый, x265 даёт около 2 fps на FullHD).

Будет ли в этом случае экономия 50 гигов оправдана? Думаю, что нет.

Ну у меня объемы другие, и ПК простаивает нередко, почему бы и видео не посчитать, пока ничем полезным за ним не занимаюсь.

А если экстраполировать? 50 Тб против 100 Тб — оправдано? Один петабайт против двух?

А тут надо считать.

1 ТБ сейчас стоит около 1500 рублей (с RAID побольше будет, естественно).

Но при этом перекодирование 2 ТБ → 1 ТБ будет стоить около 10000 часов процессорного времени, или 1000 кВт*ч, или 5000 рублей, если за потребление десктопа под нагрузкой принять скромные 100 Вт.

Давайте посчитаем.
(тут был полный расчет NAS с учетом тушки и всего прочего, но, увидев результаты, я его снес)
100 Тб — пускай 150 тысяч рублей (реально — ближе к 200т.р., а с учетом резервирования, контроллеров и прочего — 250т.р.)

Битрейт 4K-видео, пускай, 80 мбит/с. Это 36 Гб/час, массив на 100 Тб способен вместить порядка 2777 часов (~115 дней) видео.

Берем условную скорость кодирования всего-то x0.1, то есть 2777 часов видео будут кодироваться 27770 часов. Потребление при кодировании пускай 300 Вт.

Итого при таких сильно завышенных цифрах получаем 2777*10*0,3=8331 кВт*ч. Даже при 5 руб/кВт*ч это всего-то 41 тысяча рублей.

Но я не жму в 36 Гб/час, я жму FullHD в 1-2 Гб/час, а 4K — в 5 Гб/час. При таких входных данных перекодирование оказывается дороже.

FullHD в 1-2 Гб/час, а 4K — в 5 Гб/час

Какие у вас рейты при таком сжатии? Если не брать совсем «легкий» контент (легкий — это, например, 2D/3D-анимация), то в моем представлении минимальный битрейт где-то:
x265 2160p 30fps — 15 мбит/с (6,7 Гб/час)
x264 1080p 30fps — 10мбит/с (4,5Гб/час)
x265 1080p 30fps — 5 мбит/с (2.2 Гб/час)

А при архивировании с низким crf эти цифры можно смело умножать на 2, да еще если взять 48-60fps… Поэтому 30-40 мбит/с для 4K (и 60-80 на NVENC). Или я сильно заблуждаюсь?

Какие у вас рейты при таком сжатии?

-c:v hevc_nvenc -preset p7 -rc constqp -qp 27

Не забывайте, что исходное видео тоже может быть различного качества. Оно может изначально быть немного мыльное, и сильная компрессия (3-4 мбит/с на 1080p) даст результат с качеством, не отличимым от оригинала. Да и 60 fps у меня попросту нет, только 30 fps.

Конечного потребителя обновлять микрокод никто, впрочем, не заставляет.
Он, конечно, прилетает с обновлениями операционной системы, но никто не запрещает сделать hold соответствующему пакету.

Активировать AVX-512 сложнее, но тоже возможно. Сообщество уже нашло способ внедрить в новую прошивку старую версию микрокода от Intel.

Как заменить микрокод в прошивке, известно, дай бог памяти, уже не первый десяток лет. Не совсем понятно, что нашло сообщество — кто-то открыл для себя существование UEFITool/MMTool? (поправка: MMTool использовать не следует вообще, он не совсем корректно работает с современными прошивками). Для совсем ленивых есть UBU, в конце концов.

Думаю заставят, когда выйдут новые модели и ревизии материнок, где новый микрокод из коробки

Для отката микрокода не нужна какая-то более старая прошивка, из которой его непременно нужно выдирать. Микрокод нужной ревизии всегда можно взять, например, отсюда.

Ага, на E5 v3 зеонах вовсю промышляли для разблокировки турбобуста на все ядра. Надо сделать скидку, что для того, кто совершенно не в теме, подобное выглядит как магия.

Что касается абсолютной магии - трое небезызвестных в определенных кругах товарищей нашли же способ получить доступ к подсистеме процессора, которая выполняет микрокод, слить его и задизасмить, пусть и не на самых свежих процах - https://github.com/chip-red-pill Так что есть надежда, что удастся найти бекдор или уязвимость и через него заливать патченый микрокод на более свежих. Что звучит довольно безумно, но, имхо, вполне реально.

UFO just landed and posted this here

Эхх, завидую. Пока Интел отключает AVX-512, круто наверное сидеть на AMD, у которых этого набора инструкций никогда не было.

В грядущих ядрах Zen4, судя по утечкам, будет (и это же может быть дополнительной причиной отключения AVX512 сейчас - чтобы включить позже - при выходе решения от AMD)

UFO just landed and posted this here
UFO just landed and posted this here

Да, менять процессор каждый год - это тоже недостижимая мечта для пользователей Интел.

UFO just landed and posted this here
Я бы подождал снижения цен. AMD сейчас нужно что-то срочно делать с ценами, т.к. 6-ядерник Intel за 167 баксов практически не уступает, а местами обгоняет 6-ядерник AMD за 300 баксов.

5700G не стоит, если не критично наличие встройки, он заметно уступает 5800X. Хотя, если рассматривать не только серийные но и инженерные образцы, то инженерник 5700G, разогнанный до частот своего серийного собрата, но стоящий на целых 10к дешевле, может быть интересным.
UFO just landed and posted this here
Не очень круто, если «повезло» купить мамку, у которой поддержки Zen3 не будет.

Еще на заре существования AM4 было объявлено, что процессорное гнездо не будет меняться на протяжении всего жизненного цикла платформы. Так и случилось, но если уж говорить о совместимости, то нельзя не отметить, что материнки на базе наборов логики 300-й серии в большинстве своем так и не получили обновлений прошивки, позволяющих использовать ЦП с микроархитектурой Zen 3. Да, в Сети есть неофициальные модифицированные версии BIOS для небольшого числа старых плат, но их существование как раз подчеркивает наличие искусственных ограничений со стороны AMD.

На самом деле это пробный камень для Intel - они в дальнейшем планируют продавать процессоры с программно отключённым фунционалом и дополнительно зарабатывать на продаже программных ключей для разблокировки (коммит для поддержки этого безобразия уже отправлен для включения в ядро Linux). Такой же мерзкий и грязный приёмчик как у Tesla с их программно-заблокированным подогревом сидений и.т.п. Жаль что такую грязную игру ещё не запретили, так что голосуйте рублём.

Еще в 2015-2017 годах было понятно, что они идут к модели, где начнут активировать ядра по подписке, но амд со своим многоядерным ryzen им всю малину изгадил

коммит для поддержки этого безобразия уже отправлен для включения в ядро Linux

пруф можно?

коммит для поддержки этого безобразия уже отправлен для включения в ядро Linux
А смержат ли?
Конечно. Ну если сам по себе патч хороший.
Что в железе есть/будет, то ядро должно поддерживать. Вон Линус на PAE негодует, но в Linux PAE лучше чем в Windows работает.
Такой же мерзкий и грязный приёмчик как у Tesla с их программно-заблокированным подогревом сидений

Разработчики софта с разными уровнями лицензирования:

image
UFO just landed and posted this here
Тут, конечно, можно было бы сослаться на то, что дистрибутив коммерческой софтины обычно кое-что умеет даже без оплаты, но я не думаю, что это критичная разница. Обычно это «кое-что» либо крайне урезано, либо функционально лишь в течении триального периода, что можно приравнять к «на постоянной основе оно неюзабельно без приобретения лицензии».

Так что, процессор вполне можно сравнить с коммерческой софтиной: покупая процессор я получаю камень и некоторый набор функций (аналог покупки базовой лицензии на софтину — мне присылают полный, не демо, дистрибутив и лицензию, дающую некоторые фичи), доплатив, получаю дополнительные функции (аналог апгрейда лицензии).

Вот если бы они камни продавали базово по цене селерона, а потом лицензией открывал и9 на том же кристалле, то .... всё равно пусть идут лесом.

Продавали, был эксперимент ЕМНИП в Норвегии — у селерона отрастали дополнительных два ядрышка, по цене в сумме получался практически пентиум. Но в массы не пошло.
Ещё же Фетлон 5000 был в своё время весьма популярен, причём без всяких лицензий.

Искусственная рыночная сегментация и распределение пользователей по секторам рынка с разной рентабельностью — известный приём, который позволяет максимизировать прибыль.

Года идут, а интел ничему не учатся. Вам бы процессоры выпускать получше и подешевле, а они последние соки из потребителя выжимают. Удачи им.

Года идут, а интел ничему не учатся

гхм, цель intel (как и любой коммерческой компании) не в выпуске «получше и подешевле», а в зарабатывании денег, с этим у них всё хорошо.
https://www.intc.com/news-events/press-releases/detail/1505/intel-reports-third-quarter-2021-financial-results

UFO just landed and posted this here
UFO just landed and posted this here
UFO just landed and posted this here
UFO just landed and posted this here
UFO just landed and posted this here
а так совершенно ничего не добилась в коммерческом смысле, ага.)

добилась, кто же спорит. только в сравнении с интелом это всё копейки.


14 нм и неработающем 10 нм

опять же, речь про зарабатывание денег, отношение прибыли к выручке у intel поражает, я думаю, что своё производство — один из ключевых моментов.


да, была стагнация в технология, но это и понятно — зачем развиваться, если ты и так лучше всех?


эпл б его утопила

нет, конечно же. apple не горит желанием продавать свои процессоры на сторону, а ноутбуки/десктопы apple — это всё-таки нишевый товар.

UFO just landed and posted this here
UFO just landed and posted this here
UFO just landed and posted this here
UFO just landed and posted this here
UFO just landed and posted this here
UFO just landed and posted this here

Да. Наверно камни у них не плохи. В тестах и каких то рабочих задачах. В повседневке я че то намучался с 5800. В играх вечно какие то подергивание и прочее. Долго рассказывать. Перепрыгнул на интел и компутер ожил ) Самый трешак был его охладить. там температура прыгает сама по себе +- 30 градусов на ровном месте скачет. Подозреваю это у них так работает Precision Boost Overdrive

UFO just landed and posted this here

Перечитал я тут всё. не понимаю о чем речь. О каких то множителях 51 и прочем отключении avx. Ради интереса включил принудительно этот ваш AVX и включил лок на 5200.

Я уже не одину статью подобной прочитал но ни в одной автор не дал скриншотов или доводов что это действительно так.

Сделал скришот. Всё прекрасно работает. Материнская плата Асус Апекс. С крайним биосом.

ps я бы даже потестил avx. вкл\выкл. Но не знаю чем.

включил принудительно этот ваш AVX

чтобы не было разночтения, что вы имеете в виду под «включил»? запустили код, который использует avx?

Включил принудительно в биосе. В статье шла речь о его выпиливание оттуда и принудительном отключении. Он стоял в авто. Сделал enable. Там целое в меню в биосе про avx512

 запустили код, который использует avx?

Нет. Не запустил. И запускать мне нечего. Я об этом написал даж

так частота сбрасывается при использовании кода с avx512.
притом, пишут, что при использовании avx512 на одном ядре частота снижается на всех ядрах:
https://blog.cloudflare.com/on-the-dangers-of-intels-frequency-scaling/


поэтому может получиться парадоксальная ситуация.
скажем, есть некий алгоритм (например, расчёт контрольных сумм в zfs или. как в статье cloudflare, шифрования), у которого есть реализация как с avx512, так и без неё.
провели тестирование, производительность на такт у реализации с avx512 гораздо лучше, поэтому, несмотря на некоторое снижение частоты, эта реализация быстрее.
отлично, начали использовать её.
но тут оказывается, что (процессор-то у нас многоядерный) на других ядрах параллельно с этим кодом выполняется какой-то код, который о avx512, как говорится, ни сном, ни духом. и падение производительности этого кода от снижения частоты оказывается выше, чем выигрыш нашего кода от avx512 (то есть суммарная производительность процессора падает).
другими словами, если A₁ быстрее A₂, это ещё не значит, что (A₁ параллельно с B) будет быстрее, чем (A₂ параллельно с B).

Не понятно на чем они там что тестировали. Во первых как говорилось для включения avx обязательно надо выключать Е ядра. Я не берусь утверждать что либо. Возможно имеются как то не стандартные задачи. Но..в топ материнках по типу апекса, выключается троттлинг принудительно, фиксируется частота. Он будет греться возможно, он упадёт в bsod но троттлинг не включится. Но это уже совсем как бы не решение для рядового пользователя как мы понимаем. Я а в виде гонял zfs тесты. Ничего не грелось и соответственно троттлинга не было. Завтра ещё раз детальнее изучу все. И про одно ядро тоже. Мне бы какую то задачку погонять с avx512, и тогда будет вся информация из первых рук.

Если честно я слабо понимаю на кой черт эти Е ядра нужны. Их включение приводит к падению производительности в целом всей системы. Экономия электричества? Вот честно не понимаю. В данный момент их просто отключают все. Ну или почти все.

Не понятно на чем они там что тестировали

на зионах, разумеется.


Если честно я слабо понимаю на кой черт эти Е ядра нужны. Их включение приводит к падению производительности в целом всей системы

зависит от задач. если задачи интерактивные/малопоточные, то возможны варианты.
если же задача счётная и хорошо параллелится, то E-ядра могут оказаться и интереснее P-ядер, сегодня часто тепловыделение является ограничивающим производительность фактором, а производительность на ватт у E ядер должна быть лучше.

Если честно я слабо понимаю на кой черт эти Е ядра нужны.

У экономичного ядра лучше соотношение производительности к площади кристалла и потребляемой мощности. Благодаря маркетологам одной небезизвестной корпорации в последнее время стало очень модно использовать процессор для выполнения сильно паралельных алгоритмов, и в таких задачах набор экономичных ядер при прочих равных будет эффективнее. Вон посмотрите на GPU - там "ядра" и не ядра вовсе, но по производительности в паралельных задачах процессоры с GPU не сравняются никогда.

А кто будет отвечать за то, на каком типе ядра будет работать поток?

В случае видеокарты мы явным образом пишем код и делегируем выполнение. Что делать в случае процессора?

В случае видеокарты шедулинг тоже происходит автоматически, никто явным образом не задает что такой-то мультипроцессор будет в данный момент времени вот это вот выполнять. Другое дело что там все ядра одинаковые, и нет проблемы выбора ядра для конкретной задачи.

В целом мне не очень понятно, почему не канает жадный выбор по порядку (сначала заполняем P-ядра, потом E, потом включаем мультитрединг на P). Видимо, или это не слишком хорошо работает, или же Intel решили реализовать это у себя внутри дабы не напрягать разработчиков OC, а MS решили не внедрять это API в Windows 10 :)

Жадный выбор не работает, потому что у ядер различный IPC. Для эффективного выбора ядра нужно проводить мониторинг используемых инструкций.

Собственно, Intel так и планирует делать — собирать телеметрию и передавать информацию планировщику ядра (см. Intel Thread Director).

Настолько различный, что имеет смысл аж мониторинг делать? Интересно.

Да. Либо следовать гайдам и раскидывать нагрузку по ядрам самостоятельно:

https://www.intel.com/content/www/us/en/developer/articles/guide/alder-lake-developer-guide.html

Кстати, у P-ядер и E-ядер разные L2-кэши. Это может привести к замедлению обмена данных между потоками, работающими на ядрах разного типа.

Жадный выбор не работает, потому что у ядер различный IPC.

почему? с ht же работает (пока загрузка процессора невелика задействуем одно только из пары виртуальных ядер).
тут то же самое: сначала по одному виртуальному ядру на каждое P-ядро, потом E-ядра, потом уже дозагружаем виртуальные P-ядра.


другое дело, что это несколько примитивный базовый алгоритм, в дальнейшем возможны усложнения (например, если задача неинтерактивная, то, возможно, её вообще не стоит исполнять на P-ядрах)


Для эффективного выбора ядра нужно проводить мониторинг используемых инструкций

да, и это тоже. но это уже скорее вторая часть алгоритма: как распределять задачи по ядрам когда свободных P-ядер уже нет.

В реальности у нас ещё есть Turbo Boost: чем больше ядер одновременно задействовано, тем ниже становится частота процессора.

Поэтому, когда у нас имеются как критичные к скорости работы потоки, так и не критичные, распределение всех потоков на P-ядра по жадному принципу будет снижать производительность.

Вопрос в том, как рассказать ОС, какие потоки являются важными, а какие — нет. Навскидку можно процессы с приоритетом Low сразу кидать на E-ядра. Или же добавить функции API ОС для этого дела (но тогда будут проблемы с обратной совместимостью).

Специально заказал i5-12600, отчасти по причине что он не имеет E-ядер и, с одной из мыслей, - поиграться с AVX512. У кого-то есть информация на каких материнках оно ещё не обновилось, а на каких будет патч?

у меня в заказе недорогая GIGABYTE B660M DS3H DDR4, но информации найти не удалось

UFO just landed and posted this here

И у asus. Но там какие-то топовые платы, которые в 5 раз дороже обычных

UFO just landed and posted this here
Sign up to leave a comment.