Comments 15
Инженеры компании ходили по различным проектам открытого программного обеспечения и причиняли оптимизацию сортировки
на Zen 4 скорость сортировки даже незначительно падает
Звучит так, будто вы на что-то намекаете
Там много факторов может быть, я вот в прошлом месяце упражнялся с реализацией Flat Field Correction, используя AVX-2/AVX-512, и там я упёрся в скорость чтения из памяти и записи, хоть я и мимо кэша писал, и по итогу AVX-512 показал такую же или чуть худшую производительность, так как судя по всему "бутылочным горлышком" была именно память, а команды AVX-512 к тому же чуть просаживали частоту и в результате выигрыш нивелировался.
Да сколько можно! Только начал искать модель своего проца в списке - а у десктопных отрубили AVX-512 из-за ... перегрева. Интел, лицо не сломается под Win 12 специальный процессор делать?
Подождите. Конкурентное преимущество у Интела вырисовывается потихоньку. Они умеют дожимать такие штуки. Не в следующем году, так еще через год сделают.
Интел, лицо не сломается под Win 12 специальный процессор делать?
А у них E-ядра (экономичные) всё равно не умели в AVX-512. И не умели даже работать при включенной поддержке AVX-512.
Так что, если гипотетически предположить, что Windows 12 будет требовать AVX-512 (что вряд ли), пришлось бы отключать энергоэффективные ядра и серьёзно терять в производительности.
С учётом того что судя по сливам даже в некст поколениях будет по прежнему 8 P ядер, когда E ядер до 32 - то это точно не вариант для интел.
Вообще забавно вышло с 512, сначала заанонсили поддержку, сделали c ним процы, потом продолжили в новом поколении - и выпилили к хренам.
При этом сколько рассказывали как это полезно.
А AMD мало того что в AVX 2 имеет сильно лучшую энергоэффективность относительно Intel, так еще и в 7000 серии без проблем запилили 512.
(Хотя AVX 512 у AMD и работает мнее эффективно чем у интел, но разница в энергопотреблении колоссальна, 7950X с 16 ядрами жрет в кранчере с 512 ускорением 175вт, против 230вт у 12900к с только 8 P ядрами, про 11900к который со снятыми лимитами выжирает до 320 - вообще молчу, настоящий шок контент на самом деле)
При этом сколько рассказывали как это полезно.
Так на самом деле полезно. Вон в Ксеонах работает и хорошо работает.
В десктопных процах не вышло. Бывает. Ждем в следующих поколениях. Заодно поддержка в софте уже будет. Можно будет сразу радоваться ускорению, а не ждать софт.
так еще и в 7000 серии без проблем запилили 512.
И судя по тестам оно не работает. Хотя подождем разработчиков АМД. Пусть свой патч пилят. Такое соперничество мы всецело поддерживаем. Успехов всем.
Оно не работает конкретно в данном случае, в принципе - работает, тестов в инете полно жеж.
Интел давно славится тем, что его ПО, а особенно специфичный софт с процами от AMD не дружит от слова совсем, или дружит плохо.
Я сейчас навскидку не вспомню, но вроде как несколько скандалов на эту тему было.
А кстати я хрен знает, как они будут ее реализовывать, ибо E ядра с поддержкой сделать не выйдет - слишком сильно раздует транзисторный бюджет, только наверное фиксить невозможность работы с включенными Е ядрами, но и тогда AVX будет лишь на 6-8 ядрах, интел себя в ловушку загнал в этом плане, с своим биг-литтл.
Но посмотрим, да.
Я всеми руками за аналогичный патч от АМД чтобы и у них было такое же ускорение. Ждем. Но пока имеем что имеем.
А кстати я хрен знает, как они будут ее реализовывать, ибо E ядра с поддержкой сделать не выйдет
На Е и не надо. Они не для того. На них вообще есть смысл еще больше сократить набор инструкций. Интересно в Интеле думают в эту сторону?
Эммм.. а асимметричное распределение задач средствами ОС и самого проца невозможно, что ли? Основные мелкожручие процессы раскидываются на Ешки, узкие горячие на P&AVX?
Выше уже написали, что во многих задачах оно упрется в скорость доступа в ОЗУ. У xenon уже в старых моделях было 4 канала для доступа к памяти. В десктопе у Интела вроде до сих пор два. И хоть это теперь ddr5, всë равно проиграет четырём каналам ddr4. Эта же проблема ограничивает и количество ядер. Нет смысла добавлять больше ядер, если они будут биться за один канал памяти. Кэш конечно помогает, но только в задачах где одни и те же данные переиспользуются несколько раз, причём между этими моментами нет других операций. Т е не так много таких задач и сортировка не в их числе. Очень странно, почему бы вместо добавления ядер не добавить в десктоп ещё два канала памяти...
Для этого они внедряют avx10
А в других фреймворках AVX512 из коробки есть?
Intel добавила сортировку на AVX-512 в OpenJDK: ускорение в 7–15 раз